第1页共26页社交网站的行为影响及分析北京理工大学吴帆周振寰吴少聪摘要:问题一:模型一循序渐进,将求“一天浏览该日志的人数变化”的问题转化为求解:人数f(t)—时间t函数。然后将f(t)-t的求解细分为四个主要函数的求解:1)日志在好友列表中排位—时间函数的求解;2)好友查看该日志的概率—排位函数的求解;3)单个好友看该日志的总概率—时间函数的求解;4)对上述函数求和,对所有好友查看该日志的总概率——时间函数的求解;最终,得到人数f(t)—时间t函数;问题二:基于模型一得到的结果,问题二通过对留言与日志本身的等价性分析,利用好友在任意时刻浏览并留言的概率函数,求出在留言系统下“浏览日志人数”关于时间的新的变上限积分关系,微分简化目标函数。得出结果。问题三:基于问题三和问题二的相似性,分析不同点,将单一分享系统分为“被分享用户”系统和“分享用户”系统。其中,“被分享用户”系统下的模型求解,和问题二是几乎一致的。最后,我们通过类比分析“分享系统”下人数变化函数,求出优化模型。问题四:不同被点次数对应不同参与概率,用不同的量表示,问题的所求是和这些量每次的变化有关系的,我们用递推关系公式来求解被点名人数的变化情况。并通过对每个人被点名概率相同与否的分析,以及对一个人被点多次的问题的解决,实现对模型的优化。关键字:变上限积分、等价类比、递推运用、程序求解问题一:浏览日志人数随时间变化模型:1.问题重述:以某大学内社交网站用户群体为研究对象,该群体的用户每天在8:00-23:00间随机的上一次社交网站,查看新鲜事列表中的新鲜事,并在网站上执行一些基本操作,该群体中的麦兜同学的好友列表里有264名好友,已知每名好友的好友数量和一天内产生的新鲜事数条数,他在9:00发表了一篇日志,求这一天浏览该日志的人数变化情况。第2页共26页2、问题分析:根据我们的理解:问题中“浏览该日志”是指查看日志,即该操作包含在所产生的新鲜事中。而题干中的“浏览最近发生的30件事”中的浏览是指:只看标题而不查看;一天内产生的新鲜事数条数,就是这个人在新鲜事列表浏览查看新鲜事的数量。下面我们对模型的建立与求解都是建立在这一理解基础上的。将8:00—23:00以小时为单位分为15段,分别记为:时段1、时段2------、时间段15,根据问题条件以及实际情况,可用以下流程图来反映问题的求解方向:所以实际问题转化为了:求解某时段t浏览过该日志的人数,即:人数f(t)—时间T函数。此函数为下面要求的目标函数。9:00发表日志264位好友的新鲜事列表出现该事,并排在最前随着时间段T的变化,该日志的排位N发生变化,N与t满足函数关系N=g(t)排位N的变化,好友观看该日志的概率就会发生变化,即:N与满足函数关系:)N(G,当到达某一时间段时,n=31,此时=0.264位好友的好友也产生新鲜事,每产生一个,该日志的排位下降1位,当下降30位后,好友新鲜事列表中无该日志时段2到t内264位好友各自看该日志的总概率,则2641N=t时段时浏览该日志的总人数得到浏览日志人数变化情况第3页共26页3、符号说明:t:时间(段);Tmax:该日志排位为30时的时段,也称临界时段;vn:单位时间(小时)内,第n个好友新鲜事列表中新增的新鲜事数;Nn:该日志在第n个好友新鲜事列表中的排位;u(i):排位为i时,好友查看该新鲜事的概率;p(n,x):第n位好友在x时间查看该日志的概率;(n,t):时区(1,t]内第n位好友查看该日志的总概率;f(t):时区(1,t]内麦兜所有好友查看该日志的总概率之和,也称:时区(1,t]内浏览过该日志的人数;m:麦兜的某个好友a的好友数;nk:麦兜的第n位好友发新鲜事条数;4、基本假设:1.基于问题一的特定条件,假设好友的操作全部用于查看新鲜事上;2.好友上线与查看完新鲜事处于同一时段;3.某一时间段是一个左开右闭区域,例如:第一时段为:(8:00-9:00];4.由于好友上线情况不受其他因素影响,假设好友的上线按时间段平均分布,即时间段T好友上线人数=264/15;5.新鲜事的热门程度与排位(或时效)有关且仅与排位(或时效)有关,即新鲜事被查看的概率是排位(或时效)的单值函数;5、问题的求解:根据问题的分析,由于随着时间段t的变化,该日志在好友新鲜事列表中的排位Nn不同,排位不同则该日志的被查看概率(i)不同,被查看概率不同对查看人数变化f(t)有影响。解决这个问题,我们按以下步骤进行:step1:该日志在第n个好友新鲜事列表中的排位Nn与时间段x之间函数关系的求解:对第n个好友,时间段2刚开始,该日志排位为1,根据:排位变化值=变化速度*时间,得:(Nn-1)=vn*(x-2),即:Nn=vi*(x-2)+1-----------【1】对第n个好友(不妨记为a),一小时内新增新鲜事数vn等于a的好友数m乘以a的每位好友平均每天发新鲜事条数再除以15,题目中没有给出好友a的好友发新鲜事的情况,我们用麦兜264位好友发新鲜事的情况近似代替,得到:vn=m*((2641knk)/264)/15-----【2】将式【2】代入式【1】,得到该日志在第n位好友新鲜事列表中的排位Nn与时间第4页共26页段x之间函数:Nn=0.056*m*(x-2)+1--------【3】式【3】中m为定值,n[1,264],Nn[1,30];当x到达某值时,Nn=30,我们将Nn=30代入式【3】求出时段x的临界值为:Tmax=(30-1)/(0.056*m)+2=(517.86/m)+2,所以T(2,(517.86/m)+2];step2:好友查看该日志的概率(i)与该日志在新鲜事列表排位Nn之间函数关系的求解:新鲜事排位越靠前,此事越新,好友查看该日志的概率越大,此原理与新闻的价值随时间变化原理类似,所以,我们将新闻价值M—时间t函数(函数形式为:价值M=k*t-n,其中k为比例常数,n为常数)等效地应用于概率(i)—排位Nn函数的求解过程中。假设,概率(i)与排位Nn函数关系为:(i)=K1*Nn^(-K2)---------【4】(K1、K2待定)由于在实际中概率(i)是时间点的函数,所以,我们将(i)连续化,对式【4】等号两边同时乘以dNn得:(i)*dNn=K1*Nn^(-K2)*dNn-----【5】;对式【5】在n=1:30上积分得:301(i)*dNn=301dNn*(-K2)Nn^*K1----【6】根据实际意义,式【6】的等号左边积分为1,则式【6】等号的右边=[(K1/(-K2+1))*Nn^(-K2+1)]130=(K1/(-K2+1))*(30^(-K2+1)-1)=1----【7】式【7】为K1与K2的关系式。由式【4】可知,K1的实际意义为:当日志排位n=1时,好友查看该日志的概率。所以若知道n=1时好友查看该日志的概率(1),再根据K1=(1)以及式【7】,目标函数便可确定。为了确定K1,K2的值,我们在交友网站“校内”发起了一次以“看新鲜事你更愿意从第几个(共30个)看起”为题投票活动,共有382个人参加,经过统计,得到结果列表如下:第5页共26页根据上表可确定:K1=(1)=0.1117,将K1的值代入式【7】解得:K2=0.5011=1/1.99621/2,将K1、K2值代入式【4】,得概率n—排位n函数确定为:(i)=K1*Nn^(-K2)=0.1117*Nn^(-1/2)-------【8】为了用实际数据检验式【8】的正确性,我们用MATLAB将上表所确定的图像与式【8】确定的图像作于同一坐标轴上(具体代码见附录A):由上图可以发现,式【8】图像与实际情况图像有较好的吻合度,所以式【8】完全可以用来反映好友查看该日志的概率n与该日志在新鲜事列表排位n之间函数关系。step3:整合step1与step2所得出的结论,以得到第n个好友a在x时间段(点)查看该日志的概率,即:概率—时间函数:排位—时间函数(由式【3】得到):Nn=0.056*m*(x-2)+1(x(2,(517.86/m)+2],m为定值,n[1,264],Nn[1,30]);概率—排位函数(由式【8】得到):新鲜事排位12345678910概率0.11170.07720.06520.05680.04820.04320.04240.03870.03760.0348新鲜事排位11121314151617181920概率0.03570.03460.03010.02540.02820.02090.02510.02580.02970.0248新鲜事排位21222324252627282930概率0.02740.02360.02150.02090.02360.01960.02180.02080.02280.0239第6页共26页(i)=0.1117*Nn^(-1/2);整合以上两式可得第n个好友a查看该日志的概率—时间函数为:p(n,x)=0.1117*(0.056*m*(x-2)+1)^(-1/2)--------【9】(x(2,(517.86/m)+2],m为定值,n[1,264])考虑到x的取值范围,将全域中概率—时间函数表示如下:p(n,x)=]2+(517.86/m)2,(x(-1/2))^1+1)-(x*m*0.056(*0.1117152517.86/m]2,1[x0,---------------------------------------------------【10】step4:时区(1,t]内第n位好友查看该日志的总概率(n,t)随时间t变化函数关系的求解:总概率(n,t)=时区(1,t]中各时段概率之和,实际问题中,概率是时间的连续函数,所以,(n,t)等于时间1到时间T概率对时间的积分。同时,根据式【10】,当152517.86/m]2,1[x,时,p(n,x)=0,所以积分区域只考虑]2+(517.86/m),2(x的情况。其他情况,总概率保持不变。根据以上分析,(n,t)等于如下区域中的变上限函数(不同好友发新鲜事条数kn相当于积分的权重):(n,t)=t1n(-1/2)dx)^11)-(x*m*0.056(*0.1117*k------【11】(]2+(517.86/m)2,(x,m为常数)由式【11】解得:(n,t)=kn*(0.2234/a)*[(a*(t-1)+1)1/2-1]-----------【12】(a=0.056*m=vi;]2+(517.86/m)2,(t)step5:时区(1,T]内麦兜的全部264位好友查看该日志的总概率(n,t)之和f(t)随时间t变化函数关系的求解:式【12】表示时区(1,t]内某一好友查看该日志的总概率(n,t),它的意义是:在这段时区内第n个好友分配1*(n,t)部分来查看该日志。所以,f(t)的意义就是:时区(1,t]内查看该日志的人数。第7页共26页对任取某一时间:t,则,在t时刻总概率之和:f(t)=2641i)t(n,=2641ikn*(0.2234/a)*[1)2)-(t*(a-1]=2641ikn*[-(0.2234/a)+(0.2234/a0.5)*a12-t](相对于t,a1很小)2641ikn*[-(0.2234/a)+(0.2234/a0.5)*2-t]-------------【1-13】(a=0.056*m;]2+(517.86/m)2,(t,m为n有关的常数)式【13】即为所需求的目标函数。step6:目标函数p(t)—t简化形式的确定:分析式【1-13】中对t的约束发现:t的取值范围随着n的不同而不同。所以,当t取某一的定值时,式【1-13】中n的取值达不到264个,此时:P(T)=N1ikn*[-(0.2234/a)+(0.2234/a0.5)*2-t]+264Nikn*[-(0.2234