#272011、问题的重述1.1问题的背景自从1984年美国洛杉矶奥运会开始,奥运会就开始攫取着巨大的商业价值,它与电视结盟,在运动员入场仪式、颁奖仪式、热门赛事、金牌榜发布等受关注的时刻发布赞助商广告,它在每个行业中仅挑选一家奥运全球合作伙伴,也就成为了商业社会里企业最重要的展示舞台。不过高昂的赞助费用尤其是宣传费用将绝大多数企业排除在了奥运会之外。但是他们不甘心错过奥运会这个吸引大众眼球的巨大宣传机会,试图寻找新的新闻传播渠道。随着科学技术的发展,数字化不仅仅打碎了时间也将一切碎片化,利用社交网络可以获得更加丰富的比赛信息和网友的评论。这也为更多的企业提供了在奥运期间宣传自己的机会。1.2需要解决的问题一家企业想利用社交网络在奥运会期间进行企业宣传。假设现在奥运会开幕还有100天,一个社交网络的专业推广者平均每天可以新增500个粉丝,普通网络用户平均每天可以新增20个粉丝,些粉丝会把推广者发布的和奥运会相关的所有信息都分享给自己的粉丝们。专业推广者是一种稀缺资源,假设能够找到的专业推广者仅有10人,他们是否愿意为公司工作,取决于公司开出的薪水。由于工资是按日结算,们随时可能转投工资更高的其他公司。兼职推广者可以大量雇到,但他们必须由专业推广者培训后才能上岗工作,一个专业推广者一天最多培训20人,培训将占用专业推广者的工作时间。甲公司现有网络推广资金20万元,想利用网络推广扩大产品的知名度。该公司的一个竞争对手乙公司也同样计划利用奥运期间进行商品的网络推广,他们同样预算了20万元的推广资金,乙公司目前产品的市场占有率是甲公司的1.5倍。问题一:建立合理的数学模型,帮助甲公司制定一份奥运期间的网络推广的资金使用和用人方案,使得产品推广的效果达到最大。问题二:某黑客公司研制了一个能够自动添加粉丝的软件,售价10000元,该软件一天可以自动发出100000个粉丝添加邀请,待添加的目标用户都是从社交网络中按照广度优先的原则搜索到的,但是其中仅有一些粉丝数较少或者经常无目的添加关注的网友愿意接受邀请。请建立数学模型说明这个软件的出现对上一问的用人和资金使用方案是否有影响?如果有影响,该如何对方案进行调整?2、问题的分析2.1问题的难点与分析2.1.1问题一的难点与分析:难点:在计算这个问题时,网络推广的粉丝之间存在重复,粉丝属于普通用户,不会大量发展新的粉丝,所以普通网络用户存在一个粉丝基数,那么就承接了第一阶段的问题,需要先计算出粉丝的重复度,以及普通用户的粉丝基数。再将这些数据带进此问的计算会大大减少误差。在确定了重复度和粉丝基数后,本阶段任务中还需要考虑的难点如下:1、如何安排专业推广员和兼职推广员的数量才能让受众数达到最大。#272022、如何安排专业推广员和兼职推广员的数量才能让推广资金运用的最少。3、在受众数最大与运用推广资金最少这两个矛盾面前用什么样的标准来权衡他们。4、怎样处理乙公司目前产品的市场占有率是甲公司的1.5倍这个条件。分析:对提出的难点1、2、3,我们可以这样处理:受众数最大与运用推广资金最少的矛盾最终是为了使得推广效果最好,那么就定义一个指标,作为推广效果的判定,根据提出的难点1、2、3,可以定义推广资金与受众数的比值最为评价指标,也就是用花在每个粉丝身上的平均推广费用来衡量推广效果。对提出的难点4,乙公司同样预算20万,说明乙公司与甲公司具有相同效力的推广强度,而,乙公司目前的市场占有率是甲公司的1.5倍,也就是说在推广过程中,甲公司每新发展5个粉丝,其中就有3个已经是乙公司的粉丝,需要剔除。对于培训兼职人员的问题在于值不值得培训,培训后能不能带来最终受众的增加,以及如果值得培训,那么在100天的哪个时间培训能使得这100天的受众数最多。可以先只对一个专业推广员在这100天中的安排做讨论讨论怎样的安排能是得最后的效果最好。2.1.2问题二的难点与分析:在这个问题中,需要关注这样一句话:“其中仅有一些粉丝数较少或者经常无目的添加关注的网友愿意接受邀请”,那么这句话涉及到了受邀请粉丝的比例,需要求出一个比例范围,在这个比例范围中,这种软件的出现是不会影响第一问中的结果的,当比例超过某一值时,这种软件的出现将会影响上面问题的结果,需要在目标函数中加入新的目标,调整人员安排。2.2问题的突破点2.2.1问题一的突破点:1、以推广资金与发展的粉丝数的比值最为评价指标,也就是用花在每个粉丝身上的平均推广费用来衡量推广效果。2、先只对一个专业推广者在这100天内作安排,使得效果最好。2.2.1问题二的突破点:1、受邀请粉丝的比例是个不确定数,它决定着最终结果是否受影响。2、受邀请粉丝的比例显然是以区间体现出来的,需要反映什么区间段对元问题有影响,什么区间段对原问题没有影响。3、模型的假设1、假设所有网络普通用户的转发行为都发生在第一次看到该条新闻之后此后看到同一条新闻,用户将不再转发此新闻。2、假设专业推广者的粉丝均为普通网络用户。3、随题数据具有一般的代表性,可以作为对整体预测的依据。4、假设虑粉丝基数不会随时间的变化而有减少的可能。5、假设兼职推广者不会因工资涨幅的影响而跳槽。6、假设每一次的新增粉丝对所接受的消息都会传播给其自己的所有粉丝,并且粉丝的粉丝也会继续传播给自己的粉丝,不停的延续下去,不存在只读不传的用户。#272037、假设市场中只有甲乙两家公司在竞争并占有市场。8、假设培训过的兼职推广者一旦接受培训,就会一直为甲公司工作直至第100天。4、符号说明符号说明:jw从第一天到第j天总共花费的资金jR从第一天到第j天总共产生的知名度jn第j天招聘的专业推广者jm第j天所培训的网络推广者()fx平均在粉丝身上的费用之差pz专专业推广者发展的粉丝总数pz兼兼职推广者发展的粉丝总数5、模型的建立与求解5.1数据处理5.1.1数据分析与优化加权重复度计算:Twitter社交网络的数据在SPSS中打开一共有两列,835541行,第一列有2503个用户名表示有2503个信息的传播者;第二列有465017个用户名,表示有465017的真实丝数,那么第二列重复的粉丝数就有835541-465017=370524。此处,可以考虑直接求解一次信息传播中粉丝的平均重复度:370524===44.35%835541重复粉丝数重复度计算粉丝数但仔细分析数据发现,这2503个传播者所形成的粉丝数差异还是相当大的,如果直接像上述方法求重复度,无法真实反应粉丝数特别大与粉丝数特别小的那些传播者造成的重复度。我们用图直观的感受下这种差异,如下图:图1:部分传播者的粉丝数直观图上面部分的传播者粉丝数能够比较清晰的看出传播者之间还是有蛮大的粉丝数差异的。下面是全部2503个传播者的粉丝数直观图,看这张图的时候很直观的体现应该是#27204大部分的传播者的粉丝数相对都比较大,大致靠近500。图2:所有传播者粉丝数的直观图由此考虑,本文对上述模型进行修正,将2503个传播者按其粉丝数分成若干组,组距定为100,这样就将原来的一张表,分成了由粉丝数大小决定的若干张子表,再有上述方法分别求出每一个粉丝数区间下的重复度。如下表:表1:粉丝数区间数据统计表粉丝数区间传播者数总人数真实粉丝数粉丝重复数重复度0-1001n522199981m1113088681q27.34%101-2002n241350382m19500155382q34.93%201-3003n150374173m20824165933q39.27%301-4004n130462834m25759205244q54.28%401-5005n14586953745m3870083083665q44.92%501以上6n214316m7966356q44.37%总和N=2503835541M46501737052440.83%完成上述表格后,本文以真实粉丝数的比例作为权重来计算加权重复度,这样能够真实反应个部分粉丝的重复比例,更加切合实际。加权重复度模型如下:61iiimqqM即:356124123456++mmmmmmqqqqqqqMMMMMM最终计算得:40.83%q5.2.2普通用户粉丝基数的计算:由于推广这种行为只有专业推广者与兼职推广者才会做,也只有他们才会每天发展大量新的粉丝,那么对于普通用户来说,他们在接受到某一信息时,其一是将这一信息传播给自己的粉丝,再由粉丝传播给粉丝的粉丝,其二就是自己发展的20粉丝,很显然,这里就要计算普通用户的平均粉丝基数了,通过Twitter的数据,可以通过加权平均来计算普通用户的粉丝基数。#27205上面在做重复度的时候已经对数据进行了处理,此处正好可以利用上述处理的数据计算加权平均粉丝基数。26611iiiiiiimmmwnMnM即:222222356124123456mmmmmmwnMnMnMnMnMnM最终计算结果为:334w5.2问题一模型的建立与求解:专业推广者每天发展500个粉丝后,这500个粉丝会将信息传给自己的粉丝,粉丝再往下传给自己的粉丝,不停的延续下去,但是受乙公司市场占有率的影响,这些粉丝中可能就有3/5被乙公司发展去,成为乙公司的粉丝,从而不能成为甲公司的受众。那么,首先我们先来考虑只有一个专业推广者的情况,在只有一个专业推广者的情况下,会有哪些决策呢?很显然只有两种,要么让其自己发展粉丝,要么让其培训兼职推广者来发展粉丝,那么这两种情况下到底应该选择呢,下面来比较下只哟一个专业推广者这两种决策下发展粉丝的效率值,或者说,计算这两种决策最终平均在每个粉丝身上的花费,计算过程如下表:表2:两种方案对比计算表t1tti自己发展粉丝粉丝数250015q22225001205q……z专费用500500……500平均费用1215q222121205q……z专p培训兼职推广者粉丝数270015q22227001205q……z兼费用15001500……平均费用721515q22272151205q……z兼p注:其中:40.83%q2238818850088188nninqqzqq专2238818870088188nninqqzqq兼#2720622318818888188nninzqqqq专p22315008818870088188nninzqqqq兼p由表可以看出,平均在粉丝身上的费用随着时间的延长,数据变的越来越小,第t天当天体现的是让专业推广者自己发展粉丝比让其培训兼职推广者来发展粉丝的效率高,也就是前者平均花在粉丝身上的钱少。经过i天后,得到上表中的表达式,下面就比较这两个表达式的大小:即:比较z专p和z兼p的大小,可以表达为下面的函数式:()pfxzz兼p专很明显,随着时间的推移,两者的平均使用费用虽然都减小了,但是前者始终小于后者,只是两者无限的趋近罢了。此时考虑到资金的限制,只有20万,在第一阶段中提过有2亿的潜在用户,姑且在这认为甲公司目前可以发展的粉丝广度为2亿,此时可以引进平均费用界限差值,即当这2亿人用这20万全部发展到时,平均的费用肯定小于201=21000万元元/人亿人,由此可以用平均费用界限差值来解决上面由于无限趋近而产生的不能确定时间跨度的问题。定义上述()fx,当()fx小于11000,即两者的差小于11000时,认为两种决策在这种时间跨度内的效果相同。通过程序实现,可以计算得到:=6x,也就是说,当专业推广者第一天推广,或者培训的兼职推广者第一天推广后,只要时间跨度大于了6天,就视为两个的效果相同,也就是两种决策后在每个粉丝身上的平均费用相同。通过Mathe