1基于任务吸引度的众包平台定价方案优化摘要本文对自助式劳务平台的运营模式及运营效果进行了分析,建立多目标规划模型对定价方案进行了优化,并加入任务打包情况对此方案进行了修改,最终应用在新项目的任务定价中。对问题一,该项目任务点分布于四个不同城市。在分析定价规律时,考虑数据的宏观分布情况,分别以各任务点与市中心距离、各任务点处会员分布密度为回归变量,以定价为响应变量,通过回归分析研究变量间的定量关系,确定回归系数后,以会员分布密度与定价的回归方程作为定价规律判定。回归方程表明:定价在宏观上与会员分布密度呈反比例函数关系。其次,在分析任务未完成原因时,分别定义任务的距离吸引度、标价吸引度来量化距离、标价对任务完成情况的影响,将任务未完成原因归结为四方面:标价吸引度低、距离吸引度低、会员分布密度低、其它因素。对问题二,将设计定价方案的过程视为定价方与任务完成方进行博弈的过程,在博弈论的视角下对众包任务定价方案进行了设计。首先定义了定价基准值的概念,来量化任务本身的价值。根据问题一的分析结果,任务未完成原因主要是距离吸引度、标价吸引度过低,因此在定价时,从权衡各任务点距离吸引度、标价吸引度入手,分析了任务完成过程中个体的行为规律。针对任务完成方,分析了会员预定各任务的概率;针对定价方,分析了任务被预定概率、任务被完成概率,其中任务被完成概率与由会员信誉值决定的概率修正因子有关。以任务被完成概率、定价为目标,建立了无约束多目标规划模型,利用遗传算法确定了每个任务的最优定价。最后,比较了所设计方案与原方案下任务完成比例和任务标价,很好地表现出了新方案优化效果。其中新方案的任务完成率为:0.7122,标价总额为:34112.7356。对问题三,要求修改问题二中定价模型,从而导出适用于含任务包的任务定价方案。任务打包后,对定价方案造成的影响主要是:任务包中任务个数与会员预定限额之间的矛盾。首先,在考虑会员预定限额的基础上,确定了任务包的基准价、标价吸引度及距离吸引度。受到物流配送区域划分方法的启发,建立了基于点密度的任务聚类模型对任务进行打包处理。进而类比问题二,建立了含任务包的目标规划模型,确定最优定价,并得出此定价下的任务完成概率。与问题二中任务完成率、标价总额进行对比,结果表明,将任务打包后任务完成率提高。其中打包后的任务完成率为:0.8059,标价总额为:36371.4592。对问题四,针对新项目任务分布高度集中的特点,需要结合实际,对任务包内任务个数进行限制。基于任务个数上限,对问题三打包方案进行了改进,运用改进后的打包方案对任务打包后,通过建立含任务包的目标规划定价模型,确定了每项任务的定价。结果分析表明,在此方案下任务完成率为:0.5042。最后,加入任务开始预定时间指标,对众包任务的下发、预定、完成过程进行仿真分析,作为模型的改进。关键词:会员分布密度回归分析吸引度目标规划任务聚类2一、问题重述1.1问题的背景众包是一种公开面向互联网大众的分布式的问题解决机制,它通过整合计算机和互联网上未知的大众来完成计算机单独难以完成的任务。如今,这种基于移动互联网的自助式劳务众包平台层出不穷,为企业提供各种商业检查和信息搜集,例如:阿里众包、猪八戒等。此种调查方式相比传统的市场调查方式可以大大节省调查成本,而且有效地保证了调查数据真实性,缩短了调查的周期。“拍照赚钱”是移动互联网下的一种自助式劳动众包平台之一。用户通过下载APP,注册成为会员,然后从APP上领取需要拍照的任务(比如上超市去检查某种商品的上架情况),赚取APP对任务所标定的酬金。因此APP成为该平台运行的核心,而APP中的任务定价又是其核心要素。如果定价不合理,有的任务就会无人问津,导致商品检查的失败。1.2问题的数据条件附件一给出一个已结束项目的任务数据,包含了每个任务的位置、定价和完成情况(“1”表示完成,“0”表示未完成);附件二给出会员信息数据,包含了每个会员的位置、信誉值、参考其信誉给出的任务开始预订时间和预订限额,原则上会员信誉越高,越优先开始挑选任务,其配额也就越大;附件三给出一个新的检查项目的任务位置信息。1.3问题的提出(1)研究附件一中项目的任务定价规律,分析部分任务未完成的原因。(2)为附件一中的项目设计新的任务定价方案,并和原方案进行比较。(3)在实际情况下,多个任务因为位置比较集中,导致用户会争相选择,现考虑将这些任务结合在一起打包发布,应如何修改问题二中的定价模型,并分析对最终的任务完成情况的影响。(4)针对附件三中的新项目的任务位置信息设计任务定价方案,并评价该方案的实施效果。二、问题分析2.1问题的总分析本文首先要求我们研究已完成项目的定价规律,分析部分任务未完成的原因,其次针对部分任务未完成的原因,重新设计任务的定价方案,再次在问题二的基础上考虑任务打包的情况,修改问题二的定价模型,并分析对最终的任务完成情况的影响,最后针对新项目的任务位置信息设计任务定价方案,并评价此方案的实施效果。3本文的总体分析流程图如下:图1.问题的总分析2.2具体问题分析2.2.1问题一的分析问题一要求我们研究任务定价规律,分析导致任务未完成的原因。首先,结合附件一中的数据,需要从宏观和微观两个角度分析影响任务定价的因素,并需要对这些因素进行合理量化,可以据此描述定价规律。然后,结合定价规律分析,找到可能影响任务未被完成的原因作为指标,对这些指标进行定性和定量分析,确定影响任务未被完成的主要因素。2.2.2问题二的分析问题二要求我们结合问题一中任务未完成的原因,重新设计定价方案并和问题一的方案进行比较。由于众包平台本身的特点,任务预订情况无法预知,任务分配结果无法预知。因此,若在定价时未充分考虑影响任务完成的各项因素,就会出现诸如附件一中大量任务无法被完成的现象。在设计定价方案时,相当于公司与会员之间的一个博弈过程,只有充分分析并预测会员在选择任务、完成任务之中可能出现的行为概率,才能更好的设计定价方案,保证每个任务以最大的概率完成。首先,要选择合适的指标量化分析定价规律,问题的重点在于如何选取指标并进行合理量化。其次,还需从公司和会员的角度考虑,分析两者之间行为规律,选择使得任务完成比例最高且任务定价最小的点,作为双方利益最大化的平衡点作为任务的最优定价。2.2.3问题三的分析问题三要求我们考虑任务打包情况下的定价模型,并分析对最终任务完成情况的影响。首先,考虑任务打包的角度有很多种,受到快递配送区域划分的启发,可以根据点4密度选取初始聚类中心。其次,需要在问题二定价模型的基础上,考虑如何进行修改,建立含有打包任务的定价模型。最后,通过对比打包前后任务完成率,分析任务打包对任务完成情况的影响。2.2.4问题四的分析问题四要求我们根据新项目的任务的位置设计定价方案,并评价该方案的实施效果。首先应该从附件给出的任务分布数据入手,判断此项目中任务的地域分布,进而设计合理的定价方案,可以考虑对上文所建立模型进行改进,确定适用于此项目的任务定价方案。三、模型假设假设一:附件二中提供的会员位置的GPS信息为会员每次开始完成任务的起始位置。假设二:当会员被分配到每个任务时,其完成该任务的概率只与会员信誉值有关,不考虑除此之外的随机因素。假设三:每位会员均在其规定的预定任务开始时间进行预定。四、符号说明符号说明jw任务j实际定价ijd会员i与任务j距离j会员分布密度j任务标价吸引度ij任务距离吸引度i会员信誉值)(jBP任务j被完成概率任务完成率i点密度注:表中未提及的符号在文中出现时进行说明。5五、模型的建立与求解5.1问题一:定价规律分析及任务未完成原因分析5.1.1数据处理:(1)任务点分布分析借助于智图GeoQ在线地图[1],绘制出任务点分布图,发现任务点分布于广州、佛山、深圳和东莞四个城市。在对任务点进行分类时,为分析定价规律,我们将任务点所属行政区域作为分类依据对任务点进行初步划分。一般具有规则边界的区域可以借助于函数表达式完成对点的分类,而城市边界线是不规则的图形,难以用函数表达式进行描述。为简化问题,我们借助于百度地图的API得到四个城市边界线上点的经纬度。再结合附件一中给出的任务点的经纬度,利用MATLAB绘制出四个城市的边界曲线和任务点的示意图,并将任务点按照所属行政区域进行分类,如图2所示。(2)会员分布情况分析利用附件二的数据,画出所有会员分布图,如图3所示。112112.5113113.5114114.511522.422.622.82323.223.423.623.82424.2经度纬度佛山市深圳市广州市东莞市112112.5113113.5114114.511522.422.622.82323.223.423.623.82424.2经度纬度佛山市深圳市广州市东莞市图2.任务点分布图图3.会员分布图5.1.2定价规律分析分析公司在进行任务定价时,可能考虑的因素,如图4所示:6图4.影响定价的因素其中道路情况,区域人口密度等因素包含很大的随机性,难以进行量化。本文主要从附件一数据入手,分析宏观的定价规律。本文从任务点位置出发,选择使用任务点与市中心距离作为定价准则一;从会员分布出发,选择使用各任务点的会员分布密度作为定价准则二。从这两点来刻画任务定价规律。由于每个城市的任务定价受各个城市的因素影响而不同,但公司在对任务进行定价时采用的标准相同。因此,以下仅以广州市为例建立定价规律模型,其他三个城市类似。(1)影响定价的可能指标一:任务点与市中心的距离四个城市市中心的经纬度见表1:表1.四个城市市中心经纬度城市广州佛山深圳东莞市中心经纬度(113.28,23.12)(113.12,23.03)(114.08,22.07)(113.45,23.02)第j个任务点距离市中心的距离为:jjjjRrsinsincoscoscosarccos0000(1)其中,j和j为任务点j的经度和纬度,0和0为市中心的经纬度。为了分析定价规律,以距市中心距离jr0为自变量,标价jw为因变量画出散点图,如图5:图5.jr0与jw的散点图7通过散点图及拟合效果可以看出,两变量间无明显函数关系,说明距市中心距离与定价之间相关性很弱,即在定价时,考虑的主要因素不是任务点距离市中心的距离。(2)影响定价的可能指标二:会员分布密度由于每个任务点的会员分布密度不同,导致任务的标价不同,故计算某个任务点所在区域内会员的个数时,我们将任务点作为区域的中心。定义任务点的会员分布密度:2rmjj(2)其中jm为以任务点j为中心,r为半径的圆形区域内的会员个数。部分任务点的会员分布密度计算结果见表2:表2.部分任务点的会员分布密度任务号码A0001A0002A0003A0004A0005A0006会员分布密度(人/km2)8.2767.9589.8680.31815.7290.318任务号码A0007A0008A0009A0010A0011A0012会员分布密度(人/km)7.95810.8231.91014.64211.45910.823为了分析定价规律,以密度j为自变量,任务标价jw为因变量,画出散点图,如图6:图6.j与jw的散点图通过散点图分析,选择反比例回归模型作为分析定价与会员密度之间关系的回归模型,如下:cawjj(3)其中a、c为回归系数。通过拟合确定回归系数后,得出回归方程表达式:47.63017.47jjw(4)拟合后方差为0.09403,相关系数为0.7075,说明拟合效果良好。8(3)定价规律判定基于拟合方差及相关系数结果表明,回归模型的显著性强,说明会员分布密度与定价之间存在较强的相关关系,因此以会员分布密度与定价的回归方程作为定价规律判定,即在宏观上,任务定价规律表现为:47.63017.47jjw(5)其中jw为任务点j的标价,j为任务点j处的会员分布密度。回归方程表明:定价在宏观上与会员分布密度呈反比例函数关系。5.1.3确定影响任务完成情况的指标会员在选择任务时,主要考虑两个