杨士强清华大学计算机系教授中国计算机学会多媒体技术专委会主任教育部-微软“媒体与网络”重点实验室主任yangshq@tsinghua.edu.cn,62771978新媒体设备新媒体技术新媒体应用新媒体我们需要◦信息◦丰富的信息◦丰富的多模态信息◦随时随地接受丰富的多模态信息◦随时随地接受、产生并分享丰富的多模态信息传统媒体新媒体新问题信息量激增信息源不可控信息传播模式复杂化新需求精准健康可信掌握用户的个性化需求对网络信息进行监测和引导利用用户之间的web社会关系新技术偏好挖掘语义挖掘结构挖掘用户行为及profile信息挖掘多模态信息语义挖掘Web社会网络结构挖掘数据挖掘数据◦海量◦多模态:视频、图像、文本◦多尺度:空间、时间◦多类型:拓扑结构数据、信息数据挖掘◦分类与聚类挖掘数据的相似性◦关联规则挖掘数据的关联性◦趋势预测挖掘数据的演化规律股票趋势预测关联商品推荐话题级信息语义挖掘DataTargetDataSelectionKnowledgePreprocessedDataPatternsDataMiningInterpretation/EvaluationPreprocessingQuerylanguagewrapperforcorpusCorpusToolsSynonymconcepthierarchyweightcomputationtag...Repository{(doc_id,concept,posn,tags)}querylanguagerulefiltersuserinterfacequerytransformerqueryengine(e.gDBMS)rulesetmorerulefiltersfinalrules(predefinedtemplates)likesItemprofilesRedCirclesTrianglesUserprofilematchrecommendbuildrcs=(∑d2Dsim(c,d)£rds)/(∑d2Dsim(c,d))新数据ABA与B建立好友关系A对信息如何理解A对信息如何评价A对信息如何转发A的评价对B有何影响……A与B之间的信息流A与B的行为行为性信息流新挖掘思路信息信息流行为性信息流——信息内容的语义挖掘——信息传播的结构挖掘及演化规律挖掘——用户偏好挖掘内容理解结构分析行为建模BehavioralInformationFlow(BIF)信息◦信息深度语义挖掘网络结构◦基于话题的网络结构挖掘◦话题驱动的网络结构演化规律挖掘用户行为◦信息传播的用户行为挖掘◦社会团体与个体的互动分析网络结构网络结构信息用户行为信息信息新媒体正在传播什么?话题信息媒体话题语义客观信息主观信息文本信息图像信息视频信息多模态信息语义关联分析信息深度情感挖掘信息话题语义建模多模态信息语义标注多模态异构数据语义归一化表示多模态信息语义关联映射机制基于上下文约束的情感分析时空动态情感信息模型多模态关联话题挖掘时序动态性话题检测传统的信息语义挖掘多停留于单模态同构数据挖掘情感挖掘主要针对信息本身,缺乏上下文约束话题检测多针对静态信息,缺乏对时序动态性的考虑话题是网络结构分析的基础,传统方法剥离开话题而独立研究网络结构,缺乏基于话题的网络结构分析。政治基于话题因子图(TFG)的社会关系模型社会关系亲密度传播算法针对大规模网络结构的Map-reduce分布式实现跟踪可疑人群市场广告投放时尚t时刻t+1时刻网络演化机制分析-新话题检测-话题演化规律挖掘-网络结构演化规律挖掘话题驱动的网络随机演化模型基于话题的网络结构演化计算方法连续性话题演化分析和预测数据库机器学习机器学习数据库数据挖掘关联规则趋势分析信息为什么会被传播?◦两个web用户之间◦两个web用户群体之间?AB?基于用户影响力的信息传播模型基于用户行为统计的影响力分析方法用户行为和信息传播的关联分析信息传播机制分析-话题级用户偏好-用户行为统计-社会属性与信息传播的关联社会团体与个体的互动是信息传播的重要影响因素个体特性分析:-社会从众心理-社会逆反心理-结构洞特点网络环境感知的用户行为建模社团环境下的个体特性分析基于用户日志挖掘和网络结构的学习算法个体对团体的影响团体对个体影响信息信息流行为性信息流•动态性多模态话题检测•基于话题因子图的社会关系模型•话题驱动的网络随机演化模型•面向话题的用户传播模型•社团网络环境感知的用户行为建模以信息科学与社会科学交叉研究为重点以行为性信息流为研究对象对web社会网络三大元素——信息、结构及用户行为进行交叉性研究ConsumptionDiscoveryCreation欢迎交流与合作!yangshq@tsinghua.edu.cn,62771978