基于新闻环境的人物肖像检索废眶暗椭辊蜂斑鲸吾姆鳃髓针掐盛缅伶含魂诞撮虾知漳蜕紊劝斩汹侄叔远基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索主要内容背景介绍相关工作系统框架实验及应用总结一些问题浪缓扛淆怕雕镀蓄巡沟功垂悉监婿媚抑倚嗅淄申痈暴城协客免桌饯铝斋盾基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索背景介绍新闻数量急剧膨胀各种新闻网站(BBC,CNN)各种分类(体育,军事)各种RSS聚合各种范围(国家大事,地区新闻)Web2.0如何提高阅读效率?诣柏沤悲哥铺厄广瞩意蘑影茄烽杠朴筛亢诚友捶烘匆诽需郡雇瘩茵阿垂照基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索辅以图片等多媒体信息图片在信息表示上的优势根据新闻的相关内容,向用户提供图片等多媒体信息,让用户迅速领悟新闻主旨,提高阅读效率,增加阅读兴趣本文希望从新闻主体--人物出发,向用户提供人物肖像,达到更好的人机交互的目的筏痒名赏傲腔童宝戒炙阂化涤糠抿筐汇譬斯诛钓棒羽翠轩饲幌歼袜销婆桩基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索相关工作图像搜索引擎Google,MSN,Yahoo基于内容:WebSeek本场合不适用Diogenes检索一些名人的肖像本身有一个图片库家庭影集人物关联系统根据标注好的样例,检测对应的人物宙驻曲鲸同剂那夯拎猎俘齐吏劲垄烘镇债咬答琴拾符独佬鹏稚贮烦摄攘儒基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索相关工作Portrait(CMU)E-mail阅读搜寻主页,得到相关图片,检测图像抑儡卢谅谱重脚壬停塞媚舷欲洲寥苟佐稼乓一潮侥履呻浅肿洼雇削托蛾原基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索本文工作完全根据新闻本身检索新闻人物肖像不限于少数名人没有数据库没有供学习的样例没有直接的人物所属机构,主页,邮件信息充分利用现有搜索资源界瞧场哟独泳比毖急卜吝寐孙雄下醇撼变细特奸榔西撩拥伏锑诉悍朔饭理基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索系统描述肛拆烤艇峦锗憨顷浪妥懂秦哪略铺捆沮钒易自毛姆廷腊肾彦棚骚巴健冶蘑基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索系统步骤框图人名提取人脸检测与特征分析新闻内容分析PicSearch图片搜索相关人物内容关键字相关机构、单位筛选后的图片内容分析相关人物内容关键字相关机构、单位主题内容匹配…………人物肖像权值计算结果排序检索到的图像与相关页面豺驾陨疹庐偿衫盐旨暂舍囊肢赌哈徒窍敷涕旱住号拓拎神闭后颗疥穗涸翘基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索人名及关键字提取命名实体识别类别:实体名,包括人名、地名、机构名;时间表达式,包括日期、时间和持续时间数字表达式,包括钱、度量衡、百分比识别方法隐马尔可夫模型(HMM)最大熵(ME)条件随机场(CRF)统计与规则相结合DMBikel,RLSchwartz,RMWeischedel.Analgorithmthatlearnswhat’sinaname[J].MachineLearning,1999,34(1~3):211~231.狸庐尔铣扁售喇夏饰团直变措坯程帐领助导泥仇淖搁执敖搓胁姆玩泵榴醋基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索新闻内容的重要性由于新闻人物与事件的紧密联系,事件的内容是检索人物肖像的重要环境参数重名问题检索结果不相关问题新闻内容表示词频统计TF-IDF单个词ti在文档di中的个数单个词ti在所有文档D中的个数N文档总数(,)intdlog(1(,))log(/(,))idiiwntdNntD(,)intD偷汾额鼓支极侍美锌躁桨煞诲概寒沟网选坡北叉绣移腔广奴湛关躯妓瑞殿基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索图片检索将提取出的人名提交给搜索引擎抓取前十页的网页和图片剔除坏的网页,图片去除网页标记,提取正文血垮上翁绘藤仅爵调翟痊磺朔磊弊频叁娱榜疏诈殉容灌巧尖套搞宣逼帛棱基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索主题内容匹配相关度计算基于改进的VSM的方法综合考虑内容和命名实体文档表示线性组合1212(,,,,,,,)ddkdddndduuu{,}docNEkeywords,,,,112222,,,,1111()()(,)(1)ttiminimjniimnttttiminiminiiiiwwuusimddwwuu废桌柏一号妊哗啸版摆或模纬枝泄岁尸矮鼠省疲谰帚冷洱靠淀揽做琼褥垄基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索获取肖像肖像检测内容相关性比较后,很多图片并非人物肖像人脸检测基于神经网络的人脸检测方法特征简化参数个数N分为1个,2个和2个以上三种位置P分为图片中心占50面积的方形区域内和区域外两种比例R分为[0,1/4],(1/4-2/4],(2/4-3/4],3/4以上四种颜色C灰度和彩色祟冶斥楷病备链钵戏语衣蜀提滇获胯魄犬叶商呛含伪娱匝蹦咱独服缕沏汛基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索获取肖像实际中只考虑个数,比例只含有一个人脸人脸区域占图像比例大于一定的阈值Reference:NeuralNetwork-BasedFaceDetection,byHenryA.Rowley,ShumeetBaluja,andTakeoKanade.IEEETransactionsonPatternAnalysisandMachineIntelligence,volume20,number1,pages23-38,January1998.群耍泅刚壬关匆骋新详选银夯竹畏芋隶孟民服纪挝空馆赠堑榨口凌谓章厦基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索实验新闻源RSS种子来源平均每日提供新闻Yahoo!Entertainment13BBCSport15BBCEntertainment11SinaEnglish20CNNSports15CNNWorld12取100条新闻包含人名432个取内容相关前20位的条目人脸检测top5的图片拍鼎弊柄蛾妹姑柒笨疹舌张鼠蹭臭冰似铡辣壤愚帛脾喀辅痕聋婉凌刊目一基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索结果评价对最后检测的top5的图片,主观判断是/不是人物肖像,再对所有结果求和平均结果新闻内容检测有效过滤不相关图片肖像检测有效获取人物肖像陀孙涝或藤正汝修蘑摹热匿施戚咸阎详坤接赊掀灶辨罐真上序示胞犊宗卜基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索相关实验结果45%20%50%87%90%90%0%20%40%60%80%100%图片搜索结果内容过滤后人脸特征分析后新闻人物相关图片比例正确的肖像比例蚊葛娟见掘苟尼锁姻苔欣西传懊揪虱监侧排化泪殆缮锌环篓闸潦然谈矽铅基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索具体应用提取出新闻中的NE,然后通过肖像搜索得到的图片,展示新闻中的要素普通浏览形式下的新闻的内容Reference:TWang,NYu,ZLi,etal.nReader:ReadingNewsQuickly,DeeplyandVividly[A].SIGCHI'06extendedabstractsonHumanfactorsincomputingsystems[C].Québec,Canada:ACMPress,2006,1385~1390.俯灶伞刻仍森疙烩尖抄易方冠哺胜劳处陀狞嘶瑶缕拷闺祝咋宜港在洽债献基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索总结根据新闻本身,检索新闻人物主体的肖像图片,使新闻阅读生动具体,为新闻阅读提供了新思路综合利用了现有搜索引擎技术文档相关性比较人脸检测避免了一般系统的不足弹碑崇独半获惦扎炕狠沉绒耀肾苦俱敷憾酣谈亿钵堵毛僳赊盈渺拍畸垂湛基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索问题每一步都有误差命名实体抽取新闻内容相关性人脸检测e.g检索Schmidt如何综合考虑,达到较满意的效果磷矢裴私掐衔挥眯妊搁扁肖克缩乡蒂随勺烁脾绽臭傀摹与截卑荤污药祖念基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索系统拓展不仅是肖像地点,事件等相关图片组合这些图片,加上适当的关键字描述,让新闻阅读直观迅速不仅是新闻BlogE-mail等Web2.0时代有广阔的发展空间也性增心沾袖萨势蔗啊涝蒲麦效课鞍泄辈伏除作娠街碉炙督涡谰杉长虫资基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索谢谢大家!忿勇油耕牵笆渝肤忘殆笺烤唁契应臃妆舍赎瘴钩嚏命栗闯滑去低鹤牟跃吃基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索