自然语言处理与人工智能白硕2015年3月,北京“善解人意”是智能的必要条件图灵测试中文屋子分析哲学语言相对论各种推理机、智能机各种大脑各种搜索、数据库各种助手、机器人拿语言说事儿拿语言干事儿语言是怎么回事儿?“人意”隐藏在符号怪阵背后语音文字电子输入词法句法语义语用浅层深层“浅层”语言知识的“深度”学习仍然改变不了其“浅层”特性“深层”语言知识长什么样,至今仍众说纷纭,遑论学习了合称“语法”“深层”的作用链波及“浅层”,是解决浅层疑难问题的最终手段“浅层”见效快,门槛低,可以摆脱语言学家自己玩“音乐会说话”“人意”依语言的不同难度各异打扫卫生鸡不吃了王冕死了父亲这本书的出版一种人谁都看不上这种亏我们十年前就吃过学语言?语言学?三部曲•无规律,习惯用法•有规律,母语特殊•有规律,本质普适“傻子”与“疯子”遇到规则不能涵盖的情形表现糟糕不靠谱也敢拿出来遭遇资源建设和数据获取双重瓶颈油水不多了规则统计深层浅层傻疯√厚此薄彼理、工、农、医各类专家在领域知识建模时被待若上宾语言学专家在领域知识建模时被“粗暴地无视”浅层方法还在吃着“规模红利”深层方法还没找到“抄底利器”语言学领域的大量珍宝竟然无人能识,被“买椟还珠”两点肯定、两点建议语言边界问题是一个非良定义问题,统计学习领域知识是正解符号根基是认识意义的关键,把符号根基建立在网络空间是正解建议关注“领域知识长什么样”。它比“领域知识是什么”更根本,决定学习的上限建议关注递归现象。它是语言的本质,也是智能推理的本质,递归处理能力决定NLP未来个人研究兴趣(NLP部分)PPT(部分分析树)——语言学知识长什么样RNN(反馈神经网)——语言学知识自动获取PR&R(模式推理与检索)——自然语言作为知识表示个人研究兴趣(语言学部分)结构强制与专名识别汉语中的话题化现象X-bar理论用于汉语语言/思维vs.NLP/AI:三个“之一”……知识领域之一,其知识的获取有共性门面之一,自然的交互界面窗口之一,借以观察内部知识表示和推理语言/思维vs.NLP/AI:两个“不指望”不指望AI的天上掉下NLP的馅饼不指望NLP的突破带来AI的飞跃NLP的唯一可靠的进步途径就是深入了解语言NLP与各种“大脑”NLP是各种“大脑”外显能力的基石寻章摘句型retrieval老调新谈型paraphrase死记硬算型brutal分析理解型analyticNLP挑战在这里某投资者持有10000股中国平安股票,如果该投资者希望为手中持股建立保险策略组合,他应该如何操作?(中国平安期权合约单位为1000)A.买入10张中国平安认购期权C.买入10张中国平安认沽期权B.卖出10张中国平安认购期权D.卖出10张中国平安认沽期权工作方式游侠方式:小团队方式:大团队方式:核心技术、顶层建模资源建设、根基对接、限定领域应用大规模标注与训练、非限定领域应用、智能综合集成很超前很轻灵很震撼结语形势•NLP核心关键问题没有解决•NLP应用取得进展并不偶然方向•突破的钥匙握在语言学家手中•递归嵌套、远距相关是试金石机会•XX大脑并不取代游侠模式•抄底仍有机会关联•NLP与AI并无强关联•NLP可为AI做些微贡献互动时间