智能科学技术导论第08讲情思表达主讲:周昌乐教授福建省仿脑智能系统重点实验室厦门大学智能科学与技术系周昌乐教授教学课件dozero@xmu.edu.cn导语《诗经·大序》(毛诗序)中说:“情动于中而形于言,言之不足,故嗟叹之;嗟叹之不足,故咏歌之;咏歌之不足,不知手之舞之,足之蹈之也”。推而广之,一切文学艺术,无不都是我们思想情感的展现。那么对于这样思想情感展现的心智能力,机器也能够拥有吗?本讲中,我们将主要围绕着诗文中的情思表达主题,来探讨机器开展诗文创作的可能性,以及其中所将面临的困难所在。值得强调的是,尽管是探索性的,但迄今为止,也只有人工智能的研究者们,才能将科学技术与人文艺术有机地结合在一起。福建省仿脑智能系统重点实验室3第8.1节诗文创作人类区别于其它生灵的昀显著特点之一,恐怕无过于人类的“能说会道”了。“能说”是指人类言说的能产性,能够用有限的法则来产生无限话语的能力。我们通过发音器官可以“滔滔不绝”、“喋喋不休”、“连篇累牍”地言说,就是对这种能力的形容。正象海德格尔在“语言”一文中(见《诗·语言·思》第165页)明白道出的那样:“人言说,我们在清醒时言说,我们梦乡里言说。我们总是言说。”我们似乎与生俱来就拥有无限制言说的潜在能力。福建省仿脑智能系统重点实验室4第8.1节诗文创作当然,仅仅是“能说”还不能真正体现出人类的语言天赋,人类智慧在语言能力方面更为重要的一面是“会道”。“语妙绝伦”、“妙语连篇”、“辞丰意雄”、“花言巧语”、“辞微旨远”、“言简意赅”等无不是揭示了我们言说的艺术性、精巧性和复杂性。也就是说,我们不但能说,而且还很会说。我国战国时代的思想家子思在《中庸》中是这样描述我们的语言能力的:“故君子语大,天下莫能载焉;语小,天下莫能破焉。”而德国诗人海涅对语言功能更是推崇倍至,说:“语言可以把死人从墓中叫出来,也能把活人埋入地下;语言可以把侏儒变为巨人,也能将巨人彻底打倒。”可谓把这种“会道”性给刻画到了极致。福建省仿脑智能系统重点实验室5第8.1节诗文创作那么,面对人类语言能力的这样“能说会道”,机器又能做到些什么呢?凭着机器的计算速度,要做到“能说”似乎并不难,光是利用计算理论的递归可枚举性,我们就可以轻而易举地让机器“滔滔不绝”地言说起来。但要让机器在这“滔滔不绝”之中,避免“语无伦次”、“语焉不详”及“言语无味”而做到“会道”,却是一件十分棘手的事情。为了实际上让我们看一看机器在言说之上到底能做些什么、做到什么程度,让我们从具体的机器诗文实例说起。福建省仿脑智能系统重点实验室6第8.1节诗文创作基于一定的规则,通过随机性填词,机器很容易“自主”地产生语句或句群,比如:(1)喧嚣的旋转的雾蒙蒙的旋转的海洋沉睡着。(2)一支只会笨拙地大笑的雄铅笔定会嘎嘎大叫。程序必定不会总是在记忆里把姑娘嘎嘣嘎嘣地嚼吧?那个吐痰时笨了吧唧的十位数毛病可能会坍塌。肯定把一个突如其来的男人认作亲戚的那位蛋糕必然会一个劲儿地甩掉。(3)虽然人道主义者们获得了一项诺贝尔奖,然而除此之外,农奴也获得了。你可以在《哥德尔、艾舍尔、巴赫》里找到许多这类机器说的“话”。福建省仿脑智能系统重点实验室7第8.1节诗文创作很明显,上面的这些语句或句群在句法形式上还是“通顺”的,因为机器是严格按规则产生语句的,但在表达上却缺乏意义,让人感到不是不知所云,就是语焉不详的印象,就好象是机器患有Wernicke失语症(缺乏理解性的流利言说症)一样。不过,如果人们用不带偏见的眼光去挑选机器生成的语话,你还别说,有时还真能找出那么一二句佳句来。福建省仿脑智能系统重点实验室8第8.1节诗文创作比如机器创作的如下一则诗歌实例就很象一首地道的日本俳句:每一个清澈的池塘一只鸟俯看着挂霜的冷杉荒野蓝色的月亮你还别说,“三分诗七分读”,很有一点朱自清“荷塘月色”的意境。再如,下面一首打油诗据说是美国汉普群学院计算机系的一位本科生D·里茨在毕业论文中编制的程序“自由”创作的。除了意境和情感稍显欠缺外,基本上还合辙押韵,酷似人写的。福建省仿脑智能系统重点实验室9第8.1节诗文创作机器创作的打油诗曾有一个来自斯特劳斯的废物在那玫瑰花上建起字节小屋编造一个字节是一个头的谎言然后接通那个棚子的电源斑鸠从人造革鼻子里飞出曾有一个来自内德的水手在那头上跑着一只猎狗将一个词转页刊登然后激起一阵笑声试图越过这个古怪的雪橇溜走福建省仿脑智能系统重点实验室10第8.1节诗文创作或许,由于人的主动解读性,诗歌较之散文更易“鱼目混珠”些,因为对于言语能力而言,重要的可能更在于立意谋篇。那么机器的立意谋篇能力又如何呢?请看这里一篇机器创作的“公案”:一个小的年轻禅师想要一个小的白色异形钵。“我们怎样才能不经过学习就能知道和理解呢?”这个年轻禅师问一个大的困惑着的禅师。这个困惑着的禅师带着一个小的红色的石钵从一座褐色的硬山走向一座白色的软山。这个困惑着的禅师看到了一个红色的软棚屋。这个困惑着的禅师想要这个棚屋。“菩提达摩为何要来中国?”这个困惑着的禅师问一个大的顿悟了的弟子。“桃子是大的”,这个弟子回答这个困惑着的禅师。“我们怎样才能不经过学习就能知道和理解呢?”这个困惑着的禅师问一个大的年老的禅师。这个年老的禅师来自一个白色的石G0025。这个年老的禅师消失了。福建省仿脑智能系统重点实验室11第8.1节诗文创作上面的“公案”文理通顺是无话可说的,但尽管用了一些禅宗的术语,也有机锋问答以及一些反事实的陈述,可到底有几分象真正的禅宗公案呢?试与真的公案比较:赵州行脚时参师(指临济义玄),遇师洗脚次。州便问:“如何是祖师西来意?”师云:“恰值老僧洗脚。”州近前作听势。师云:“更要第二杓恶水泼在。”州便下去。真公案与假“公案”同样都有答非所问,同样也有机锋对答,但其底蕴却相差甚远。福建省仿脑智能系统重点实验室12第8.1节诗文创作我相信,不用说机器们,即使是和尚们参究这机器的“公案”也是绝对开不了悟的,因为在机器“装模作样”的“公案”言说之下,并没有那个“无关文字”的第一义的。或许机器诗文难就难在创意之上,无法拥有自己一致连贯的意义要表达,没有自己的思想和情感要抒发。但如果你读到的是这样的一道机器“抒情诗”,你又会作何感想呢?福建省仿脑智能系统重点实验室13第8.1节诗文创作Limphopecallsatmoon;Stonecallslovewhilelimpstarkolngingbecomesstrange;buticytreepusheswithdespair;Brightnessbecomesmisty;Stonestandssilkenasstarksilkstandsbrightfrom;Silkengreensunnightthoughbankbecomesbright;butstrangebrightnessstandsNmp;thoughlovestandsmistywithlimpgreencrystal;butlovecallsslowlyatearthstrangewithlonging;Firebecomessilkenwhilehopecaressesslowlyasmisty;mistysnow.中文大意为:残心犹望月,顽石亦有情。冰枝挥悲意,光芒变朦胧。石似青似立,青丝照夜明。岸前华兴照,残人站当中。爱本多傍徨,成败在心诚。心若柔似雪,烈火变柔情。福建省仿脑智能系统重点实验室14第8.1节诗文创作在我国,自上个世纪80年代始,就有不少个人和研究机构陆续开展了汉语诗歌的自动创作研究。在1984年我国首届青少年计算机程序设计竞赛中,上海育才中学14岁的学生梁建章就成功编制了“计算机诗词创作”程序。该程序共收入500多个词汇,以山水云松为主题,平均不到30秒钟就能创作一首五言绝句诗,可谓高产“诗人”。下面题为“云松”的诗就是该程序产生的:銮仙玉骨寒,松虬雪友繁。大千收眼底,斯调不同凡。很有古诗韵味。福建省仿脑智能系统重点实验室15第8.1节诗文创作另外,辽宁省建设银行工程师艾群也有电脑创作的诗作“发表”,其中的“北方的思念”和“乡情”尤为让人叫绝。“北方的思念”为:雨巷盼望孤独/故乡的依稀揉白了/模糊的坐标/全是橡树的风景思念你/心的座/甚至去了/美丽的春色,重回/北方的思念。而“乡情”全诗如下:夜空长长/日历交融了墙,/久远的威风上/人迷失在充满生机的故乡。以看到的背影拒绝回声,/唇急给于心中,/自无束的情里/拂过无声的落叶。你还别说,真有那么一点思乡情浓的味儿。福建省仿脑智能系统重点实验室16第8.1节诗文创作题目叫“无题”。第一句:在思维的____里(中),“__”填场所的词第二句:我____着____……“__”填感觉的动词,“__”填感觉的名词第三句:一句大白话第四句:也许__________……有所暗示将来句。无题在思维的停车场里,在夜色的芬芳中我拥抱着你的声音……晚上7:30我会坐375路离开,也许明天会有个更好的约会……朦胧诗速成妙法福建省仿脑智能系统重点实验室17第8.1节诗文创作很明显,上述的机器诗歌之所以有那么一点诗情画意,当然是源于人们的选择和解读,所谓“三分诗七分读”。这一点,从上面的朦胧诗速成法不难看出。从这个意义上讲,机器创作诗歌,困难不在于组合搭配出好的诗句,而是如何在创作的诗句中进行评判,使得机器总能创作出好的诗句,从而真正保证机器产生诗歌的质量。福建省仿脑智能系统重点实验室18第8.1节诗文创作为此,我们采用了遗传算法的计算策略,并加上必要的一些改进,比如引入网状关系词库、词对映象结构等数据基。结果,基于诗歌语句群体上,经过一段时间的运行,就可以创作如下质量(统计意义上)更好的诗歌。(1)清明传语愁送客,两岸千里欲渡河。茫茫春光催碧草,晓露琼楼阑珊色。(2)白沙平舟夜涛声,春日晓露路相逢。朱楼寒雨离歌泪,不堪肠断雨乘风。可以看出,虽然诗歌句子与句子之间的意思仍然改进不大,但是词语之间的搭配关系有了明显的改进。福建省仿脑智能系统重点实验室19第8.1节诗文创作我们认为上述较好结果的产生主要是因为采用了改进的遗传算法,增加了词语搭配之间的规律性。如果在此基础上再考虑句子之间语义搭配问题,那么,句子之间的意义关联性也同样可以得到改进。关键是要找到句子意义关联描述的适当方法,这正是需要进一步研究解决的问题。为此,在全面构建的全宋词语料库的基础上了,加上风格、情感、句法与语义等全方位因素的考虑,我们又开发出了一个产生较大影响的宋词自动创作系统。福建省仿脑智能系统重点实验室20第8.1节诗文创作对于我们开发的系统,当输入关键词“菊”和词牌“清平乐”,机器创作宋词例子如下:相逢缥缈,窗外又拂晓。长忆清弦弄浅笑,只恨人间花少。黄菊不待清尊,相思飘落无痕。风雨重阳又过,登高多少黄昏。当输入关键词“饮酒”和词牌“西江月”,系统创作宋词的例子则是:饮酒开怀酣畅,洞箫笑语尊前。欲看尽岁岁年年,悠然轻云一片。赏美景开新酿,人生堪笑欢颜。故人何处向天边,醉里时光渐渐。应该说,效果都还是相当不错的。福建省仿脑智能系统重点实验室21第8.1节诗文创作或许读者会问,如何能够断定上述机器创作的作品效果是好的呢?为了说明这一点,可以将人类的诗歌与机器的诗歌混在一起让人们去判别哪一首是人类作的,哪一首又是机器作的?如果都能正确判别,那么说明机器诗歌难以鱼目混珠。反之,如果在很大的概率上,人们都会判别错误,那么就说明机器诗歌可以达到乱真的地步。同意吗?下面我们就请诸位来做这样一次评判,看看我们系统创作的宋词到底能否到达乱真的地步?福建省仿脑智能系统重点实验室22第8.1节诗文创作如下两首宋词是主题一样的《点绛唇》,读者能判断出哪首是机器作的吗?点绛唇•佳人人静风清,兰心蕙性盼如许。夜寒疏雨,临水闻娇语。佳人多情,千里独回首。别离后,泪痕衣袖,惜梦回依旧。点绛唇•念佳人娇颜似花,佳期如梦天一方。人海茫茫,何处诉衷肠。一夜东风,红杏满庭芳!思欲狂?巾短情长,无语寄斜阳。还像会事吧?情理交