正文

第76節(jié):微軟對聯(lián)背后的故事(4)

揭秘微軟亞洲研究院:微軟的夢工場 作者:微軟亞洲研究院


來自總部的印度朋友Raman Chandra,他參與馬可波羅計劃到微軟亞洲研究院訪問五個月。他的太太Koty Jane后來也來到北京。他們伉儷在北京度過了難忘的時光。

在此期間,我和我太太還有女兒星美曾經(jīng)在一起有過交流,吃飯,聊天,很投機。在他們離開中國之際,我感覺戀戀不舍,于是就用微軟對聯(lián)把他和他太太的名字輸入,對出一個橫批,作為離別禮物贈送給他們。

上聯(lián):陳睿蒙

下聯(lián):簡凱迪

橫批:展翼鵬程

我還記得張亞勤曾欲送即將退休的微軟雷德蒙研究院前院長凌大任一個禮物。他的秘書要求我寫幾句古雅的中文以表心意,供亞勤參考。我絞盡腦汁,寫不出來。于是求助微軟對聯(lián)。我把凌大任名字嵌入到上聯(lián)里,輸入 “縱橫意氣凌大任”, 結(jié)果系統(tǒng)對出“上下春風(fēng)倚青云”,橫批是“錦繡江山”。

在微軟深圳移動部門和微軟MSN部門同事的支持下,我們的系統(tǒng)很快實現(xiàn)了手機版本。通過短信或者彩信方式可以獲得下聯(lián)和橫批。2006年末,經(jīng)理們到香港參加中文大學(xué)舉行的第一屆微軟亞洲研究院聯(lián)合實驗室會議?;貋碇笤谥楹6虝和A魞扇绽^續(xù)討論公司業(yè)務(wù)。我因為要去探望我在深圳工作的哥哥,就又逗留了一日。李世鵬因為要去臺灣做一個特邀報告,因此也逗留了數(shù)日。晚上的時候,我和李世鵬在蛇口的一家酒吧喝啤酒。酒吧在一個輪船上,坐在船上可看到一輪明月高高地掛在天際。水光澹澹,微風(fēng)習(xí)習(xí)。遠處的香港如同海市蜃樓一般漂浮在海月之間。李世鵬詩興大發(fā)。出上聯(lián):遠看香港朦朧燈景。他把上聯(lián)發(fā)用手機發(fā)短信給對聯(lián)的服務(wù)器,馬上收到了系統(tǒng)回復(fù)的一個短信:“看看您的大作吧,上聯(lián):遠看香港朦朧燈景,下聯(lián):遙望神州寂寞月光。還滿意吧,回復(fù)88看更多內(nèi)容?;貜?fù)8+文字,重新出上聯(lián)?!笔砾i又出上聯(lián):“春花秋月何時了”。系統(tǒng)回復(fù) “暮雨朝云去不還”。這樣一唱一和,不覺夜色已深了。真有“不覺碧山暮,秋云暗幾重”之境。

電腦對聯(lián)成功決

我經(jīng)常在想,為什么這么一個聽起來有點天方夜譚的項目居然獲得了如此大的成功?到底有哪些地方值得今后的工作借鑒呢?

首先我認為,得益于沈向洋的匠心獨運的選題。在此之前,重慶大學(xué)陳廷槐教授曾經(jīng)給我寫過一封信,尋求在計算機自動生成詩詞曲聯(lián)領(lǐng)域的合作。當時為此事跟沈向洋請教過。沈向洋認為這個題目太難了,最關(guān)鍵的一點就是生成的詩詞的意境和表達形式可能是發(fā)散的。很難說什么是對的,什么不對的,因此不能有效地評價,而能夠進行自動評價是關(guān)系到系統(tǒng)可持續(xù)發(fā)展的關(guān)鍵。我們認為對聯(lián)需要首先輸入上聯(lián),然后輸出下聯(lián)。兩者已經(jīng)要么相對,要么相合。在形式上,上聯(lián)、下聯(lián)要符合平仄,字數(shù)、詞數(shù)要相當,而且上下聯(lián)文字使用的規(guī)律要一致。譬如上聯(lián)出現(xiàn)了疊字則下聯(lián)一定要出現(xiàn)疊字,上聯(lián)出現(xiàn)了疊音則下聯(lián)一定要出現(xiàn)疊音。因此在形式上也有衡量的標準。而且,從機器學(xué)習(xí)的角度來講,輸入是上聯(lián)和輸出則是下聯(lián),結(jié)構(gòu)非常清晰,便于學(xué)習(xí)。

我們也討論了項目的重要性。對聯(lián)的研究,看似小題目,卻牽扯大問題。首先,依靠互聯(lián)網(wǎng)和人工智能技術(shù)幫助振興和普及數(shù)千年中華文化,于國于民都是大事。在學(xué)術(shù)研究上,因為涉及到自然語言處理,人工智能、機器翻譯的重要算法的研究,對推動以上學(xué)科領(lǐng)域的發(fā)展也大有價值。

第二,我認為本項目的成功,得益于微軟亞洲研究院的創(chuàng)新文化。微軟研究院歷來鼓勵創(chuàng)新,不怕失敗。因此,這樣一個大膽的項目得到了沈向洋院長和繼任的洪小文院長的大力支持,

第三,這個項目涉及到自然語言處理、網(wǎng)絡(luò)挖掘、網(wǎng)絡(luò)服務(wù)、界面設(shè)計。需要上述種種領(lǐng)域的人才通力配合。微軟研究院各個方面的人才濟濟,而且大家配合默契。良好的組織管理和團隊精神,保證了這個項目的有條不紊地順利進行。同時這個系統(tǒng)也是許多來自不同學(xué)校的實習(xí)同學(xué)一起努力的結(jié)果。在此,特別向參加本項目的所有同事和同學(xué)表示誠摯的謝意。

許多人問我下一步的計劃。我在想,利用微軟對聯(lián)技術(shù),應(yīng)該可以試一試絕句和律詩的自動生成了。但愿能夠做出來,把中華文明發(fā)揚光大。

作者介紹:

周明,從2001年至今,擔(dān)任微軟亞洲研究院自然語言處理組主任。從事自然語言處理有23年歷史。在1999年加入微軟之前,曾任清華大學(xué)計算機系自然語言處理研究組的負責(zé)人。他是中國第一個中英機器翻譯系統(tǒng)CEMT-1的研制者,在日本連續(xù)10年 (1998-2008) 市占率超60%的中—日、日—中機器翻譯產(chǎn)品 “J-Beijing”的發(fā)明人。他領(lǐng)導(dǎo)的自然語言組在中文分詞、跨語言檢索,機器翻譯等國際競爭中均獲得第一名的佳績。目前他擔(dān)任《計算語言學(xué)》、《機器翻譯》、《亞洲自然語言信息處理》等國際學(xué)術(shù)期刊的編委,還曾任世界計算語言學(xué)會議、世界人工智能大會的領(lǐng)域主席,亞洲信息檢索大會程序委員會主席。他的信念是第一要做對的事,第二要用簡單的方法,第三要做認真和執(zhí)著的人。他業(yè)余時間喜歡讀書,欣賞唐詩、宋詞,當然還有對聯(lián)。


上一章目錄下一章

Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號