正文

第78節(jié):找到屬于自己的關鍵詞(2)

揭秘微軟亞洲研究院:微軟的夢工場 作者:微軟亞洲研究院


第二年:“掌握擴大戰(zhàn)果的本領”

發(fā)表第一篇文章固然重要,但是如何排除幸運的因素,真正具有持續(xù)發(fā)表SIGIR論文的實力更加重要。這方面,微軟亞洲研究院的國際化平臺給了我很大的幫助。每年,研究院都會吸引大量國外的知名學者來進行訪問交流,我正是借助這樣的機會認識了楊益銘教授。

楊益銘教授是美國卡耐基梅隆大學的教授,是文本分類領域的專家。我有幸在她訪問研究院期間和她合作了的一篇論文。當我把初稿寫出來讓她修改的時候,她來來回回和我討論了5遍“引言”怎么寫。其實她完全可以直接幫我把這一章改好,所花的力氣要少很多。但是楊老師耐心地給我提意見,讓我自己一點一點修改。這個過程使我意識到有了好的技術,還要清晰準確地表達出來,恰到好處地突出自己的貢獻。這對我日后的論文寫作以及給學生改論文都有很大的幫助。至今仍然十分羨慕楊老師的境界:“寫論文其實是一件很享受的事情,寫起來象清泉流水一樣,禁不住要把那么好的研究成果和別人分享”。

和楊老師合作在SIGKDD Explorations 上發(fā)表了一篇關于大規(guī)模文本分類的論文之后,我又開始了獨立準備下一年度SIGIR論文的階段。不過,這次明顯感覺與以往不同了:不再是為了量身定做一篇論文而找題目做,而是圍繞著自己正在做的研究題目寫論文。

這次我準備的兩篇文章一篇講的是基于隨機補的網絡圖排序,另外一篇則是關于文檔檢索的新算法。它們都不是有關經驗比較的論文,也沒有像第一年那樣按照SIGIR的“范式文本”來寫,但是這兩篇文章也都被SIGIR 2006錄用了。

經過這個過程,我感覺自己真的入門了:至少知道什么樣的工作是SIGIR這個領域真正認可的工作,也知道如何寫出具有自己風格的論文來。

第三年:“找到屬于自己的關鍵詞”

入行兩年發(fā)表了3篇SIGIR論文,其實并不是一件容易的事情,因為這個會議競爭非常激烈,每年全球范圍內只收錄幾十篇文章,而且無疑來自美國的論文占了絕大多數(shù)。也因此,我慢慢被一些外面的學者認可,也接觸到了更多的同行朋友。

一次開會的時候,和幾個同行聚在一次聊天,各自介紹自己的研究方向。到我表達的時候,發(fā)現(xiàn)只能用“信息檢索”這樣的大詞來形容,因為自己做過的3篇SIGIR論文相關性并不大,很難找到更貼切的描述。一個朋友說:你要有自己的關鍵詞,比如美國伊利諾斯大學香檳分校的翟老師的關鍵詞就是語言模型,卡內基梅隆的楊老師的關鍵詞就是文本分類,你的關鍵詞是什么?

這個問題給了我很大的觸動。仔細想想,確實知名學者多半都有他們自己的成名之作,有很集中的研究方向。而我目前的狀態(tài)似乎還是有點為了發(fā)論文而發(fā)論文,沒有真正地去規(guī)劃屬于自己的研究方向。如果繼續(xù)這樣下去,可能接下來的幾年里我還會發(fā)表更多的SIGIR論文,但是當再次被別人問及同樣的問題時,我仍然無法避免這種尷尬。所以,我決定要集中火力,做有影響力的,可以作為自己關鍵詞的研究方向。

我和我的經理就此進行了一次長談。談話中,一方面他向我強調了微軟亞洲研究院開放的研究氛圍,對我表示了極大的支持;另一方面,和我分享了“l(fā)ess is more”的道理,并和我一起分析和確定了主攻的研究方向。考慮到我的數(shù)學基礎比較扎實,對機器學習和優(yōu)化理論比較熟悉,同時考慮到不論對信息檢索領域還是對微軟公司的搜索引擎而言,排序(ranking)都是一個核心的問題,我們最終把研究的重點放在了排序學習(learning to rank)上。

在此基礎上,我對自己和實習生的研究方向做了較大的調整:大家的研究方向都圍繞著排序學習展開,比如:排序學習的損失函數(shù)研究,基于多平面的排序學習方法,排序學習中的特征選擇問題,基于排序學習的序列融合等等。我們也再接再厲在SIGIR 2007上發(fā)表了3篇論文。這三篇論文由于都是關于排序學習的,被安排在了同一個分會上宣講。這個分會上總共只有4篇文章,因此我們的表現(xiàn)受到了很大的關注。我也從此有了自己的關鍵詞:排序學習。


上一章目錄下一章

Copyright ? 讀書網 m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號