會后,我被邀請成為SIGIR 2008資深程序委員會的成員,以及國際期刊《信息檢索》的編委,從一個信息檢索領(lǐng)域的的參與者轉(zhuǎn)變成了的組織者。
第四年:“為引領(lǐng)一個學(xué)派而努力”
微軟公司有一種內(nèi)部導(dǎo)師制度,鼓勵資深員工作為年輕員工的導(dǎo)師,對他們的成長進(jìn)行幫助和指導(dǎo)。我非常幸運(yùn),通過經(jīng)理的引薦,Rakesh Agrawal ,這個數(shù)據(jù)挖掘領(lǐng)域最成功的學(xué)者,在2007年底成為了我的導(dǎo)師。我還清晰地記得在我和Rakesh的面談中,他對研究的看法給了我很大的震撼。比如,“寫文章不是為了當(dāng)下被會議收錄,而是為了要推動這個學(xué)術(shù)方向的發(fā)展,要形成一定的學(xué)派,至少在10年之內(nèi)都產(chǎn)生深遠(yuǎn)的影響”;再比如,“人們總是忘記你的好論文,而銘記著你不好的論文,聲望要用10年去積累但是可以毀于一旦,因此要非常嚴(yán)肅對待自己的每一篇論文,確保質(zhì)量”。
和Rakesh的交流讓我認(rèn)識到有個關(guān)鍵詞還遠(yuǎn)遠(yuǎn)不夠,這個關(guān)鍵詞需要代表著我自己主導(dǎo)的學(xué)派。帶著這種想法,我在經(jīng)理的幫助下對研究課題進(jìn)行了重新的審視,并且對研究過程進(jìn)行了更好的質(zhì)量控制。我和我的合作者們現(xiàn)在正在為了引領(lǐng)“列表級別的排序?qū)W習(xí) (listwise approach to learning to rank)”這一屬于我們自己的學(xué)派而努力著。
可喜的是,我們在這個方向上已經(jīng)取得了階段性的成績。比如,我們在SIGIR 2008上又發(fā)表了3篇相關(guān)的論文,還在ICML 上發(fā)表了2篇關(guān)于“列表級別的排序?qū)W習(xí)”的理論文章,討論了列別級別排序?qū)W習(xí)的統(tǒng)計一致性和泛化性能。除了發(fā)表論文以外,我們還通過在SIGIR上組織Workshop,發(fā)布Benchmark數(shù)據(jù)集,在SIGIR和 WWW等頂級會議上做專題講座的方式推廣“列表級別的排序?qū)W習(xí)”。
我們的研究成果受到了越來越多的關(guān)注,然而我們知道,前方要走的路還很長。不過,在微軟亞洲研究院這個平臺上,我們有信心可以越走越遠(yuǎn),推動排序?qū)W習(xí)領(lǐng)域的進(jìn)步,也為整個SIGIR的發(fā)展做出自己的貢獻(xiàn)。
作者介紹:
劉鐵巖,2003年獲得清華大學(xué)博士學(xué)位,同年加入微軟亞洲研究院,現(xiàn)任信息檢索與挖掘組主管研究員。他的研究興趣包括排序?qū)W習(xí)的理論,算法和系統(tǒng)。他已在國際期刊和會議上發(fā)表了近70篇學(xué)術(shù)論文,擁有近40項專利或申請。他被國際期刊“視覺通信和圖像表達(dá)”授予2004~2006年度最高引用論文獎,被SIGIR2008授予最佳學(xué)生論文獎。他是數(shù)十個國際會議的程序委員會成員及國際期刊編委。他的研究風(fēng)格是結(jié)合信息檢索的應(yīng)用需求,提出全新的研究方向,并給出有效的解決方案和嚴(yán)謹(jǐn)?shù)睦碚摲治觥?/p>