Google公司的第一位雇員克雷格.希爾維斯通俏皮地說:“我希望看到搜索引擎變成《星球大戰(zhàn)》里那些計算機。你跟它們講話,它們就明白你問的是什么?!?/p>
希爾維斯通是Google另類文化的代表人物,說話慢聲細語,不過他可不是在開玩笑。幾乎在每一場關(guān)于搜索的前景的討論中,我們都能聽到搜索有朝一日會變得像人一樣聰明這樣的論調(diào)。當被問起他將如何描述他們公司的搜索服務(wù)時,Ask Jeeves公司的總經(jīng)理保羅.加迪回答道:“就像《星球大戰(zhàn)》里的機器人,我們知道你一切可能的需求?!?/p>
但是我們要如何實現(xiàn)它呢?只有能夠像作為讀者的你理解目前這個句子那樣理解一個請求的搜索工具時,才能夠被稱為智能化搜索。至少人們期待如此。曾獲得麥克阿瑟獎的天才電腦工程師丹尼.希利斯現(xiàn)在正在經(jīng)營咨詢事業(yè)他說:“我的問題并非找到一樣?xùn)|西,而是理解它?!彼又f,只有當搜索引擎能夠像指導(dǎo)學(xué)生的專家一樣理解一個人真正想找什么,并且引導(dǎo)他理解這個東西的時候,才真正解決了搜索理解問題。他總結(jié)道:“搜索顯然是孕育智能的溫床,而智能正在這溫床中發(fā)芽。”
希利斯認為搜索的前景更多地同理解聯(lián)系在一起,而不再是單純找到什么。但是,一臺機器真的可以了解你想要找什么嗎?解答這個問題的一個方法是通過圖靈(Turing)測試,這也許就是計算機處理的最高理想。
何為圖靈測試?它是英國數(shù)學(xué)家阿蘭.圖靈于1950年在一篇開創(chuàng)性的論文中提出的。在這篇文章中,圖靈提出了一個模型,用于測試一臺機器是否智能。學(xué)術(shù)界對這種測試本身及其具體的操作規(guī)程一直爭論不休,不過我們可以了解一下它大致的工作原理。我們先將一臺問答器與一臺機器和一個人分別連接起來。提問者并不知道哪端連著機器,哪端連著人。這名提問者要通過向兩者提問來判斷哪個是機器,哪個是人。如果一臺機器可以騙過提問者,使其相信自己是人類,那么它就通過了圖靈測試,可以被認為是具有智能的。
圖靈曾經(jīng)預(yù)言,到2000年,計算機就能變得足夠聰明,具備鄭重其事地挑戰(zhàn)圖靈測試的實力。人們確實在認真和努力地嘗試通過圖靈測試,但迄今為止,即使是計算機領(lǐng)域最優(yōu)秀、最聰明的人也都沒有成功地通過這個測試。1990年,一個有錢的怪人―休.羅納拿出100萬美元以及一枚金牌來獎勵第一個通過這項測試的計算機。每一年,人工智能公司爭先恐后地來爭奪這筆獎金,然而哪一年也沒有人能把這筆錢帶回家。
出現(xiàn)這種情況的原因非常多,不過一個非常大的可能性是,人們分析這個問題的思路是錯的。目前,參賽者的重點都放在個體機器人的研究上,他們將數(shù)百萬種可能的答案序列編入這臺機器人的程序中,希望它可以為每個可能的問題提供一個合理的答案。這類嘗試中最負盛名的成果是“Cyc”―源于“百科全書”(encyclopedia),發(fā)音很像psych。它是人工智能的先驅(qū)道格.萊納特畢生努力的結(jié)果。Cyc將成千上萬條常識性的原則編入程序,這些原則包括山脈先上升后下降,山谷位于山頭或山脈之間等常識。然后,它在這些簡單的原則基礎(chǔ)之上構(gòu)建一個堅固的模型。Cyc試圖通過這種方式來解決人工智能技術(shù)領(lǐng)域最致命的問題。絲毫不令人驚訝,Cyc設(shè)計的參與者,斯里尼賈.斯里尼瓦桑成了雅虎最早的雇員之一,并幾乎從一開始就管理雅虎的以網(wǎng)頁目錄為基礎(chǔ)的搜索產(chǎn)品。
目前所有單個組織的蠻干都失敗了,而且它們將來成功的希望也非常渺茫,而搜索更有可能被智能化。通過巧妙地利用各種算法,開發(fā)和整合網(wǎng)絡(luò)上業(yè)已存在的智能,也就是由數(shù)以百萬計的程序處理、話語、行為以及鏈接這個構(gòu)成網(wǎng)絡(luò)的基石匯聚而成的人類意圖數(shù)據(jù)庫。歸根結(jié)底,這是Google起步的方式。如果真有一家公司能夠宣稱自己發(fā)明了智能化的搜索引擎,這家公司就是Google。
這個世界需要什么?任何一家能全方位解答好這個問題的公司,可以揭開市場營銷、商業(yè)運作,甚至是人類文明領(lǐng)域的眾多未解之謎。在過去的幾年中,Google似乎就成為了這樣一家公司。