正文

1.4 神話的煉成(1)

搜主義:Google持續(xù)成長(zhǎng)的秘密 作者:張遠(yuǎn)昌


遷延蹉跎,來(lái)日無(wú)多,二十麗姝,請(qǐng)來(lái)吻我,衰草枯楊,青春易過(guò)。

—— [英國(guó)劇作家]莎士比亞·W

隨著Google成功掀起的瘋狂,沒(méi)有人會(huì)反對(duì)“Google具有廣泛的社會(huì)意義”的說(shuō)法。Google改變了網(wǎng)民對(duì)網(wǎng)絡(luò)的用法,讓網(wǎng)絡(luò)變得真正實(shí)用起來(lái)。那么,Google是如何做到這些的呢?

搜索引擎的前世今生

在搜索引擎領(lǐng)域,Google并不是第一個(gè)吃螃蟹的人。實(shí)際上,計(jì)算機(jī)剛被發(fā)明,專(zhuān)家們就想到了用它來(lái)搜索資料。

4 000年來(lái),人類(lèi)一直沒(méi)有放棄編制目錄、目次、索引來(lái)加速尋找資料的努力。我國(guó)古代的“結(jié)繩記事”可算搜索引擎的鼻祖。

1962年,現(xiàn)代傳播學(xué)的啟蒙大師馬薩爾·麥克爾漢(Marshall McLuhan)在一本新書(shū)中第一次使用“世界村”一詞,預(yù)測(cè)電子媒體將帶領(lǐng)人類(lèi)進(jìn)入通訊無(wú)障礙的世界,世界也將由此變成一個(gè)村落。1969年12月,網(wǎng)際網(wǎng)絡(luò)誕生,麥克爾漢為我們所描述的世界村正在一步一步變成現(xiàn)實(shí)。

20世紀(jì)70年代初,一門(mén)叫“信息檢索”的學(xué)問(wèn)逐漸興起,人們開(kāi)始使用數(shù)字化的方式儲(chǔ)存、搜索資料。當(dāng)時(shí)用戶對(duì)搜索資料的需求不高,信息檢索也僅處于萌芽狀態(tài),只能整批式地支持儲(chǔ)存、索引,同時(shí)可以集中查詢書(shū)目資料,包括書(shū)籍的標(biāo)題、作者、主題、關(guān)鍵詞等。這種技術(shù)被廣泛運(yùn)用于圖書(shū)館,實(shí)際上,也絕大部分運(yùn)用于圖書(shū)館。

時(shí)間到了20世紀(jì)70年代末。一種執(zhí)行分時(shí)操作系統(tǒng)的計(jì)算機(jī)開(kāi)始出現(xiàn),同時(shí)一種可以查詢內(nèi)文的“全文檢索”技術(shù)也開(kāi)始為人們所使用?!叭臋z索”逐漸替代“信息檢索”成為一門(mén)新學(xué)問(wèn)。

英國(guó)科學(xué)家伯納斯·李(Tim Berners Lee)的努力在很大程度上消除了網(wǎng)絡(luò)發(fā)展的最大障礙。1989年,伯納斯·李發(fā)明萬(wàn)維網(wǎng)(WWW)并將程序無(wú)償捐獻(xiàn)供人使用。于是,現(xiàn)代網(wǎng)絡(luò)開(kāi)始出現(xiàn)雛形,人們可以通過(guò)HTML傳播網(wǎng)頁(yè)信息,網(wǎng)絡(luò)上的信息開(kāi)始成倍增加。

解決了網(wǎng)絡(luò)傳播信息的障礙之后,人們迫切需要將這些浩如煙海的信息如何整理、歸類(lèi)從而成為便于搜索的目錄。20世紀(jì)90年代初,一大批搜索引擎開(kāi)始了網(wǎng)頁(yè)抓取索引工作。其中大部分起源于學(xué)術(shù)調(diào)研項(xiàng)目,但那時(shí)候只抓取了網(wǎng)頁(yè)的標(biāo)題、地址和頭區(qū)信息,無(wú)法索引完整的網(wǎng)頁(yè)。1994年,華盛頓大學(xué)發(fā)明的WebCrawler成為世界上第一個(gè)能夠索引完整網(wǎng)頁(yè)的搜索引擎。后來(lái)被美國(guó)在線(AOL)收購(gòu),并成為 Lycos和InfoSeek的效仿對(duì)象。

伯納斯·李發(fā)明萬(wàn)維網(wǎng)(WWW)6年后,美國(guó)數(shù)字設(shè)備公司(Digital Equipment Corporation)的Louis Monier發(fā)明了網(wǎng)絡(luò)蜘蛛(Web spider)軟件,跟此前所有的集中式書(shū)目信息系統(tǒng)不同,這種軟件可以自動(dòng)爬行于網(wǎng)頁(yè)間擷取網(wǎng)絡(luò)資料。美國(guó)數(shù)字設(shè)備公司研究小組把這一嶄新的“網(wǎng)絡(luò)信息系統(tǒng)”命名為AltaVista。


上一章目錄下一章

Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)