遷延蹉跎,來日無多,二十麗姝,請來吻我,衰草枯楊,青春易過。
—— [英國劇作家]莎士比亞·W
隨著Google成功掀起的瘋狂,沒有人會(huì)反對“Google具有廣泛的社會(huì)意義”的說法。Google改變了網(wǎng)民對網(wǎng)絡(luò)的用法,讓網(wǎng)絡(luò)變得真正實(shí)用起來。那么,Google是如何做到這些的呢?
搜索引擎的前世今生
在搜索引擎領(lǐng)域,Google并不是第一個(gè)吃螃蟹的人。實(shí)際上,計(jì)算機(jī)剛被發(fā)明,專家們就想到了用它來搜索資料。
4 000年來,人類一直沒有放棄編制目錄、目次、索引來加速尋找資料的努力。我國古代的“結(jié)繩記事”可算搜索引擎的鼻祖。
1962年,現(xiàn)代傳播學(xué)的啟蒙大師馬薩爾·麥克爾漢(Marshall McLuhan)在一本新書中第一次使用“世界村”一詞,預(yù)測電子媒體將帶領(lǐng)人類進(jìn)入通訊無障礙的世界,世界也將由此變成一個(gè)村落。1969年12月,網(wǎng)際網(wǎng)絡(luò)誕生,麥克爾漢為我們所描述的世界村正在一步一步變成現(xiàn)實(shí)。
20世紀(jì)70年代初,一門叫“信息檢索”的學(xué)問逐漸興起,人們開始使用數(shù)字化的方式儲(chǔ)存、搜索資料。當(dāng)時(shí)用戶對搜索資料的需求不高,信息檢索也僅處于萌芽狀態(tài),只能整批式地支持儲(chǔ)存、索引,同時(shí)可以集中查詢書目資料,包括書籍的標(biāo)題、作者、主題、關(guān)鍵詞等。這種技術(shù)被廣泛運(yùn)用于圖書館,實(shí)際上,也絕大部分運(yùn)用于圖書館。
時(shí)間到了20世紀(jì)70年代末。一種執(zhí)行分時(shí)操作系統(tǒng)的計(jì)算機(jī)開始出現(xiàn),同時(shí)一種可以查詢內(nèi)文的“全文檢索”技術(shù)也開始為人們所使用?!叭臋z索”逐漸替代“信息檢索”成為一門新學(xué)問。
英國科學(xué)家伯納斯·李(Tim Berners Lee)的努力在很大程度上消除了網(wǎng)絡(luò)發(fā)展的最大障礙。1989年,伯納斯·李發(fā)明萬維網(wǎng)(WWW)并將程序無償捐獻(xiàn)供人使用。于是,現(xiàn)代網(wǎng)絡(luò)開始出現(xiàn)雛形,人們可以通過HTML傳播網(wǎng)頁信息,網(wǎng)絡(luò)上的信息開始成倍增加。
解決了網(wǎng)絡(luò)傳播信息的障礙之后,人們迫切需要將這些浩如煙海的信息如何整理、歸類從而成為便于搜索的目錄。20世紀(jì)90年代初,一大批搜索引擎開始了網(wǎng)頁抓取索引工作。其中大部分起源于學(xué)術(shù)調(diào)研項(xiàng)目,但那時(shí)候只抓取了網(wǎng)頁的標(biāo)題、地址和頭區(qū)信息,無法索引完整的網(wǎng)頁。1994年,華盛頓大學(xué)發(fā)明的WebCrawler成為世界上第一個(gè)能夠索引完整網(wǎng)頁的搜索引擎。后來被美國在線(AOL)收購,并成為 Lycos和InfoSeek的效仿對象。
伯納斯·李發(fā)明萬維網(wǎng)(WWW)6年后,美國數(shù)字設(shè)備公司(Digital Equipment Corporation)的Louis Monier發(fā)明了網(wǎng)絡(luò)蜘蛛(Web spider)軟件,跟此前所有的集中式書目信息系統(tǒng)不同,這種軟件可以自動(dòng)爬行于網(wǎng)頁間擷取網(wǎng)絡(luò)資料。美國數(shù)字設(shè)備公司研究小組把這一嶄新的“網(wǎng)絡(luò)信息系統(tǒng)”命名為AltaVista。