Google站在前人的肩上,對(duì)搜索引擎進(jìn)行了顛覆傳統(tǒng)的修改,創(chuàng)造出了新的價(jià)值,同時(shí)還創(chuàng)造出了一家市值達(dá)845億美元的公司,也促使搜索成為互聯(lián)網(wǎng)的心臟。
截止到2005年2月16日,Google已留存、搜集整理了8 058 044 651個(gè)網(wǎng)頁,13億張圖像,成為搜集網(wǎng)頁最完整的搜索引擎。而在7年前,整個(gè)網(wǎng)絡(luò)僅有區(qū)區(qū)3億個(gè)網(wǎng)頁。這符合“資料多多益善”(More data is better data)的莫瑟定律(Mercer’s Law)。
目前,Google在全球各地?fù)碛? 000多部紅帽Linux服務(wù)器,Google用這幾千臺(tái)機(jī)器構(gòu)成一個(gè)龐大的超級(jí)計(jì)算機(jī),并很好地完成了一切步驟:搜集信息、整理歸類、精確網(wǎng)絡(luò)信息、處理搜索請求。盡管每天要處理1億以上、每秒上千次的搜索查詢, Google仍然能夠在不到1秒的時(shí)間內(nèi)對(duì)近百億網(wǎng)頁進(jìn)行篩選并得出搜索結(jié)果。
以往的搜索引擎,盡管也能搜索到相關(guān)信息,但精確性卻大打折扣,搜索結(jié)果往往很少能符合搜索用戶的需要。Google卻成功地解決了這些問題:不用空間向量模型(關(guān)鍵詞比對(duì)),而用精確搜索(完全符合)與網(wǎng)頁排名。這顛覆了傳統(tǒng)上重視齊全,而不重視搜索結(jié)果精確的想法。同時(shí)也呼應(yīng)了Google“快比慢好”以及“信息永遠(yuǎn)累積遞增”的兩個(gè)信條。
Google通過其佩奇位階(網(wǎng)頁級(jí)別,PageRank)技術(shù),越多網(wǎng)頁所鏈接到的頁面,將會(huì)獲得更好的排名。網(wǎng)頁上一個(gè)個(gè)的超級(jí)鏈接,就像一張張選票,選擇出最有價(jià)值的網(wǎng)頁,體現(xiàn)了Google式的網(wǎng)絡(luò)民主:越多網(wǎng)頁所鏈接到的網(wǎng)頁,其信息越符合用戶的需求。“網(wǎng)頁排序”技術(shù)顛覆了傳統(tǒng)搜索引擎依賴分析網(wǎng)頁內(nèi)文字的排名方式,讓單一網(wǎng)頁的所有者很難操弄網(wǎng)頁內(nèi)的文字與超級(jí)鏈接,影響自己網(wǎng)頁的重要性排名。Google的首頁簡約典雅,但有用的信息幾乎都在前幾頁。實(shí)際上,用戶通常查看前幾頁的搜索結(jié)果。
雖然AltaVista具有前所未有的廣泛搜索范圍和快速的搜索速度,但能夠把搜索范圍、速度及PageRank技術(shù)完美結(jié)合起來的Google最終實(shí)現(xiàn)了質(zhì)的飛躍。