HOME

 

 

那福忠,知名電子出版專家、網路作家。
   
  雅虎的新搜尋引擎:Inktomi
  那福忠 May 20, 1998
  請把你的想法寫信給我: Frank.Na@Gmail.com
   

   雅虎(Yahoo!)這個全球上網上數第一名的網站,宣佈換搜引擎的伙伴。原來是Digital公司的Alta Vista,現在要換成Inktomi,在三個月內轉換完成。雅虎除了本身也是搜尋引擎(從讀者來看)之外,還提供了許多分門別類的資訊,像新聞、氣象、財經、旅遊等資訊。而與其合作伙伴Alta Vista也提供這些資訊,成了競爭對手,所以要換一個純技術合作對象,就找到了Inktomi。雅虎把網站分門別類,作得條理清楚,主要是用人力去分類,所以讀者查詢的結果,較為切題。但用人力做這件事,做不了多快,所以遇到查不到的,就需要另一個資料豐富的索引來彌補,Alta Vista正好扮演這個角色。Alta Vista是網上蜘蛛搜取全球40%以上的網站,並全文檢索掃描,每個字部作成索引,也是一個了不起的製作,但因為是自動做的,有些地方當然不若雅虎那樣精確。這兩家合作,互補長短,本來很好,現在雅虎要換成Inktomi,或許與作法有關。Inktomi無疑是技術本位的,其搜尋引擎可用在許多地方,也得過許多獎,但本身不提供網索引或其他資料,主要是與別人合作,提供技術。最好的例子,是與Wired合作的查詢網站HotBot,也是現在熱門網站之一。Inktomi自稱其搜尋引擎是最快、最可靠、最經濟、也最能放大(Scalable)的系統,其基本設計頗值得一提。與其用大型系統來應付資料量的成長,Inktoim卻相反的用市面便宜的設備,但可以一個個加到一起,成為一群(Cluster),而且可以平行運算,資料庫也分散到各個設備。所以盡管有一百台PC在一起,卻視為一個大系統,每台電腦同時運算,平行處理,加快了速度,而且沒有負荷限制,因為便宜的電腦可以一台一台加入,系統就逐漸擴大。所以這種技術,促成其快速與經濟的優勢。當然還有使系統不中斷、相互支援、高容錯度軟體,資料庫的分散與整合的技術等等,也都使其搜引擎吸引人的地方。把這個搜尋引擎用到網站的查詢上,據Inktomi說,其「爬虫」軟體(網上蜘蛛類)可在一天內找到一千萬個文件,這樣的速度,對維持網站的最新資料,貢獻就大了。現在查詢到的網址,時常遇到已經移走了或報廢的情況,原因無非是這個索引太老舊了。Inktomi以這麼快速經常更新網址索引,這種情形就不會發生了。我預計yahoo!會利用Inktomi的快速搜尋結果,與原來利用人力分類的雙邊優勢結合,提供讀者更好的服務。應該不會用Inktomi製作另外一個查詢服務網站,像現在的Alta Vista一樣。事實上,Yahoo!現在就有與HotBot連結的地方。Inktomi的技術的確有教人讚賞的地方,像網路Cache(與搜尋引擎沒有直接關係),就是一好點子。大家想盡辦法增加網路頻寬,但資料流量的增加永遠大於網路的架設,Inktomi就想到一個相反的作法,即減少資料流量,以舒解頻寬的不足。作法是在網上不同層級作Cache,實際上就是大型的Proxy,凡是預計我這一地區人常用的資料,就放在Cache裏,用的時候就在Cache裏取,不必透過上層網路。如果這種架構作得好,可節省網際網路上20%到40%的資料流量。當然這些Cache Proxy都是大型的,一般以機構為主的小型Proxy是不管用的。

從雅虎的成功,到Inktomi的成功,網路上仍有許許多機會,教人成功!


上一篇   下一篇 索 引