Google Scholar

前幾天在 OUI-BLOG 看到這個訊息,一直想 PO 上來卻遲遲沒有時間,其實就是 GOOGLE 實驗室推出了幾項測試中的新服務, GOOGLE SCHOLAR 只是其中的一項,目的主要是專注於學術方面的論文、文章、網站、 PDF 為主要的搜尋對象。SLOGAN 下得非常漂亮:「Stand on the shoulders of giants」,輕鬆的點出這個搜尋機制的目的:「讓所有的使用者能夠站在巨人的肩膀上」,但是這可不是「可以踩在別人的肩膀上往上爬」的意思。
自從在 UDN 的數位文化誌發表一篇無酬文稿「 GOOGLE IPO 啟示錄 」之後,就發覺那不是一條發表文章的路子,面對一些搞不清楚的基本教義派,才明瞭根本沒辦法向一群腦袋已經如死水的人說明一些可能要寫本書才能說明的事 情。最早一開始的時候 GOOGLE 的兩位創始人只有一支程式稱做「背爬引擎」( BackRub ),功能就是回溯追尋一個網頁被哪些網頁所連結,存入資料庫後去計算在所有的資料中這一個網頁所具有的重要性,這種「重要性」是經由一種投票機制計算,就 是現在 GOOGLE 所使用的 PageRank 機制。任何有一些些程式經驗的人都應該可以看的出來,資料庫擴充的機制是由一個程式負責,在前端負責資料搜尋與關鍵字比對是另外一個程式在負責,在 GOOGLE 的歷史當中也明述說這對 GOOGLE 而言帶來搜尋上的利基,這也是為什麼 GOOGLE LAB 能夠一直不斷推出不同服務的原因,而其他的搜尋引擎,像是 YAHOO 也開始在精深資料庫的蒐集與擴大的同時,也在發展新的比對技術。只能說我在跟一個學文史的人談理工,一點用都沒有。GOOGLE 的兩位創始人發現能在這廣大並且自動蒐集資料的資料庫中,由關鍵字的比對與參照網頁重要性來發展精準的搜尋,再說服贊助主獲得資金後開始開發新的比對技 術,就此 GOOGLE 站上了搜尋引擎的霸主地位。只是比對技術單是針對所有網頁只能滿足一般人的需求,要針對不同的領域就要有不同的程式來負責做專門領域的比對,這次 GOOGLE 所推出的引擎就是單就學術文本的搜尋引擎,的確令人興奮。