Google必須懺悔,因為他並不了解你。如果你問「美國前10深的湖泊是哪些?」Google會根據關鍵字找出提到這些詞彙的權威網站,但是Google資深副總Amit Singhai承認,Google其實並不懂你的問題,Google只是「雙手祈禱期待網路上有某個人曾經寫過關於該主題的內容」。
Google搜尋的未來會相當不同,在深入的交談中,有20年以上搜尋領域經驗的Singhai標示了未來搜尋的方向將超越關鍵字,進入實體(entity)、特徵(attribute)及關係的世界。換句話說,Google未來的搜尋引擎不只會懂你搜尋的湖泊問題,而且還會知道湖泊是由水所組成、並告訴你每一座湖泊的深度、表面積、溫度和鹽度。
話說從頭
搜尋從20世紀後半期發展以來,都是以文本為基礎、關鍵字索引的工作,很少變化。直到網際網路的出現,因為搜尋開始有了「連結」(link)的幫助,Google是第一個把「連結」當成「推薦代理人」,Google的搜尋結果是基於內容連結及連結的權威性,經過時間演變,Google加上了一些對於內容、關鍵字及使用者回饋的演算法,讓搜尋結果更符合使用者需求。
最後,Google將會從「關鍵詞」,轉型到「意義」。「Google搜尋引擎知道〝New〞〝York〞兩個字常常出現在一起,因此改變了兩個字個別的涵義」,但是Google並不知道〝New York〞是一座城市,有多少人口,位於何處。
重大的改變
Google現在希望將網頁上的字,轉換成為代表具體意義的實體,並具備相關的特性。這是人腦一般運作的方式,但是對於電腦來說,這挑戰並不小!
Google正在「建立龐大的內部理解系統,找出實體、實體在世界上存在的位置及人們想要了解該實體的相關知識」,Singhai說。
2010年,Google併購了Freebase,一個擁有1,200萬個由社群建立的典範實體資料庫。但是Google還得投資更多以「為交互的實體及特徵間建立龐大的知識圖譜(Knowledge Graph)」。
Google現在正在為未來超複雜演算法的搜尋引擎建立基礎架構,因此需要更多的伺服器,以協助建立知識圖譜。雖然Google現在才剛起步,但是在Google搜尋上已經可以看到一些類人工智慧的成果,只是多數人沒注意到。
舉例來說,在Google搜尋輸入關鍵字「Monet」(莫內),除了標準的搜尋結果,還可以看到下方有一小區「Artwork Searches for Claude Monet」,並出現莫內最棒的5張作品縮圖。這代表了Google搜尋已經開始了解「Monet」是一個畫家,而畫家最重要的東西就是他的偉大作品。
Singhai承認他夢想打造「星際大戰」中的電腦,像Siri一樣,你可以問電腦任何問題,並獲得有意義的答案。
超越搜尋
Google的知識圖譜也將對「機器人學」(Robotics)帶來助益,機器人學現在受限於對於語言的理解能力,因此Google的計畫未來將能夠把語言帶入機器人的人機互動中。
世界的知識如此巨大,Google知識圖譜到底要懂多少實體,才能夠回答所有事情呢?
「人腦的美妙之處,就在於他可以建立任何事物,並決定任何事物,即使他們以前從來沒想過這個問題。我認為目前我能夠給的最好答案,就是人腦一直持續建立新的知識,Google在建立知識圖譜的努力也是一個沒有止境的過程」,Singhai說。
來源:Mashable
from 數位時代 Beta3.0 | Topics & Links http://www.bnext.com.tw/Article/view/cid/103/id/22092