2021年7月31日
信報
去年在本欄寫過一篇《斯威夫特的文字生成器》,介紹兒童不宜的名著《格列佛遊記》(Gulliver's Travels),提到書中一個天馬行空的「發明」,可讓全無才能的人寫出學術鉅著。機器是一塊大板,上面滿佈片言隻語,只要啟動機關,字句就會隨機變化,遇到有意思的句子就紀錄下來,久而久之就可以產生偉大作品了。
最近在另一本書再遇這部機器,事關的不是英國文學,而是人工智能。這本題為The Myth of Artificial Intelligence的新書,作者是穿梭學界商界的電腦科學專家Erik J. Larson,不算是暢銷作品,內容也不大眾化,但絕對是我近年讀過最精彩深刻的一本好書。
歸納演繹溯因三種思考方法
顧名思義,此書旨在向近年的人工智能熱潮潑冷水。從傳媒報導和KOL科幻片式的思想馳騁,到名學者(如天文學家霍金)到創業家(如Tesla的馬斯克)的驚人預測,潛移默化之下,大家都對人工智能都有個鮮明印象,就是人類貢獻快要被其取替,很多事情都可以之代勞,而人工智能甚至會喧賓奪主,將人類變成工具或寵物。天馬行空的想像,人類終結的恐懼,跟現實有多大距離?作為行內人的Larson認為現時技術水平遠遠未達此程度,仍有大量基本困難未解決,人工智能統治世界仍是空中樓閣。
基本困難,源自人類智能毫不簡單,腦袋中存有的資訊深不可測,根據資訊作選擇的過程亦難以簡化成公式。
眾所周知,思考方法大致可分為三種。演繹法(deduction)是從前提推演出結論,例如從「這袋中所有硬幣都是一元」和「此硬幣是從這袋中拿出來」,我們就可以推斷「此硬幣是一元」。答案已隱含在前提之中,日常生活中我們會用到這種思考方法(例如買東西找錢),而早期的人工智能,研究方向正是要製造出這種推理機器,可以又快又準的處理複雜推算,亦可以檢查推算是否正確。只論演繹法,人工智能早已遠比人類智能優勝,隨便一部計數機就是明顯例子。
歸納法(induction)是從經驗推出結論,例如從「這些硬幣是從這袋中拿出來」和「這些硬幣都是一元」,我們就可以得出「這袋中所有硬幣都是一元」的結論。推理不一定對,但日常生活中我們常用到這種思考方法,憑記憶憑往績決定行為(例如天陰要帶遮)。人工智能早已研究出大量方法從數據中歸納學習,只是苦無數據可用,長期停留在理論層面。不過,自從互聯網興起,可供使用的數據以驚人速度增加,存在已久的工具因而有用武之地。大家熟悉的「大數據」、「機器學習」等概念,形容的正是過去十數年在各種資訊爆炸的情況下,歸納法如何被運用到出神入化,讓企業深入了解消費者喜好,掌握和預期大家的一舉一動。
暫只能在狹窄範圍內表現優秀
除了演釋法和歸納法,人類生活還需要溯因法(abduction)。從「這袋中所有硬幣都是一元」和「這些硬幣都是一元」,我們不期然會得出「這些硬幣是從這袋拿出來」的推斷。邏輯上這是個稱為affirming the consequent的謬誤,但日常生活中我們難免要用到這個思考方法。例如我見到女朋友發脾氣,表面上無緣無故,我就會試從各種可能性中去「溯因」,猜不中女朋友也許會發更大脾氣,但猜中就是心靈相通的加分表現了。我依靠的不是演釋法也不是歸納法,而是溯因法,亦即有點根據的靠估,也就是英文中的educated guess或intuition。
除了處理人際關係,人類的藝術創作以及學術研究,也需要這種「不合邏輯」的思想跳躍。我們不能從達文西或畢加索的作品推演出一個完整的思考過程,我們也不能從牛頓或愛恩斯坦的理論一步步的追本溯源。這些都是刻苦努力過後的靈機一觸,這些都是從天而降的inspiration ,這些都是可遇不可求的insight,都是解釋不了的。
現時人工智能面對的困境,是演釋法表現完美無瑕,歸納法在無限量數據供應下亦愈見精準,就像將《格列佛遊記》中那部機器變成事實並發揚光大,唯獨是溯因法的研究未見突破。歸根究底,就是我們對靈活創意的思考過程認識有限,未能將其依樣畫葫蘆成為電腦程式。人工智能暫時只能在準繩度和應用範圍之間作取捨。要比人類智能優勝,就要將活動範圍收窄,讓人工智能從人類腦袋處理不了的大量數據中學習,將一些簡單步驟做到盡善盡美。將範圍擴闊,大量數據就於事無補,不擅溯因法的人工智能表現就會大打折扣,隨時比一個普通人做得更差。最常遇到的例子,莫過於網上翻譯功能,無論人工智能的數據庫有多強大,遣詞用字之間的微妙分別就是會lost in translation ,犯下人類不會犯的搞笑錯誤。
當然,Larson並沒有否定現有成果,只是老實指出人工智能距離人類智能尚遠,沒有大眾傳媒所吹噓的誇張而已。革命尚未成功,同志仍需努力,我們等待的是另一個基本性的技術突破。
from 也是這裡,也在這裡~ http://ktoyhk.blogspot.com/2021/08/20210731.html