如果你是高中學生,試著回答這一個四選一問題「一群組織在一起共同工作完成特別的功能」稱為:a. 器官 b. 生物 c. 系統 d. 細胞。如果這個問題太容易,再看下一題「在ㄧ個松鼠群居的地方,讓松鼠數量減少的最大原因」是:a. 捕捉者的數量減少 b. 松鼠之間的競爭減少 c. 食物增加 d.森林火災次數增加。這是正式的高中科學考試題目,一個稱為 Aristo 的 AI 軟體,通過了 90% 的高一(8年級)、80% 的高四(12年級)的科學測驗。 對用功一點的學生這些題目並不難,Aristo 是 AI 軟體,對科學知識更是豐富,但問題在問的方式並不直接了當,先要解譯題目的文字敘述,對人也許輕而易舉,對電腦則是困難的挑戰。上述的第一題還算容易選答,第二題則要繞一個彎子,分析之後才能選答,90%、80% 的答對率不是一件容易的事。 四年前舊金山有一個 8 萬美元的競賽,700 位專家試圖製作 AI,通過 8 年級科學考試,結果全軍覆歿,最好的成績還不到 60%,在語言能力與邏輯思考上,遠不如剛進高中的學生。Aristo 是西雅圖 Allen AI 學院發展出來的,不但能解譯自然語言,而且能模仿人類用邏輯抉擇。Allen 學院是由微軟共同創辦人 Paul Allen 於 2013 年所創建。 Allen 學院起初意在研發一個數位的亞里斯多德 (Digital Aristotle),所以取名 Aristo,但要制訂一個 AI 標準,不能以下棋或專為機器設計的題目為準,所以決定以紐約的標準學生考試的選擇題為主,實際的題目有的含有圖表,但為了簡化將之刪除,否則回答問題要結合語言與電腦視覺解譯圖表,增加 AI 複雜度,刪除圖表後仍能回答的很好。 科學考試不能僅靠學習規則得到好成績,而需要用邏輯來連結,以前面的松鼠題目為例,森林火災的增加,會殺死松鼠,或減少讓松鼠生存與繁殖所需的食物。Aristro 能模仿人類的分析答對了問題,是突破性的成就,也代表 AI 正走向 AGI(Artificial General Intelligence) 通用人工智慧。所謂通用,簡單的說就是能跟人流暢的溝通,不限領域的有意義對話,這是 AI 的最高理想,許多專家朝這一目標研究。 說到 AGI,就不能不說「圖靈測試」(Turing Test),圖靈 (Alan Turing, 1912-1954) 是英國的數學家、電腦科學家,最為大家所樂道的,是二次大戰破解德國密碼機 Enigma,從中獲取情報導致聯軍勝利。但在科學上他發明了圖靈機器 (Turing Machine),用數學模型模擬現代電腦的運作,後人尊他為電腦之父,在 1950 年他設計了圖靈測試,用來測驗電腦是否有人類的智慧。 圖靈測試很簡單,兩個人與一個電腦分開在三個房間,一個人問問題,另一個人與電腦交錯回答問題,反覆多次問答之後,問的人如果有半數(有的說三分之一)無法分辨答案是另一個人、還是電腦回答的,那電腦就算通過測試,也就認為有人類的智慧。幾十年來有無數電腦專家設計軟體,想要通過這個測試,至今除了在有限度的領域,還沒有任何電腦軟體通過。 Aristo 的功能仍屬有限度的領域,專家認為仍無法與學生的理性能力相比,但技術可以推廣用作服務,如網路搜尋與醫院資料記錄。至於提升 AI 能力如通過 GRE (Graduate Records Examination),也就是通過研究所的入學考試,內容分語文與數學的推理,在語文上或可以做到,但數學推理則挑戰太高。 紐約時報報導了 Aristro 的消息,認為機器可以瞭解自然語言並適當回應,在技術上是一個里程碑,同時例舉測驗 Aristro 的五道試題,讓讀者裁判 Aristro 的科學程度。 一、細胞的哪一部分結構把養份送到細胞中心?a. 細胞膜 b. 葉綠體 c. 細胞質 d.細胞核。 二、什麼器具最能分開鐵屑與黑胡椒的混合物?a. 磁鐵 b. 過濾紙 c. 三樑天秤 (triple beam balance) d.電壓表。 三、當食物被機械化的消化了,是:a. 變成另一種元素 b. 絞碎成小塊 c. 轉換成能量 d.排出體外。 四、紐約州在一月比三月有更大的機會下雪,是因為北半球:a. 偏向太陽溫度較暖 b. 偏向太陽溫度較冷 c. 反向太陽溫度較暖 d. 反向太陽溫度較冷。 五、溫度計裡面液體的變動顯示溫度的變化,溫度升高表示液體的分子:a. 動作慢下來而且凝聚 b. 動作加快而且分開 c. 遇熱收縮 d. 遇熱擴散。 高中一年級的學生注意了,一個稱為 Aristro 的 AI,科學成績可能超過你。 Photo by Alex Knight from Pexels |