接近金牌水平,AI向人類奧數“下手”


從下棋到解析蛋白質結構,人工智能(AI)變得越來越無所不能。美國谷歌公司的DeepMind這次將目標瞄準數學領域,開發的一款AI幾何推理模型——AlphaGeometry能夠以接近國際數學奧林匹克(奧數)競賽金牌得主的水平,解決復雜的幾何問題。相關研究1月17日發表于《自然》。
奧數面向中學生每年7月舉辦,是全球最難的數學競賽之一。解決奧數幾何問題需要一定的數學創造力,而這正是AI一直在試圖攻克的。即使在其他領域展現出非凡推理能力的OpenAI的GPT-4,在奧數幾何問題上也只能得0分。
AI之所以對奧數幾何問題久攻不下,除了問題的難度外,缺乏訓練數據也是一個很重要的原因。奧數自1959年以來每年舉辦一次,且每次比賽只有6道題。然而,AI系統解決幾何問題需要數百萬甚至數十億個數據點,現有數據遠不能滿足訓練的需要。
為此,DeepMind的Thang Luong和同事創建了一種工具,可生成數以億計的機器可讀的幾何證明,從而繞過了現有數據不足的難點。
研究人員使用這些數據對AlphaGeometry進行訓練,并用30道奧數幾何題對它進行基準測試。結果,AlphaGeometry在標準時限內正確解出了25道題。相比之下,之前最先進的系統解決了其中10道題,而根據預測,人類奧數金牌得主平均解決25.9道題。
Luong介紹,AlphaGeometry由兩部分組成,一個是快速、直觀的語言模型系統——GPT-f,另一個是較慢、更具分析性的“符號引擎”系統。
面對一道奧數幾何題,AlphaGeometry首先利用GPT-f提出要嘗試的定理和論點,接著“符號引擎”就會通過邏輯推理,按照數學規則構建GPT-f提出的論點。兩個系統協同工作、不斷切換,直到問題解決。
Luong表示,雖然AlphaGeometry在解決奧數幾何題方面非常成功,但它的答案往往比人類的證明更長。不過,它可以發現一些人類遺漏的東西。比如,它對一道2004年奧數競賽題的解法,比官方給出的答案更好、更通用。
英國倫敦數學科學研究所的何楊輝指出,該系統在可用的數學運算方面存在固有的局限性,因為奧數問題應該用大學本科階段以下教授的定理來解決。因此,增加AlphaGeometry可以獲得的數學知識能夠改善系統,甚至有助于它取得新的數學發現。
目前,DeepMind拒絕透露是否計劃讓AlphaGeometry參加奧數現場比賽,以及是否再擴展該系統以解決其他非幾何奧數問題。
(徐銳)
相關論文信息:
https://doi.org/10.1038/s41586-023-06747-5
本文鏈接:http://www.albanygandhi.com/news-7-141.html接近金牌水平,AI向人類奧數“下手”
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
【申報】關于發布《2024年北京市支持中小企業發展資金實施指南(第一批)》的通知
關于公布2023年國家技術創新示范企業名單和國家技術創新示范企業復核評價結果的通知(工信部科函〔2024〕7號)
國務院辦公廳印發《關于加快內外貿一體化發展的若干措施》的通知
北京市經濟和信息化局關于“千億暢融”融資小程序正式上線運營的通知
我國科學家成功實現無串擾的量子網絡節點
賦予“公共品”屬性 安全科技迎來質變時刻
催化組合將二氧化碳轉為碳納米纖維 有助抵消強效溫室氣體排放
圖說外觀設計|局部外觀設計專利申請概覽
北京市地方標準管理辦法
進一步促進北京老字號創新發展的行動方案(2023-2025年)
小二推薦:DY分付怎么取出現金回顧一周: