接近金牌水平,AI向人類奧數“下手”

從下棋到解析蛋白質結構,人工智能(AI)變得越來越無所不能。美國谷歌公司的DeepMind這次將目標瞄準數學領域,開發(fā)的一款AI幾何推理模型——AlphaGeometry能夠以接近國際數學奧林匹克(奧數)競賽金牌得主的水平,解決復雜的幾何問題。相關研究1月17日發(fā)表于《自然》。
奧數面向中學生每年7月舉辦,是全球最難的數學競賽之一。解決奧數幾何問題需要一定的數學創(chuàng)造力,而這正是AI一直在試圖攻克的。即使在其他領域展現出非凡推理能力的OpenAI的GPT-4,在奧數幾何問題上也只能得0分。
AI之所以對奧數幾何問題久攻不下,除了問題的難度外,缺乏訓練數據也是一個很重要的原因。奧數自1959年以來每年舉辦一次,且每次比賽只有6道題。然而,AI系統(tǒng)解決幾何問題需要數百萬甚至數十億個數據點,現有數據遠不能滿足訓練的需要。
為此,DeepMind的Thang Luong和同事創(chuàng)建了一種工具,可生成數以億計的機器可讀的幾何證明,從而繞過了現有數據不足的難點。
研究人員使用這些數據對AlphaGeometry進行訓練,并用30道奧數幾何題對它進行基準測試。結果,AlphaGeometry在標準時限內正確解出了25道題。相比之下,之前最先進的系統(tǒng)解決了其中10道題,而根據預測,人類奧數金牌得主平均解決25.9道題。
Luong介紹,AlphaGeometry由兩部分組成,一個是快速、直觀的語言模型系統(tǒng)——GPT-f,另一個是較慢、更具分析性的“符號引擎”系統(tǒng)。
面對一道奧數幾何題,AlphaGeometry首先利用GPT-f提出要嘗試的定理和論點,接著“符號引擎”就會通過邏輯推理,按照數學規(guī)則構建GPT-f提出的論點。兩個系統(tǒng)協(xié)同工作、不斷切換,直到問題解決。
Luong表示,雖然AlphaGeometry在解決奧數幾何題方面非常成功,但它的答案往往比人類的證明更長。不過,它可以發(fā)現一些人類遺漏的東西。比如,它對一道2004年奧數競賽題的解法,比官方給出的答案更好、更通用。
英國倫敦數學科學研究所的何楊輝指出,該系統(tǒng)在可用的數學運算方面存在固有的局限性,因為奧數問題應該用大學本科階段以下教授的定理來解決。因此,增加AlphaGeometry可以獲得的數學知識能夠改善系統(tǒng),甚至有助于它取得新的數學發(fā)現。
目前,DeepMind拒絕透露是否計劃讓AlphaGeometry參加奧數現場比賽,以及是否再擴展該系統(tǒng)以解決其他非幾何奧數問題。
(徐銳)
相關論文信息:
https://doi.org/10.1038/s41586-023-06747-5
本文鏈接:http://www.albanygandhi.com/news-7-141.html接近金牌水平,AI向人類奧數“下手”
聲明:本網頁內容由互聯(lián)網博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯(lián)系,我們將在第一時間刪除處理。
《人力資源服務機構管理規(guī)定》(人社部第50號令)
北京市地方標準管理辦法
國務院辦公廳印發(fā)《關于加快內外貿一體化發(fā)展的若干措施》的通知
【解讀】《海關總署關于失信企業(yè)認定標準相關事項的公告》政策解讀——案例篇
2024年載人航天工程發(fā)射任務啟幕 天舟飛船解鎖3小時“速運”模式
第七屆中關村國際前沿科技大賽境外賽區(qū)醫(yī)藥健康領域決賽舉辦
【申報】關于征集2024年度新三板掛牌補貼支持資金項目的通知
圖說外觀設計|一圖概覽制度新變化
《北京經濟技術開發(fā)區(qū)關于鞏固和增強經濟回升向好態(tài)勢的若干措施》
科技部關于開展2023年度全國科普統(tǒng)計調查工作的通知
技術:攻略怎么找分付套現的商家,分付如何快速提現
2025印度阿比特龍哪里買代購購買渠道揭曉,印度阿比特龍多少錢一盒大概費用揭曉!
案例:白條風控秒到賬方法(教你如何找到合適的商家)-知者
聚精會神:拼多多先用后付怎么套出來(最全攻略)
海闊天空:拼多多先用后付額度秒套-公布十個操作方法
龍鳳呈祥:廣州代還信用卡墊還,可長期合作,多年經驗誠信
組織:微信分付是怎么套出來的,揭秘分付怎么套出來
誠信!青島市北線下套VISA信用卡太快捷了,最多兩分鐘流程
攤上:刷白條加油購的靠譜商家(用7個流程步驟)
最新詳解:羊小咩便荔卡購物額度怎么套出來 (精彩絕倫,建議反復觀看)