“征服”數學,AI是否有能力“回答世界”

最近,專門為人工智能(AI)設立的AI國際奧林匹克數學競賽(IMO)即將進入尾聲,其結果將隨今年7月于英國巴斯舉行的65屆IMO大會同步揭曉。這項賽事的目的是推動發展大語言模型的數學推理能力,訓練出更高數學水平的新AI模型。
純數學領域中的重大發現是推理和創造力的靈感結晶,往往意味著人類智慧極限的突破。迄今為止,解決或協助解決高等級數學難題,仍是AI領域一項極其復雜的多維度重大挑戰。隨著AI越來越多出現在數學領域,這是否預示著AI開始具有人類水平的推理能力?它會否為通用人工智能(AGI)鋪平道路?
數學一直被視為人類智力的“天花板”,數學家則不斷在挑戰人類智力的極限。同時,數學難題也一直是大模型難以“征服”的領域之一。
數學是推理的語言。長期以來,人們一直在為這類難題的復雜推理而苦惱。近年來,越來越多的數學家認為,這個領域正進入一個嶄新時代:機器智能的數學能力正不斷提升,在一些任務中的表現甚至超過人類數學家。
去年底,谷歌DeepMind公司發布的數學大模型FunSearch,針對人類歷史上的諸多數學難題給出了新的解法。這是大模型第一次對數學領域中具有挑戰性的開放性問題給出新的發現或解法,也將為解決懸而未決的數學難題開辟新的途徑。
DeepMind公司亞歷克斯·戴維斯和數學家一起,建立了用于協助數學研究的機器學習框架。他認為數學是推理的語言,“如果大模型能學會流利地使用數學,我們將創造出一個非常值得信賴的智能伙伴”。
要理解AI從事復雜數學的意義,就必須了解人類數學家的工作。與應用數學相比,純數學是在不考慮實際目的的情況下進行的。美國威斯康星大學麥迪遜分校的喬丹·艾倫伯格認為,從根本上說,數學研究的目的是通過研究抽象的對象和概念,如數字、代數和幾何,找到基本的關系和原理。研究純數學需要復雜的推理、直覺和創造力。澳大利亞悉尼大學的喬迪·威廉姆森說:“推理是數學過程的精髓?!?nbsp;
事實上,很難找到一門比數學更能體現推理的人類思維學科了。這就解釋了為什么數學推理長期以來被視為一種即使是最強大的計算機也無法企及的東西。盡管數學家使用計算機已有數十年之久,但僅限于比較簡單粗暴的計算。說到人工智能,即使是大獲成功的深度學習神經網絡,也無法在數學推理方面取得多大進展。不過,最近有跡象表明,最新的AI大模型可能會改變這種狀況。
數學大模型 表現直逼人類最優秀選手
盡管AI的工作原理“有些不透明”,但它們在發現復雜數據集中的新模式時,可以完成人類數學家難以完成的任務
伯奇和斯溫納頓-戴爾猜想是數論中一個懸而未決的重大問題。這個猜想是美國克雷數學研究所在21世紀之交選出的七個“千年大獎問題”之一。這些問題都被認為極具挑戰性,懸賞獎金高達100萬美元。
2019年,在伯奇和斯溫納頓-戴爾猜想提出約60年后,英國倫敦數學科學研究所的何楊輝教授和他的同事們想試試AI能否提出新的見解。于是,他們讓AI神經網絡在一個包含數百萬條橢圓曲線的數據庫中搜索曲線的某個特征,結果AI沒有讓人失望。在對其預測進行更詳細的分析后,何楊輝和同事們發現了一個驚人模式,并將其繪制在圖表上——它很像椋鳥成群結隊時產生的流體形狀。
這項工作吸引了更多研究人員,他們后來找到描述這種模式的方程,并發現在其他重要的數學函數中也會出現相似模式。何楊輝說:“AI能夠讓我們去嘗試一些東西,這些東西如果只憑我們自己的直覺,可能不會去嘗試。”
一年后,數學家與DeepMind合作,利用機器學習算法,在紐結理論和表示論這兩個數學分支的大型數據庫中,也有了類似的發現。與此同時,該算法還發現了數據庫中一些潛在的有趣關系。進一步分析后,研究人員還找到了一些新的猜想。
戴維斯表示,盡管數學家們對機器學習是否對數學研究有實際幫助抱有極大懷疑,但在發現復雜數據集中的新模式時,AI顯然可完成人類數學家無法完成的任務,盡管它的工作原理有時“有些不透明”。
威廉姆森感覺,與這些系統一起工作,就像有一個不能很好溝通的合作者,“在與AI合作時,我總有一種感覺,那就是它在某種程度上知道答案,但卻無法告訴我為什么”。
不過,AI并不總是那么不友好。2022年,OpenAI推出了ChatGPT,這是一種基于大語言模型(LLM)的AI聊天機器人。它們通過吸收大量文本,能對各種提示做出流暢的、類似人類的回應。
對于ChatGPT的出現,數學家們并不感到驚恐,但更想知道,它的底層架構(一種被稱為Transformer的神經網絡)是否能被改造成一種更懂數學的工具。他們最大的擔心是,它雖然有生成文本的能力,卻在過濾錯誤答案或發現自己的錯誤方面無能為力。
因此,DeepMind的研究人員在構建FunSearch系統時,創建了一個LLM,以計算機程序的形式編寫數學問題的解決方案,并將其與一個按性能對程序進行排名的系統相結合——它會將效果最好的程序反饋給LLM,LLM則據此反復改進版本,直到有新的發現。與DeepMind合作開發FunSearch的艾倫伯格覺得,這個AI系統比之前想象的要好用很多。
此后,另一支DeepMind團隊又用同樣的方式建立起一個名為“阿爾法幾何”(AlphaGeometry)的數學大模型,解決了國際數學奧林匹克(IMO)中的復雜幾何問題。解答國際數學奧林匹克的數學題,需要強大的頭腦創造力,而AI歷來在解答此類問題中的表現不佳。但“阿爾法幾何”經過針對性訓練后,在邏輯檢查系統的加持下,其幾何學的解題表現幾乎與最優秀的人類選手不相上下。
證明“形式化” AI正加速學習數學思維
一旦AI能夠閱讀人類數學庫中的語料,并掌握人類使用這些數學庫的方法,或許它們將具備證明一些數學問題的能力
不少數學家認為,在人工智能的幫助下,他們可能會獲得更多的新發現。有些人甚至認為,這也可能是數學創造力的最初萌芽。威廉姆森猜想,可能這就是創造力,“數學家就像詩人、音樂家或小說家,只是擁有非常好的創造能力和非常敏銳的評估能力”。
不過,這些最新突破也提出了一個更誘人的可能性:如果能再進一步,用大量研究級別的數學語料庫來訓練一個類似“阿爾法幾何”的系統,那么它就有可能開始為現有的猜想找到證明,并提出全新證明和猜想,而不需要人類輸入提示——這可能就相當于人類水平的推理和理解了。
但問題在于,絕大多數尖端數學語料都無法被計算機讀取——讓計算機讀懂數學的過程,既棘手又耗時,許多數學家寧愿把時間花在數學本身的研究上。
不過,這個方向正吸引越來越多的關注者,尤其當計算機輔助和計算機檢驗在現代數學的證明過程中越來越重要。因為,數學知識是通過證明創造出來的,這與通過實驗和觀察來檢驗假設的大多數自然科學學科都不相同。美國約翰斯·霍普金斯大學的艾米麗-里爾說:“證明是數學的中心,這是數學學科的真諦。”
當安德魯·懷爾斯在1993年最終證明著名的費馬大定理后,他還必須將其與數論和代數幾何領域的前沿成果相融合,從而推動進一步的研究。但是,長達數百頁的證明也日益成為數學家的“眼中釘”。一位日本科學家對數論問題“abc猜想”的證明長達500頁,面對密密麻麻的符號,很少有人能夠通讀
這時,AI就可以提供幫助。它們不僅能快速檢查證明步驟是否正確,還能幫助數學家編寫證明。盡管目前AI能做的還遠遠落后于當前的數學研究,但這種情況正在改變——如果能將足夠多的證明“形式化”,讓人工智能可以訪問它們,那么AI工程師就能以此為語料訓練這些系統,讓它們比人類更快、甚至更有效地生成猜想和證明。這樣,人工智能就能通過數學思維學會推理。
為證明“凝聚數學”理論中的一個關鍵結果,2018年菲爾茲獎得主、德國波恩大學的彼得·舒爾茨發起了“液態張量實驗”,并用數學軟件Lean對結果進行形式化。在整個團隊的努力下,他們于2021年5月完成了一個關鍵子定理的形式化,又于2022年7月得到了完整定理的形式化。
由于這個項目大幅擴充了Lean的數學庫,使其他的Lean形式化項目效率得到了提升,越來越多的頂尖數學家也將他們的新研究納入到Lean中。去年,他們證明了一個重要猜想,并在不到一個月的時間內將其形式化。這樣一來,數學領域的書面證明和形式化證明之間的時間差從數年縮短到數周。
英國倫敦帝國理工學院的凱文·巴薩德認為,這對AI的發展意義重大,“一旦AI能夠閱讀人類數學庫中的語料,并掌握人類是如何使用這些數學庫的,或許它們將可具備證明一些數學問題的能力?!?nbsp;
離AGI更近 “AI數學家”呼之欲出
如果AI習得人類水平的數學推理,人類將向AGI邁出重要一步。不過,推理僅僅只是真正的AGI所具備的諸多技能之一
不過,當AI可以做到這一步,它們能夠發明新的概念嗎?換而言之,它們是否能夠在沒有人類輸入的情況下提出新的數學見解——那些對人類來說,都十分罕見的靈光一現?
對許多數學家來說,答案是否定的,或者至少還需要幾十年時間才可能實現。“數學家所依賴的理解和推理過程是人類獨有的,AI迄今所做的一切都還沒能改變這一點?!卑退_德說,“到目前為止,我們還沒有看到這方面的證據。”
即便如此,自2022年菲爾茲獎研討會以來,許多世界頂尖數學家一直在討論AI將在多大程度上改變他們的工作,以及他們可能需要如何適應。
另一方面,能夠解決高等數學問題,對整個AI的進步意味著什么,則是另一問題,而這可能對所有人都產生影響。有一部分人認為,習得人類水平的數學推理,會讓AGI離我們更近。
這其中的邏輯非常清楚:如果數學是人類推理的最高形式,如果AI能夠像人類最優秀的數學家一樣完成數學推理,甚至做得更好,那么這將代表著人類向AGI邁出了重要一步。不過,戴維斯指出,真正的AGI還需要具備更廣泛的技能,推理僅僅是其中之一。
克里斯蒂安·塞格迪是一名計算機科學家,曾致力于用AI進行數學運算和自動形式化。他相信,“超人AI數學家”到2026年就會出現,“一旦擁有了推理這種新技能,AI不僅可以擁有人類的直覺,而且還將大大超越”。
如果塞格迪是對的,那么在通往人工智能的道路上,機器數學家可能會帶著人類走得比許多人愿意承認的更遠。哪怕退一步來說,數學高級別難題所帶來的挑戰也會將AI的發展推向新高度。
威廉姆森說:“數學在描述宇宙的許多方面有著非凡的能力?!奔僭O我們有一個系統,它普遍能夠回答高難度的數學問題。那么這樣一個系統也應該能夠回答我們這個世界的難題。
本文鏈接:http://www.albanygandhi.com/news-3-357.html“征服”數學,AI是否有能力“回答世界”
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
春雨的唯美有韻味句子
李益《行舟》全詩及鑒賞
寫景的古詩
授權委托書
元旦相聲臺詞
《我叫金三順》的臺詞
內科科室年度工作計劃
法人授權委托書
法人授權委托書
特別授權代理委托書
勇往直前:DY月付額度怎么套出來,推薦五大提現操作方法
目前印度索坦/舒尼替尼2025年不出國代購渠道有哪些?印度索坦什么價位
喜從天降:上海虹口區代還信用卡墊還,專業公司可靠,流程簡單高效
如登春臺:石家莊欒城區上門代還信用卡,最便宜的地方,便捷商家
印度艾曲泊帕(艾曲波帕28粒劑)多少錢一盒,2025國內購買印度艾曲泊帕價格yb價格一覽表
知識:悅刻waka在哪里拿貨?推薦三個拿貨方式
總結五個辦法: 羊小咩享花卡出來這個額度了怎么弄出來, 一看就會
篤行致遠:羊小咩額度怎么套出來-?3個正確提出步驟推薦
大吉大利:深圳上門代還信用卡,可長期合作,需要的請聯系
最新詳解:套白條的商家微信(重要方法須掌握)-知者