為達最佳瀏覽效果,建議使用 Chrome、Firefox 或 Microsoft Edge 的瀏覽器。

關閉此視窗 請至Edge官網下載 請至FireFox官網下載 請至Google官網下載
    限制級
    您即將進入之新聞內容 需滿18歲 方可瀏覽。
    根據「電腦網路內容分級處理辦法」修正條文第六條第三款規定,已於網站首頁或各該限制級網頁,依台灣網站分級推廣基金會規定作標示。 台灣網站分級推廣基金會(TICRF)網站:http://www.ticrf.org.tw

    30名頂尖數學家聯手出題被破解 AI解題後嗆:無須引用、自己算出來

    2025/07/14 14:45 即時新聞/綜合報導
    菁英數學家們要設計出自己可以解決但會讓模型崩潰的數學題目,結果許多問題都遭到AI擊潰。(美聯社)

    菁英數學家們要設計出自己可以解決但會讓模型崩潰的數學題目,結果許多問題都遭到AI擊潰。(美聯社)

    曾德峰/核稿編輯

    AI發展學習持續進步,近日一場祕密數學會議召開,30名來自世界各地的頂尖數學家在美國加州齊聚一堂,挑戰人工智慧研究實驗室OpenAI的o4-mini模型,菁英數學家們要設計出自己可以解決但會讓模型崩潰的數學題目,結果許多問題都被AI擊潰。

    據《生活科學》(LiveScience)網站報導,5月中旬在加州伯克利召開一場祕密數學會議,30名來自世界各地的頂尖數學家齊聚一堂,對決OpenAI最強推理模型o4-mini,這是一種大語言模型(LLM),它由OpenAI訓練,能夠進行高度複雜的推理;30名世界頂尖數學家分成5組,設計出他們可以解決但會導致模型崩潰的數學問題,若AI無法解答,設計問題的數學家即可獲得7500美元(約新台幣21.9萬)。

    結果令數學家們大吃一驚,日裔知名數學家小野健設計一個博士論文級的題目,AI先花了2分鐘尋找並掌握了該領域的相關文獻,然後,它稱想先嘗試解決一個更簡單的「玩具」版本的問題,以便學習;幾分鐘後,AI說自己準備好解決更困難的問題了。5分鐘後,o4-mini給了一個正確但又很巧妙的解決方案,它還加註「不用引用文獻,因為那個神秘數字是我親手算出來的」。

    小野健驚訝表示,AI不僅能計算,還能像人類一樣表現出結構化的推理過程,直呼「我從未在模型中見過這種推理。這就是科學家所做的事。這太可怕了。」雖然菁英數學家團隊最終成功找到了10個讓AI難以應對的問題,但仍對AI的進步感到震驚,認為已達數學天才等級,同時AI速度也讓數學家印象深刻,只需幾分鐘就能完成人類專家需要數週或數月才能完成的工作。

    小野健指出,若AI達到能夠計算出數學家無法解決的「第5級」問題,那數學家的角色將會發生巨大的變化,數學家可能會轉向簡單地提出問題並與推理機器人互動,以幫助他們發現新的數學真理,就像教授對待研究生一樣。

    不用抽 不用搶 現在用APP看新聞 保證天天中獎  點我下載APP  按我看活動辦法

    相關新聞
    國際今日熱門
    看更多!請加入自由時報粉絲團

    網友回應
    載入中
    此網頁已閒置超過5分鐘,請點擊透明黑底或右下角 X 鈕。