如何識破人工智能在一本正經地瞎編亂造

你能看得出人工智能在瞎編亂造嗎?《自然》6月19日發(fā)表的一項研究報道了一種能檢測大語言模型(LLM)幻覺(hallucination)的方法,該方法能夠測量生成回答的含義的不確定性,或者用于提升LLM輸出的可靠性。
像ChatGPT和Gemini這樣的LLM是能夠閱讀和生成自然人類語言的人工智能系統(tǒng)。不過,這類系統(tǒng)很容易產生幻覺,生成不準確或沒有意義的內容。然而檢測LLM出現幻覺的程度很困難,因為這些回答的呈現方式可能讓它們看起來很可信。
在這項研究中,英國牛津大學的Sebastian Farquhar和同事嘗試了量化一個LLM產生幻覺的程度,從而判斷生成的內容有多少是忠于提供的源內容的。
研究人員的方法能檢測出LLM的“編造”(confabulation)——這是“幻覺”的一個子類別,指不準確和隨意的內容,常出現在LLM缺乏某類知識的情況下。
這種方法考慮了語言的微妙差別,以及回答如何能以不同的方式表達,從而擁有不同的含義。他們的研究表明,該方法能在LLM生成的個人簡介,以及關于瑣事、常識和生命科學這類話題的回答中識別出“編造”。
然而澳大利亞皇家墨爾本理工大學的Karin Verspoor在一篇同時發(fā)表的“新聞與觀點”文章中指出,該任務由一個LLM完成,并通過第三個LLM進行評價,等于在“以毒攻毒”。Verspoor還寫道,“用一個LLM評估一種基于LLM的方法似乎是在循環(huán)論證,而且可能有偏差。”
不過,Verspoor指出,他們的方法有望幫助用戶理解在哪些情況下使用LLM的回答時需要多加小心,也意味著可以提高LLM在更多應用場景中的置信度。
相關論文信息:https://doi.org/10.1038/s41586-024-07421-0
本文鏈接:http://www.albanygandhi.com/news-3-379.html如何識破人工智能在一本正經地瞎編亂造
聲明:本網頁內容由互聯(lián)網博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯(lián)系,我們將在第一時間刪除處理。
描寫夜景唯美句子
小寒節(jié)氣唯美句子
贊美雪的句子唯美
3月春暖花開的句子唯美
描寫臘八的詩句
描述溫泉的詩句
企業(yè)法人授權的委托書
法人代表授權委托書
半導體銷售年度工作計劃
描寫團圓的詩句
一分鐘學會: 羊小咩享花卡怎么提出來秒到, 三個圖文教程方法一看就會!
風大物燥:螞蟻花唄怎么提現出來 - 公布十個操作方法
精簡三步驟:2024最新DY月付額度如何提現出來流程介紹
兩分鐘必看篇:DYDou分期怎么找商家取出現金
大吉大利:東莞東城區(qū)代還信用卡墊還,真實商戶積分,價格最低的地方
心花怒放:鄭州金水區(qū)上門代還信用卡,的6種刷法 (無視風控秒回款)
勇往直前:DY月付怎么套出來,6個最新套出來的方法
心曠神怡:上海金山區(qū)上門代還信用卡,怎么套取出來(一手商家無中介差價)
喜從天降:上海市墊還信用卡,怎么刷出來,5種常用方式
重要:京東白條可以套出來嗎(12種提現方法技巧分享)-知者