OpenAI高層巨變:三位核心人物同期離場

剛剛,OpenAI高層大地震:
聯創John Schulman辭職跑路,聯創&總裁Greg Brockman長期休假,產品副總裁Peter Deng也被曝離職。
John Schulman(約翰·舒曼),長年領導OpenAI強化學習團隊,被譽為“ChatGPT架構師”。
也是他在Ilya Sustkever離開之后,臨時接管了超級對齊團隊。
現在他宣布“做了一個艱難的決定”,加入隔壁Anthropic,也就是Claude團隊。
與此同時,OpenAI總裁Greg Brockman也宣布將休長假,直到年底。
OpenAI計劃10月1日起在全球各地舉辦開發者日等活動,他也將缺席。
Brockman自述是在連續工作了9年之后第一次放松,但對年底之后的計劃說的比較模糊,也有網友認為是出于保密協議。
在舒曼離職官宣20分鐘后,奧特曼在回復中感謝了舒曼的貢獻,以及回憶了兩人2015年初次見面時的情景。
但截至目前,奧特曼沒有對Brockman休假做任何回應。
奧特曼平常有打字句首字母和“i”不用大寫字母的習慣,但每當重要同事選擇離開時,他都會表現得更正式一些。
著名OpenAI內幕爆料賬號蘋果哥表示:現在領導層已經成了一個空殼,你們還是趕緊發布產品吧。
ChatGPT架構師離職
舒曼本科在加州理工學習物理,在UC伯克利短暫學習過神經科學,后來師從強化學習大牛Pieter Abbeel,完成計算機科學博士學位。
在他成為OpenAI聯創時,博士還未畢業。
OpenAI是他在實習之外工作過的第一家也是唯一一家公司。
他的代表作、最高引論文PPO,也就是ChatGPT核心技術RLHF中選用的強化學習算法。
后來在從GPT-3.5、GPT-4到GPT-4o的一系列工作中都領導了對齊/后訓練團隊。
這次他自述的離職原因也是與此相關:
希望加深對AI對齊的關注,并開啟我職業生涯的新篇章,讓我可以重返實際的技術工作。
不過他也給足了OpenAI面子,補充到“不是因為OpenAI缺乏對安全對齊工作的支持而離開”,只是出于個人希望集中精力。
在ICML2023的演講中,舒曼自述過個人接下來關注的研究方向之一:如何避免過度優化。
ChatGPT 中的一些令人討厭的行為(例如過度道歉)是過度優化的結果。
RLHF很容易對狹窄的指標進行過度優化,例如模型可能學會了能獲得獎勵的捷徑,但沒有真正理解。
適當的對話任務訓練需要推理、換位思考和知識,研究人員必須精心設計訓練過程、獎勵功能和數據集
獎勵信號必須評估整個對話的質量,而不僅僅是個別反饋。
在今年五月份與播客主持人Dwarkesh Patel訪談時,舒曼也表示,算力應該更多從預訓練向后訓練轉移。
OpenAI人才持續流失
由于在AI安全方面理念和奧特曼不合,OpenAI的人才發生了大量流失。
今年5月,超級對齊團隊的兩名負責人——首席科學家Ilya Sutskever和RLHF發明者之一Jan Leike,在同一天內相繼離開OpenAI。
彼時離超級對齊團隊的成立,過去還不到一年。
Jan Leike離開后更是連發十幾條推文,對著OpenAI瘋狂炮轟,控訴其沒有兌現20%算力的承諾,并且對安全的重視程度遠不及產品。
后來,Jan Leike選擇加入了OpenAI的競爭對手Anthropic,繼續進行超級對齊的研究。
在GPT-4項目上與Jan Leike共同領導對齊工作的Ryan Lowe,也已于3月底離開OpenAI。
還有超級對齊成員之一William Saunders,以及參與過GPT-4對抗性測試的Daniel Kokotajlo,也都從OpenAI離職。
更不必說隔壁Anthropic的創始人Dario Amodei和Daniela Amodei兄妹,也是OpenAI出身。
哥哥Dario離開前是OpenAI的研究副總裁,妹妹Daniela則是安全與策略部門副總監,走的時候還把GPT-3首席工程師Tom Brown等十幾名員工一起帶到了Anthropic。
導致他們選擇出走創業的原因之一,就是OpenAI在安全問題尚未解決的情況下就直接發布了GPT-3,引發了他們的不滿。
對安全的重視,加上創始人的背景,也讓Anthropic成為了包括Jan Leike和這次離職的舒曼在內的OpenAI員工的主要去處之一。
OpenAI這邊最近在安全工作上也有所動作——
7月末,OpenAI把安全部門高級主管Aleksander Madry調離了安全崗位,并給他重新分配了“AI推理”的工作。
但OpenAI告訴媒體,Madry到了新職位上之后,仍將致力于人工智能安全工作。
CEO奧特曼也是強調,OpenAI一直都很重視安全工作,并堅持了“給整個安全團隊至少20%算力”的承諾。
但眼尖的網友很快發現,奧特曼玩了一波偷換概念,原來承諾的的是給超級對齊團隊20%算力,被偷偷改成了全部安全團隊。
所以,在奧特曼的推文之后,網友也是毫不留情地把這一背景信息添加了上去,并附上了當時OpenAI的官方鏈接。
emm……互聯網還是有記憶的。
One More Thing
在內部大量人才流失的同時,OpenAI的“老仇人”馬斯克這邊也有新的動作——
馬斯克剛剛再一次把OpenAI告上了法庭,一同被告的還有奧特曼以及總裁Brockman。
這次起訴的理由是,馬斯克認為自己參與創立OpenAI之時受到了奧特曼和Brockman的“欺騙和敲詐勒索”。
馬斯克稱,自己當初參與并投資OpenAI就是因為相信了奧特曼的話,當時奧特曼承諾OpenAI是一個安全、開放的非營利組織。
但后來OpenAI成為了營利性組織,還把一部分股份賣給了微軟,這讓馬斯克感到十分不滿,認為自己遭到了背叛,痛斥奧特曼“背信棄義”。
馬斯克的律師Marc Toberoff表示,此次訴訟和之前撤回的那起有很大差別,要求被告“對故意向馬斯克和公眾做出虛假陳述的行為負責”,并尋求“大規模追回他們的不義之財”。
同時,起訴書還要求撤銷OpenAI對微軟授予的許可。
參考鏈接:
[1]https://www.bloomberg.com/news/articles/2024-08-06/openai-co-founder-john-schulman-departs-for-ai-rival-anthropic
[2]https://www.cnbc.com/2024/07/23/openai-removes-ai-safety-executive-aleksander-madry-from-role.html
[3]https://x.com/sama/status/1818867964369928387
[4]https://www.documentcloud.org/documents/25031741-elon-vs-openai-again
[5]https://www.nytimes.com/2024/08/05/technology/elon-musk-openai-lawsuit.html
本文鏈接:http://www.albanygandhi.com/news-23-489.htmlOpenAI高層巨變:三位核心人物同期離場
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
【解讀】《關于調整減免車輛購置稅新能源汽車產品技術要求的公告》解讀
關于發展銀發經濟增進老年人福祉的意見
工業和信息化部辦公廳關于舉辦2023年中國5G發展大會的通知(工信廳通信函〔2023〕275號)
《綠色建材產業高質量發展實施方案》
【解讀】執行2024年關稅調整方案等政策有關事宜公告的解讀
2024年載人航天工程發射任務啟幕 天舟飛船解鎖3小時“速運”模式
關于政協第十四屆全國委員會第一次會議第02948號(科學技術類135號)提案答復的函
2023年度《科技部門戶網站工作年度報表》
關于印發北京市進一步強化節能實施方案(2024年版)的通知(京發改〔2024〕182號)
昌平區加快獨角獸、專精特新企業培育發展支持辦法
鴻然達:靠譜蘋果id貸,蘋果id貸款口子最新
疊加-白條怎么套出來秒到商家(2025新春秒到提現介紹)
大吉大利:深圳大鵬新區 代還信用卡墊還,口碑商戶高效便捷服務
印度版索托拉西布國內哪里買更可靠呢?索托拉西布(Sotrdx)多少錢一盒?
瑾瑜:一次性悅刻waka哪里買?試試這十個渠道
大吉大利:佛山高明代還信用卡取現,找我就可以了,值得信任
透露:白條額度怎么套出來(百度精選教程)-知者
風大物燥:DY月付怎么刷出來 - 教你三個操作方法
歡天喜地:三亞墊還信用卡,怎么刷出來,5種常用方式
歡欣鼓舞:昆明嵩明縣上門代還信用卡,怎么刷出來,5種常用方式