谷歌發布基礎世界模型Genie,能一圖創建互動的虛擬環境

據谷歌公司官網26日報道,谷歌旗下“深度思維”公司重磅發布了一個根據互聯網視頻訓練的基礎世界模型——Genie(精靈)。其可從合成圖像、照片、草圖生成多種動作可控的環境。
Genie效果的動圖截圖演示。
圖片來源:谷歌官網
過去幾年,生成式人工智能(AI)模型能通過語言、圖像甚至視頻生成內容。谷歌此次引入生成式人工智能新范式,即生成式交互式環境,通過單個圖像提示即可生成交互式、動作可控的環境。
Genie是一個110億參數的基礎世界模型,在超過20萬小時的二維(2D)游戲視頻上進行訓練,無需人工監督。這意味著Genie可以從視頻中自行識別不同動作的特征和模式。其能學習各種角色的動作、控制和行動。
Genie的獨特之處還在于它能夠專門從互聯網視頻中學習細顆粒度的控制。Genie不僅能觀察哪些部分是可控制的,而且能根據生成的環境來推測出多種潛在的動作。
該模型接受單個圖像(無論是AI合成圖像、照片還是草圖),并將其轉換為可玩的游戲,響應用戶控件。從圖像到基本的交互環境一步到位。
用戶只需提供一張紙上的草圖、一幅完美的數字藝術作品,甚至是AI生成對2D世界的描述,Genie就會完成剩下的工作,幫用戶生成2D游戲。
谷歌官網稱,Genie專注2D平臺游戲和機器人技術的視頻,但方法通用,應適用于任何類型領域并可擴展至更大的互聯網數據集。只需一張圖像就能創建全新的交互環境,這為生成和進入虛擬世界的各種新路徑開啟了大門。
本文鏈接:http://www.albanygandhi.com/news-1-597.html谷歌發布基礎世界模型Genie,能一圖創建互動的虛擬環境
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
西安考研機構哪個靠譜(文都哪個比較好啊今年大三了)
跨考歷史學考研難嗎 有沒有朋友是在上海奉賢星火考的大路啊
賀州學院碩士(賀州學院出來有前途嗎)
舟山研究生考點在哪里 北大佛學院有多厲害
考研勵志哲理故事四則
2014考研:經濟學名詞解釋薈萃(第8輯)
2014經濟學考研輔導:宏觀經濟學案例分析(15)
2014經濟學考研輔導:宏觀經濟學案例分析(18)
2015經濟學考研:西方經濟學模擬試題二答案
5月份研究生考試(5月份研究生考試和12月份的有什么區別)
金長明:2024蘋果id貸款,蘋果id貸款口子2024
勇往直前:花唄怎么提現出來到支付寶(推薦十個方法)
2025年多吉美60片一盒價格多少錢:現如今多吉美多少錢一盒2025yb價格公布!印度多吉美(多吉美)正常價格一覽表:市場售價(約1200元)一盒!印度多吉美多少錢一盒價格(約1200元)售價一覽
揭秘 樂伐替尼/侖伐替尼2025年銷售價格貴不貴 在國內代購印度仿制藥樂伐替尼最低價格多少錢
好學不倦:拼多多先用后付怎么套出來(9個最新操作步驟)
乘風破浪:DY月付怎么套出來 - 推薦十個操作方法
老撾(孟加拉)維奈克拉(Venetoclax)Ventok代購多少錢
積極進取:羊小咩享花卡怎么套出來啊,享花卡最新三種提現方法
小白必看:教你花唄怎么快速提現出來(試試這三個操作方法)
小白必看:2024花唄怎么自己提現出來現金(2024花唄套取現金方法)