AI數(shù)據(jù)爆發(fā)“石油危機(jī)”,內(nèi)容公司可以躺著賺錢了

244次瀏覽

ChatGPT 的出現(xiàn)和 Midjourney 的爆發(fā)式采用讓 AI 實(shí)現(xiàn)了第一次大規(guī)模應(yīng)用,即大模型的普及。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

所謂大模型,是指具有大量參數(shù)和復(fù)雜結(jié)構(gòu)的機(jī)器學(xué)習(xí)模型,能夠處理海量數(shù)據(jù)、完成各種復(fù)雜的任務(wù)。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

AI數(shù)據(jù)版權(quán)糾紛g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

如果把當(dāng)下的 AI 大模型比作汽車,原始數(shù)據(jù)就是原油。無(wú)論如何,首先 AI 模型需要足夠的“原油”。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

AI 公司的“原油”來(lái)源主要有以下幾類:g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

●網(wǎng)上公開(kāi)免費(fèi)的數(shù)據(jù)源,比如維基百科、博客、論壇、新聞資訊等;g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

●老牌新聞媒體和出版社;g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

●大學(xué)等研究機(jī)構(gòu);g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

●使用模型的 C 端用戶。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

現(xiàn)實(shí)世界的石油歸屬權(quán)已經(jīng)有成熟的法律規(guī)范,而在 AI 這個(gè)天地尚且混沌的領(lǐng)域,“原油”開(kāi)采權(quán)還不明晰,由此造成的糾紛不勝枚舉。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

就在最近,多家大型音樂(lè)廠牌起訴AI音樂(lè)制作公司Suno和Udio,指控其侵犯版權(quán)。這起訴訟與《紐約時(shí)報(bào)》去年12月對(duì)OpenAI的訴訟類似。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

2023年7月,一些作家對(duì)該公司提起訴訟,指控ChatGPT根據(jù)受版權(quán)保護(hù)的內(nèi)容生成了作者作品的摘要。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

同年12月,《紐約時(shí)報(bào)》也對(duì)微軟和OpenAI提起類似版權(quán)侵權(quán)訴訟,指控這兩家公司利用該報(bào)的內(nèi)容訓(xùn)練人工智能聊天機(jī)器人。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

此外,還有一起集體訴訟在加利福尼亞州提起,指控OpenAI未經(jīng)用戶同意,從互聯(lián)網(wǎng)上獲取用戶私人信息來(lái)訓(xùn)練ChatGPT。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

OpenAI 最終并沒(méi)有為這份指控買單,他們表示不認(rèn)同《紐約時(shí)報(bào)》的指控,也無(wú)法復(fù)現(xiàn)《紐約時(shí)報(bào)》提到的問(wèn)題,更重要的是,所謂《紐約時(shí)報(bào)》提供的數(shù)據(jù)源,對(duì)于 OpenAI 來(lái)說(shuō)并不重要。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

來(lái)源:https://openai.com/index/openai-and-journalism/g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

對(duì)于 OpenAI 來(lái)說(shuō),這件事情帶來(lái)的最大教訓(xùn)也許就是處理好與數(shù)據(jù)供應(yīng)商的關(guān)系,明確雙方權(quán)責(zé)。于是,我們?cè)诮荒甑臅r(shí)間內(nèi)看到 OpenAI 跟很多數(shù)據(jù)供應(yīng)商達(dá)成合作伙伴關(guān)系,包括但不僅限于The Atlantic、Vox Media、News Corp、Reddit、Financial Times、Le Monde、Prisa Media、Axel Springer、American Journalism Project 等等。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

未來(lái),OpenAI 將名正言順地使用這些媒體的數(shù)據(jù),而這些媒體也會(huì)將 OpenAI 的技術(shù)融合到產(chǎn)品中。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

AI 推動(dòng)內(nèi)容平臺(tái)變現(xiàn)g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

不過(guò),OpenAI 跟數(shù)據(jù)供應(yīng)商達(dá)成合作關(guān)系最根本的原因不是恐懼被起訴,而是機(jī)器學(xué)習(xí)即將面臨的數(shù)據(jù)枯竭。MIT等研究人員曾進(jìn)行一項(xiàng)研究估計(jì),機(jī)器學(xué)習(xí)數(shù)據(jù)集可能會(huì)在 2026 年之前耗盡所有「高質(zhì)量語(yǔ)言數(shù)據(jù)」。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

「高質(zhì)量的數(shù)據(jù)」因此成為像 OpenAI 和 Google 這樣的模型制造商的香餑餑。內(nèi)容公司與AI模型廠商屢屢達(dá)成合作,開(kāi)啟躺平賺錢模式。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

傳統(tǒng)媒體平臺(tái)Shutterstock陸續(xù)和Meta, Alphabet, Amazon, Apple, OpenAI, Reka等AI公司達(dá)成合作, 2023年通過(guò)內(nèi)容授權(quán)給AI模型將年收入提高到 1.04 億美元,預(yù)計(jì) 2027 年產(chǎn)生 2.5 億美元收入;Reddit 授權(quán)給谷歌的內(nèi)容版權(quán)收入每年高達(dá) 6000 萬(wàn)美元;蘋果也在尋求與主流新聞媒體合作,開(kāi)出一年至少5000萬(wàn)美元的版權(quán)費(fèi)。內(nèi)容公司從 AI 公司收到的版權(quán)費(fèi)正在以 450% 的年增長(zhǎng)率瘋狂上漲著。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

而在過(guò)去一些年里,流媒體之外的內(nèi)容難以變現(xiàn),這是內(nèi)容行業(yè)的一大痛點(diǎn)。相比互聯(lián)網(wǎng)創(chuàng)業(yè)時(shí)代,AI 的出現(xiàn)給內(nèi)容行業(yè)帶來(lái)了更大的想象力以及更強(qiáng)烈的收入預(yù)期。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

高質(zhì)量數(shù)據(jù)依然稀缺g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

當(dāng)然不是什么樣的內(nèi)容都符合 AI 的需求。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

關(guān)于前文提到的 OpenAI 和《紐約時(shí)報(bào)》的爭(zhēng)論,另一個(gè)亮點(diǎn)是數(shù)據(jù)質(zhì)量。從原油中提煉石油,一則是要油本身質(zhì)量好,二則提純技術(shù)要好。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

OpenAI 特意強(qiáng)調(diào)《紐約時(shí)報(bào)》的內(nèi)容并未對(duì) OpenAI 的模型訓(xùn)練產(chǎn)生任何重大貢獻(xiàn),比起能夠讓 OpenAI 每年自掏腰包數(shù)千萬(wàn)美金的 Shutterstock,《紐約時(shí)報(bào)》這類靠時(shí)效性起家的文字媒體并不是 AI 時(shí)代的寵兒。AI 更需要深刻而獨(dú)特的數(shù)據(jù)。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

而高質(zhì)量數(shù)據(jù)太稀缺,AI 公司也開(kāi)始在“提純技術(shù)”和“一站式應(yīng)用”上下功夫。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

6 月 25 日,OpenAI 收購(gòu)實(shí)時(shí)分析數(shù)據(jù)庫(kù)公司 Rockset。這家公司主要提供實(shí)時(shí)數(shù)據(jù)索引和查詢功能,OpenAI將在其產(chǎn)品中集成 Rockset 的技術(shù),提高數(shù)據(jù)的實(shí)時(shí)使用價(jià)值。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

通過(guò)收購(gòu)Rockset,OpenAI 計(jì)劃使 AI 更好地利用和訪問(wèn)實(shí)時(shí)數(shù)據(jù)。這能使 OpenAI 的產(chǎn)品支持更復(fù)雜的應(yīng)用,如實(shí)時(shí)推薦系統(tǒng)、動(dòng)態(tài)數(shù)據(jù)驅(qū)動(dòng)的聊天機(jī)器人、實(shí)時(shí)監(jiān)控和報(bào)警系統(tǒng)等。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

Rocket是 OpenAI 內(nèi)置的“石化部門”,將普通數(shù)據(jù)直接轉(zhuǎn)化為應(yīng)用所需的高質(zhì)量數(shù)據(jù)。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

創(chuàng)作者數(shù)據(jù)確權(quán)是異想天開(kāi)嗎?g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

互聯(lián)網(wǎng)媒體平臺(tái)(Facebook、Reddit 等)的數(shù)據(jù)很大程度來(lái)自于UGC,即用戶貢獻(xiàn)內(nèi)容。很多平臺(tái)在向 AI 公司收取高額數(shù)據(jù)費(fèi)的同時(shí),也悄悄在用戶條款上加上了一條“平臺(tái)擁有使用用戶數(shù)據(jù)訓(xùn)練 AI 模型的權(quán)力”。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

雖然用戶條款對(duì) AI 模型訓(xùn)練權(quán)力有所標(biāo)注,但創(chuàng)很多作者并不清楚自己生產(chǎn)的內(nèi)容具體被哪些模型使用,也不知道是否是付費(fèi)使用,更無(wú)從獲得本該屬于自己的相關(guān)權(quán)益。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

在今年 2 月份的 Meta 季度業(yè)績(jī)電話會(huì)議上,扎克伯格明確表示將使用 Facebook 和 Instagram 上的圖片來(lái)訓(xùn)練他的 AI 生成工具。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

據(jù)報(bào)道,Tumblr 也已經(jīng)與 OpenAi 和 Midjourney 神秘達(dá)成內(nèi)容授權(quán)協(xié)議,但并未公開(kāi)具體協(xié)議的具體的內(nèi)容。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

圖片庫(kù)平臺(tái)EyeEm的創(chuàng)作者們最近也收到一份通知,提示他們發(fā)布過(guò)的照片會(huì)用于 AI 模型訓(xùn)練。通知提到,用戶可以選擇因此不使用產(chǎn)品,但還未提及任何補(bǔ)償政策。EyeEm 的母公司 Freepik 向路透社透露,該公司已與兩家大型科技公司簽署協(xié)議,以每張圖片 3 美分左右的價(jià)格授權(quán)其 2 億張圖片中的大部分圖片。首席執(zhí)行官 Joaquin Cuenca Abela 表示,還有五筆類似的交易正在進(jìn)行中,但拒絕透露買家的身份。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

Getty Images、Adobe、Photobucket、Flickr、Reddit 等UGC 為主導(dǎo)的內(nèi)容平臺(tái)都面臨類似的問(wèn)題,在巨大的數(shù)據(jù)變現(xiàn)誘惑下,平臺(tái)選擇忽視用戶的內(nèi)容所有權(quán),一把將數(shù)據(jù)打包賣給 AI 模型公司。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

整個(gè)過(guò)程都在暗處進(jìn)行,創(chuàng)作者并沒(méi)有任何反抗的機(jī)會(huì)。甚至許多創(chuàng)作者,可能要在未來(lái)某一天,在某個(gè)模型中訓(xùn)練出與自己作品類似的內(nèi)容時(shí),才能有機(jī)會(huì)懷疑曾經(jīng)的作品被某個(gè)平臺(tái)拿去賣給 AI 公司做模型訓(xùn)練。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

解決創(chuàng)作者的數(shù)據(jù)確權(quán)和收益難以保護(hù)的問(wèn)題,Web3 可能是個(gè)好選擇。當(dāng) AI 公司在美股屢創(chuàng)新高時(shí),web3 的 AI 概念幣也在同時(shí)一飛沖天。區(qū)塊鏈以其去中心化和不可篡改的特性,在保護(hù)創(chuàng)作者權(quán)益上享有得天獨(dú)厚的優(yōu)勢(shì)。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

諸如圖片和視頻這樣的媒體內(nèi)容已經(jīng)在 2021 年的牛市完成了上鏈的大規(guī)模采用,而社交平臺(tái)的 UGC 內(nèi)容上鏈也在悄然發(fā)生。同時(shí),許多 web3 AI 模型平臺(tái)已經(jīng)在激勵(lì)為模型訓(xùn)練做貢獻(xiàn)的普通用戶,無(wú)論是數(shù)據(jù)所有者,還是訓(xùn)練者,都被激勵(lì)著。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

AI 模型指數(shù)級(jí)的發(fā)展為數(shù)據(jù)確權(quán)提出了更大的需求,創(chuàng)作者應(yīng)該思考:為什么我的作品在沒(méi)有經(jīng)過(guò)我同意的情況下被 5 美分一幅賣給了 AI 模型公司?為什么整個(gè)過(guò)程中我不知情,且無(wú)法得到任何收益?g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

媒體平臺(tái)竭澤而漁也無(wú)法緩解 AI 模型公司的數(shù)據(jù)焦慮,實(shí)現(xiàn)高質(zhì)量數(shù)據(jù)高產(chǎn)量的前提是數(shù)據(jù)確權(quán),是創(chuàng)作者、平臺(tái)和 AI 模型公司三者合理的利益分配。g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

參考來(lái)源g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

Shutterstock Made $104 Million Licensing Assets to AI Devs Last Year(PetaPixel)g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

All The Photo Companies That Have Struck Licensing Deals With AI Firms(PetaPixel)g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

Reddit has a new AI training deal to sell user content(TheEverge)g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

GPT-4耗盡全宇宙數(shù)據(jù)!OpenAI接連吃官司,竟因數(shù)據(jù)太缺了,UC伯克利教授發(fā)出警告(新智元)g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

OpenAI acquires Rockset(OpenAI)g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊


g5I知多少教育網(wǎng)-記錄每日最新科研教育資訊

本文鏈接:http://www.albanygandhi.com/news-23-2.htmlAI數(shù)據(jù)爆發(fā)“石油危機(jī)”,內(nèi)容公司可以躺著賺錢了

聲明:本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。

熱門文章

延伸閱讀

相關(guān)閱讀

2023年度湖北省科學(xué)技術(shù)獎(jiǎng)復(fù)評(píng)第一批專家名單公布
現(xiàn)公布第一批參加2023年度湖北省科學(xué)技術(shù)獎(jiǎng)復(fù)評(píng)的專家名單(按姓氏筆畫(huà)排名)。 青年科技創(chuàng)新獎(jiǎng) 王發(fā)洲、王航宇、
廈門市公示賽馬制揭榜掛帥項(xiàng)目擬立項(xiàng)項(xiàng)目
關(guān)于2023年賽馬制揭榜掛帥項(xiàng)目擬立項(xiàng)項(xiàng)目公示 根據(jù)《廈門市科學(xué)技術(shù)局關(guān)于組織申報(bào)2023年度賽馬制揭榜掛帥科技計(jì)劃項(xiàng)
云南省科技廳公示關(guān)于農(nóng)業(yè)領(lǐng)域自上而下擬立項(xiàng)項(xiàng)目
云南省科技廳關(guān)于農(nóng)業(yè)領(lǐng)域自上而下擬立項(xiàng)項(xiàng)目的公示 根據(jù)《云南省科技計(jì)劃項(xiàng)目管理辦法》等要求,經(jīng)省科技廳廳務(wù)會(huì)
安徽省科技廳發(fā)布區(qū)域聯(lián)合基金項(xiàng)目指南建議
安徽省科學(xué)技術(shù)廳關(guān)于征集2024年度國(guó)家自然科學(xué)基金區(qū)域創(chuàng)新發(fā)展聯(lián)合基金(安徽)項(xiàng)目指南建議的通知 皖科基礎(chǔ)秘〔20
2023寧夏回族自治區(qū)科學(xué)技術(shù)獎(jiǎng)綜合評(píng)審結(jié)果公示
2023年度自治區(qū)科學(xué)技術(shù)獎(jiǎng)評(píng)審委員會(huì)綜合評(píng)審結(jié)果公示 按照《寧夏 回族自治區(qū)科學(xué)技術(shù)獎(jiǎng)勵(lì)辦法》和《寧夏回族自
2022年度陜西高校學(xué)生工作精品項(xiàng)目結(jié)項(xiàng)驗(yàn)收結(jié)果公示
根據(jù)《 中共陜西省委教育工委辦公室關(guān)于做好2022年度學(xué)生工作精品項(xiàng)目和2023年度研究課題結(jié)題驗(yàn)收的通知》(陜教工生辦

熱點(diǎn)精選

最新推薦

您可能感興趣

國(guó)際科創(chuàng)項(xiàng)目前沿大賽競(jìng)技

【解讀】新修訂《公司法》

關(guān)于發(fā)展銀發(fā)經(jīng)濟(jì)增進(jìn)老年人福祉的意見(jiàn)

【解讀】北京市通州區(qū)人民政府辦公室印發(fā)關(guān)于《北京市積極應(yīng)對(duì)疫情影響助企紓困的若干措施》落實(shí)指引的通知(通政辦發(fā)〔2022〕26號(hào))

首批30家服務(wù)站“各顯其能”—— 北京:多維度靶向賦能專精特新企業(yè)

科技部 中央宣傳部 中國(guó)科協(xié)關(guān)于評(píng)選表彰全國(guó)科普工作先進(jìn)集體和先進(jìn)工作者的通知

對(duì)十四屆全國(guó)人大一次會(huì)議第2199號(hào)建議的答復(fù)

科技部2023年全國(guó)人大建議和全國(guó)政協(xié)提案辦理情況

【申報(bào)】關(guān)于征集2024年度新三板掛牌補(bǔ)貼支持資金項(xiàng)目的通知

關(guān)于印發(fā) 《北京市房地產(chǎn)廣告發(fā)布指引》《北京市金融投資理財(cái)類廣告發(fā)布指引》的通知(京市監(jiān)發(fā)〔2024〕9號(hào))

封控必看-DY月付怎么找靠譜商家!

今日揭曉:鹿優(yōu)選先享卡包哪里提出來(lái)靠譜

如登春臺(tái):合肥長(zhǎng)豐縣代還信用卡可長(zhǎng)期合作,高效便捷服務(wù)

如登春臺(tái):鄭州代還信用卡取現(xiàn),多年經(jīng)營(yíng),需要的請(qǐng)聯(lián)系

2025代購(gòu)印度布加替尼價(jià)格在多少錢一盒價(jià)格公開(kāi):4500元一盒一覽,印度布加替尼真實(shí)價(jià)格折合人民幣在4500元!2025印度布加替尼國(guó)內(nèi)的渠道有哪些?

大吉大利:佛山禪城代還信用卡墊還,口碑商戶值得信任

風(fēng)馳電掣:杭州臨平區(qū)代還信用卡怎么刷出來(lái),5種常用方式

通報(bào):京東白條有辦法套出來(lái)嗎(12種完美換現(xiàn)小妙招詳情介紹)-知者

實(shí)事求是:DY月付怎么套出來(lái) - 分享三個(gè)提現(xiàn)方法

經(jīng)驗(yàn):白條怎么套出來(lái)方法太詳細(xì)了(五種方法提現(xiàn)詳解)-知者

主站蜘蛛池模板: 美女久久久久久| 99视频在线观看视频| 欧美一级视频免费看| 伊人色综合一区二区三区| 色偷偷91综合久久噜噜| 国产无套乱子伦精彩是白视频 | 欧美精品黑人粗大| 免费a级片在线观看| 美女被免费网站在线视频免费| 国产成人一区二区三区精品久久| 538精品视频| 夜夜爱夜夜爽夜夜做夜夜欢| 七月婷婷精品视频在线观看| 日本娇小videos精品| 亚洲xxxxxx| 欧美成人黄色片| 亚洲精品国产av成拍色拍| 精品无码国产自产拍在线观看蜜 | 乱理电影不卡4k4k| 欧美人与动性行为网站免费| 亚洲激情在线观看| 狠狠躁夜夜躁人人爽天天天天97 | 51影院成人影院| 国产综合激情在线亚洲第一页| avtt香蕉久久| 好爽好多水小荡货护士视频| 三级理论中文字幕在线播放| 无码福利一区二区三区| 久久国产精品99精品国产| 最近中文AV字幕在线中文| 亚洲人成网站在线观看播放青青| 欧美色视频超清在线观看| 在线观看一区二区三区视频| 一线高清视频在线观看www国产| 挺进白嫩老师下面视频| 久久久久99精品成人片试看| 日韩影片在线观看| 人人狠狠综合久久亚洲婷婷| 精品久久久无码中文字幕| 啊啊啊好大在线观看| 色婷婷免费视频|