OpenAI發(fā)布Sora:AI巨變,其對(duì)人類的顛覆性影響
所屬頻道:新聞中心
2022年,OpenAI聊天機(jī)器人ChatGPT的面世無(wú)疑成為了引領(lǐng)人工智能浪潮的標(biāo)志性事件,宣告了新一輪科技革命的到來(lái)。無(wú)論是聊天娛樂(lè)、教育學(xué)習(xí),還是工作生產(chǎn)、醫(yī)療健康等領(lǐng)域,人工智能正以前所未有的速度滲透到我們生活的方方面面。
而就在2月16日,OpenAI宣布推出全新的人工智能模型“Sora”。據(jù)了解,通過(guò)文本指令,Sora可以直接輸出長(zhǎng)達(dá)60秒的視頻,并且包含高度細(xì)致的背景、復(fù)雜的多角度鏡頭,以及富有情感的多個(gè)角色。
這是繼文本、圖像之后,OpenAI將其先進(jìn)的AI技術(shù)拓展到了視頻領(lǐng)域。Sora無(wú)疑是人工智能領(lǐng)域的一次重大突破,該技術(shù)不僅展示了AI在理解和創(chuàng)造復(fù)雜視覺(jué)內(nèi)容方面的先進(jìn)能力,而且對(duì)內(nèi)容創(chuàng)作、娛樂(lè)和影視制作行業(yè)帶來(lái)了前所未有的挑戰(zhàn)和機(jī)遇。
對(duì)Sora問(wèn)世的本源思考 我們知道,人類通過(guò)獲取和識(shí)別自然界和社會(huì)的各種信息來(lái)辨別物體,從而認(rèn)知并改變世界。信息廣泛指人類社會(huì)傳播的各種內(nèi)容,包括音訊、消息以及通訊系統(tǒng)傳輸和處理的對(duì)象。這些信息以多種載體形式存在,如文字、符號(hào)、表格、聲音、圖形圖像、視頻和動(dòng)畫等。 然而,現(xiàn)在,Sora的出現(xiàn)意味著對(duì)現(xiàn)實(shí)世界的理解、模擬和生成不再局限于人類。它涵蓋了文字、圖形圖片、語(yǔ)音和視頻等形式,而過(guò)去這些只有人類才能完成。正因如此,Sora的問(wèn)世預(yù)示著這個(gè)世界正在發(fā)生難以想象的變革。 大模型的核心技術(shù):機(jī)器學(xué)習(xí) 大模型的核心技術(shù)是自然語(yǔ)言處理(NLP)和深度學(xué)習(xí)。具體而言,它基于Transformer架構(gòu),使用了大規(guī)模無(wú)監(jiān)督學(xué)習(xí)方法,例如自回歸語(yǔ)言建模和掩碼語(yǔ)言建模,來(lái)訓(xùn)練一個(gè)龐大的神經(jīng)網(wǎng)絡(luò)模型。 機(jī)器學(xué)習(xí)聽(tīng)起來(lái)很高大上,其本身也確實(shí)很復(fù)雜。為了將簡(jiǎn)單問(wèn)題復(fù)雜化,機(jī)器學(xué)習(xí)是模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,如果我們從人類的學(xué)習(xí)行為來(lái)理解機(jī)器學(xué)習(xí),也許就比較容易。 人在認(rèn)識(shí)世界和學(xué)習(xí)的過(guò)程中,通常會(huì)先學(xué)習(xí)抽象的概念入手來(lái)了解某個(gè)事物或原理,這個(gè)概念其實(shí)就是對(duì)應(yīng)機(jī)器學(xué)習(xí)的特征工程。比如我們?cè)趯W(xué)習(xí)幾何指示的三角形,首先會(huì)從符號(hào)來(lái)認(rèn)識(shí),然后是了解三角形的定義、性質(zhì)和計(jì)算公式。三角形的定義、性質(zhì)和計(jì)算公式,對(duì)應(yīng)機(jī)器學(xué)習(xí)的特征工程。 通常老師在講完課程后,會(huì)留一些課后作業(yè)和家庭作業(yè),用以加深和鞏固學(xué)生對(duì)三角形的概念、定義、性質(zhì)和計(jì)算公司的理解。那么學(xué)生做作業(yè)的過(guò)程,就是機(jī)器學(xué)習(xí)的訓(xùn)練樣本。訓(xùn)練數(shù)據(jù)是用來(lái)幫助機(jī)器學(xué)習(xí)知識(shí)、建立起蘊(yùn)含知識(shí)的模型的數(shù)據(jù)。 為了更好地提升學(xué)習(xí)效果和學(xué)習(xí)成績(jī),學(xué)生還會(huì)參加課外補(bǔ)習(xí)班,然后做各種刷題和模擬練習(xí),這個(gè)過(guò)程就是讓機(jī)器學(xué)習(xí)的有更多的和更有效的訓(xùn)練樣本。在每個(gè)學(xué)期中,學(xué)校通常都會(huì)安排周考、月考、期中考、期末考,用以檢驗(yàn)學(xué)生的學(xué)習(xí)效果并作為考核的依據(jù),最終的結(jié)果就是考上好的高中和好的大學(xué)。 學(xué)生參加各種考試就是對(duì)應(yīng)機(jī)器學(xué)習(xí)的測(cè)試樣本。測(cè)試樣本是機(jī)器學(xué)習(xí)里模型服務(wù)的對(duì)象,對(duì)測(cè)試數(shù)據(jù)作出正確的預(yù)測(cè)和反饋,是機(jī)器學(xué)習(xí)一系列活動(dòng)的最終目的。 我們看到,計(jì)算機(jī)世界所有的技術(shù)和手段,包括機(jī)器學(xué)習(xí),都來(lái)源于我們現(xiàn)實(shí)日常生活和實(shí)踐,并且我們普通大眾都是能很好地理解。 很多時(shí)候父輩和祖輩們,可能他們沒(méi)讀過(guò)書,甚至不識(shí)字,但中華民族一些古老的知識(shí)和智慧(如成語(yǔ)、諺語(yǔ))他們都能懂,甚至自然而然地去遵從。這些知識(shí)和智慧其實(shí)就是我們的基因,這些基因會(huì)一代代傳遞下來(lái),并且不受文字和語(yǔ)言的限制。 這種基因的遺傳,其實(shí)也可以想象成一段“代碼”,假設(shè)這段代碼是更高維世界設(shè)計(jì)出來(lái),那么人類也算是高維世界的“人工智能”。然后人類現(xiàn)又在自身的基因和日常實(shí)踐基礎(chǔ)上,設(shè)計(jì)出了第N+1代人工智能,并另類延續(xù)了人類的基因。 Sora會(huì)帶來(lái)哪些變局和顛覆性影響? Sora模式的提出,必將對(duì)未來(lái)的視頻制作模式產(chǎn)生巨大的影響,并為各行各業(yè)帶來(lái)新的機(jī)遇。但Sora帶來(lái)的影響,無(wú)論從寬度和深度來(lái)說(shuō),都將遠(yuǎn)超這些。 1、對(duì)行業(yè)、職業(yè)的沖擊和顛覆 根據(jù)OpenAI官方文章介紹以及分享的演示視頻來(lái)看,Sora稱得上是“王炸級(jí)”的AI工具。就像OpenAI將圖像生成模型DALL-E集成到ChatGPT產(chǎn)品中那樣,如果OpenAI將視頻生成模型Sora也集成到ChatGPT供所有用戶使用,那么應(yīng)該能夠?qū)σ曨l相關(guān)的行業(yè)逐漸帶來(lái)改變,比如影視制作、短視頻創(chuàng)作、在線教育、廣告?zhèn)髅健⒂螒蜷_(kāi)發(fā)、直播,等等。 2、虛擬現(xiàn)實(shí)融合帶來(lái)的影響 Sora模式可以按照用戶的喜好和動(dòng)作,在短時(shí)間內(nèi)產(chǎn)生各種場(chǎng)景、情節(jié),增強(qiáng)了用戶的互動(dòng)體驗(yàn)。sora的問(wèn)世,當(dāng)人沉浸在虛擬的元宇宙的時(shí)候,比如有AR、VR,當(dāng)體驗(yàn)做到極致的時(shí)候,可能會(huì)分不清哪個(gè)是現(xiàn)實(shí)、哪個(gè)是虛擬。或者知道卻不愿意區(qū)分,就像人做了美夢(mèng)不愿意醒來(lái)一樣,因?yàn)樘摂M世界過(guò)的可能會(huì)比現(xiàn)實(shí)世界更好。 3、數(shù)實(shí)融合驅(qū)動(dòng)精神境界提升 隨著數(shù)字技術(shù)發(fā)展,人類社會(huì)活動(dòng)的一切過(guò)程都有可能被記錄下來(lái),形成數(shù)據(jù)。sora的出現(xiàn),未來(lái)可以依據(jù)價(jià)值體(如組織、企業(yè)、個(gè)人、群體的標(biāo)簽畫像、行為為記錄,可以方便地生成和還原完整現(xiàn)實(shí)世界的一切原始模型和軌跡。 也就是說(shuō),可能不需要查看攝像頭視頻,或需要畫像專家依據(jù)目擊者的描述來(lái)勾勒嫌犯的畫像,就可能直接生成相關(guān)的視頻(不只是靜態(tài)畫面)。因此,未來(lái),你擁有多少財(cái)富、物資和房產(chǎn),在平臺(tái)里都是透明的,你所花的任何一筆錢,其實(shí)也是透明的. 這個(gè)可能導(dǎo)致的結(jié)果,隨便一筆花費(fèi)別人都知道。如果是來(lái)路不正的錢,可能都不會(huì)有機(jī)會(huì)花費(fèi),違法犯罪行為也更都無(wú)法隱藏。所以,數(shù)字技術(shù)的發(fā)展,會(huì)驅(qū)使人們提升精神和道德的修養(yǎng),使得人們可能會(huì)更多地從物質(zhì)層面的追求,轉(zhuǎn)向精神層面的追求和探索。 Sora只是小試牛刀,它展現(xiàn)的不僅僅是一個(gè)視頻制作的能力,而是大模型對(duì)真實(shí)世界有了理解和模擬之后,會(huì)對(duì)整個(gè)人類社會(huì)全方位帶來(lái)新的突破和變革。 結(jié)語(yǔ) 中國(guó)人常說(shuō):“六六大順、逢七必變”這句話。對(duì)于數(shù)字“七”包含著許多奧妙,例如7日來(lái)復(fù),一周有7天,7年之癢,公司7年一個(gè)坎,個(gè)人職業(yè)往往7年會(huì)有起落等等。 二十一世紀(jì)有三個(gè)7,,一個(gè)“七”已經(jīng)讓人頭痛,兩個(gè)“七”更加復(fù)雜,3個(gè)代表“多”,很多事情都可能要變,二十一世紀(jì)會(huì)是非常快速的一個(gè)時(shí)期。因此,如果再拿二十世紀(jì)的思維,有可能是行不通。比如在數(shù)字化時(shí)代,我們可以彎道超車和選擇新的路徑,而簡(jiǎn)單地照搬西方的思想和管理模式可能行不通。當(dāng)然,這并不意味著我們之前學(xué)習(xí)和西方學(xué)習(xí)沒(méi)有必要,相反,之前的學(xué)習(xí)是非常有必要的。 Sora的出現(xiàn)是人類AI技術(shù)新的里程碑,我們?cè)贏I上暫時(shí)落后于美國(guó),但任何事情有好有壞,AI對(duì)人類的沖擊和顛覆的后果還未最終驗(yàn)證。有一種觀點(diǎn),認(rèn)為所有的創(chuàng)造發(fā)明其實(shí)都是發(fā)現(xiàn),即讓人們?cè)诤线m的時(shí)間“發(fā)現(xiàn)”,在我們發(fā)現(xiàn)這些規(guī)律和科學(xué)奧秘之前,它們本就一直存在和起作用。 道德經(jīng):“天網(wǎng)恢恢,疏而不失(漏)”,如果“天網(wǎng)”看成是一個(gè)看不見(jiàn)、摸不著的高維“數(shù)字系統(tǒng)”,天網(wǎng)和現(xiàn)實(shí)世界的對(duì)接和映射,并將現(xiàn)實(shí)世界的萬(wàn)事萬(wàn)物進(jìn)行了記錄和存檔。Sora的問(wèn)世讓現(xiàn)實(shí)世界和數(shù)字世界連接和孿生趨向無(wú)縫連接和融合,那么天網(wǎng)系統(tǒng)、現(xiàn)實(shí)世界和數(shù)字世界三者的相互作用,又將會(huì)進(jìn)一步給我們的未來(lái)帶來(lái)更多的變化。01
02
03
04
(審核編輯: 智匯lucy)
分享