技術(shù)頻道

娓娓工業(yè)
您現(xiàn)在的位置: 中國傳動(dòng)網(wǎng) > 技術(shù)頻道 > 技術(shù)百科 > OpenAI推出Sora:AI領(lǐng)域的革命性突破

OpenAI推出Sora:AI領(lǐng)域的革命性突破

時(shí)間:2024-02-22 10:30:35來源:三界逆熵實(shí)驗(yàn)室

導(dǎo)語:?2022年,OpenAI聊天機(jī)器人ChatGPT的面世無疑成為了引領(lǐng)人工智能浪潮的標(biāo)志性事件,宣告了新一輪科技革命的到來。無論是聊天娛樂、教育學(xué)習(xí),還是工作生產(chǎn)、醫(yī)療健康等領(lǐng)域,人工智能正以前所未有的速度滲透到我們生活的方方面面。

而就在2月16日,OpenAI宣布推出全新的人工智能模型“Sora”。據(jù)了解,通過文本指令,Sora可以直接輸出長達(dá)60秒的視頻,并且包含高度細(xì)致的背景、復(fù)雜的多角度鏡頭,以及富有情感的多個(gè)角色。

這是繼文本、圖像之后,OpenAI將其先進(jìn)的AI技術(shù)拓展到了視頻領(lǐng)域。Sora無疑是人工智能領(lǐng)域的一次重大突破,該技術(shù)不僅展示了AI在理解和創(chuàng)造復(fù)雜視覺內(nèi)容方面的先進(jìn)能力,而且對內(nèi)容創(chuàng)作、娛樂和影視制作行業(yè)帶來了前所未有的挑戰(zhàn)和機(jī)遇。

一次性看完Sora發(fā)布的所有精彩視頻

01

對Sora問世的本源思考

我們知道,人類通過獲取和識(shí)別自然界和社會(huì)的各種信息來辨別物體,從而認(rèn)知并改變世界。信息廣泛指人類社會(huì)傳播的各種內(nèi)容,包括音訊、消息以及通訊系統(tǒng)傳輸和處理的對象。這些信息以多種載體形式存在,如文字、符號(hào)、表格、聲音、圖形圖像、視頻和動(dòng)畫等。

然而,現(xiàn)在,Sora的出現(xiàn)意味著對現(xiàn)實(shí)世界的理解、模擬和生成不再局限于人類。它涵蓋了文字、圖形圖片、語音和視頻等形式,而過去這些只有人類才能完成。正因如此,Sora的問世預(yù)示著這個(gè)世界正在發(fā)生難以想象的變革。

02

大模型的核心技術(shù):機(jī)器學(xué)習(xí)

大模型的核心技術(shù)是自然語言處理(NLP)和深度學(xué)習(xí)。具體而言,它基于Transformer架構(gòu),使用了大規(guī)模無監(jiān)督學(xué)習(xí)方法,例如自回歸語言建模和掩碼語言建模,來訓(xùn)練一個(gè)龐大的神經(jīng)網(wǎng)絡(luò)模型。

機(jī)器學(xué)習(xí)聽起來很高大上,其本身也確實(shí)很復(fù)雜。為了將簡單問題復(fù)雜化,機(jī)器學(xué)習(xí)是模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,如果我們從人類的學(xué)習(xí)行為來理解機(jī)器學(xué)習(xí),也許就比較容易。

人在認(rèn)識(shí)世界和學(xué)習(xí)的過程中,通常會(huì)先學(xué)習(xí)抽象的概念入手來了解某個(gè)事物或原理,這個(gè)概念其實(shí)就是對應(yīng)機(jī)器學(xué)習(xí)的特征工程。比如我們在學(xué)習(xí)幾何指示的三角形,首先會(huì)從符號(hào)來認(rèn)識(shí),然后是了解三角形的定義、性質(zhì)和計(jì)算公式。三角形的定義、性質(zhì)和計(jì)算公式,對應(yīng)機(jī)器學(xué)習(xí)的特征工程。

通常老師在講完課程后,會(huì)留一些課后作業(yè)和家庭作業(yè),用以加深和鞏固學(xué)生對三角形的概念、定義、性質(zhì)和計(jì)算公司的理解。那么學(xué)生做作業(yè)的過程,就是機(jī)器學(xué)習(xí)的訓(xùn)練樣本。訓(xùn)練數(shù)據(jù)是用來幫助機(jī)器學(xué)習(xí)知識(shí)、建立起蘊(yùn)含知識(shí)的模型的數(shù)據(jù)。

為了更好地提升學(xué)習(xí)效果和學(xué)習(xí)成績,學(xué)生還會(huì)參加課外補(bǔ)習(xí)班,然后做各種刷題和模擬練習(xí),這個(gè)過程就是讓機(jī)器學(xué)習(xí)的有更多的和更有效的訓(xùn)練樣本。在每個(gè)學(xué)期中,學(xué)校通常都會(huì)安排周考、月考、期中考、期末考,用以檢驗(yàn)學(xué)生的學(xué)習(xí)效果并作為考核的依據(jù),最終的結(jié)果就是考上好的高中和好的大學(xué)。

學(xué)生參加各種考試就是對應(yīng)機(jī)器學(xué)習(xí)的測試樣本。測試樣本是機(jī)器學(xué)習(xí)里模型服務(wù)的對象,對測試數(shù)據(jù)作出正確的預(yù)測和反饋,是機(jī)器學(xué)習(xí)一系列活動(dòng)的最終目的。

我們看到,計(jì)算機(jī)世界所有的技術(shù)和手段,包括機(jī)器學(xué)習(xí),都來源于我們現(xiàn)實(shí)日常生活和實(shí)踐,并且我們普通大眾都是能很好地理解。

很多時(shí)候父輩和祖輩們,可能他們沒讀過書,甚至不識(shí)字,但中華民族一些古老的知識(shí)和智慧(如成語、諺語)他們都能懂,甚至自然而然地去遵從。這些知識(shí)和智慧其實(shí)就是我們的基因,這些基因會(huì)一代代傳遞下來,并且不受文字和語言的限制。

這種基因的遺傳,其實(shí)也可以想象成一段“代碼”,假設(shè)這段代碼是更高維世界設(shè)計(jì)出來,那么人類也算是高維世界的“人工智能”。然后人類現(xiàn)又在自身的基因和日常實(shí)踐基礎(chǔ)上,設(shè)計(jì)出了第N+1代人工智能,并另類延續(xù)了人類的基因。

03

Sora會(huì)帶來哪些變局和顛覆性影響?

Sora模式的提出,必將對未來的視頻制作模式產(chǎn)生巨大的影響,并為各行各業(yè)帶來新的機(jī)遇。但Sora帶來的影響,無論從寬度和深度來說,都將遠(yuǎn)超這些。

1、對行業(yè)、職業(yè)的沖擊和顛覆

根據(jù)OpenAI官方文章介紹以及分享的演示視頻來看,Sora稱得上是“王炸級(jí)”的AI工具。就像OpenAI將圖像生成模型DALL-E集成到ChatGPT產(chǎn)品中那樣,如果OpenAI將視頻生成模型Sora也集成到ChatGPT供所有用戶使用,那么應(yīng)該能夠?qū)σ曨l相關(guān)的行業(yè)逐漸帶來改變,比如影視制作、短視頻創(chuàng)作、在線教育、廣告?zhèn)髅?、游戲開發(fā)、直播,等等。

2、虛擬現(xiàn)實(shí)融合帶來的影響

Sora模式可以按照用戶的喜好和動(dòng)作,在短時(shí)間內(nèi)產(chǎn)生各種場景、情節(jié),增強(qiáng)了用戶的互動(dòng)體驗(yàn)。sora的問世,當(dāng)人沉浸在虛擬的元宇宙的時(shí)候,比如有AR、VR,當(dāng)體驗(yàn)做到極致的時(shí)候,可能會(huì)分不清哪個(gè)是現(xiàn)實(shí)、哪個(gè)是虛擬?;蛘咧绤s不愿意區(qū)分,就像人做了美夢不愿意醒來一樣,因?yàn)樘摂M世界過的可能會(huì)比現(xiàn)實(shí)世界更好。

3、數(shù)實(shí)融合驅(qū)動(dòng)精神境界提升

隨著數(shù)字技術(shù)發(fā)展,人類社會(huì)活動(dòng)的一切過程都有可能被記錄下來,形成數(shù)據(jù)。sora的出現(xiàn),未來可以依據(jù)價(jià)值體(如組織、企業(yè)、個(gè)人、群體的標(biāo)簽畫像、行為為記錄,可以方便地生成和還原完整現(xiàn)實(shí)世界的一切原始模型和軌跡。

也就是說,可能不需要查看攝像頭視頻,或需要畫像專家依據(jù)目擊者的描述來勾勒嫌犯的畫像,就可能直接生成相關(guān)的視頻(不只是靜態(tài)畫面)。因此,未來,你擁有多少財(cái)富、物資和房產(chǎn),在平臺(tái)里都是透明的,你所花的任何一筆錢,其實(shí)也是透明的.

這個(gè)可能導(dǎo)致的結(jié)果,隨便一筆花費(fèi)別人都知道。如果是來路不正的錢,可能都不會(huì)有機(jī)會(huì)花費(fèi),違法犯罪行為也更都無法隱藏。所以,數(shù)字技術(shù)的發(fā)展,會(huì)驅(qū)使人們提升精神和道德的修養(yǎng),使得人們可能會(huì)更多地從物質(zhì)層面的追求,轉(zhuǎn)向精神層面的追求和探索。

Sora只是小試牛刀,它展現(xiàn)的不僅僅是一個(gè)視頻制作的能力,而是大模型對真實(shí)世界有了理解和模擬之后,會(huì)對整個(gè)人類社會(huì)全方位帶來新的突破和變革。

04

結(jié)語

中國人常說:“六六大順、逢七必變”這句話。對于數(shù)字“七”包含著許多奧妙,例如7日來復(fù),一周有7天,7年之癢,公司7年一個(gè)坎,個(gè)人職業(yè)往往7年會(huì)有起落等等。

二十一世紀(jì)有三個(gè)7,,一個(gè)“七”已經(jīng)讓人頭痛,兩個(gè)“七”更加復(fù)雜,3個(gè)代表“多”,很多事情都可能要變,二十一世紀(jì)會(huì)是非??焖俚囊粋€(gè)時(shí)期。因此,如果再拿二十世紀(jì)的思維,有可能是行不通。比如在數(shù)字化時(shí)代,我們可以彎道超車和選擇新的路徑,而簡單地照搬西方的思想和管理模式可能行不通。當(dāng)然,這并不意味著我們之前學(xué)習(xí)和西方學(xué)習(xí)沒有必要,相反,之前的學(xué)習(xí)是非常有必要的。

Sora的出現(xiàn)是人類AI技術(shù)新的里程碑,我們在AI上暫時(shí)落后于美國,但任何事情有好有壞,AI對人類的沖擊和顛覆的后果還未最終驗(yàn)證。有一種觀點(diǎn),認(rèn)為所有的創(chuàng)造發(fā)明其實(shí)都是發(fā)現(xiàn),即讓人們在合適的時(shí)間“發(fā)現(xiàn)”,在我們發(fā)現(xiàn)這些規(guī)律和科學(xué)奧秘之前,它們本就一直存在和起作用。

道德經(jīng):“天網(wǎng)恢恢,疏而不失(漏)”,如果“天網(wǎng)”看成是一個(gè)看不見、摸不著的高維“數(shù)字系統(tǒng)”,天網(wǎng)和現(xiàn)實(shí)世界的對接和映射,并將現(xiàn)實(shí)世界的萬事萬物進(jìn)行了記錄和存檔。Sora的問世讓現(xiàn)實(shí)世界和數(shù)字世界連接和孿生趨向無縫連接和融合,那么天網(wǎng)系統(tǒng)、現(xiàn)實(shí)世界和數(shù)字世界三者的相互作用,又將會(huì)進(jìn)一步給我們的未來帶來更多的變化。


標(biāo)簽: AI機(jī)器人

點(diǎn)贊

分享到:

上一篇:關(guān)于人工智能的幾個(gè)相關(guān)概念

下一篇:移動(dòng)協(xié)作機(jī)器人的RGB-D感知的...

中國傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:凡本網(wǎng)注明[來源:中國傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動(dòng)網(wǎng)(www.surachana.com)獨(dú)家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來源“中國傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

網(wǎng)站簡介|會(huì)員服務(wù)|聯(lián)系方式|幫助信息|版權(quán)信息|網(wǎng)站地圖|友情鏈接|法律支持|意見反饋|sitemap

傳動(dòng)網(wǎng)-工業(yè)自動(dòng)化與智能制造的全媒體“互聯(lián)網(wǎng)+”創(chuàng)新服務(wù)平臺(tái)

網(wǎng)站客服服務(wù)咨詢采購咨詢媒體合作

Chuandong.com Copyright ?2005 - 2025 ,All Rights Reserved 深圳市奧美大唐廣告有限公司 版權(quán)所有
粵ICP備 14004826號(hào) | 營業(yè)執(zhí)照證書 | 不良信息舉報(bào)中心 | 粵公網(wǎng)安備 44030402000946號(hào)