首頁(yè)>新聞中心>智能制造

OpenAI時(shí)隔一年再出“王炸”

中美AI差距緣何再度拉大?

2024-02-20 08:46:00

  本報(bào)記者 樊三彩
  “一只狼對(duì)著月亮嚎叫,感到孤獨(dú),直到它找到狼群?!?/div>
  “一位時(shí)尚女性走在充滿溫暖霓虹燈和動(dòng)畫城市標(biāo)牌的東京街道上。她穿著黑色皮夾克、紅色長(zhǎng)裙和黑色靴子,拎著黑色錢包?!?/div>
  “一只貓叫醒熟睡的主人,要求吃早餐。主人試圖忽視這只貓,但貓嘗試了新的策略,最后主人從枕頭下拿出秘密藏匿的零食,讓貓?jiān)俅粢粫?huì)兒?!?/div>
  …………
  能想象嗎,這些清晰流暢的視頻場(chǎng)景,竟然出自一款人工智能模型。2月16日,OpenAI時(shí)隔一年再出“王炸”,宣布推出全新的生成式人工智能模型Sora。該模型可以直接輸出長(zhǎng)達(dá)60秒的視頻,并且包含高度細(xì)致的背景、復(fù)雜的多角度鏡頭,以及富有情感的多個(gè)角色。截至目前,其官網(wǎng)已經(jīng)更新48個(gè)類似的視頻demo(樣片)。
  這一突破引起業(yè)內(nèi)人士廣泛關(guān)注的原因在于,2021年初和2022年末,OpenAI先后推出了圖像生成系統(tǒng)DALL·E和聊天機(jī)器人ChatGPT。此次則是繼圖像、文本之后,將先進(jìn)的AI(人工智能)技術(shù)拓展到了視頻領(lǐng)域,視頻相關(guān)業(yè)務(wù)或?qū)⑹桩?dāng)其沖。工業(yè)4.0研究院院長(zhǎng)胡權(quán)告訴《中國(guó)冶金報(bào)》記者:“當(dāng)國(guó)內(nèi)還掙扎在4秒AI視頻的連貫性的邊緣時(shí),OpenAI已經(jīng)可以制作60秒的視頻了。當(dāng)我們以為快要追趕上他們的腳步時(shí),突然發(fā)現(xiàn)差距正在越來越大。”
  中美AI差距或在加大
  基礎(chǔ)研究不到位是關(guān)鍵
  通過文字生成視頻,對(duì)于大模型而言,難在哪里?華為技術(shù)有限公司運(yùn)營(yíng)商服務(wù)解決方案規(guī)劃部客戶技術(shù)總監(jiān)顧廷權(quán)表示:“sora是根據(jù)人的文字描述(類似簡(jiǎn)單劇本)生成相應(yīng)的視頻(類似MV電影),這就需要為模型訓(xùn)練數(shù)據(jù)做高描述性的標(biāo)注,大模型不僅要理解提示的內(nèi)容,還要構(gòu)建這些內(nèi)容在物理世界中的存在方式。”
  OpenAI發(fā)布的Sora核心論文顯示,Sora采用了一種Transformer架構(gòu),能夠處理視頻和圖像潛在編碼的時(shí)空片段。它創(chuàng)新應(yīng)用了多項(xiàng)技術(shù),如實(shí)現(xiàn)視覺數(shù)據(jù)創(chuàng)新轉(zhuǎn)化的補(bǔ)片技術(shù)(先將視頻數(shù)據(jù)壓縮到低維度潛在空間,再將其分解成時(shí)空補(bǔ)片,進(jìn)而實(shí)現(xiàn)從視頻到補(bǔ)片的轉(zhuǎn)化)、視頻生成的Transformer擴(kuò)展技術(shù)等。
  “同樣是生成虛擬空間,其實(shí)數(shù)字孿生相較于Sora的難度更高?!鳖櫷?quán)剖析道,“數(shù)字孿生與自動(dòng)駕駛類似,可以劃分為若干成熟度等級(jí)(如L0、L1、L2、L3、L4等),目前大多數(shù)字孿生都在L2級(jí)以下,僅實(shí)現(xiàn)了可視化和虛實(shí)簡(jiǎn)單交互等功能?!焙鷻?quán)同樣認(rèn)為:“相較于數(shù)字孿生體的先進(jìn)應(yīng)用(不是當(dāng)前一些人認(rèn)為的可視化或局部的仿真),OpenAI做的東西還沒有涉及物理世界,難度當(dāng)然要小得多。”
  同時(shí),我國(guó)也在大力發(fā)展人工智能大模型,據(jù)不完全統(tǒng)計(jì),目前已達(dá)上百個(gè)。既然如此,為何中美人工智能領(lǐng)域差距始終存在,并且再度加大?360創(chuàng)始人周鴻祎微博發(fā)文認(rèn)為:“盡管國(guó)內(nèi)大模型發(fā)展水平表面看已經(jīng)接近GPT-3.5,但實(shí)際上跟4.0比還有一年半的差距。OpenAl手里應(yīng)該還有一些秘密武器,無(wú)論是 GPT-5,還是機(jī)器通過自我學(xué)習(xí)自動(dòng)產(chǎn)生內(nèi)容,奧特曼(OpenAI CEO)是個(gè)營(yíng)銷大師,知道怎樣掌握節(jié)奏,他們手里的武器并沒有全拿出來。這樣看來,中國(guó)跟美國(guó)的AI差距可能還在加大。”
  在胡權(quán)看來,基礎(chǔ)研究不到位是差距形成的關(guān)鍵所在?!坝捎贑hatGPT-3.5已經(jīng)實(shí)現(xiàn)開源,國(guó)內(nèi)很多大模型公司都在這一基礎(chǔ)上開展研究,這意味著我們?cè)谘刂鴦e人的技術(shù)路徑前進(jìn),因而很難實(shí)現(xiàn)超越。”他表示,目前國(guó)內(nèi)存在一種資源錯(cuò)配的現(xiàn)象,如很多科研院所也在開展大模型應(yīng)用研究以圖盈利,當(dāng)前的科研體制導(dǎo)致我們很難形成開創(chuàng)性的突破。此外,新型的AI發(fā)展需要大量投資,目前國(guó)內(nèi)的投資強(qiáng)度遠(yuǎn)遠(yuǎn)不夠;產(chǎn)業(yè)環(huán)境不利于創(chuàng)新,例如,監(jiān)管過于嚴(yán)格,企業(yè)無(wú)法低風(fēng)險(xiǎn)試錯(cuò)。他建議,國(guó)家通過設(shè)立基金的方式來支持人工智能的發(fā)展,而不是指定企業(yè)或項(xiàng)目,這樣才能讓那些真正有實(shí)力的項(xiàng)目涌現(xiàn)出來。
  AGI不再遙遠(yuǎn) 工業(yè)應(yīng)用猶可期
  值得注意的是,Sora并非完美。正如公開的核心論文所說:“作為一個(gè)模擬器,Sora當(dāng)前還有許多局限。比如,它無(wú)法精確模擬像玻璃破碎這樣的基本物理互動(dòng)。有些互動(dòng),比如吃東西,并不總能正確反映物體狀態(tài)的改變。我們?cè)贠penAI Sora 介紹頁(yè)中詳細(xì)列出了模型的其它常見失誤,包括長(zhǎng)時(shí)間視頻樣本中出現(xiàn)的不一致性或物體的突然出現(xiàn)等問題?!?/div>
  即使存在這樣的局限,也無(wú)法掩蓋其依舊是一款劃時(shí)代的人工智能模型,依舊是“向著創(chuàng)建能夠模擬物理世界的通用工具邁出的有前途的一步”。
  周鴻祎認(rèn)為,Sora 的誕生意味著實(shí)現(xiàn) AGI(通用人工智能)可能從10 年縮短至一兩年?!坝辛舜竽P图夹g(shù)作為基礎(chǔ),再加上人類知識(shí)的引導(dǎo),可以創(chuàng)造各個(gè)領(lǐng)域的超級(jí)工具,例如在生物醫(yī)學(xué)、蛋白質(zhì)、基因研究以及物理、化學(xué)、數(shù)學(xué)的學(xué)科研究上,大模型都會(huì)發(fā)揮作用?!彼硎?。
  科技創(chuàng)業(yè)公司研究機(jī)構(gòu)PitchBook估計(jì),2023年全球生成式AI的市場(chǎng)規(guī)模將達(dá)到426億美元,2026年則將達(dá)到981億美元,未來增長(zhǎng)動(dòng)能可期。而不斷涌現(xiàn)的生成式人工智能,其對(duì)于人類的影響每次都會(huì)引發(fā)廣泛關(guān)注與討論。
  周鴻祎表示,這次OpenAI利用它的大語(yǔ)言模型優(yōu)勢(shì),讓Sora實(shí)現(xiàn)了對(duì)現(xiàn)實(shí)世界的理解和對(duì)世界的模擬兩層能力,這樣產(chǎn)生的視頻才是真實(shí)的,才能跳出2D的范圍模擬真實(shí)的物理世界?!斑@次 Sora對(duì)物理世界的模擬,至少將會(huì)對(duì)機(jī)器人具身智能和自動(dòng)駕駛帶來巨大的影響。原來的自動(dòng)駕駛技術(shù)過度強(qiáng)調(diào)感知層面,而沒有工作在認(rèn)知層面。其實(shí)人在駕駛汽車的時(shí)候,很多判斷是基于對(duì)這個(gè)世界的理解。比如對(duì)方的速度怎么樣,能否發(fā)生碰撞,碰撞嚴(yán)重性如何,如果沒有對(duì)世界的理解就很難實(shí)現(xiàn)真正的無(wú)人駕駛?!彼f。
  “在大模型與人類或企業(yè)的關(guān)系上,如果大模型良性發(fā)展,會(huì)成為人類的AI助手;反之,會(huì)被大量濫用,再由國(guó)家力量禁止或打擊。”胡權(quán)指出。
  至于在工業(yè)上的應(yīng)用,胡權(quán)表示:“通過文字生成視頻,已經(jīng)沒有原理上的障礙了,但工程上的困難還比較多:一是設(shè)計(jì)一個(gè)應(yīng)用系統(tǒng),這里面涉及一些類似黑箱的模塊,看起來OpenAI不會(huì)開源;二是需要用數(shù)據(jù)來訓(xùn)練算法,否則無(wú)法生成好的結(jié)果,類似ChatGPT的模型算法一樣;三是計(jì)算能力,跟隨者需要擁有類似的計(jì)算能力。”
  相關(guān)鏈接
  AI在贊比亞
  探測(cè)到巨型銅礦
  2月初,利用AI勘探銅、鋰等綠色轉(zhuǎn)型所需金屬的硅谷獨(dú)角獸KoBold Metals宣布,公司在贊比亞Mingomba項(xiàng)目上發(fā)現(xiàn)了巨型銅礦儲(chǔ)量。這家公司背后的投資者是由比爾·蓋茨牽頭,貝索斯、馬云、孫正義、達(dá)利歐、布隆伯格等人參與投資的突破能源風(fēng)險(xiǎn)投資基金,以及普徠仕等知名機(jī)構(gòu)和挪威國(guó)家石油公司。
  據(jù)悉,該公司利用AI技術(shù)大量讀取分析所有地球衛(wèi)星拍攝的地質(zhì)圖片、激光地球掃描數(shù)據(jù),以及全球的地震波數(shù)據(jù),并用時(shí)一年重新繪制了一張精細(xì)無(wú)比的全球地殼礦藏分布圖,并借此在贊比亞探測(cè)到一個(gè)巨型銅礦。
  多家科技企業(yè)承諾打擊
  濫用人工智能干擾選舉
  2月16日,全球多家科技企業(yè)在第60屆慕尼黑安全會(huì)議(慕安會(huì))上簽署協(xié)議,承諾在2024年這個(gè)多國(guó)舉行重要選舉的年份打擊旨在干擾選舉的人工智能濫用行為。人工智能的負(fù)面影響被此屆慕安會(huì)列為全球主要安全威脅之一。
  微軟將在德國(guó)投資
  32億歐元發(fā)展人工智能
  2月15日,微軟公司總裁在德國(guó)首都舉行的一次活動(dòng)上表示,未來兩年,微軟將在德國(guó)投資32億歐元,重點(diǎn)發(fā)展人工智能。作為該公司過去40年來在德國(guó)進(jìn)行的最大一筆投資,微軟將在2024年和2025年把大部分資金用于建立數(shù)據(jù)中心和培訓(xùn)人工智能人才。
  日本計(jì)劃2024年
  引入生成式人工智能立法
  近日,據(jù)日經(jīng)新聞報(bào)道稱,日本執(zhí)政黨自民黨計(jì)劃在2024年提議政府引入生成式人工智能立法。
  《中國(guó)冶金報(bào)》(2024年02月20日 04版四版)

來源:中國(guó)冶金報(bào)-中國(guó)鋼鐵新聞網(wǎng)

編輯:宋玉錚

版權(quán)說明

【1】 凡本網(wǎng)注明"來源:中國(guó)冶金報(bào)—中國(guó)鋼鐵新聞網(wǎng)"的所有作品,版權(quán)均屬于中國(guó)鋼鐵新聞網(wǎng)。媒體轉(zhuǎn)載、摘編本網(wǎng)所刊 作品時(shí),需經(jīng)書面授權(quán)。轉(zhuǎn)載時(shí)需注明來源于《中國(guó)冶金報(bào)—中國(guó)鋼鐵新聞網(wǎng)》及作者姓名。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
【2】 凡本網(wǎng)注明"來源:XXX(非中國(guó)鋼鐵新聞網(wǎng))"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng) 贊同其觀點(diǎn),不構(gòu)成投資建議。
【3】 如果您對(duì)新聞發(fā)表評(píng)論,請(qǐng)遵守國(guó)家相關(guān)法律、法規(guī),尊重網(wǎng)上道德,并承擔(dān)一切因您的行為而直接或間接引起的法律 責(zé)任。
【4】 如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的。電話:010—010-64411649
品牌聯(lián)盟
  • 燃燒裝置2.gif
  • 湖南華菱集團(tuán).jpg
  • 山東鋼鐵集團(tuán).jpg
  • 1_看圖王.png
  • 微信圖片_20240117152632.jpg
  • W020190430461031429831.jpg
  • 首鋼.jpg
  • 冶金工業(yè)規(guī)劃研究院logo1.jpg
  • W020130618825601874406.jpg
  • W020130618825602778336.jpg
  • W020130618825603702632.jpg
  • W020130618825617201098.jpg
  • W020130618825606679805.jpg
  • W020130618825607505186.jpg
  • brand04.png
  • brand06.png
  • brand05.png
  • brand03.png
  • brand02.png
    read_image.gif

    地址:北京市朝陽(yáng)區(qū)安貞里三區(qū)26樓 郵編:100029 電話:(010)64442120/(010)64442123 傳真:(010)64411645 電子郵箱:csteelnews@126.com

    中國(guó)冶金報(bào)/中國(guó)鋼鐵新聞網(wǎng)法律顧問:大成律師事務(wù)所 楊貴生律師 電話:010-58137252 13501065895 Email:guisheng.yang@dentons.cn

    中國(guó)鋼鐵新聞網(wǎng)版權(quán)所有,未經(jīng)書面授權(quán)禁止使用 京ICP備07016269號(hào) 京公網(wǎng)安備11010502033228