本報(bào)記者 樊三彩
日前,全國數(shù)據(jù)資源調(diào)查工作組發(fā)布《全國數(shù)據(jù)資源調(diào)查報(bào)告(2023年)》(以下簡稱《報(bào)告》),分析了2023年全國數(shù)據(jù)資源調(diào)查的結(jié)果及未來的發(fā)展趨勢。
“我國數(shù)據(jù)資源‘產(chǎn)—存—算’規(guī)模優(yōu)勢基本形成,數(shù)據(jù)‘供—流—用’各環(huán)節(jié)主體逐漸豐富,海量數(shù)據(jù)和豐富場景優(yōu)勢潛力亟須釋放,數(shù)據(jù)資源管理和利用整體處于起步階段?!薄秷?bào)告》列舉了4個方面具體表現(xiàn):一是數(shù)據(jù)生產(chǎn)總量大,但有效供給不足。存儲數(shù)據(jù)中,一年未使用的數(shù)據(jù)占比約4成,數(shù)據(jù)加工能力不足導(dǎo)致大量數(shù)據(jù)價(jià)值被低估、難以挖掘復(fù)用。二是算力、存力規(guī)模增長,還需適度超前布局。隨著大模型研發(fā)應(yīng)用不斷增加,對存力、算力提出更高要求。三是數(shù)據(jù)流通交易需求旺盛,多元流通模式待完善。數(shù)據(jù)交易機(jī)構(gòu)建設(shè)加速,產(chǎn)品成交率為17.9%,數(shù)據(jù)供給難以滿足旺盛需求。四是數(shù)據(jù)應(yīng)用場景加速落地,數(shù)據(jù)價(jià)值有待釋放。樣本企業(yè)中,96%的行業(yè)重點(diǎn)企業(yè)已實(shí)現(xiàn)數(shù)據(jù)場景化應(yīng)用,但實(shí)現(xiàn)數(shù)據(jù)復(fù)用增值的大企業(yè)僅占8.3%。
數(shù)據(jù)產(chǎn)存算規(guī)模大,數(shù)據(jù)流通、交易變化快
《報(bào)告》顯示,我國數(shù)據(jù)產(chǎn)量、存量、算力規(guī)模大,數(shù)據(jù)流通、交易變化快,公共數(shù)據(jù)開放共享授權(quán)運(yùn)營加快探索,企業(yè)數(shù)據(jù)多場景落地,為構(gòu)建數(shù)據(jù)要素市場提供了堅(jiān)實(shí)基礎(chǔ)。
一是數(shù)據(jù)生產(chǎn)規(guī)模大、范圍廣,增長速度快。2023年數(shù)據(jù)生產(chǎn)總量達(dá)到32.85澤字節(jié)(ZB),同比增長22.44%,非結(jié)構(gòu)數(shù)據(jù)爆發(fā)式增長。在生產(chǎn)方面,老舊生產(chǎn)設(shè)備的升級改造以及智能邊緣設(shè)備、工業(yè)機(jī)器人、數(shù)控機(jī)床等智能設(shè)備的推廣應(yīng)用,推動生產(chǎn)制造數(shù)據(jù)同比增長20%。
二是數(shù)據(jù)存儲空間合理,終端存儲高于云存儲,產(chǎn)存轉(zhuǎn)化待提升。2023年,我國累計(jì)數(shù)據(jù)存儲總量為1.73澤字節(jié)(ZB),存儲空間利用率為59%。數(shù)據(jù)云存儲占比超過40%,其中行業(yè)重點(diǎn)企業(yè)云存儲占比為23.49%。云存儲高靈活性和高便捷性的優(yōu)勢有效支撐了業(yè)務(wù)協(xié)同帶來的數(shù)據(jù)交互需求。行業(yè)重點(diǎn)企業(yè)數(shù)據(jù)終端存儲占比超七成,海量數(shù)據(jù)被分散存儲,數(shù)據(jù)互聯(lián)、復(fù)用難度較大,但邊緣智能化一定程度上能促進(jìn)數(shù)據(jù)由存向用轉(zhuǎn)化。同時,數(shù)據(jù)產(chǎn)存轉(zhuǎn)化率較低。一方面,海量數(shù)據(jù)復(fù)用價(jià)值較低;另一方面,大模型、訓(xùn)練工具等支撐能力不足,部分高價(jià)值數(shù)據(jù)在“大浪淘沙”過程中被遺棄。
三是算力規(guī)模增長快,區(qū)域算力按需布局,智算能力需求旺。截至2023年底,2200多個算力中心的算力規(guī)模約為0.23十萬億億次浮點(diǎn)運(yùn)算/秒(ZFLOPS),同比增長約30%。與此同時,大模型訓(xùn)練算力需求高漲,一體化算力體系建設(shè)仍需加快推進(jìn)。東部地區(qū)實(shí)時計(jì)算需求增幅較大,西部地區(qū)憑借綠色化和低成本的算力優(yōu)勢逐步承接?xùn)|部計(jì)算需求,但存算利用率仍然低于東部地區(qū)。能夠支撐行業(yè)垂直領(lǐng)域大模型落地的算力不足,大模型與國產(chǎn)軟硬件的適配性問題尚需解決。
四是數(shù)據(jù)流通方式多元,交互能力有所提升,交易供需不均衡。全國各地交易所快速鋪開,上海、浙江、深圳、海南等地?cái)?shù)據(jù)交易機(jī)構(gòu)“百花齊放”,交易模式、數(shù)商生態(tài)、技術(shù)底座各具特色。然而,交易機(jī)構(gòu)在標(biāo)準(zhǔn)、規(guī)則方面尚未達(dá)成共識,場內(nèi)交易吸引力不足。27家交易所上架的數(shù)據(jù)產(chǎn)品中,僅有17.9%實(shí)現(xiàn)交易,數(shù)據(jù)場內(nèi)交易活躍度較低。
五是公共數(shù)據(jù)開放共享初見成效,授權(quán)運(yùn)營起步探索,政企數(shù)據(jù)融合不斷深入。公共數(shù)據(jù)體系逐步完善,數(shù)據(jù)匯聚能力不斷提升,授權(quán)運(yùn)營機(jī)制正初步探索。公共數(shù)據(jù)在開發(fā)利用、流通交易中占比較大,平臺企業(yè)、數(shù)據(jù)分析企業(yè)對公共數(shù)據(jù)需求高漲。該調(diào)查中,有18.6% 的平臺企業(yè)和51%的中央企業(yè)在數(shù)據(jù)開發(fā)利用過程中用到了政府開放數(shù)據(jù)。工商、氣象、交通、地理等公共數(shù)據(jù)廣泛應(yīng)用于數(shù)據(jù)開發(fā)利用,成為釋放數(shù)據(jù)價(jià)值的催化劑。
六是數(shù)字化轉(zhuǎn)型激活企業(yè)數(shù)據(jù),場景應(yīng)用提質(zhì)增效,數(shù)據(jù)外溢效應(yīng)仍不足。該調(diào)查中,96%的行業(yè)重點(diǎn)企業(yè)已實(shí)現(xiàn)數(shù)據(jù)場景化應(yīng)用,其中超八成行業(yè)重點(diǎn)企業(yè)已經(jīng)運(yùn)用數(shù)據(jù)輔助運(yùn)營管理優(yōu)化,半數(shù)企業(yè)在生產(chǎn)環(huán)節(jié)實(shí)現(xiàn)數(shù)據(jù)驅(qū)動。該調(diào)查中,21.9%的大企業(yè)尚未建設(shè)數(shù)據(jù)管理系統(tǒng),大多數(shù)中小企業(yè)數(shù)字化轉(zhuǎn)型產(chǎn)生的數(shù)據(jù)未實(shí)現(xiàn)復(fù)用。企業(yè)對數(shù)據(jù)價(jià)值的認(rèn)識和判斷不足,數(shù)據(jù)增值的投入和能力有限,開展數(shù)字化轉(zhuǎn)型的大型行業(yè)重點(diǎn)企業(yè)中,僅有8.3%實(shí)現(xiàn)了數(shù)據(jù)復(fù)用增值,數(shù)據(jù)價(jià)值有待進(jìn)一步釋放。
數(shù)據(jù)流通將向規(guī)范有序、多元協(xié)同發(fā)展
《報(bào)告》顯示,全國數(shù)據(jù)資源調(diào)查工作驗(yàn)證了我國發(fā)展數(shù)字經(jīng)濟(jì)具備超大規(guī)模市場、海量數(shù)據(jù)資源和豐富應(yīng)用場景的潛在優(yōu)勢。未來,隨著數(shù)據(jù)技術(shù)不斷進(jìn)步,基礎(chǔ)制度持續(xù)完善,數(shù)據(jù)產(chǎn)、存、流、用將呈現(xiàn)以下趨勢。
一是數(shù)據(jù)生產(chǎn)向高增速和高質(zhì)量同步發(fā)展。在政策、技術(shù)和應(yīng)用多重因素驅(qū)動下,我國數(shù)據(jù)規(guī)模將保持快速增長趨勢,高質(zhì)量數(shù)據(jù)資源將成為經(jīng)濟(jì)增長的重要源泉。一方面,數(shù)據(jù)規(guī)模優(yōu)勢將進(jìn)一步擴(kuò)大,預(yù)計(jì)2024年數(shù)據(jù)生產(chǎn)量增幅將超25%;另一方面,數(shù)據(jù)存儲能力也將隨硬件技術(shù)的迭代升級和成本降低而提升。數(shù)字化轉(zhuǎn)型將促進(jìn)各行業(yè)高質(zhì)量數(shù)據(jù)的形成,數(shù)據(jù)從設(shè)備、系統(tǒng)的分散狀態(tài)轉(zhuǎn)向匯聚和應(yīng)用。同時,AI大模型的迅猛發(fā)展對大規(guī)模、高質(zhì)量、多樣性數(shù)據(jù)集提出更高要求,有助于數(shù)據(jù)質(zhì)量進(jìn)一步提升。
二是數(shù)據(jù)存儲計(jì)算向一體化按需供給發(fā)展。隨著人工智能訓(xùn)練需求的高漲,算力在短期內(nèi)仍會出現(xiàn)難以滿足需求的情況,但會隨應(yīng)用需求加速調(diào)整布局,提高算力利用率。一方面,數(shù)據(jù)存儲結(jié)構(gòu)將按需調(diào)整,邊緣智能計(jì)算能力將有所提高,把有價(jià)值的數(shù)據(jù)釋放出來;另一方面,協(xié)同交互需求推動部分?jǐn)?shù)據(jù)向云端遷移,實(shí)現(xiàn)在線調(diào)度和應(yīng)用。隨著數(shù)據(jù)高效計(jì)算、實(shí)時讀取需求不斷增長,未來全國一體化算力體系將向算力調(diào)度、安全服務(wù)等多元功能擴(kuò)展,緩解東部實(shí)時計(jì)算壓力的同時,釋放西部算力優(yōu)勢。
三是數(shù)據(jù)流通向規(guī)范有序、多元協(xié)同發(fā)展。一方面,隨著國家層面的數(shù)據(jù)交易規(guī)范、數(shù)據(jù)流通基礎(chǔ)規(guī)則不斷完善,數(shù)據(jù)交易場所、數(shù)據(jù)服務(wù)商等流通載體將逐步走向規(guī)范有序;另一方面,場內(nèi)場外流通交易模式更加多元化,各類細(xì)分領(lǐng)域交易機(jī)構(gòu)將向?qū)I(yè)化發(fā)展。平臺企業(yè)和中央企業(yè)將持續(xù)發(fā)揮行業(yè)數(shù)據(jù)樞紐作用,帶動行業(yè)領(lǐng)域的數(shù)據(jù)匯聚、 流通和應(yīng)用。
四是數(shù)據(jù)應(yīng)用向需求牽引、智能驅(qū)動發(fā)展。應(yīng)用場景牽引的數(shù)據(jù)開發(fā)利用將成為主要趨勢,AI技術(shù)成為數(shù)據(jù)開發(fā)利用的重要推動力。一是應(yīng)用需求涌現(xiàn),場景逐漸豐富化。大模型對海量高質(zhì)量數(shù)據(jù)提出了迫切需求,垂直領(lǐng)域的數(shù)據(jù)應(yīng)用需求將持續(xù)保持快速增長,并逐步從業(yè)務(wù)降本提效轉(zhuǎn)向協(xié)同創(chuàng)新、市場拓展,數(shù)據(jù)驅(qū)動業(yè)務(wù)發(fā)展將成為主要應(yīng)用訴求。二是自然語言處理、語音識別等技術(shù)進(jìn)步降低開發(fā)門檻,圍繞數(shù)據(jù)增值的產(chǎn)品服務(wù)將逐漸成為數(shù)據(jù)供給的主要方式。
《中國冶金報(bào)》(2024年06月18日 04版四版)