5月30日,全國數(shù)據(jù)資源調(diào)查工作組(國家工業(yè)信息安全發(fā)展研究中心)編纂的《全國數(shù)據(jù)資源調(diào)查報告(2023年)》對外公布。
根據(jù)說明,2024年2月,國家數(shù)據(jù)局聯(lián)合中央網(wǎng)信辦、工業(yè)和信息化部、公安部組織開展全國數(shù)據(jù)資源調(diào)查,國家工業(yè)信息安全發(fā)展研究中心承擔調(diào)查實施工作。在前期工作基礎(chǔ)上,此次調(diào)查擴大調(diào)查范圍、擴展調(diào)查對象、增設(shè)調(diào)查指標,通過全量測算和抽樣調(diào)查等方式,調(diào)查全國關(guān)鍵數(shù)據(jù)資源情況,為政府施策、產(chǎn)業(yè)發(fā)展提供參考。
調(diào)查報告指出,數(shù)據(jù)作為新型生產(chǎn)要素,具有重要基礎(chǔ)性和戰(zhàn)略性,是發(fā)展新質(zhì)生產(chǎn)力的重要基礎(chǔ)。近年來,在政產(chǎn)學(xué)研用合力推動下,我國數(shù)據(jù)規(guī)模實現(xiàn)快速增長,數(shù)據(jù)流通交易架構(gòu)逐步形成,數(shù)據(jù)開發(fā)利用創(chuàng)新探索,數(shù)據(jù)要素價值加快釋放,為做大做強數(shù)字經(jīng)濟、建設(shè)數(shù)字中國奠定了堅實基礎(chǔ)。
調(diào)查發(fā)現(xiàn),我國數(shù)據(jù)資源管理和利用整體處于起步階段,數(shù)據(jù)“產(chǎn)-存-算”規(guī)模優(yōu)勢基本形成,數(shù)據(jù)“供給-流通-應(yīng)用”主體逐漸豐富,海量數(shù)據(jù)和豐富場景優(yōu)勢潛力仍待釋放。
全國數(shù)據(jù)生產(chǎn)、存儲、計算呈現(xiàn)規(guī)模大、增速快的特點。2023年,全國數(shù)據(jù)生產(chǎn)總量達到32.85澤字節(jié)(ZB),同比增長22.44%。2023年,全國數(shù)據(jù)存儲總量為1.73澤字節(jié)(ZB),存儲空間利用率為59%。2023年,2200多個算力中心的算力規(guī)模超0.23十萬億億次浮點運算/秒(ZFLOPS),同比增長約30%。其中,智能算力占比約30%。
2023年,全國一體化政務(wù)數(shù)據(jù)共享樞紐接入53個國家部門、31個省/自治區(qū)/直轄市和新疆生產(chǎn)建設(shè)兵團數(shù)據(jù),“一網(wǎng)通辦”事項不斷增加。2023年,公共數(shù)據(jù)開放量同比增長超16%。18.6%的平臺企業(yè)和51%的中央企業(yè)在數(shù)據(jù)開發(fā)利用過程中應(yīng)用到政府開放數(shù)據(jù)。4個國家部門、15個省級數(shù)據(jù)管理部門探索公共數(shù)據(jù)授權(quán)運營。
值得注意的是,數(shù)據(jù)生產(chǎn)存儲、流通交易、開發(fā)利用過程中的數(shù)據(jù)量降幅較大,能支撐人工智能訓(xùn)練的數(shù)據(jù)資源較少,數(shù)據(jù)價值仍需進一步挖掘。2023年,全國數(shù)據(jù)產(chǎn)存轉(zhuǎn)化率為2.9%,海量數(shù)據(jù)源頭即棄。企業(yè)一年未使用的數(shù)據(jù)占比為38.93%,大量數(shù)據(jù)被存儲后不再被讀取和復(fù)用。交易所需求方是供給方的1.75倍,數(shù)據(jù)產(chǎn)品成交率為17.9%,數(shù)據(jù)場內(nèi)交易供需匹配率低。2023年,尚未建設(shè)數(shù)據(jù)管理系統(tǒng)的大企業(yè)比例為21.9%,實現(xiàn)規(guī)劃管理的數(shù)據(jù)資源仍然較少。2023年,開展數(shù)字化轉(zhuǎn)型的大企業(yè)中,實現(xiàn)數(shù)據(jù)復(fù)用增值的僅有8.3%,數(shù)據(jù)價值挖掘任重道遠。
1)我國數(shù)據(jù)生產(chǎn)規(guī)模持續(xù)擴大
2023年數(shù)據(jù)生產(chǎn)總量達到32.85澤字節(jié)(ZB),同比增長22.44%,非結(jié)構(gòu)數(shù)據(jù)爆發(fā)式增長。隨著5G、AI技術(shù)的快速發(fā)展及智能設(shè)備的規(guī)模應(yīng)用,內(nèi)容創(chuàng)作、影像視聽等非結(jié)構(gòu)數(shù)據(jù)對我國數(shù)據(jù)總規(guī)模增長貢獻較大,消費民生領(lǐng)域新業(yè)態(tài)不斷涌現(xiàn),滿足了人們不斷增長的文化娛樂消費需求。
2)智慧城市擴大物聯(lián)感知范圍
公共數(shù)據(jù)獲取范圍不斷擴大,設(shè)施物聯(lián)傳感數(shù)據(jù)占比超40%。城市各種基礎(chǔ)設(shè)施、資源、服務(wù)等加速數(shù)字化、網(wǎng)絡(luò)化、智能化升級,攝像頭、傳感器、無線設(shè)備等相互連接形成城市的“神經(jīng)脈絡(luò)”,實時捕捉城市交通、人流等各種信息,推動海量數(shù)據(jù)從大街小巷匯入城市大腦。
3)智能應(yīng)用推動數(shù)據(jù)產(chǎn)量提速
隨著技術(shù)的創(chuàng)新突破以及硬件的迭代更新,生產(chǎn)生活的數(shù)字化應(yīng)用逐漸增加,推動我國數(shù)據(jù)產(chǎn)量快速增長。在生活方面,智能網(wǎng)聯(lián)車驅(qū)動車、路、網(wǎng)、云數(shù)據(jù)快速交換,出行數(shù)據(jù)同比增幅達到49%。在生產(chǎn)方面,老舊生產(chǎn)設(shè)備的升級改造以及智能邊緣設(shè)備、工業(yè)機器人、數(shù)控機床等智能設(shè)備的推廣應(yīng)用,推動生產(chǎn)制造數(shù)據(jù)同比增幅達到20%。
4)算力中心規(guī)模持續(xù)增長,算力建設(shè)仍需適度超前布局
至2023年底,2200多個算力中心的算力規(guī)模約為0.23十萬億億次浮點運算/秒(ZFLOPS),同比增長約為30%。與此同時,大模型訓(xùn)練算力需求高漲,科學(xué)、政務(wù)、金融、工業(yè)等行業(yè)算力需求隨之增加,一體化算力體系建設(shè)仍需加快推進,保持適度超前布局。
5)消費領(lǐng)域數(shù)據(jù)交互活躍度較高
2023年,四大運營商數(shù)據(jù)顯示全國數(shù)據(jù)總流量較去年同期增長7.6%,數(shù)據(jù)流量保持穩(wěn)步增長。隨著汽車、家居、穿戴等智能終端品類不斷豐富和聲像視聽數(shù)據(jù)交互需求持續(xù)增加,移動互聯(lián)網(wǎng)數(shù)據(jù)流通活躍度不斷增加。
6)平臺和央企數(shù)據(jù)流通量遠超其他企業(yè)
中央企業(yè)和平臺企業(yè)成為行業(yè)領(lǐng)域的數(shù)據(jù)樞紐,在各自領(lǐng)域探索交互機制。平臺企業(yè)是行業(yè)領(lǐng)域的數(shù)據(jù)樞紐。本次調(diào)查中,平臺企業(yè)平均數(shù)據(jù)交互量為行業(yè)重點企業(yè)的249倍,各行業(yè)數(shù)據(jù)正逐漸向平臺聚攏。SaaS服務(wù)模式日益成熟,平臺提供數(shù)據(jù)產(chǎn)品中SaaS化產(chǎn)品占比超五成,訂閱式交易占比逐年增多。中央企業(yè)成為產(chǎn)業(yè)鏈數(shù)據(jù)樞紐。本次調(diào)查中,中央企業(yè)平均數(shù)據(jù)交互量為行業(yè)重點企業(yè)的42倍。鏈主企業(yè)正在通過產(chǎn)業(yè)鏈協(xié)同賦能上下游企業(yè),匯聚全產(chǎn)業(yè)鏈數(shù)據(jù)。
在發(fā)展趨勢方面,全國數(shù)據(jù)資源調(diào)查工作驗證了我國發(fā)展數(shù)字經(jīng)濟具備超大規(guī)模市場、海量數(shù)據(jù)資源和豐富應(yīng)用場景潛在優(yōu)勢。未來,隨著數(shù)據(jù)技術(shù)不斷進步,基礎(chǔ)制度持續(xù)完善,數(shù)據(jù)生產(chǎn)規(guī)模將保持高速增長,存儲計算將向按需調(diào)度發(fā)展,數(shù)據(jù)流通將向規(guī)范有序、多元協(xié)同發(fā)展,數(shù)據(jù)開發(fā)利用將向需求牽引、智能驅(qū)動發(fā)展。
1)數(shù)據(jù)生產(chǎn)向高增速和高質(zhì)量同步發(fā)展
在政策、技術(shù)和應(yīng)用多重因素驅(qū)動下,我國數(shù)據(jù)規(guī)模將保持快速增長趨勢,高質(zhì)量數(shù)據(jù)資源將成為經(jīng)濟增長的重要源泉。一方面,數(shù)據(jù)規(guī)模優(yōu)勢將進一步擴大。數(shù)據(jù)生產(chǎn)能力將隨著衛(wèi)星通信、自動駕駛、生成式AI等新技術(shù)的規(guī);瘧(yīng)用而持續(xù)提升,預(yù)計2024年數(shù)據(jù)生產(chǎn)量增長將超25%,同時,數(shù)據(jù)存儲能力也將隨硬件技術(shù)的升級迭代和成本降低提升。另一方面,數(shù)字化轉(zhuǎn)型將促進各行業(yè)高質(zhì)量數(shù)據(jù)形成,數(shù)據(jù)從設(shè)備、系統(tǒng)的分散狀態(tài)釋放、匯聚和應(yīng)用。同時,AI大模型的迅猛發(fā)展對大規(guī)模、高質(zhì)量、多樣性數(shù)據(jù)集提出更高要求,有助于數(shù)據(jù)質(zhì)量進一步提升。
2)數(shù)據(jù)存儲計算向一體化按需供給發(fā)展
隨著人工智能訓(xùn)練需求的高漲,算力在短期內(nèi)仍會出現(xiàn)難以滿足需求的情況,但會隨應(yīng)用需求加速調(diào)整布局,提高算力利用率。一方面,數(shù)據(jù)存儲結(jié)構(gòu)將按需調(diào)整,邊緣智能計算將有所提高,把有價值的數(shù)據(jù)釋放出來;協(xié)同交互需求推動部分數(shù)據(jù)向云端遷移,實現(xiàn)在線調(diào)度和應(yīng)用。另一方面,隨著數(shù)據(jù)高效計算、實時讀取需求不斷增長,未來全國一體化算力體系將向算力能力發(fā)布、算力調(diào)度、安全服務(wù)等多元功能擴展,緩解東部實時算力壓力的同時,釋放西部算力優(yōu)勢。
3)數(shù)據(jù)流通向規(guī)范有序、多元協(xié)同發(fā)展
隨著國家層面的數(shù)據(jù)交易規(guī)范進一步完善。一方面,隨著數(shù)據(jù)流通基礎(chǔ)規(guī)則不斷完善,數(shù)據(jù)交易場所、數(shù)據(jù)服務(wù)商等流通載體將逐步走向規(guī)范有序發(fā)展。另一方面,場內(nèi)場外流通交易模式更加多元化,各類細分領(lǐng)域交易機構(gòu)向?qū)I(yè)化發(fā)展。平臺企業(yè)和中央企業(yè)將持續(xù)發(fā)揮行業(yè)數(shù)據(jù)樞紐作用,帶動行業(yè)領(lǐng)域的數(shù)據(jù)匯聚、流通和應(yīng)用。
4)數(shù)據(jù)應(yīng)用向需求牽引、智能驅(qū)動發(fā)展
應(yīng)用場景牽引的數(shù)據(jù)開發(fā)利用將成為主要趨勢,AI技術(shù)成為數(shù)據(jù)開發(fā)利用的重要推動力。一方面,應(yīng)用需求涌現(xiàn),場景逐漸豐富化。大模型對海量高質(zhì)量數(shù)據(jù)提出了迫切需求,垂直領(lǐng)域的數(shù)據(jù)應(yīng)用需求將持續(xù)保持快速增長,并逐步從業(yè)務(wù)降本提效轉(zhuǎn)向協(xié)同創(chuàng)新、市場拓展,數(shù)據(jù)驅(qū)動業(yè)務(wù)發(fā)展將成為主要應(yīng)用訴求。另一方面,自然語言處理、語音識別等技術(shù)進步降低開發(fā)門檻,圍繞數(shù)據(jù)增值的產(chǎn)品服務(wù)將逐漸成為數(shù)據(jù)供給的主要方式。