12 月 19 日消息,據(jù)“新一代人工智能聯(lián)盟”公眾號(hào)消息,2023 年 12 月 7 日,中關(guān)村視聽產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)盟批準(zhǔn)發(fā)布《信息技術(shù) 虛擬現(xiàn)實(shí)內(nèi)容表達(dá) 音頻》(標(biāo)準(zhǔn)號(hào) T / AI 125-2023)團(tuán)體標(biāo)準(zhǔn)。起草單位包括:
清華大學(xué)、北京理工大學(xué)、中國電子技術(shù)標(biāo)準(zhǔn)化研究院、北京字跳網(wǎng)絡(luò)技術(shù)有限公司、賽因芯微(北京)電子科技有限公司、北京全景聲信息科技有限公司、清華大學(xué)天津電子信息研究院、北京大學(xué)、咪咕文化科技有限公司、騰訊科技(深圳)有限公司、北京愛奇藝科技有限公司、小米通訊技術(shù)有限公司、全景聲(北京)智能科技有限公司、華為技術(shù)有限公司、中國傳媒大學(xué)。
據(jù)介紹,AVS VR 音頻團(tuán)體標(biāo)準(zhǔn)《信息技術(shù) 虛擬現(xiàn)實(shí)內(nèi)容表達(dá) 音頻》的正式制定起始于 2016 年 6 月舉行的工作組第 57 次會(huì)議,AVS 音頻組輸出“AVS 虛擬現(xiàn)實(shí)音頻技術(shù)方案征集書 V1.0”,啟動(dòng)虛擬現(xiàn)實(shí)中沉浸式音頻編解碼及渲染技術(shù)的征集工作。
2020 年 4 月 7 日,經(jīng)新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟和中關(guān)村視聽產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)盟標(biāo)準(zhǔn)工作組聯(lián)合審議決定立項(xiàng) AVS VR 音頻團(tuán)體標(biāo)準(zhǔn)。
AVS VR 音頻團(tuán)體標(biāo)準(zhǔn)歷經(jīng)工作組正式和臨時(shí)加會(huì)議 41 次,共收到 VR 音頻相關(guān)提案 115 項(xiàng),被采納的技術(shù)提案 39 項(xiàng),于 2022 年 11 月 25 日形成 AVS VR 音頻團(tuán)標(biāo) FCD。
2023 年 1 月 6 日 AVS VR 音頻完成團(tuán)標(biāo)征求意見稿的組內(nèi)公示后,形成了送審稿,并在 2023 年 10 月 26 日通過了全國信標(biāo)委多媒體分委會(huì)的審查,終于 2023 年 12 月 7 日形成團(tuán)體標(biāo)準(zhǔn)正式發(fā)布。
AVS VR 音頻標(biāo)準(zhǔn)描述了虛擬現(xiàn)實(shí)音頻表達(dá)所需要的元數(shù)據(jù)、渲染器及面向傳輸?shù)臄?shù)據(jù)流方式,支持 3DOF 和 6DOF 等虛擬現(xiàn)實(shí)場(chǎng)景下所需要的技術(shù)功能,涉及基于聲道、對(duì)象、場(chǎng)景三類信號(hào)的采集制作和渲染回放等相關(guān)技術(shù)描述。AVS VR 音頻標(biāo)準(zhǔn)中采納的所有技術(shù)均依據(jù) VR 音頻測(cè)試方案進(jìn)行了第三方測(cè)試驗(yàn)證,包括規(guī)范性驗(yàn)證,功能性驗(yàn)證和渲染效果主觀測(cè)試,并在實(shí)際系統(tǒng)中進(jìn)行了系統(tǒng)驗(yàn)證。
標(biāo)準(zhǔn)中的相應(yīng)技術(shù)在各大賽事、活動(dòng)中也早有應(yīng)用。2022 年 9 月中央廣播電視總臺(tái)“云聽”客戶端使用 AVS VR 音頻標(biāo)準(zhǔn)中的耳機(jī)渲染技術(shù)完成 CCTV 中秋晚會(huì)現(xiàn)場(chǎng)直播;2022 年 11 月世界杯央視轉(zhuǎn)播演示系統(tǒng)使用了 AVS VR 音頻標(biāo)準(zhǔn)中的揚(yáng)聲器渲染技術(shù)進(jìn)行監(jiān)聽,從制作端生成元數(shù)據(jù)下發(fā),并按制作者意圖生成實(shí)時(shí)、動(dòng)態(tài)元數(shù)據(jù)下發(fā),實(shí)現(xiàn)了制作、監(jiān)聽與下發(fā)數(shù)據(jù)的完整流程。同時(shí),AVS VR 音頻雙耳渲染技術(shù)還在 VR 頭顯設(shè)備中基于 Unity3D 軟件平臺(tái)進(jìn)行了 3DOF 和 6DOF 下的主觀聽音測(cè)試驗(yàn)證。
AVS VR 音頻標(biāo)準(zhǔn)在遵循 ITU-R BS.2076-2 規(guī)范的前提下,面向適應(yīng)我國全景音頻播出、沉浸式音頻通信、虛擬現(xiàn)實(shí)音頻交互等領(lǐng)域,提供虛擬現(xiàn)實(shí)音頻內(nèi)容的元素定義、編碼規(guī)范和渲染重建建議,服務(wù)于虛擬現(xiàn)實(shí)(VR / AR / MR / XR)設(shè)備和相關(guān)系統(tǒng)中的音頻應(yīng)用。
結(jié)合國內(nèi)虛擬現(xiàn)實(shí)音頻產(chǎn)業(yè)發(fā)展的實(shí)際情況,按照 AVS 工作組的標(biāo)準(zhǔn)制訂流程和 AVS 音頻組工作規(guī)范,在 AVS 音頻組的組織下,依照技術(shù)需求,審議技術(shù)提案、制定測(cè)試方案、進(jìn)行測(cè)試和評(píng)比,采納滿足技術(shù)需求且性能更優(yōu)的技術(shù)提案,構(gòu)建標(biāo)準(zhǔn)技術(shù)的基礎(chǔ)架構(gòu),通過標(biāo)準(zhǔn)文本編輯、參考軟件驗(yàn)證形成標(biāo)準(zhǔn)草案。該標(biāo)準(zhǔn)填補(bǔ)了國內(nèi)虛擬現(xiàn)實(shí)音頻技術(shù)標(biāo)準(zhǔn)的空白,并爭(zhēng)取為相關(guān)國際標(biāo)準(zhǔn)的制定發(fā)揮關(guān)鍵作用。
該標(biāo)準(zhǔn)將首先作為 AVS 團(tuán)體標(biāo)準(zhǔn)發(fā)布,并申請(qǐng)成為國家標(biāo)準(zhǔn)和 IEEE 國際標(biāo)準(zhǔn)發(fā)布。
IT之家注:新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟(AITISA)由兩百余家來自人工智能行業(yè)內(nèi)的企業(yè)、高校和科研院所、資本機(jī)構(gòu)、服務(wù)機(jī)構(gòu)、創(chuàng)新創(chuàng)業(yè)企業(yè)組成。