根據(jù)美國商標(biāo)和專利局(USPTO)近日公示的清單,微軟攜手 OpenAI 構(gòu)想了一個聲音識別 AI 技術(shù)專利,不僅能夠識別門鈴、狗叫或嬰兒啼哭等日常聲音,還能檢測地震和風(fēng)暴等自然災(zāi)害的跡象。
微軟構(gòu)想的該系統(tǒng)通過處理環(huán)境聲音,可以提醒用戶注意潛在的危險,可以在公共安全、備災(zāi)工作發(fā)揮重要作用。
微軟這項聲音 AI 專利的核心在于對音頻信號的復(fù)雜處理。
系統(tǒng)首先將聲音信號分解成較小的片段,在經(jīng)過獨立處理之后創(chuàng)建聲音在時域中的規(guī)范化表示,本質(zhì)上是聲音在時間軸上的映射。
然后該系統(tǒng)映射數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò),進一步匹配和評估聲音片段,識別出的每一類聲音事件的分配得分(assigning scores)和發(fā)生概率。
系統(tǒng)再調(diào)用算法進行后期處理之后,完善這些分?jǐn)?shù)和概率,為每種聲音類型生成置信度值(confidence values)。這一細(xì)致的過程使人工智能能夠準(zhǔn)確識別從普通到潛在危險的各種聲音。