11 月 8 日消息,目前各大互聯(lián)網(wǎng)廠商都在開發(fā)自家的 AI 大模型產(chǎn)品,其中涉及到不少版權爭議,且各家的競爭也異常激烈。
愛企查 App 顯示,11 月 7 日,華為技術有限公司申請的“一種語言模型保護方法、裝置及計算設備集群”專利公布。
專利文件稱,開發(fā)基于大語言模型的系統(tǒng)需要高昂的機器和人力成本,因此大語言模型本身是公司構(gòu)建 AI 競爭力的核心資產(chǎn)。目前,研究已經(jīng)證實了通過模型竊取技術,可以用很低的成本實現(xiàn)大語言模型功能的復刻,從而導致大語言模型的知識產(chǎn)權遭到侵犯。因此,需要對大語言模型進行有效的保護,避免模型竊取的攻擊,實現(xiàn)對現(xiàn)有侵權行為的鑒定。
IT之家從專利摘要獲悉,華為申請的方法包括:
獲取用戶輸入的請求文本,在屬于目標類別的情況下,將目標指令和請求文本輸入至語言模型進行處理,得到添加有水印詞的第一回復信息并輸出,其中,目標指令用于指示語言模型在處理的結(jié)果中添加水;在請求文本的類別不屬于目標類別的情況下,將請求文本輸入至目標語言模型進行處理,得到第二回復信息并輸出。
這樣,在通過語言模型處理特定類型的請求時,可以通過語言模型自動生成帶水印包含的回復信息,實現(xiàn)了在盡量不損傷模型生成文本質(zhì)量的前提下提高語言模型的版權保護能力。