記者陳俐穎/綜合報導
微軟近日提出了一項新的專利,專利的名稱為「用於合成音訊的人工智慧模型」。專利說明微軟正在發明一種智慧音訊合成技術,用於為各種媒體如電影、電視節目、遊戲,甚至現場錄音創造聲音、音樂和其它音訊元素。
[廣告] 請繼續往下閱讀.
專利提到了遊戲中的動態時刻,可以創造出配合玩家行動的樂譜,可以使用視覺、音訊和文本特徵來設置參數,以指導眾多的AI模型構建音訊樂譜。
微軟的新專利描述詳細介紹了眾多的AI引擎,這些引擎的任務是根據提供的數據進行音訊播放。可以分析人類的表情和情緒,收集位置數據,分析形勢等等。AI可以學習圖片、影片、電影、現場活動,並產生一組音訊,可以用適當的聲音效果和音樂為視覺效果分層。
這種高科技的人工智能可以為媒體創作開闢許多新穎的作法,可以用一個巨大的、不斷增長的音頻樂譜庫來製作電影、遊戲等,例如為英雄的出場設計一首史詩般的管弦樂曲,為寵物的離去譜寫一首憂傷的曲子,為槍聲和爆炸開發音效,所有這些都可以委託給人工智能的算法。