「微軟小冰」導入語音交互技術 比Google、Apple語音助理更人性化

2018年04月23日 12:38

記者洪聖壹/台北報導

微軟宣布率先推出全雙工語音交互感官(Full-duplex Voice Sense)新一代的語音交互技術,使用戶與人工智慧之間的語音交互能更貼近人類自然的對話方式,就像是在與朋友打一通電話,自然地聊天,率先啟用該技術的,就是已經擁有 2 億中文用戶的「微軟小冰」。

微軟小冰是微軟公司在亞洲的研究單位於 2014 年 5 月 30 日,在中國大陸推出的第一個支援中文語音的「人工智慧聊天機器人」,相較於 Cortana這種以完成任務為導向的「智慧個人助理」,微軟小冰以EQ情商發展為方向,能夠與使用者進行更長時間、更自然的對話—兼具幽默感,可以與使用者閒聊、談心、玩遊戲,甚至可以記住使用者的資訊,像跟朋友聊天一樣就某個有趣的話題展開對話,現在的微軟小冰,不僅會唱歌、寫詩,還會寫新聞。

微軟小冰全球研發負責人周力表示,到目前為止,大多數個人語音助理或聊天機器人的對話場景就像拿著對講機或發簡訊一樣,一方先講話或寫下文字,另一方收聽或閱讀這些訊息後再做出回應,這並不是人們自然的交流方式。

他認為,人與人之間在打電話或面對面聊天時,都會邊聽邊想,事先預測對方的這句話會說什麼。還可能在適當的時候打斷對方,或在雙方都不說話時打破沉默,然後根據對方的反應展開新的話題,這才是自然的交流方式。

就實際應用來說,微軟公開的全雙工語音交互感官(Full-duplex Voice Sense)人機互動技術,使小冰能夠以「全雙工」模式傳輸數據,交流的雙方可以同時說話,像在打電話一樣,小冰預測人類即將說出的內容,生成回應並控制對話節奏。

微軟表示,小冰豐富的技能,也讓這一技術有了更大的發揮空間:例如,小冰能夠暫停正在執行的任務(例如暫停為使用者講故事),然後去執行其他任務(例如開燈),然後還能回來繼續剛才的故事。就像一個人可以在對話中暫停話題,之後再回到原來的話題上。

此外,採用該技術的智慧硬體設備將不再需要使用者在每輪對話時都說出喚醒詞(通常是人工智慧的名字)。僅需一次喚醒,就可以輕鬆達成連續對話,相較於 Apple 旗下的 Siri 聰明許多,支援語系也比 Google Assistant 還多。

微軟表示,除了小冰,在美國開發的聊天機器人Zo導入這項技術,接下來微軟在全球開發的其他人工智慧,如印度的Ruuh、日本的凛菜りんな和印度尼西亞的Rinna 。

分享給朋友:

讀者迴響