萬盛學電腦網

 萬盛學電腦網 >> 網頁制作 >> 交互設計 >> Siri的語音交互革命

Siri的語音交互革命

  iPhone 4S融入了語音功能,這將是手機的革命性的交互操作。或許你使用過Android的語音命令、Bing的語言搜索和Dragon Dictation的語音輸入,但是這些和Siri還有很大差距:

  a.語音命令只能理解系統特定的詞匯。

  b.語音搜索與手動輸入是並列搜索方式,識別詞匯再搜索。

  c.語音輸入也是將語音聲波轉換為文本。

  而Siri不但包含以上技術,看似還要理解用戶說話的意思,將人類語言翻譯成系統可以理解的語言,之後再執行命令。之所以像是理解用戶,個人認為原因在於:

  a.視頻弱化了特定的語音命令,比之前的語音操作看起來更像是人與人之間的溝通,啟動操作符合用戶語言習慣。

  b.有人性化的語音反饋,而不是呆板的視覺反饋,手機就是一位聲音甜美的私人助理。

  c.覆蓋了手機常用功能,不限於某個特定的應用程序中使用。

  d.做的更為徹底,很少有手動點擊行為,這會影響語音交互的流暢度。

  從資料和視頻中看看Siri可以做哪些事情及其存在的問題:

  1.結合藍牙4.0或者耳機喚醒手機。語音搜索和語音輸入等技術都要用戶手動點擊按鈕觸發語音功能,這事本身就不夠酷。但是不借助設備還存在困難,語音功能實時開啟探測聲波會耗費電量。

  2.語音功能面臨噪音和識別來源的問題,在視頻中Siri都是在個人獨處,比較安靜的環境下使用,適用的場景比較單一。或許以後會加上定向麥克風和聲紋判定聲波來源,排除外界干擾。

  3.包含語音搜索,可以直接搜索天氣、股票、聯系人和地址,這類搜索結果單一,不需要從眾多結果中選擇。

  4.包含語音命令,語音查詢聯系人、啟動某個應用程序和設置鬧鐘等,但還限於手機中常用的功能。命令必須是特定的語句格式,比如打電話是“call+ 人名”,播放音樂是“play+歌名”,短信是“tell+人名+內容”。

  5.語音播報短信文本,語音輸入短信和郵件,但系統可能會進行二次確認,將輸入內容再次讀一遍,適合盲人使用。這種語音輸入和語聊一樣,需要用戶點擊按鈕觸發系統開始探測聲波。

  6.系統在答復用戶時,使用人性化語句交流,而不是簡單的完成命令或者特定的詞組。

  設想下所有的手機操作都可以使用語音完成,大大減少文本輸入和功能之間的頻繁切換,更多的應用程序會支持語音交互。隨著產品迭代,語音真有可能把手機變為智能機器人,不僅僅是執行命令,陪用戶聊天等更為復雜的機器翻譯也可能融入到手機中,Siri才只是個開始。

  文章來源:曉生語錄 轉載請注明出處鏈接。

copyright © 萬盛學電腦網 all rights reserved