智能硬件交互任重道遠

自2017年開始,國內智能硬件市場上對智能音箱的關注度飛速提升,幾家大廠先後推出自己的智能音箱產品。而在此之前,國外巨頭包括谷歌、亞馬遜,也都已經推出自己的智能音箱產品,尤其是亞馬遜的Echo,2016年的銷量超過1400萬台。

為什麼智能音箱產品在所謂智能硬件元年過了兩三年之後才火起來?其實火爆的並不是智能音箱產品本身,而是智能音箱背後的語音助手,比如亞馬遜的Alexa、蘋果的Siri等。

前面我講了一個智能燈類產品的案例,這類產品通常需要用戶去找手機、打開App,然後才能開燈。這個過程的體驗差在哪裡?交互方式。

我們和電燈原來的交互方式是通過牆上的開關,如果是床頭燈,直接伸手就能夠到了,智能燈反而把這個交互方式複雜化了。

類似電燈這類的產品智能化,與手機電視不一樣,是沒有屏幕的,因此最好的交互方式應該是語音交互。

蘋果公司旗下的智能語音助手Siri,目前已經支持自然語言輸入、實時翻譯等多種功能,可以讓一定版本以上的iPhone手機或iPad(平板電腦)變身為智能化機器人,聽上去十分酷炫。

此外還有亞馬遜的Alexa,我國現在也出現了各類語音識別技術和應用軟件,智能語音助手品類已經非常之多。可是即使技術已研發多年,甚至有公司表示其產品的語音識別能力已經可以媲美人類,但至今語音交互也沒能成為主流應用。

原因有兩方面。

第一個是語音交互還不太符合人們的使用習慣。智能手機上的很多輸入法現在已經支持語音輸入,並且效果還不錯,但絕大多數用戶在掏出手機後,最大的習慣不是對著手機說話,而是用手指觸摸。我們還沒有形成對著手機說話這類使用習慣,而且如果是在公共場合,由於要保持素質,也不適合大聲講話。

今天的很多年輕人會選擇在網上訂餐,但很少有人在訂餐前便已經考慮好要吃什麼。他們會打開一個訂餐的App,根據相應推薦進行選擇。在購買火車票或飛機票時也是如此,觸摸、點擊、滑動才是最習慣、最直接的人機交流方式。

當然,使用習慣不是語音交互沒能成為主流應用的主要原因,主要原因是當前語音交互技術仍然存在較大的應用障礙。雖然目前語音識別技術已經可以說比較成熟,用戶說的標準官方語言如普通話、英語,甚至部分地區的方言,語音識別軟件都可以快速識別並轉換成文字,但是,語音識別只是語音交互的基礎,語音交互更大的挑戰在於語義識別。而語義識別,對於當前的人工智能技術來說,與人類自身還存在巨大的鴻溝。

舉例來說,我和智能語音助手說一句話:「這是一本講極致產品的書。」智能語音助手能夠理解的是這些文字,分別是「這」「是」「一本」「講」「極致」「產品」「的」「書」。每個字或詞,它都可以識別出來,可能根據「吞下」的詞典,也大概知道「書」是什麼,但是,它一定理解不了「講極致產品的書」是什麼書。

而智能硬件,比如智能空調,如果我在家比較熱,我希望當我說「屋裡好熱」時,它能夠自動調節溫度;但是如果我說「屋裡好熱,可是孩子感冒了」,它就難以理解我後半句話的意思是不用調低溫度了。

這是當前語音交互領域面臨的最大挑戰。

受技術限制,當前的智能硬件的用戶交互體驗也不十分完美,反應較慢,用戶經常需要耐心等待人工智能的回應,一個回合一個回合地與人工智能交流,會磨蝕用戶的耐心,這明顯違背了人性。

另外,如果我們想讓人工智能認識貓這種動物,可能需要讓其瀏覽101萬張貓的照片,這就意味著人工智能需要大數據的鼎力支持。在互聯網和大數據的相關積累不足時,數據基數也不存在,智能硬件的用戶體驗便會受到很大限制。

因此,在智能硬件的交互設計工作上,無論是創業者還是巨頭公司,都還有很長的路要走。

瑕不掩瑜,即使智能硬件確實存在各種問題,暫不可能在一兩年內就改變世界,但我始終認為它是未來發展的大勢所趨,也是360重點關注且始終踐行的產品方向。

《極致產品:國民簡明爆品實踐指南》