智能家居的入口到底是什么?在這個行業(yè)發(fā)展幾年之后,業(yè)內(nèi)依然沒有就這個問題達(dá)成共識。最初,手機(jī)一度被認(rèn)為充當(dāng)了這個角色,但在大多數(shù)場景中,手機(jī)與智能家居并沒有實現(xiàn)交互,更多的充當(dāng)?shù)氖恰斑b控器”的功能。
語音識別技術(shù)的成熟讓巨頭開始探索,智能音箱成為智能家居交互入口的可能性。比如亞馬遜的Echo、谷歌的Google Home、蘋果的HomePod。根據(jù)eMarketer的數(shù)據(jù)顯示,在今年一季度美國語音助手市場中,亞馬遜Echo的市場份額達(dá)到70.6%,Google Home占到23.8%,其他廠商合計占5.6%的市場份額。
國內(nèi)越來越多的公司也開啟智能音箱這個品類。科大訊飛與京東曾經(jīng)推出叮咚音響,借助科大訊飛的語音識別功能和京東的智能家居生態(tài)圈,用戶可以通過叮咚音響實現(xiàn)與智能家居的交互,比如語音控制,音響也可以提供聽歌、聽書、聽小說等互聯(lián)網(wǎng)搜索功能。
背靠電商品臺,叮咚音響去年年底發(fā)布的A3實現(xiàn)了語音購物功能,整個環(huán)節(jié)不需要手機(jī)等其他終端就可以完成在京東購物全流程。
阿里巴巴人工智能實驗室(A.I. Labs)近日也推出自己的智能音響:天貓精靈X1,該實驗室成立于2016年,負(fù)責(zé)阿里巴巴集團(tuán)旗下消費級AI產(chǎn)品的研發(fā)。
天貓精靈內(nèi)設(shè)第一代中文人機(jī)交流系統(tǒng)AliGenie,用戶可通過其實現(xiàn)與智能家居的交互,并且實現(xiàn)語音購購物、手機(jī)充值、叫外賣、音頻音樂等播放功能。
除了作為智能家居的入口,天貓精靈可以通過語音完成整個天貓和淘寶的購物流程。比如用戶通過語音命令下單“一支筆”,天貓精靈會自動根據(jù)用戶的購買記錄或者搜索排名向用戶推薦,在支付等環(huán)節(jié)中,音響需要根據(jù)用戶的聲紋判斷是否問本人,確認(rèn)將會完成支付環(huán)節(jié),否則將會被拒絕。
這其中涉及的一個重要環(huán)節(jié)是聲紋識別和聲紋購。用戶需要提前將自己的聲音注冊,并且生成聲音密碼,與機(jī)器綁定后,開啟聲紋購功能。隨后在購物和支付環(huán)節(jié)中,天貓精靈會要求用戶跟著念一串隨機(jī)數(shù)字進(jìn)行聲紋校驗,來確認(rèn)是否為本人。后續(xù)的快遞查詢、到貨提醒,也都可以通過音響的語音提醒功能完成。
在一個家庭中,音響的使用者不會只有一個人,因此,天貓精靈最多可以同時識別6個人的身份,面對不同的用戶,提供不同的推薦、購物和搜索功能。
天貓精靈推出的前一天,百度推出無人駕駛開發(fā)者平臺Apollo,在這個超過60項核心能力的平臺之上,開發(fā)者可以使用其上面的語音、視頻、增強(qiáng)現(xiàn)實、機(jī)器人視覺、自然語音處理等能力,創(chuàng)業(yè)公司用自己的數(shù)據(jù)換取對Apollo平臺的使用。
同樣,阿里巴巴也在推出天貓精靈的同時,推出AliGenie開發(fā)者平臺,主要面向內(nèi)容開發(fā)者、應(yīng)用開發(fā)者、智能家居開發(fā)者和硬件生廠商。在這個平臺中,開發(fā)者可以借助AliGenie輸出的不同維度的能力,比如深度學(xué)習(xí)能力、自然語言處理能力、算法、知識表示和推理問答系統(tǒng)等,與自己的產(chǎn)品相結(jié)合。
人機(jī)語音交互的難點在于對于語義的理解,對于同一個問題,不同地域、不同年齡和不同習(xí)慣的人會采用不同的問答方式,對于這個問題,阿里巴巴對語義理解進(jìn)行優(yōu)化,比如僅天氣預(yù)報就能夠理解786種中文提問方式,包括北方人的兒化音、小朋友經(jīng)常使用的疊字疊詞、南方人某些與普通話混淆的中文表達(dá)方式等。
語義的理解和執(zhí)行是智能音箱的基本能力,進(jìn)化則是考驗了音響的學(xué)習(xí)能力。所謂“進(jìn)化”是指在第一次向音響提出超出其能力范圍的問題之后,音響可以通過學(xué)習(xí)學(xué)會新知識,長時間進(jìn)化后,加之聲紋識別功能,音響可以成為越來越了解用戶的助手。
在智能家居和AI領(lǐng)域看來,語音識別會成為智能家居交互的主要使用方式,但是否會使用智能音箱的方式來承載,仍然是在摸索的過程中。