首頁 人工智能關我什麽事

一、語音識別

我們先來看一段對話,一位顧客正在電話預約美發服務:

店員:“您好,有什麽能幫您的嗎?”

顧客:“你好,我想為客戶預約一個女士美發。日期是5月3日。”

店員:“好的,請稍等。”

顧客:“嗯哼?”

店員:“請問您想預訂哪個時間段呢?”

顧客:“中午12點吧。”

店員:“我們12點已經約滿了,最近的時間是下午1點15分。”

顧客:“那10點到12點之間呢?”

店員:“這得看顧客想要什麽服務了。她需要哪種服務呢?”

顧客:“隻要女士理發就行。”

店員:“好的,10點可以。”

顧客:“那就10點了。”

店員:“好的,請問那位顧客的名字是?”

顧客:“她的名字是Lisa。”

店員:“好的,那就和Lisa在5月3日上午10點見咯。”

顧客:“沒錯,很好,辛苦啦。”

店員:“好的,祝您愉快,拜拜。”

聰明的讀者一定猜到,既然我們要講人工智能,這段話裏肯定有一個人是機器人。那麽到底誰是機器人呢?是不是很難猜?其實,這位打電話預約的顧客正是“機器”。或許有較真的讀者說:“這不公平,因為打電話是要聽語氣、腔調的,不能隻憑文字來判斷。”確實如此。但是因為這本書沒那麽“智能”,沒辦法自動播放給各位讀者,我們隻能說說在現場親自聽到這段對話的觀眾們的反應。這段簡單的預約電話是2018年穀歌I/O大會現場演示的視頻之一,視頻結束後引起了台下的陣陣歡呼,在這位“人工智能助理”發出“嗯哼”的聲音時,大家都會心地笑了,因為這位助理已經開始掌握了人類的語氣,模仿得惟妙惟肖,而且接電話的店員也完全沒有發現對方是人工智能。

這位人工智能的名字叫做穀歌Duplex。我們知道蘋果手機裏的Siri說話的時候還是像機器人,和人類的口語還有著顯著的差別,但是穀歌Duplex卻能做到語音、語調和人類並無二致。不僅如此,在店員提出1點15分才有時間的時候,它並未接受提議,而是進一步提出了新的方案,最終完成了預約。對於原來隻能用陳述句進行回複的語音助手來說,這種應變能力非常難得,已經是非常大的突破。而這一突破也吻合了穀歌助理的設計宗旨:為用戶節省時間,為用戶把事情搞定(也就是“get things done”)。