說句話就能控制所有電器開關、聽音樂只需報出歌名……一直以來,人類都懷揣著與其他生物乃至機器進行語音交流的夢想,而現(xiàn)在,人工智能的飛速發(fā)展,正推動這一想象變?yōu)楝F(xiàn)實。如今,語音識別技術的廣泛應用,讓智能語音產(chǎn)品逐漸風靡。
語音識別發(fā)展突飛猛進
近年來,生物識別領域日趨升溫,語音識別技術取得顯著進步,開始加速從實驗室走向消費市場。眼下,語音助手、客服機器人、智能音箱等應用都用到了語音識別技術,家電、工業(yè)、金融、汽車電子等行業(yè)成為主要商業(yè)化場景。
在國內(nèi),語音識別技術的研發(fā)始于上世紀50年代,但是由于各方面條件限制,發(fā)展一直十分緩慢。到了80年代以后,隨著計算機等技術的發(fā)展與普及,國內(nèi)外語音識別技術的研究都迎來了一股新熱潮。
進入新世紀,借助深度學習技術突破帶動的人工智能領域崛起,以及大數(shù)據(jù)等信息技術的進步,包括語音識別在內(nèi)的生物識別技術取得了突飛猛進的發(fā)展。不少科技公司、互聯(lián)網(wǎng)企業(yè)都將語音識別視為進軍人工智能的橋頭堡,進一步促進了語音識別市場的巨大擴張。
當前,國外語音識別技術發(fā)展以蘋果、亞馬遜等企業(yè)為尊;而在國內(nèi),科大訊飛、bat三巨頭、搜狗、盛大等公司也在積極布局語音識別技術,并研發(fā)、上市了一批相關產(chǎn)品。在這些公司以及資本市場的推動下,語音識別技術已然成為為火熱的科技應用之一。
語音識別技術有得有失
在生物識別領域中,語音識別技術是應用為成熟、使用為便捷、商業(yè)化程度高的一個細分領域之一。而語音識別技術之所以受到各大科技企業(yè)的關注和資本市場的青睞,就在于其所具有的一系列優(yōu)勢:
一是語音采集較為方便,無需繁復配合、也幾乎不用動手,因而能夠吸引更多的消費者;二是語音識別技術應用成本較低,一般只需一個麥克風配合系統(tǒng)軟件,語音分析、辨別的算法復雜程度也較低;三是更符合消費者的期待與需求,較為適合智能家居等新興業(yè)態(tài)的發(fā)展趨勢。
當然,語音識別技術固然優(yōu)勢多多,但是在當前階段依然存在著一些缺點,例如:每個人的聲音并不是一成不變,而是會隨著年齡的變化而變化;周邊的環(huán)境噪音對于語音的采集有一定干擾,距離因素也是采集過程中不能忽視的問題;另外,還有語音識別準確率及理解能力有待提升等不足都亟需予以重視,并逐步進行完善。
口音或方言是大挑戰(zhàn)
無論是在國內(nèi)還是國外,方言或是口音都是切實存在的,而這對于語音識別技術的應用和普及來說,無疑是大挑戰(zhàn)。因為從經(jīng)濟效益、商業(yè)化推廣等方面考慮,企業(yè)在研發(fā)階段,一般都是采用所在國為主流的語言形式,但是在實際應用時,消費者的語言習慣卻并不一定符合預期設定。
一旦用戶有嚴重的口音,或是使用的方言不在識別范圍內(nèi),那么就會導致語音識別系統(tǒng)反應遲鈍、識別率降低,甚至完全無法識別,終影響消費者的使用體驗,從而造成市場口碑受到質(zhì)疑。很顯然,如果不能解決這一挑戰(zhàn),語音識別的普及就將被限定在目前的瓶頸之中。
因此,針對口音和方言展開的新一輪語音識別技術研發(fā),或?qū)⒊蔀樾碌母偁幗裹c??梢灶A見,隨著識別語種的愈發(fā)豐富及準確率進一步提升,語音識別技術的普及程度將會再度提高,相關的產(chǎn)品將更為公眾所接受,語音識別市場的爆發(fā)也就可期了。