在很多武俠小說中,經(jīng)常會看到一些武林高手雖然站在遠(yuǎn)處,卻能通過讀唇語知曉別人說了什么。然而時(shí)至今日,這項(xiàng)“特異功能”不再只是武俠小說中擁有的情節(jié),下面就讓我們來認(rèn)識一下這項(xiàng)神奇的唇語識別技術(shù)吧。
“唇語識別技術(shù)是一項(xiàng)集機(jī)器視覺與自然語言處理于一體的技術(shù)”,海云數(shù)據(jù)CEO馮一村在接受光明網(wǎng)采訪時(shí)介紹,唇語識別技術(shù)通過機(jī)器視覺技術(shù),從圖像中連續(xù)識別出人臉,并提取此人連續(xù)的口型變化特征,隨即將連續(xù)變化的特征輸入到唇語識別模型中,識別出講話人口型對應(yīng)的發(fā)音,從而計(jì)算出可能性最大的表達(dá)語句。此外,馮一村介紹,唇語識別技術(shù)的精確度研發(fā)基于1萬小時(shí)新聞式的唇語節(jié)目,目前英文準(zhǔn)確度已經(jīng)達(dá)到80%,中文準(zhǔn)確度已經(jīng)達(dá)到71%。
唇語識別技術(shù)在噪音太大或只有攝像頭等無法準(zhǔn)確捕捉聲音的場合中具有很強(qiáng)的實(shí)用性。據(jù)中國網(wǎng)報(bào)道,在馬路、會議室、商場等噪音較大的場景里,唇語識別技術(shù)可以規(guī)避噪聲對用戶說話內(nèi)容獲取的影響,確保語音輸入的準(zhǔn)確率,保證交互的穩(wěn)定性;此外,目前在電梯、馬路等
監(jiān)控場景中只有攝像頭,并沒有麥克風(fēng),通過唇語識別技術(shù),可以獲取指定用戶
的
講話信息,為公共安全提供有效支持。
唇語識別技術(shù)又可以應(yīng)用于哪些領(lǐng)域呢?據(jù)《北京日報(bào)》報(bào)道,場景教育、身份識別、公共安全、移動支付、軍事情報(bào)等領(lǐng)域中都可以應(yīng)用唇語識別技術(shù)
。比如,通過唇語識別技術(shù)支持下的口型支付密碼,消費(fèi)者動動嘴就能進(jìn)行支付;而在軍事情報(bào)領(lǐng)域中,唇語識別技術(shù)則讓遠(yuǎn)距離獲取情報(bào)成為可能;若在公安系統(tǒng)中加入唇語識別技術(shù),公安人員則可通過平臺獲取視頻中犯罪嫌疑人的語言信息,這將極大助力犯罪緝查工作的開展。(趙鵬)
本文由中科院物理所副研究員羅會仟進(jìn)行科學(xué)性把關(guān),專家主要研究領(lǐng)域?yàn)槌瑢?dǎo)、電子、電磁、半導(dǎo)體、自動化、中子散射等。
神奇的現(xiàn)實(shí)“讀唇術(shù)”:唇語識別輕松看嘴取信息
圖文簡介
然而時(shí)至今日,這項(xiàng)“特異功能”不再只是武俠小說中擁有的情節(jié),下面就讓我們來認(rèn)識一下這項(xiàng)神奇的唇語識別技術(shù)吧。“唇語識別技術(shù)是一項(xiàng)集機(jī)器視覺與自然語言處理于一體的技術(shù)”,海云數(shù)據(jù)CEO馮一村在接受光明網(wǎng)采訪時(shí)介紹,唇語識別技術(shù)通過機(jī)器視覺技術(shù),從圖像中連續(xù)識別出人臉,并提取此人連續(xù)的口型變化特征,隨即將連續(xù)變化的特征輸入到唇語識別模型中,識別出講話人口型對應(yīng)的發(fā)音。唇語識別技術(shù)在噪音太大或只有攝像頭等無法準(zhǔn)確捕捉聲音的場合中具有很強(qiáng)的實(shí)用性。據(jù)中國網(wǎng)報(bào)道,在馬路、會議室、商場等噪音較大的場景里,唇語識別技術(shù)可以規(guī)避噪聲對用戶說話內(nèi)容獲取的影響,確保語音輸入的準(zhǔn)確率,保證交互的穩(wěn)定性。
- 來源: 科普中國
- 上傳時(shí)間:2017-12-26