原理:
創(chuàng)新互聯(lián)服務(wù)項目包括江南網(wǎng)站建設(shè)、江南網(wǎng)站制作、江南網(wǎng)頁制作以及江南網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,江南網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到江南省份的部分城市,未來相信會繼續(xù)擴大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!
主流的大詞匯量語音識別系統(tǒng)多采用統(tǒng)計模式識別技術(shù)。典型的基于統(tǒng)計模式識別方法的 語音識別系統(tǒng)由以下幾個基本模塊所構(gòu)成:
信號處理及特征提取模塊。該模塊的主要任務(wù)是從輸入信號中提取特征,供聲學模型處理。同時,它一般也包括了一些信號處理技術(shù),以盡可能降低環(huán)境噪聲、信道、說話人等因素對特征造成的影響。
統(tǒng)計聲學模型。典型系統(tǒng)多采用基于一階隱馬爾科夫模型進行建模。
發(fā)音詞典。發(fā)音詞典包含系統(tǒng)所能處理的詞匯集及其發(fā)音。發(fā)音詞典實際提供了聲學模型建模單元與語言模型建模單元間的映射。
語言模型。語言模型對系統(tǒng)所針對的語言進行建模。理論上,包括正則語言,上下文無關(guān)文法在內(nèi)的各種語言模型都可以作為語言模型,但目前各種系統(tǒng)普遍采用的還是基于統(tǒng)計的N元文法及其變體。
解碼器。解碼器是語音識別系統(tǒng)的核心之一,其任務(wù)是對輸入的信號,根據(jù)聲學、語言模型及詞典,尋找能夠以最大概率輸出該信號的詞串。
以上是語音識別的各個組成部分,而離線的語音識別,應(yīng)該也是基于以上的原理,而且在手機內(nèi)部內(nèi)置了語音的字典,從而實現(xiàn)無線的識別
如:
1、瀏覽器提供的功能,比如chrome,如果沒有提供的話就不能用。
2、具體實現(xiàn)的細節(jié)主要是chrome的離線語音識別引擎。
3、調(diào)用系統(tǒng)api,瀏覽器是個app,可以訪問所有底層的api,只要系統(tǒng)提供就可以實現(xiàn)。
相關(guān)代碼如下:
!DOCTYPE HTML html head title簡單通過html5實現(xiàn)語音識別/title script if (document.createElement(“input”).webkitSpeech === undefined) { alert(“Speech input is not supported in your browser.”); } /script /head body
input type=”text” name=”value_2″ x-webkit-speech/
/body /html
是可以的,可以去H5edu看看,其HTML5培訓課程融合了HTML5開發(fā)基礎(chǔ)課程、CSS3基礎(chǔ)課程和移動前端交互JavaScript+JQuery+Ajex等課程,從入門到精通,讓開發(fā)者全面學習HTML5
找到php的音頻轉(zhuǎn)換工具,基于html5開發(fā)的android和ios的app應(yīng)用上實現(xiàn)語音聊天功能也就理論上打通了。
1. 用phonegap封裝成android應(yīng)用,phonegap官網(wǎng)上有詳細介紹
2.實現(xiàn)js和android原生語言java的通信(google有介紹)
3.調(diào)用原生語言實現(xiàn)錄音功能(mediaRecorder類),錄音格式為 amr格式(android本身支持的語言)
4.回調(diào)js方法,把amr文件地址傳給phonegap,利用phonegap讀取錄音文件并上傳到服務(wù)器端
5.服務(wù)器端利用ffmpeg2theora 將amr轉(zhuǎn)為html5支持的音頻格式ogg
6.接下來讀取文件,利用html5的audio 播放ogg文件。
!DOCTYPE html
html xmlns=""
head
title/title
script type="text/javascript"
var wsServer = 'ws://localhost:9999/webSocket.ashx'; //基于.NET4.5服務(wù)器地址
//var wsServer = 'ws://localhost:1818'; //基于.NET服務(wù)器地址
var websocket = new WebSocket(wsServer); //創(chuàng)建WebSocket對象
//websocket.send("hello");//向服務(wù)器發(fā)送消息
//alert(websocket.readyState);//查看websocket當前狀態(tài)
websocket.onopen = function (evt) {
//已經(jīng)建立連接
alert("已經(jīng)建立連接");
};
websocket.onclose = function (evt) {
//已經(jīng)關(guān)閉連接
alert("已經(jīng)關(guān)閉連接");
};
websocket.onmessage = function (evt) {
//收到服務(wù)器消息,使用evt.data提取
evt.stopPropagation()
evt.preventDefault()
//alert(evt.data);
writeToScreen(evt.data);
//websocket.close();
};
websocket.onerror = function (evt) {
//產(chǎn)生異常
//alert(evt.message);
writeToScreen(evt.message);
};
function sendMsg() {
if (websocket.readyState == websocket.OPEN) {
msg = document.getElementById("msg").value;
websocket.send(msg);
writeToScreen("發(fā)送成功!");
} else {
writeToScreen("連接失敗!");
}
}
function writeToScreen(message) {
var pre = document.createElement("p");
pre.style.wordWrap = "break-word";
pre.innerHTML += message;
output.appendChild(pre);
}
/script
/head
body
div
input type="text" id="msg" value="beyond is number one!" /
button onclick="sendMsg()"send/button
/div
div id="output"/div
/body
/html
H5edu實訓html5開發(fā)解答
如果想指定語言類別,還可以增加lang屬性,如:inputx-webkit-speech lang="zh-CN"/。以及表示語法的(據(jù)說bUIltin:search可以過濾助詞):input x-webkit-speech x-webkit-grammar="bUIltin:search" /
還有一個onwebkitspeechchange的方法,發(fā)生在語言識別成功,且文字輸入到文本框后觸發(fā)。
網(wǎng)頁名稱:html5聊天語音,語音聊天實現(xiàn)
URL標題:http://www.2m8n56k.cn/article16/dscdcdg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站建設(shè)、標簽優(yōu)化、電子商務(wù)、網(wǎng)站收錄、營銷型網(wǎng)站建設(shè)、網(wǎng)站設(shè)計公司
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:[email protected]。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)