高質量訓練數據集賦能 標貝語音識別再添新語種
人工智能蓬勃發展的今天,人工智能產品在生活中的滲透率越來越高,常見的如手機語音助手、智能音箱、車載語音交互、iOT物聯網等已經與生活密不可分。其中,語音識別技術作爲連接人與機器溝通的基本途徑之一,也成爲了行業關注焦點,迎來快速發展階段。
近日,標貝科技全新推出英語語音識別能力,得益於海量的數據基礎及深度學習平臺,英語語音識別的準確率得到全面提升,助推語音交互技術在更多場景的落地應用。
標貝英語語音實時識別詞準率達95%以上
人機交互主要解決如何讓機器聽得懂,並作出正確的迴應,因而語言識別和自然語言處理能力尤爲重要。標貝科技此次推出的英語語音識別功能完全基於標貝自研的深度神經網絡訓練聲學模型進行研發,通過大量英語語料數據,不斷對識別模型進行優化訓練,從而讓語音識別準確率獲得大幅提升,英語語音識別詞準率高達95%。
此外,標貝英語語音識別可以支持一句話、長語音、錄音文件三種形式的識別轉寫,同時還能根據應用場景需要,針對特定詞彙識別效果進行優化定製,適用於不同場景下的美式英語、中式英語、中英文混合識別,提升用戶交互體驗。
衆所周知,基於機器學習的各種技術,往往都需要使用大量的數據來訓練,語音識別的準確率更是離不開算法和數據的積累。實際應用中,數據作爲機器學習的基礎,很多時候數據質量的好壞對總體性能的影響甚至超過了算法本身的影響。斯坦福大學副教授、Coursera聯合創始人吳恩達,曾經強調數據質量對於AI的重要性:80%的數據+20%的模型=更好的AI。
因此,在當前人工智能產業發展進入場景應用的關鍵時期,對數據質量提出了更高的要求。自成立起,標貝科技紮根AI數據服務領域,自研一站式數據採標平臺-數據工場,全方位支持文本、語音、圖像、視頻等各類型數據的處理,爲企業客戶提供數據採集、標註等定製化數據解決方案,滿足不同行業、多類型的場景化數據需求,持續提升數據產能和效率。
目前,標貝科技構建了大規模、多語種的AI語音數據庫,總時長超過10萬小時。其中,自有語音識別庫超過50餘種,包括英日韓等3大主流外語及成人、青少年/兒童中文、地方方言等,覆蓋智能硬件、智能客服、AI教育、有聲閱讀、車載交互等多個應用場景。
*以上數據庫列表僅爲部分內容,如需完整數據庫請聯繫我們
據瞭解,本次標貝科技推出的英語語音識別系統基於自有的兒童英文數據庫、美式英文朗讀與對話數據庫、英式英語數據庫、中國成人說英文數據庫、中國青少年英文數據等近萬小時的優質英語語音數據進行模型訓練,海量數據做爲基石,在深度學習神經網絡算法加持下,能夠保證系統可以快速的輸出高準確率的識別結果。
標貝科技數據業務相關負責人表示,數據標註行業的發展已經越來越趨向於專業化,客戶需求已經從早期較簡單的、通用的數據過渡到更復雜的多語種、個性化的、場景化的數據,對於很多細分領域,需要大量真實的模型進行標註去迭代優化。而標貝科技基於自研的一體化採標平臺,採用人機協作的方式,推出場景化的英語語音識別能力,目的就是爲了滿足不同的應用場景,讓用戶享受到更快速、更準確的英語語音識別服務。
立足業務場景 突破AI數據應用價值
多年行業深耕,標貝科技積累了豐富的行業經驗和案例,連續兩年入選年度數據標註公司排行榜單TOP10,助力自動駕駛、電商、智能客服、智能家居、社交娛樂、融媒體等領域頭部企業客戶智能語音交互業務上線,並獲得衆多用戶的信賴與認可。
未來,隨着人工智能、5G、IoT等技術的成熟,作爲聯動各智能設備終端的關鍵通道,語音識別、語音合成等智能語音交互技術將得到更廣泛的落地應用。標貝科技將持續聚焦場景化的數據服務,在技術創新和場景應用的雙輪驅動之下,進一步提升人機協同的準確率和效率,爲AI產業發展提供更多種類、更大規模、更高價值的數據服務,助力人工智能產業生態鏈進一步完善。