自 2020 年推出Webex 助手以來,我們從客戶那里收到的最常見問題是:“它準(zhǔn)確嗎?” 我明白了;客戶希望確保,如果他們選擇使用 Webex AI(人工智能)自動轉(zhuǎn)錄引擎,它將兌現(xiàn)保持準(zhǔn)確會議記錄的承諾,讓與會者專注于對話,而不是輸入會議記錄,并通過輔助功能使會議更具包容性。人工智能過度承諾和交付不足的例子有很多,對于關(guān)鍵業(yè)務(wù)任務(wù),Webex 已經(jīng)取得了長足的進步,以確保對準(zhǔn)確性的不懈關(guān)注。
隨著世界進入混合工作模式,隱藏式字幕、轉(zhuǎn)錄和捕獲行動項目等功能在推動平等和包容的會議體驗方面變得比以往任何時候都更加重要,無論用戶說什么語言、他們可能有什么可訪問性需求或是否他們選擇跳過會議來處理他們忙碌的生活并依靠 Webex 助手來提供回顧。我們的目標(biāo)是利用人工智能和機器學(xué)習(xí)為每個人提供更好的每次會議體驗。
構(gòu)建最先進的 AI 轉(zhuǎn)錄引擎是實現(xiàn)該目標(biāo)的一種方式。
鑒于 Webex 在構(gòu)建強大的端到端標(biāo)簽、培訓(xùn)和機器學(xué)習(xí)管道方面所做的投資,我們很自豪能夠利用這一基礎(chǔ)推出具有行業(yè)領(lǐng)先準(zhǔn)確性的英語轉(zhuǎn)錄引擎,用于 Webex 會議與市場上一些一流的語音識別引擎相比,體驗。為了擴大我們技術(shù)的覆蓋范圍以覆蓋全球 98% 以上的 Webex 客戶,我們將推出完全由內(nèi)部構(gòu)建的西班牙語、法語和德語 ASR(自動語音識別引擎),將免費提供適用于今年上半年的所有 Webex 助手用戶。
當(dāng)我們想到對話的準(zhǔn)確轉(zhuǎn)錄時,我們經(jīng)常設(shè)想,如果我們讓人類轉(zhuǎn)錄員聽這個音頻文件,轉(zhuǎn)錄將反映所說內(nèi)容的準(zhǔn)確記錄。然而,從長遠來看,在一些流行的數(shù)據(jù)集(例如“CallHome”)上測量了人為錯誤率,迄今為止報告的最佳結(jié)果是 6.8% 的錯誤率;這意味著如果您有 100 個單詞的成績單,其中大約 7 個單詞會被人類轉(zhuǎn)錄不準(zhǔn)確。還值得一提的是,“CallHome”是一個數(shù)據(jù)集,它構(gòu)成了以英語為母語的人之間的 30 分鐘無腳本電話對話。[1] 預(yù)計具有不同英語口音的人的數(shù)據(jù)集的百分比錯誤會更高。
更有趣的是,由語言學(xué)數(shù)據(jù)聯(lián)盟 (LDC) 衡量的轉(zhuǎn)錄者間一致性在 4.1% 到 9.6% 之間,這取決于它是仔細的多重轉(zhuǎn)錄還是快速轉(zhuǎn)錄 [2]。這意味著,如果您將相同的音頻文件提供給 2 個人,即使在完美的環(huán)境條件下,他們?nèi)匀徊粫a(chǎn)生相同的錄音。
我們的目標(biāo)是繼續(xù)改進 Webex 轉(zhuǎn)錄,使其不僅與人工轉(zhuǎn)錄相媲美,而且超越它,并為我們在不同口音、性別和聲學(xué)環(huán)境中提供的每種語言實現(xiàn)一流的準(zhǔn)確性。