自 2020 年推出Webex 助手以來(lái),我們從客戶那里收到的最常見(jiàn)問(wèn)題是:“它準(zhǔn)確嗎?” 我明白了;客戶希望確保,如果他們選擇使用 Webex AI(人工智能)自動(dòng)轉(zhuǎn)錄引擎,它將兌現(xiàn)保持準(zhǔn)確會(huì)議記錄的承諾,讓與會(huì)者專注于對(duì)話,而不是輸入會(huì)議記錄,并通過(guò)輔助功能使會(huì)議更具包容性。人工智能過(guò)度承諾和交付不足的例子有很多,對(duì)于關(guān)鍵業(yè)務(wù)任務(wù),Webex 已經(jīng)取得了長(zhǎng)足的進(jìn)步,以確保對(duì)準(zhǔn)確性的不懈關(guān)注。
隨著世界進(jìn)入混合工作模式,隱藏式字幕、轉(zhuǎn)錄和捕獲行動(dòng)項(xiàng)目等功能在推動(dòng)平等和包容的會(huì)議體驗(yàn)方面變得比以往任何時(shí)候都更加重要,無(wú)論用戶說(shuō)什么語(yǔ)言、他們可能有什么可訪問(wèn)性需求或是否他們選擇跳過(guò)會(huì)議來(lái)處理他們忙碌的生活并依靠 Webex 助手來(lái)提供回顧。我們的目標(biāo)是利用人工智能和機(jī)器學(xué)習(xí)為每個(gè)人提供更好的每次會(huì)議體驗(yàn)。
構(gòu)建最先進(jìn)的 AI 轉(zhuǎn)錄引擎是實(shí)現(xiàn)該目標(biāo)的一種方式。
鑒于 Webex 在構(gòu)建強(qiáng)大的端到端標(biāo)簽、培訓(xùn)和機(jī)器學(xué)習(xí)管道方面所做的投資,我們很自豪能夠利用這一基礎(chǔ)推出具有行業(yè)領(lǐng)先準(zhǔn)確性的英語(yǔ)轉(zhuǎn)錄引擎,用于 Webex 會(huì)議與市場(chǎng)上一些一流的語(yǔ)音識(shí)別引擎相比,體驗(yàn)。為了擴(kuò)大我們技術(shù)的覆蓋范圍以覆蓋全球 98% 以上的 Webex 客戶,我們將推出完全由內(nèi)部構(gòu)建的西班牙語(yǔ)、法語(yǔ)和德語(yǔ) ASR(自動(dòng)語(yǔ)音識(shí)別引擎),將免費(fèi)提供適用于今年上半年的所有 Webex 助手用戶。
當(dāng)我們想到對(duì)話的準(zhǔn)確轉(zhuǎn)錄時(shí),我們經(jīng)常設(shè)想,如果我們讓人類轉(zhuǎn)錄員聽(tīng)這個(gè)音頻文件,轉(zhuǎn)錄將反映所說(shuō)內(nèi)容的準(zhǔn)確記錄。然而,從長(zhǎng)遠(yuǎn)來(lái)看,在一些流行的數(shù)據(jù)集(例如“CallHome”)上測(cè)量了人為錯(cuò)誤率,迄今為止報(bào)告的最佳結(jié)果是 6.8% 的錯(cuò)誤率;這意味著如果您有 100 個(gè)單詞的成績(jī)單,其中大約 7 個(gè)單詞會(huì)被人類轉(zhuǎn)錄不準(zhǔn)確。還值得一提的是,“CallHome”是一個(gè)數(shù)據(jù)集,它構(gòu)成了以英語(yǔ)為母語(yǔ)的人之間的 30 分鐘無(wú)腳本電話對(duì)話。[1] 預(yù)計(jì)具有不同英語(yǔ)口音的人的數(shù)據(jù)集的百分比錯(cuò)誤會(huì)更高。
更有趣的是,由語(yǔ)言學(xué)數(shù)據(jù)聯(lián)盟 (LDC) 衡量的轉(zhuǎn)錄者間一致性在 4.1% 到 9.6% 之間,這取決于它是仔細(xì)的多重轉(zhuǎn)錄還是快速轉(zhuǎn)錄 [2]。這意味著,如果您將相同的音頻文件提供給 2 個(gè)人,即使在完美的環(huán)境條件下,他們?nèi)匀徊粫?huì)產(chǎn)生相同的錄音。
我們的目標(biāo)是繼續(xù)改進(jìn) Webex 轉(zhuǎn)錄,使其不僅與人工轉(zhuǎn)錄相媲美,而且超越它,并為我們?cè)诓煌谝?、性別和聲學(xué)環(huán)境中提供的每種語(yǔ)言實(shí)現(xiàn)一流的準(zhǔn)確性。