一区二区三区A片|Av不卡高清网址|精品久久不卡一本|一区二区三区绿色|五月黄色婷婷久久|综合 另类 一区|亚洲成人VA视频|久久国产特黄大片|成人无码激情亚洲|黄色字幕网址大全

沃豐科技AI:如何阻止語音機(jī)器人客服說出“你能再重復(fù)一遍嗎?”

當(dāng)你向世界發(fā)布數(shù)字助理時(shí),你希望它永遠(yuǎn)不會說“你能重復(fù)一遍嗎?” 這四個(gè)詞表示人類與機(jī)器人對話的失敗。也許機(jī)器人沒有接受過用戶口音的訓(xùn)練。也許用戶的請求可以以多種不同的方式解釋,而機(jī)器人不確定如何推進(jìn)對話。也許機(jī)器人根本無法處理部署它的嘈雜環(huán)境——例如在餐廳。而無論出于什么原因,說“你能重復(fù)一遍嗎”都會導(dǎo)致用戶失去信心,機(jī)器人無法滿足用戶需求。這使得整個(gè)事情變得毫無意義。

當(dāng)你向世界發(fā)布數(shù)字助理時(shí),你希望它永遠(yuǎn)不會說“你能重復(fù)一遍嗎?”

這四個(gè)詞表示人類與機(jī)器人對話的失敗。也許機(jī)器人沒有接受過用戶口音的訓(xùn)練。也許用戶的請求可以以多種不同的方式解釋,而機(jī)器人不確定如何推進(jìn)對話。也許機(jī)器人根本無法處理部署它的嘈雜環(huán)境——例如在餐廳。而無論出于什么原因,說“你能重復(fù)一遍嗎”都會導(dǎo)致用戶失去信心,機(jī)器人無法滿足用戶需求。這使得整個(gè)事情變得毫無意義。

那么,你如何避免那些災(zāi)難性的四個(gè)詞呢?這正是客戶關(guān)心的,也是科技公司關(guān)心的,作為語音機(jī)器人的從業(yè)人員,在此分享語音機(jī)器人成功的6個(gè)步驟。

圖片7

1.ASR技術(shù)的重要性

當(dāng)您與機(jī)器人交談時(shí),轉(zhuǎn)錄是您所說內(nèi)容的技術(shù)。你會聽到行業(yè)內(nèi)部人士談?wù)撜Z音轉(zhuǎn)文本或自動語音識別(ASR),但他們實(shí)際上是一回事——轉(zhuǎn)錄用戶口語的技術(shù)。

糟糕的轉(zhuǎn)錄只是意味著用戶被誤解了。例如,他們說北京地鐵站“上地”,但轉(zhuǎn)錄是“上帝”。從那一刻起,機(jī)器人可能試圖將對話帶向一個(gè)完全無關(guān)緊要的方向。更糟糕的是語音機(jī)器人說“對不起,你能重復(fù)一遍嗎?”

因此,語音轉(zhuǎn)文本的有效性對與語音機(jī)器人的對話產(chǎn)生了巨大影響。準(zhǔn)確的對話轉(zhuǎn)文本不僅要讓對話保持正常,而且是首先開始對話所需的第一個(gè)要素。

有可能獲得完美的轉(zhuǎn)錄嗎?

最好的轉(zhuǎn)錄員是人類,甚至人類也會犯錯(cuò)誤。人類最好的理解能力能夠獲得 99% 的準(zhǔn)確率。這已經(jīng)足夠好了。但是隨著深度學(xué)習(xí)的進(jìn)步,語音機(jī)器人與人類相當(dāng)?shù)淖R別率成為可能。

2.響應(yīng)時(shí)間的挑戰(zhàn)

當(dāng)您向朋友發(fā)送短信時(shí),您不會希望他們在毫秒內(nèi)回復(fù)。但是聲音不同,我們預(yù)計(jì)語音響應(yīng)要比文本快得多。但是在中國,語音對話的平均等待時(shí)間為0.74秒。時(shí)間要比預(yù)計(jì)長得多。這樣的話,用戶就認(rèn)為他們被機(jī)器人誤解了,或者他們認(rèn)為機(jī)器人忽視了他們。無論如何,這造成了糟糕的客戶體驗(yàn)。

那么讓我們來看一下這個(gè)等待時(shí)間語音機(jī)器人都做了什么,包括:

1、收集用戶的音頻輸入(他們的單詞以及其他可能的符號,如情感)

2、轉(zhuǎn)錄所說的話

3、讓機(jī)器人理解清楚這些話的意思

4、機(jī)器人分析用戶想做什么

5、在為用戶生成應(yīng)答的同時(shí),為用戶提供他們需要的東西

所有這些都比眨眼所需的時(shí)間多一點(diǎn)。

響應(yīng)時(shí)間是一個(gè)很大的挑戰(zhàn)。機(jī)器人必須以實(shí)時(shí)的方式做出反應(yīng)。因此,您需要一個(gè)技術(shù)堆棧,可以快速處理大量數(shù)據(jù),并協(xié)同工作,以類似人類的響應(yīng)時(shí)間扭轉(zhuǎn)對話轉(zhuǎn)折。

3.從目標(biāo)業(yè)務(wù)中訓(xùn)練您的模型

您用于訓(xùn)練ASR模型的數(shù)據(jù)應(yīng)特定于您的用例。如果您出售保險(xiǎn),您的用戶在致電您時(shí)將使用特定的單詞和短語。這些話語可能與您在公司內(nèi)部使用的短語不同。這就需要你思考一個(gè)問題:“誰會和這個(gè)機(jī)器人說話?”即你的目標(biāo)人群是誰。

如果是為了公司內(nèi)部使用,那么繼續(xù)使用您在公司視頻通話中使用的術(shù)語進(jìn)行培訓(xùn)。如果是針對一部分公眾的,那么您必須使用公眾音頻來代表他們談?wù)撨@些事情的方式。

您使用的音頻具備以下:

客戶使用的單詞和短語

客戶可能擁有的各種口音

您的客戶將在物理環(huán)境中與您交談

為此,您需要一個(gè)語音識別系統(tǒng),允許您針對特定用例重新訓(xùn)練模型。也可以通過第三方科技公司為您的企業(yè)模型進(jìn)行訓(xùn)練。目前以沃豐科技為例的科技公司提供這樣的服務(wù),

4.從你能得到的最好的TTS開始,然后改進(jìn)它

目前隨著科技的發(fā)展,新一波語音識別初創(chuàng)公司,從一開始就實(shí)現(xiàn)了85%至90%的識別精度。而傳統(tǒng)提供商的準(zhǔn)確率為65%至75%。這是一個(gè)很好的開端,但可以進(jìn)一步改進(jìn)。

一旦您為您的用例選擇了最好的TTS提供商,您將需要根據(jù)您的需求調(diào)整模型。也許它缺少詞匯量,或者它不理解您所在地區(qū)的特定口音,或者您的機(jī)器人將被部署在嘈雜的環(huán)境中。

通過專注于滿足這些獨(dú)特需求的訓(xùn)練數(shù)據(jù),您將改進(jìn)您的機(jī)器人,并通過語音識別實(shí)現(xiàn)更高的準(zhǔn)確性。

如何為特定用例訓(xùn)練語音識別模型,分為兩種方式:

內(nèi)部ASR培訓(xùn)

如果將自己的團(tuán)隊(duì)聚集在一起完成這項(xiàng)任務(wù)是有意義的,那么好處是您可以確保涵蓋域中的特定語言。外包這項(xiàng)工作的風(fēng)險(xiǎn)是,它是由對您的特定語言需求不敏感的人執(zhí)行的。換句話說,您將能夠比任何人都更好地標(biāo)記您的數(shù)據(jù)。

外包ASR培訓(xùn)

如果外包更適合您,那么在工作開始前制定“風(fēng)格指南”至關(guān)重要。在這里,您將描述用戶可能說的各種事情以及它們的意思。這將有助于外包數(shù)據(jù)標(biāo)簽團(tuán)隊(duì)保持其工作的一致性和準(zhǔn)確性。

對于外包企業(yè)對選擇,企業(yè)需要選擇一個(gè)擁有豐富服務(wù)經(jīng)驗(yàn)的公司,進(jìn)行定制化的模型訓(xùn)練。以沃豐科技為例,作為中國人工智能與營銷服務(wù)解決方案提供商,服務(wù)過眾多世界500強(qiáng)、中國500強(qiáng),具有豐富的模型訓(xùn)練經(jīng)驗(yàn)。經(jīng)驗(yàn)豐富的公司不僅能夠根據(jù)公司的業(yè)務(wù)需求進(jìn)行訓(xùn)練,還能夠提供成功案例的經(jīng)驗(yàn)借鑒,以及豐富的數(shù)據(jù)存儲用于模型訓(xùn)練,一般來說數(shù)據(jù)越多則意味著ASR識別越準(zhǔn)確。

5.語義理解的重要性

關(guān)于語義理解,這里有三件事需要記住:

每個(gè)用戶都可以以自己獨(dú)特的方式進(jìn)行溝通,但您的NLP必須能夠理解您說的所有內(nèi)容。

NLP必須能夠消除具有不同含義的類似措辭之間的歧義,例如“碰撞”意味著車輛事故或計(jì)算機(jī)死機(jī)。

你需要一個(gè)持續(xù)改進(jìn)的策略。您將收到反饋,顯示您在哪里犯了一致的錯(cuò)誤——您將如何納入這些反饋以提高語義理解?

通過對客戶特定歷史記錄數(shù)據(jù)的模型進(jìn)行培訓(xùn),進(jìn)一步提高了理解的準(zhǔn)確性。這對于機(jī)器人理解語義很重要。

以某鑒別與購物一體化的購物APP為例,它曾和沃豐科技合作過關(guān)于文本交互的質(zhì)檢,因此沃豐科技具有其文本數(shù)據(jù)進(jìn)行模型訓(xùn)練,當(dāng)后期有其他例如語音信息質(zhì)檢時(shí),沃豐科技就能夠擁有豐富的歷史數(shù)據(jù),豐富的數(shù)據(jù)將使得其語音識別與理解的模型訓(xùn)練更為準(zhǔn)確。所以對于已經(jīng)所合作的科技公司可以是你的優(yōu)先選擇。

6.你無法修復(fù)你不知道的東西

誰知道機(jī)器人的問題,誰有能力解決這些問題?對話設(shè)計(jì)師、數(shù)據(jù)科學(xué)家或開發(fā)人員是否知道機(jī)器人遇到了什么問題?如果他們不知道反復(fù)出現(xiàn)的問題,他們就無法調(diào)整設(shè)計(jì)來克服這些問題。

在中國,由于SaaS軟件提供商的興盛,很多企業(yè)用到語音機(jī)器人是在云端部署的,企業(yè)自身并不具備自主升級的能力,大多數(shù)企業(yè)并沒有根據(jù)自己的業(yè)務(wù)對軟件進(jìn)行個(gè)性化升級。小部分企業(yè)有這個(gè)意識,但是在企業(yè)內(nèi)部配置運(yùn)維人員崗位,是一個(gè)成本極高的事情。

沃豐科技推出了AI訓(xùn)練師的服務(wù),能夠進(jìn)行全業(yè)務(wù)場景挖掘、知識庫整合梳理、AI業(yè)務(wù)流程配置、持續(xù)訓(xùn)練與運(yùn)營,能夠全程迅速快捷地為企業(yè)智能客服的優(yōu)化升級提供助力。

結(jié)論

語音機(jī)器人需要了解人類,人類也需要了解語音機(jī)器人。自動語音識別和自然語言理解是人工智能會話的核心元素,它促進(jìn)了機(jī)器人理解人類語音的能力。你如何選擇、實(shí)施和調(diào)整這兩種技術(shù)將對你創(chuàng)建真正理解人的語音助手產(chǎn)生重大影響,最終達(dá)成使機(jī)器人從不說“對不起,你能再重復(fù)一遍嗎?”的目標(biāo)。

THE END
免責(zé)聲明:本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的,皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方,且不允許本站使用您的字體和圖片文字等素材,請聯(lián)系我們,本站核實(shí)后將立即刪除!任何版權(quán)方從未通知聯(lián)系本站管理者停止使用,并索要賠償或上訴法院的,均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索,將不予任何的法律和經(jīng)濟(jì)賠償!敬請諒解!