




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
語義降噪語音交互技術(shù)2024/11/4第一部分什么是語義降噪語音交互技術(shù)主要的語音交互模式第一種:智能音箱式(喚醒一次說一次。單工交互,機器人聽和說輪番進行。)第二種:語音助手式(喚醒一次多輪對話。單工交互,機器人聽和說輪番進行。第三種:全雙工語音交互(機器人聽和說同時進行,但經(jīng)常會被其他人說話誤觸發(fā)。)第四種:語義降噪全雙工語音交互(在雙工交互的基礎(chǔ)上加了語義降噪。機器人不會被誤觸發(fā),不亂插話)(氖星自研專有技術(shù))第一部分什么是語義降噪語音交互技術(shù)怎么實現(xiàn)語義降噪?該技術(shù)的底座是我們AI大腦平臺。?我們讓智能體產(chǎn)生意圖,自己判斷要不要回答問題,該不該回答問題。第二部分什么是AI大腦什么是AI大腦?AI大腦是智能硬件和機器人的人機交互及決策軟件系統(tǒng),它識別用戶的自然語言、動作、表情等表達讓智能硬件和機器人做出令用戶滿意的反饋。?AI大腦不是操作系統(tǒng),它主動理解用戶,它處理比命令更復(fù)雜的自然語言等信號。?AI大腦不僅僅是人機交互系統(tǒng),它更是決策系統(tǒng)。?通過氖星智能的平臺,用戶可以建立自己更加個性化的AI大腦。(像百度智能音箱、小米智能音箱、阿里天貓精靈這樣的產(chǎn)品都是共用一個超級AI大腦,而每一個氖星機器人擁有一個獨立的AI大腦。)?AI大腦是以用戶為中心的人機交互系統(tǒng),它主動理解用戶、服務(wù)用戶。第二部分什么是AI大腦AI大腦是以用戶為中心的產(chǎn)品。AI大腦能產(chǎn)生自己的意圖。以用戶為中心的交互和以產(chǎn)品為中心的交互有本質(zhì)區(qū)別。以產(chǎn)品為中心的交互以用戶為中心的交互用戶輸入命令、固定句式學習門檻高低學習成本低高統(tǒng)一界面非統(tǒng)一界面統(tǒng)一界面只能被操作能自主思考,自主生成意圖應(yīng)用領(lǐng)域手機電腦機器人、數(shù)字人對語音識別不友好友好第二部分什么是AI大腦AI大腦的應(yīng)用在線客服機器人實體客服機器人電話客服機器人在線客服機器人實體客服機器人電話客服機器人AR/AR/VR/數(shù)字人元宇宙微信公眾號小程序機器人AI大腦AI大腦語義理解技術(shù)語義理解技術(shù)在線客服機器人、電話客服機器人、展廳機器人和實體客服機器人、微信公眾號和小程序機器人都是AI大腦的不同應(yīng)用。它們背后共用一個AI大腦。第二部分什么是AI大腦AI大腦和語音助手的區(qū)別?1.允許用戶按自己想法表達(自然語言表達)的是AI大腦;命令式輸入的是語音助手。有些產(chǎn)品只允許用戶輸入幾個字以內(nèi)的命令,肯定就是語音助手。能處理否定句、倒裝句、省略句、復(fù)句語義的是AI大腦;不能處理的是語音助手。?2.認識用戶,能回答個性化問題的是AI大腦;不認識用戶,每個設(shè)備回答問題的答案都一樣的是語音助手。?3.能完成語音點餐、語音購物等等任務(wù)型對話的是AI大腦;只能演示幾個多輪對話小場景(甚至沒有多輪對話的)的是語音助手。?4.能讓陌生人用起來的是AI大腦;陌生人用不起來的是語音助手。?5.能離開觸摸屏的是AI大腦;離不開觸摸屏的是語音助手。?6.能讓數(shù)字人動作表情和語言匹配的是AI大腦;匹配不起來的是語音助手。第二部分什么是AI大腦AI大腦和操作系統(tǒng)的區(qū)別只有擁有強大的大腦,才能稱作智能機器人。依靠操作系統(tǒng)的硬件,本質(zhì)上還是個平板電腦。機器人并非平板+AGV。只有擁有強大的大腦,才能稱作智能機器人。第二部分什么是AI大腦AI大腦的技術(shù)壁壘?AI大腦是全新的理論體系和技術(shù)體系。?傳統(tǒng)的自然語言處理技術(shù)主要是搜索技術(shù),是基于統(tǒng)計學技術(shù)建立的,核心是計算文本的相關(guān)性,并不能真正理解語義,會產(chǎn)生幻覺問題。?AI大腦需要真正理解語義,理解語言的邏輯性,需要從語言學角度定義語義,計算語義。第三部分AI大腦和大語言模型的區(qū)別AI大腦和大語言模型LLM的區(qū)別AI大腦大語言模型個性化AI大腦是個性化的大語言模型是超級大腦,沒有個性獨立人格每個AI大腦都有獨立人格沒有獨立人格,是個大雜燴主動服務(wù)能力有無理解對話場景能力有無多輪對話任務(wù)完成能力有無有無是否會產(chǎn)生幻覺否是能否用于生產(chǎn)能不能第三部分AI大腦和大語言模型的區(qū)別為什么說大語言模型不適合做機器人大腦第四部分AI大腦的商業(yè)價值A(chǔ)I大腦對于機器人相當于操作系統(tǒng)對于電腦和手機?每個機器人都需要自己的AI大腦?機器人的數(shù)量將會超越人類數(shù)量?汽車、手表、手機裝上AI大腦都變成了機器人語義降噪語音交互是AI大腦和用戶的主要交互方式。第五部分AI大腦的應(yīng)用語音交互數(shù)字人不插話免喚醒全雙工的語音交互數(shù)字人才能真第五部分AI大腦的應(yīng)用AI語音記事本AI記事本通過語音交互幫助用戶記住重要的事情。目前我們AI記事本已經(jīng)完成以下功能:1.語音記事語音提?。ㄎ覂鹤拥碾娫捠嵌嗌伲?.定時提醒,語音為家人設(shè)置定時提醒(8點鐘提醒我吃藥)3.接入大語言模型回答問題(KIMI、文心一言、智譜)4.天氣、新聞5.語音留言(告訴我兒子我晚上不回家吃飯)6.語音通話(準備開發(fā)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度食品銷售代理合同模板
- 2025版建筑屋面復(fù)合材料施工合作協(xié)議
- 2025版服裝品牌代理銷售合同范本
- 二零二五年度個人門面租賃合同(兒童游樂場租賃)
- 二零二五年度鐵路工程項目承包施工合同
- 二零二五年度5G網(wǎng)絡(luò)優(yōu)化與維護技術(shù)服務(wù)合同
- 2025版餐飲行業(yè)社保代繳服務(wù)合同
- 二零二五年度門窗安裝與節(jié)能檢測服務(wù)協(xié)議
- 二零二五年度海綿城市雨水收集利用承包經(jīng)營合同
- 二零二五年度二手車融資租賃合同范本及還款計劃
- GB 16912-2008深度冷凍法生產(chǎn)氧氣及相關(guān)氣體安全技術(shù)規(guī)程
- 化學藥品地標升國標第四冊
- 鳳凰網(wǎng)公益頻道先生訪談記錄
- 鍛造作業(yè)指導(dǎo)書
- DB15T 2748-2022 綠色電力應(yīng)用評價方法
- 喹鉬檸酮配制
- 廠房改造合同范本
- 25噸吊車起重性能表
- 娛樂場所從業(yè)人員信息登記表
- 地下水環(huán)境監(jiān)測井施工設(shè)計方案
- 陜西省開放型經(jīng)濟發(fā)展的問題及對策
評論
0/150
提交評論