微軟新研究項目公開:提升AI理解能力


【資料圖】

微軟研究院近日公開了其最新研究項目——Project Rumi。該項目旨在通過結合文本、音頻和視頻數據,運用多模態(tài)方法,提升人工智能系統的理解能力,使其更能理解人類的意圖。 近年來,人工智能系統在自然語言處理(NLP)領域取得了顯著的進步。然而,現有的NLP AI主要依賴于文本輸入輸出,忽略了人類在自然交流中的語調、面部表情、手勢和肢體語言等線索,這在一定程度上導致了其在理解方面的偏差。在AI專業(yè)術語中,這些線索被統稱為副語言。 為了解決這個問題,微軟研究院開發(fā)了Project Rumi。這是一個新穎的框架,旨在通過多模態(tài)副語言提示來增強人工智能的理解。該項目包括兩個主要部分:多模式副語言編碼器和多模式副語言解碼器。

推薦DIY文章
海藝AI:迎合“AI時代”發(fā)展潮流,刷新繪圖市場傳統認知
布局產業(yè)新高地!海星醫(yī)藥健康創(chuàng)新園B區(qū)奠基儀式隆重舉行
未來五年500億投入打底,北汽藍谷錨定細分市場增量
【展會直擊】華秋慕尼黑上海電子展精彩ing,助力電子產業(yè)高質量發(fā)展!
桂花網藍牙網關助力司乘人員職業(yè)健康監(jiān)測
DNF新推出封號申訴:每個玩家180天內只能享受一次減少處罰時間機會 每日視訊
精彩新聞

超前放送