• <table id="4yyaw"><kbd id="4yyaw"></kbd></table>
  • <td id="4yyaw"></td>
  • 發布時間:2024-06-25 13:39 原文鏈接: 這項智能技術憑啥獲國家科學技術進步獎一等獎?

    6月24日,2023年度國家科學技術獎在京揭曉,科大訊飛作為第一完成單位申報的“多語種智能語音關鍵技術及產業化”獲國家科學技術進步獎一等獎。據科大訊飛介紹,這是深度學習引發新一代人工智能浪潮以來,人工智能領域首個國家科學技術進步獎一等獎。

    由于評選周期調整等因素,2023年度國家科學技術獎競爭激烈。“多語種智能語音關鍵技術及產業化”有哪些技術突破?它為啥能成為人工智能領域的“國獎之光”?

    “這是科大訊飛繼2002年和2011年分別獲得國家科學技術進步獎二等獎之后,首次獲得國家科學技術進步獎一等獎。”科大訊飛副總裁、研究院院長劉聰對《中國科學報》表示,多語種智能語音技術對于支撐人機交互、人類語言互通及國家安全等需求具有戰略意義,產業前景廣闊,科大訊飛經過多年攻關和積累,攻克了多個技術難題,提出并突破了四個方面的技術創新。

    關鍵技術突破之一:復雜語音信號解耦建模

    語音識別研究中最具挑戰的是遠場、噪聲、多人語音混疊等現象導致的“雞尾酒會”效應典型難題。

    針對此,劉聰介紹說,科大訊飛提出了多通道語音信號時空分離建模方法和多維度語音屬性解耦表征方法,實現語音信號中內容、噪聲等高度耦合的多維屬性特征解耦,解決了“雞尾酒會”的難題,使得復雜場景下語音識別準確率得到重大突破。

    在這些技術的支撐下,科大訊飛連續4屆獲得國際多通道語音分離和識別比賽 CHIME 冠軍;連續8屆獲得國際語音合成大賽 Blizzard Challenge 冠軍。2015年,相關技術首次在大會演講場景實現語音轉寫超過人類速記員水平;2019年起連續六年服務全國兩會;個性化語音合成首次應用于媒體平臺節目配音(《創新中國》),并得到廣泛應用。

    關鍵技術突破之二:多語種共享建模

    要在多語種技術方面取得突破,必須解決小語種智能語音系統構建所面臨的知識匱乏、訓練數據稀缺等難題。

    為此,科大訊飛設計了全新的多語種通用音素體系和基本語言單元,實現多語種統一音素韻律體系的構建,又通過基于元學習的多語種預訓練和基于語族分組的多語種共享建模。劉聰介紹說,通俗地說,就是將不同的小語種進行分類,找到同類語種的共同規律,進行分析建模和訓練。

    這一策略最終顯著提升了小語種語音系統性能。據介紹,相關技術在2021 年在國際低資源多語種語音識別競賽 OpenASR 中獲得15個語種受限賽道和7個語種非受限賽道的冠軍。2024年,科大訊飛將語音屬性解耦表征、多語種多任務共享建模等關鍵技術成果集成于星火語音大模型,首批37個主流語種的語音識別效果超過OpenAI Whisper V3。另外,在奇瑞、一汽等的交互評測中,科大訊飛的技術效果也優于國際車載語音技術競品賽倫思(原Nuance車載公司),在華為的評測中也領先谷歌。

    關鍵技術突破之三:語音語義聯合建模

    復雜應用場景下,語音交互、語音翻譯往往面臨著深層次語義理解困難、專業性不足等問題。

    科大訊飛提出了語音語義互增強的魯棒口語理解技術,有效提升語音交互、語音翻譯等復雜場景的語義理解準確率;提出了多源知識增強的可信文本生成技術,專有詞匯及領域知識引用的準確率得到提升。

    劉聰說,相關技術于2018年在業內首次達到CATTI考試英語二級《口譯實務(交替傳譯類)》合格標準;并在2021~2023 年連續三屆獲得國際權威機器口語翻譯評測比賽 IWSLT冠軍,覆蓋同傳、離線、方言翻譯等多類任務。

    該技術成果還在多個方面得到應用,例如:英語口語評測首次達到人類專家水平,成為可滿足高考應用要求的技術,累計服務超1.3億考生;智能客服系統規模應用,累積服務超8億人,多行業對話成功率超90%。

    關鍵技術突破之四:國產異構硬件平臺訓練及推理加速

    在驅動智能技術的“引擎”方面,目前使用國產芯片開展智能語音算法模型訓練和推理,面臨著性能低、適配難等問題。

    劉聰介紹,面對這一困境,科大訊飛提出硬件親和的變長輸入算子融合和聯合統一量化感知訓練技術,通過軟硬件協同優化的動態張量算子自動融合方法,實現對語音等變長輸入的訓練性能優化達到國際主流芯片水平;同時,通過多硬件聯合的量化計算模擬,模型單次訓練后可在不同硬件平臺上一鍵部署。

    2023年,科大訊飛與華為聯合攻關大模型國產化算力底座核心難題,建設了首個萬卡全國產算力平臺“飛星一號”,填補了國產超大模型訓練平臺空白。目前,已有5個國產化集群建成,支持語音合成、識別、翻譯、交互等技術能力日服務8.73億次。

    跨越“技術牛”到“產業牛”的鴻溝

    劉聰告訴記者,基于這些關鍵技術的持續攻關和突破,該項目獲批牽頭建設了4個國家級創新平臺:語音產業界唯一的國家級研究開放平臺語音及語言信息處理國家工程研究中心、智能語音國家新一代人工智能開放創新平臺、認知智能全國重點實驗室、國家技術標準創新基地;并主導編制11 項國際和國家標準,獲授權發明專利 257 項,近五年累計獲得國際權威評測冠軍20 余項。

    更難得的是,科大訊飛跨越了“技術牛”到“產業牛”的鴻溝,相關技術產品市場占有率居國內前列。例如,訊飛在業界率先推出雙屏翻譯機新品類;牽頭語音同傳行業標準,服務全球50余個國家超4億觀眾,每年翻譯服務達51.5億次,在北京冬奧會、進博會、博鰲論壇、國家安全、海關等重大活動和場景中獲廣泛應用。同時,相關技術還為“中國制造”破浪出海裝上AI助手,中國汽車出口十強企業,有8家和科大訊飛合作,產品覆蓋23個語種,出口60余個國家。

     

     


    相關文章

    國家數據局發布《數字中國發展報告(2025年)》

    2025年是“十四五”收官之年,也是“十五五”謀篇布局之年。黨中央、國務院高度重視數字中國建設,習近平總書記多次作出重要指示批示。國家數據局會同有關單位,系統總結2025年數字中國建設的最新成果和典型......

    《人工智能賦能科學研究:人工智能學科體系》正式出版

    近日,由中國科學院學部組織、會聚近300位跨學科院士專家共同研究撰寫的重要學術成果——《人工智能賦能科學研究:人工智能學科體系》正式出版發行。該書作為“范式變革:人工智能與科學研究”叢書的總報告,系統......

    五部門發文規范人工智能擬人化互動服務

    日前,國家網信辦、國家發展改革委、工業和信息化部等五部門聯合公布《人工智能擬人化互動服務管理暫行辦法》(以下簡稱《辦法》),自2026年7月15日起施行。《辦法》明確,擬人化互動服務提供者不得向未成年......

    中國16家科技社團聯合倡議共促全球人工智能治理

    為推動全球共同促進人工智能治理,中國科協所屬中國自動化學會、中國電子學會、中國計算機學會、中國人工智能學會等16家科技社團4月13日共同發布《全球人工智能治理科技社團倡議》,倡導以人為本、智能向善,推......

    如果被AI對齊,人類還能做些什么?

    談到對齊,你會想到什么?是一把尺子,丈量細微的偏差,還是一份共識,守護人類文明的底線?“在人工智能(AI)時代,文化創新需要對齊什么?又該向什么對齊?”3月22日,武夷山的九曲溪畔,在由中國人民大學、......

    美總統科技顧問團擠滿高科技億萬富豪,學者與女性代表嚴重不足

    3月25日,美國總統特朗普公布了總統科學與技術顧問委員會(PCAST)首批成員名單。與往屆不同的是,此次任命高度聚焦人工智能(AI)和量子計算領域,成員以科技巨頭、商界富豪與政治盟友為主,學術背景科學......

    “科創中國”河北行鋼鐵行業人工智能技術應用培訓成功舉辦

    3月17日,由中國檢驗檢測學會與廊坊市科學技術協會共同主辦、河北省算力產業研究院承辦的“鋼鐵行業人工智能技術應用培訓”在廊坊市京津冀大數據創新應用中心成功舉辦。作為“科創中國”河北行“提升河北智能檢驗......

    全國政協委員敖虎山:推動“數字醫生”與傳統醫療體系實現規模化深度融合

    全國政協委員、中國醫學科學院阜外醫院麻醉中心主任醫師敖虎山建議,加強頂層設計,系統化推動融合人工智能、大數據與醫療專業知識的“數字醫生”與傳統醫療體系實現規模化深度融合,將其作為破解當前醫療服務難題的......

    工業和信息化部啟動工業數據筑基行動

    工業和信息化部10日對外發布《關于啟動工業數據筑基行動開展面向人工智能賦能的高質量行業數據集建設先行先試的通知》,著力突破工業數據“采”“集”“用”瓶頸。通知提出,到2026年底,培育一批行業數據合作......

    推動AI人才高質量聚集

    近來,在全球人工智能競爭升級的背景下,我國在人工智能人才供給、政策動員與平臺化組織等方面取得令人矚目的階段性進展。一方面,我國人工智能人才規模與結構優勢初步確立。我國人工智能核心產業人才規模2024年......

  • <table id="4yyaw"><kbd id="4yyaw"></kbd></table>
  • <td id="4yyaw"></td>
  • 调性视频