應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

摩爾線程開源音頻理解大模型 MooER:基于國產(chǎn)全功能 GPU 訓(xùn)練和推理

2024-08-24 09:21 IT之家
關(guān)鍵詞:摩爾線程大模型MooER

導(dǎo)讀:摩爾線程開源了音頻理解大模型 —MooER(摩耳),是業(yè)界首個基于國產(chǎn)全功能 GPU 進行訓(xùn)練和推理的大型開源語音模型。

  8 月 23 日消息,

  基于摩爾線程夸娥(KUAE)智算平臺,MooER 大模型用 38 小時完成了 5000 小時音頻數(shù)據(jù)和偽標(biāo)簽的訓(xùn)練。

  MooER 不僅支持中文和英文的語音識別,還具備中譯英的語音翻譯能力。在 Covost2 中譯英測試集中,MooER-5K 取得了 25.2 的 BLEU 分?jǐn)?shù),接近工業(yè)級效果。

  摩爾線程 AI 團隊在該工作中開源了推理代碼和 5000 小時數(shù)據(jù)訓(xùn)練的模型,并計劃進一步開源訓(xùn)練代碼和基于 8 萬小時數(shù)據(jù)訓(xùn)練的模型。

  MooER 的模型結(jié)構(gòu)包括 Encoder、Adapter 和 Decoder(Large Language Model,LLM)三個部分,具體的模型參數(shù)規(guī)模如下: