手机看片这里只有精品视频,在线欧美天码中文字幕,国产一级毛

中國移動“九天”通用基礎(chǔ)大模型 3.0 發(fā)布，核心技術(shù)開源

2025-07-28 09:53 IT之家

導(dǎo)讀：在2025 世界人工智能大會“AI 煥新產(chǎn)業(yè)共贏”企業(yè)人工智能產(chǎn)業(yè)發(fā)展論壇上，中國移動煥新發(fā)布“九天”基礎(chǔ)大模型 3.0。

　　7 月 26 日消息，在2025 世界人工智能大會“AI 煥新產(chǎn)業(yè)共贏”企業(yè)人工智能產(chǎn)業(yè)發(fā)展論壇上，中國移動煥新發(fā)布“九天”基礎(chǔ)大模型 3.0。

　　本次發(fā)布的“九天”基礎(chǔ)大模型 3.0 是國務(wù)院國資委戰(zhàn)新“百大工程”的新成果，進(jìn)一步強(qiáng)化了“高安全、高可控、全國產(chǎn)、全行業(yè)”四大特性，重點(diǎn)實(shí)現(xiàn)三大煥新：

　　一、九天眾擎語言大模型實(shí)現(xiàn)架構(gòu)與性能雙重躍遷。

　　模型突破性采用可擴(kuò)展至萬億級的 MoE 架構(gòu)，以 15T token 多階段配比預(yù)訓(xùn)練數(shù)據(jù)與全流程治理體系強(qiáng)化推理能力，創(chuàng)新構(gòu)建 113 域 ×53 能力的二維分級后訓(xùn)練框架，結(jié)合動態(tài)強(qiáng)化學(xué)習(xí)策略，驅(qū)動復(fù)雜推理能力提升 35%。

　　在 GPQA-Diamond 評測中，“九天”以 77.67 分?jǐn)孬@全球第二，超越 DeepSeekR1 和 Qwen3；在 ArenaHard V0.1 中，以 67.2 分位居全球第一；在 BFCL V3 評測中，達(dá)到 68 分。性能躍升的同時(shí)，模型進(jìn)一步強(qiáng)化了可控生成能力，破解沉浸式角色演繹，精確流程內(nèi)置等技術(shù)細(xì)節(jié)，實(shí)現(xiàn)了專業(yè)場景零幻覺。

　　基于最新的語言大模型，中國移動此次也推出多個(gè)專項(xiàng)模型。九天代碼大模型使用兩階段的持續(xù)訓(xùn)練技術(shù)，支持代碼生成、注釋生成、單元測試生成、代碼智能問答等多種任務(wù)，支持 Python、Java、JS、TS、Go、C++ 等 10 + 種主流編程語言。

　　指標(biāo)方面，在 EvalPlus、MHPP、LivecodeBenchv6 等多個(gè)代碼生成榜單上成績領(lǐng)先。九天數(shù)學(xué)大模型，短思考、長思考模式均達(dá)到業(yè)界 SOTA 水平，多項(xiàng)指標(biāo)超過 Qwen 2.5 Math、Qwen3、DeepSeek Math、DeepSeek R1-Distill 等同參數(shù)量級模型。

　　二、九天善智多模態(tài)大模型全面提升生成可控性與理解能力。

　　模型基于復(fù)雜時(shí)空建模、流匹配圖片視頻漸進(jìn)式聯(lián)合訓(xùn)練、端到端局部可控注意力機(jī)制等創(chuàng)新，同時(shí)引入多模態(tài)理解信息提升對文本指令和輸入條件圖像視頻的感知能力，聯(lián)合圖文交織數(shù)據(jù)訓(xùn)練，實(shí)現(xiàn)既能生成高質(zhì)量的圖像視頻，又能進(jìn)行多輪對話式高可控精確編輯操作，顯著提升了視覺生成的靈活便利性。

　　例如，在圖片生成功能方面可支持多輪精準(zhǔn)局部修改，如修改文字、修改背景、增加元素等。

　　模型在圖理解和視頻理解方面的性能表現(xiàn)也全面提升。

　　圖理解方面，在 MMStar、HallusionBench 和 OCRBench 等圖理解任務(wù)中，九天模型分別獲得了 82.2、64.3 和 94.9 的高分，處于業(yè)界領(lǐng)先水平；

　　視頻理解方面，九天模型在 Videomme 和 MVbench 兩個(gè)任務(wù)中均表現(xiàn)領(lǐng)先超過 Qwen2-VL 和 InternVideo2。

　　三、模型及核心技術(shù)開源。

　　一是開源九天數(shù)童結(jié)構(gòu)化數(shù)據(jù)大模型，開源內(nèi)容包括 JT-DA-8B 模型及后續(xù)演進(jìn)版本，支持下載模型權(quán)重、微調(diào)代碼、推理代碼等；

　　二是開源九天數(shù)學(xué)大模型，開源內(nèi)容包括 JT-Math-8B 系列模型，支持下載模型權(quán)重、推理代碼、技術(shù)報(bào)告；

　　三是開源九天代碼大模型，開源內(nèi)容包括 JT-Coder-8B 系列模型，支持下載模型權(quán)重、推理代碼、技術(shù)報(bào)告；

　　四是開源業(yè)界首創(chuàng)的結(jié)構(gòu)化數(shù)據(jù)模型評測數(shù)據(jù)及 TReB 評測體系，測評體系涵蓋 6 大任務(wù)、34 個(gè)能力，包括了高質(zhì)量且全面的數(shù)據(jù)、推理模式及評價(jià)指標(biāo)，支持下載評測數(shù)據(jù)集、測試代碼；

　　五是開源 CCR-Bench 行業(yè)場景復(fù)雜指令遵循評測數(shù)據(jù)集，該數(shù)據(jù)集涵蓋 174 條高質(zhì)量、多樣化、高難度復(fù)雜指令數(shù)據(jù)，高度模擬健康專家、智能客服、醫(yī)療助手等典型工業(yè)場景，支持下載數(shù)據(jù)集。

　　以上內(nèi)容已上線煥新社區(qū)、Github、HuggingFace、魔搭社區(qū)、Gitee、Arxiv。

　　從論壇獲悉，中國移動九天人工智能研究院計(jì)劃8 月推出此次發(fā)布內(nèi)容的技術(shù)深度解讀。

中國移動“九天”通用基礎(chǔ)大模型 3.0 發(fā)布，核心技術(shù)開源

相關(guān)閱讀

中國移動“九天”通用基礎(chǔ)大模型 3.0 發(fā)布，核心技術(shù)開源