技術(shù)
導(dǎo)讀:中國石油與中國移動(dòng)、華為、科大訊飛聯(lián)手打造的 700 億參數(shù)昆侖大模型,展示了 43 個(gè)專業(yè)應(yīng)用和通用應(yīng)用創(chuàng)新場景。
據(jù)中國石油報(bào),11 月 28 日,以“AI 領(lǐng)航?智繪能源”為主題的700 億參數(shù)昆侖大模型建設(shè)成果發(fā)布會(huì)在京舉辦。發(fā)布會(huì)上,中國石油介紹了與中國移動(dòng)、華為、科大訊飛聯(lián)手打造的 700 億參數(shù)昆侖大模型,展示了 43 個(gè)專業(yè)應(yīng)用和通用應(yīng)用創(chuàng)新場景。
在行業(yè)大模型方面,昆侖大模型語言大模型參數(shù)從 330 億升級(jí)到 700 億,自然語言處理、語音視覺識(shí)別、多模態(tài)交互、科學(xué)計(jì)算等專業(yè)能力大幅提升;視覺大模型訓(xùn)練數(shù)據(jù)進(jìn)一步豐富,新增的巖石識(shí)別功能有效提升了地質(zhì)研究智能化水平;新訓(xùn)練的 160 億參數(shù)多模態(tài)大模型為“人?車?生活”等營銷與服務(wù)業(yè)務(wù)提供了豐富的文、圖、音多模態(tài)交互能力。
在專業(yè)大模型方面,其構(gòu)建了我國首個(gè)勘探全領(lǐng)域?qū)I(yè)大模型,涵蓋地震處理、地震解釋、測(cè)井處理解釋 3 個(gè)專業(yè)大模型,相比傳統(tǒng)方法,在泛化性、精度等方面都有了大幅提升。
在場景大模型方面,按需構(gòu)建了 21 個(gè)場景大模型,每個(gè)場景大模型支持一類應(yīng)用場景的多種應(yīng)用。同時(shí),昆侖大模型建立了場景數(shù)據(jù)集回流機(jī)制,定期將場景語料匯聚到專業(yè)、行業(yè)數(shù)據(jù)集,逐步提高專業(yè)、行業(yè)大模型能力,減少場景大模型數(shù)量。
此外,中國石油還構(gòu)建了超過 280TB 的高質(zhì)量數(shù)據(jù)集,研發(fā)了集團(tuán)公司集中統(tǒng)一 AI 中臺(tái),算力、模型、應(yīng)用的統(tǒng)一管理和協(xié)同調(diào)度能力有效加強(qiáng)。
據(jù)悉,昆侖大模型是中國能源化工行業(yè)首個(gè)通過備案的大模型,于今年 5 月正式啟動(dòng)建設(shè),3 個(gè)月后參數(shù)量級(jí)達(dá)到 330 億。