“華為盤古大模型不作詩,只做事。”7月7日,華為開發(fā)者大會2023(Cloud)上,華為常務(wù)董事、華為云CEO張平安在主題發(fā)言環(huán)節(jié)如是說道。
(資料圖片)
圖源:直播視頻截圖
他提到,今年全球已發(fā)布數(shù)百個大模型,中國發(fā)布超80個大模型,這些大模型的共性是基本都會“對話作詩”,而華為大模型要深入到各行各業(yè),幫助其創(chuàng)造價值。
當日,華為盤古大模型3.0正式對外發(fā)布,這是一個面向行業(yè)的大模型系列。“盤古為行業(yè)而生,就要為行業(yè)著想,”張平安表示,如今,盤古大模型已在氣象、金融、制造、醫(yī)藥研發(fā)等諸多行業(yè)發(fā)揮巨大價值。
重塑千行百業(yè)
“去年年底,ChatGPT的出現(xiàn)把人工智能推到了一個新風口,當前,通用人工智能已經(jīng)成為人類社會最熱門的話題。”7月6日,華為輪值董事長胡厚崑在2023世界人工智能大會的主題演講中表示,并透露華為將在7月7日的華為云開發(fā)者大會上推出盤古大模型3.0。
次日,華為對外發(fā)布盤古大模型3.0,這是一個面向行業(yè)的大模型系列,包括“5+N+X”三層架構(gòu):
L0層包括自然語言、視覺、多模態(tài)、預(yù)測、科學計算五個基礎(chǔ)大模型,提供滿足行業(yè)場景中的多種技能需求。
圖源:企業(yè)供圖
L1層是N個行業(yè)大模型,華為云既可以提供使用行業(yè)公開數(shù)據(jù)訓練的行業(yè)通用大模型,包括政務(wù)、金融、制造、礦山、氣象等大模型;也可以基于行業(yè)客戶的自有數(shù)據(jù),在盤古大模型的L0和L1層上訓練自己的專有大模型。
L2層為客戶提供更多細化場景的模型,更加專注于政務(wù)熱線、網(wǎng)點助手、先導(dǎo)藥物篩選、傳送帶異物檢測、臺風路徑預(yù)測等具體行業(yè)應(yīng)用或特定業(yè)務(wù)場景。
比如,在氣象領(lǐng)域,盤古氣象大模型是首個精度超過傳統(tǒng)數(shù)值預(yù)報方法的AI預(yù)測模型,同時預(yù)測速度也有大幅提升。原來預(yù)測一個臺風未來10天的路徑,需要在3000臺服務(wù)器的高性能計算機集群上花費5小時進行仿真。現(xiàn)在基于預(yù)訓練的盤古氣象大模型,通過AI推理的方式,研究者只需單臺服務(wù)器上單卡配置,10秒內(nèi)就可以獲得更精確的預(yù)測結(jié)果。
在金融領(lǐng)域,盤古金融大模型可以通過銀行的各種操作、政策、案例文檔進行預(yù)訓練,根據(jù)客戶的問題,為柜臺工作人員自動生成流程和操作指導(dǎo),將原來需要平均5次的操作降低為1次,辦結(jié)時間縮短5分鐘以上。
對于制造領(lǐng)域,過去單產(chǎn)線制定器件分配計劃,往往要花費3個小時以上才能做齊1天的生產(chǎn)計劃。盤古制造大模型學習華為產(chǎn)線上各種器件數(shù)據(jù)、業(yè)務(wù)流程及規(guī)則以后,對業(yè)務(wù)需求進行準確的意圖理解,并調(diào)用天籌AI求解器插件,1分鐘即可做出未來3天的生產(chǎn)計劃。
至于藥物研發(fā)領(lǐng)域,張平安在現(xiàn)場舉了一個例子,原來一款新藥研發(fā)平均需要10年時間、花費10億美金。盤古藥物分子大模型助力西安交通大學第一附屬醫(yī)院劉冰教授團隊發(fā)現(xiàn)全球40年來首個新靶點、新類別的抗生素,并將先導(dǎo)藥物研發(fā)周期縮短至1個月、研發(fā)成本降低70%。
張平安在華為開發(fā)者大會2023(Cloud)媒體溝通環(huán)節(jié)表示,“華為在AI大模型領(lǐng)域投入非常大,而在商業(yè)化落地方面也為客戶提供了多樣化的服務(wù)模式,但現(xiàn)在談AI大模型收益還為時過早。”
人工智能開啟新黃金10年
2021年4月,盤古大模型正式對外發(fā)布。盤古大模型發(fā)布以來,已經(jīng)發(fā)展出L0、L1、L2三大階段的成熟體系持續(xù)進化。
去年9月,華為輪值董事長胡厚崑在世界人工智能大會上表示,華為云盤古預(yù)訓練大模型已完成從學術(shù)大模型到產(chǎn)業(yè)大模型的轉(zhuǎn)變,形成“基礎(chǔ)大模型-行業(yè)大模型-細分場景大模型”的發(fā)展路徑,并在醫(yī)療、互聯(lián)網(wǎng)、金融、煤礦、農(nóng)業(yè)、氣象等領(lǐng)域中實現(xiàn)降本增效。
今年,胡厚崑則在世界人工智能大會上提出,人工智能的發(fā)展,關(guān)鍵要走深向?qū)崱@這個目標,華為表示,一方面要打造強有力的算力底座。另一方面,從通用大模型到行業(yè)大模型,真正讓人工智能使能行業(yè),助力科研。
算力是訓練大模型的基礎(chǔ)。在本次華為開發(fā)者大會2023(Cloud)上,張平安宣布單集群2000P Flops算力的昇騰AI云服務(wù)在華為云的烏蘭察布和貴安AI算力中心同時上線。昇騰AI云服務(wù)除了支持華為全場景AI框架昇思MindSpore外,還支持Pytorch、Tensorflow等主流AI框架。
圖源:時代周報記者攝
同時,這些框架中90%的算子,都可以通過華為端到端的遷移工具平滑遷移到昇騰平臺。例如,美圖僅用30天就將70個模型遷移到了昇騰,同時華為云和美圖團隊一起進行了30多個算子的優(yōu)化以及流程的并行加速,AI性能較原有方案提升了30%。
根據(jù)胡厚崑透露,目前華為云生態(tài)已孵化20多個基礎(chǔ)的大模型,同時還適配了10多個業(yè)界主流的大模型。另外,華為云盤古大模型已經(jīng)深入金融、制造、政務(wù)、電力、煤礦、醫(yī)療、鐵路等10多個行業(yè),支撐400多個業(yè)務(wù)場景的AI應(yīng)用落地。
據(jù)悉,盤古大模型采用完全的分層解耦設(shè)計,可以快速適配、快速滿足行業(yè)的多變需求。客戶既可以為自己的大模型加載獨立的數(shù)據(jù)集,也可以單獨升級基礎(chǔ)模型,還可以單獨升級能力集。
在L0和L1大模型的基礎(chǔ)上,華為云為客戶提供了大模型行業(yè)開發(fā)套件,通過對客戶自有數(shù)據(jù)的二次訓練,客戶可以擁有自己的專屬行業(yè)大模型。
不過,在華為開發(fā)者大會2023(Cloud)媒體溝通環(huán)節(jié),華為相關(guān)負責人表示,華為云盤古大模型全棧技術(shù)均由華為自主創(chuàng)新的,沒有采用任何開源技術(shù),且華為云盤古大模型定位于賦能千行百業(yè),這里面必將聚集無數(shù)行業(yè)大數(shù)據(jù)(涉及行業(yè)機密等),因此未來盤古大模型不會開源 。
“我們非常有幸共同見證了科技革命的幾次浪潮,從互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng),再到云計算,到人工智能,每一輪的變革都給社會帶來了深遠的影響。毫無疑問,站在今天,通用人工智能正給我們無窮的想象空間,也正帶領(lǐng)我們走進下一個黃金的10年。”胡厚崑說道。
(責任編輯:王治強 HF013)關(guān)鍵詞: