讓數(shù)據(jù)進(jìn)去,讓智慧出來。
采訪 | 王德清
編輯 | 劉景豐
隨著數(shù)字經(jīng)濟(jì)時(shí)代來臨,計(jì)算力的重要性將越來越明顯。
近日,以“智算·新際”為主題的人工智能計(jì)算大會(huì)(AICC)在北京開幕,會(huì)上IDC和浪潮信息(000977,股吧)聯(lián)合研究并發(fā)布《2021-2022中國人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》(下稱《報(bào)告》),從AI算力產(chǎn)業(yè)發(fā)展趨勢(shì)、市場(chǎng)規(guī)模、區(qū)域算力分布和行業(yè)AI算力保有程度等多個(gè)角度,對(duì)中國人工智能發(fā)展做出綜合評(píng)估,為推動(dòng)智能經(jīng)濟(jì)發(fā)展提供極具價(jià)值的參考依據(jù)和行動(dòng)建議。
此前由IDC和浪潮信息聯(lián)合研究發(fā)布的《2020全球計(jì)算力指數(shù)評(píng)估報(bào)告》就顯示,2015-2019年,計(jì)算力指數(shù)平均每提高1個(gè)點(diǎn),國家的數(shù)字經(jīng)濟(jì)和GDP將分別增長3.3‰和1.8‰。這意味著,未來計(jì)算力將成為拉動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展的重要力量。
浪潮信息副總裁、浪潮信息AI&HPC產(chǎn)品線總經(jīng)理劉軍接受「甲子光年」采訪時(shí)表示,算力中心之于數(shù)字經(jīng)濟(jì),就像工業(yè)時(shí)代的電廠,智慧時(shí)代的算力中心承載算力的生產(chǎn)、調(diào)度和供應(yīng)的過程,為數(shù)據(jù)的加工、處理、挖掘、分析提供源源不斷的動(dòng)力源(600405,股吧),“讓數(shù)據(jù)進(jìn)去,讓智慧出來。”
數(shù)字經(jīng)濟(jì)不斷發(fā)展,先行者的經(jīng)驗(yàn)讓現(xiàn)在大多數(shù)企業(yè)清晰地認(rèn)識(shí)到,數(shù)據(jù)只存起來是不行的,更要用起來,并挖掘出其存在的價(jià)值。
1.智能計(jì)算中心成數(shù)字經(jīng)濟(jì)重要抓手
數(shù)據(jù)是數(shù)字經(jīng)濟(jì)的石油,是企業(yè)產(chǎn)出有效洞察的基礎(chǔ),可幫助企業(yè)實(shí)現(xiàn)流程和決策優(yōu)化。數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)的發(fā)展越來越依賴于數(shù)據(jù)所產(chǎn)生的價(jià)值。
賽迪顧問數(shù)據(jù)顯示,到2030年數(shù)據(jù)原生產(chǎn)業(yè)規(guī)模將占整體經(jīng)濟(jì)總量的15%,中國數(shù)據(jù)總量將超過4YB(1YB=1024^5GB),占全球數(shù)據(jù)量的30%。這意味著,屆時(shí)數(shù)據(jù)資源已成為關(guān)鍵生產(chǎn)要素,更多的產(chǎn)業(yè)通過物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)、電商等結(jié)構(gòu)或非結(jié)構(gòu)化數(shù)據(jù)資源來提取有價(jià)值信息。
這些有價(jià)值信息的采集、傳輸、處理、存儲(chǔ)、管理和利用等,均有賴于數(shù)字化基礎(chǔ)設(shè)施的完備。
而海量數(shù)據(jù)(603138,股吧)的處理與分析,意味著需要龐大的算力支撐。
此次發(fā)布的《中國人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》指出,目前算力已成為數(shù)字時(shí)代的核心生產(chǎn)力,是拉動(dòng)數(shù)字經(jīng)濟(jì)向前發(fā)展的新動(dòng)能。
此前2020年,國家發(fā)改委明確新型基礎(chǔ)設(shè)施范圍,表示以數(shù)據(jù)中心、智能計(jì)算中心為代表的算力基礎(chǔ)設(shè)施是新基建的重要信息基礎(chǔ)設(shè)施,進(jìn)一步為算力公共基礎(chǔ)設(shè)施的建設(shè)指明道路。此后,各個(gè)地方開始不斷布局智能計(jì)算中心。數(shù)據(jù)顯示,2018~2020三年的AI算力城市排名中,北京、杭州、深圳三強(qiáng)格局初定,重慶、合肥、南京、蘇州、西安等新一線城市在人工智能新賽道中表現(xiàn)搶眼。
而在最新的2021年中國人工智能城市排行榜中,TOP5城市依次為北京,杭州,深圳,南京,上海,排名6-10的城市為蘇州,廣州,濟(jì)南,成都,合肥。其中,南京首次進(jìn)入前五名,濟(jì)南首次進(jìn)入前十,位居第8位。
值得注意的是,各地競(jìng)相布局的智能計(jì)算中心并不是傳統(tǒng)數(shù)據(jù)中心和計(jì)算中心的簡單升級(jí),而是構(gòu)建未來智慧社會(huì)和智能經(jīng)濟(jì)的關(guān)鍵性公共算力基礎(chǔ)設(shè)施。通過“普適普惠”的智能計(jì)算資源多元服務(wù),智能計(jì)算中心能夠有效地推動(dòng)各地方開展數(shù)據(jù)共享平臺(tái)、智能生態(tài)建設(shè)以及智創(chuàng)產(chǎn)業(yè)聚集,是以智能技術(shù)和智慧產(chǎn)業(yè)為基礎(chǔ)的數(shù)字經(jīng)濟(jì)的發(fā)展起點(diǎn)。
我國加速發(fā)展的智能產(chǎn)業(yè),正不斷推動(dòng)各地產(chǎn)業(yè)升級(jí),使各地在人工智能開發(fā)和智能產(chǎn)業(yè)推廣上邁向更高的臺(tái)階。通過對(duì)不同地區(qū)人工智能發(fā)展程度和應(yīng)用層面的覆蓋程度來看,我國對(duì)人工智能領(lǐng)域的研究仍保持著高度的投入,在應(yīng)用層面的拓展也保持著持續(xù)上升的趨勢(shì)。
2.“核聚變”效應(yīng) 數(shù)據(jù)價(jià)值亟待進(jìn)一步釋放
與傳統(tǒng)經(jīng)濟(jì)不同,數(shù)字經(jīng)濟(jì)對(duì)于產(chǎn)業(yè)具有“核聚變”效應(yīng)。這個(gè)效應(yīng)主要體現(xiàn)在產(chǎn)業(yè)創(chuàng)新效應(yīng)、產(chǎn)業(yè)融合效應(yīng)與產(chǎn)業(yè)關(guān)聯(lián)效應(yīng)這三個(gè)方面,三者通過相互間的耦合反應(yīng),促進(jìn)產(chǎn)業(yè)的結(jié)構(gòu)調(diào)整和轉(zhuǎn)型升級(jí)。
AI算力正是將“核聚變”效應(yīng)充分釋放的最重要推手。但就像一個(gè)硬幣的兩面,智能計(jì)算在快速前行和應(yīng)用的同時(shí),阻礙其進(jìn)一步發(fā)展的挑戰(zhàn)也開始顯現(xiàn)。
人工智能計(jì)算場(chǎng)景復(fù)雜多樣,訓(xùn)練模型參數(shù)巨大,調(diào)用數(shù)據(jù)資源更是海量,但產(chǎn)業(yè)鏈卻存在著上下游供需脫節(jié)、硅芯片逼近物理和經(jīng)濟(jì)成本極限導(dǎo)致摩爾定律逼近失效等不足。這帶來了指數(shù)級(jí)增長的算力需求的同時(shí),也使計(jì)算產(chǎn)業(yè)面臨多元化、巨量化、生態(tài)化三大挑戰(zhàn)。
多元化表現(xiàn)在,隨著AI應(yīng)用的場(chǎng)景不斷豐富,計(jì)算場(chǎng)景愈加復(fù)雜,對(duì)計(jì)算芯片指令集、架構(gòu)的要求更加細(xì)分,帶來多元AI計(jì)算芯片的高速發(fā)展。同時(shí),種類繁多的計(jì)算芯片,進(jìn)一步加大了計(jì)算的復(fù)雜性。
多元化的芯片發(fā)展,為產(chǎn)業(yè)AI化的加速提供了重要的產(chǎn)業(yè)基礎(chǔ)和更加多元化的選擇。但是,芯片從造出來到大規(guī)模用起來,往往還隔著一個(gè)巨大的產(chǎn)業(yè)鴻溝。一方面,算力的供給需要構(gòu)建算力平臺(tái),需要解決架構(gòu)設(shè)計(jì)、核心部件、高速互聯(lián)、散熱設(shè)計(jì)等一系列工程問題;另一方面,面對(duì)大規(guī)模AI算力部署,AI算力平臺(tái)建設(shè)又面臨高功耗、高電流密度、高總線速率、高系統(tǒng)復(fù)雜度的新問題。集約高效、開放共享的智算系統(tǒng),是讓多元算力能夠走向產(chǎn)業(yè),讓大家用得上、用得好、用得起,實(shí)現(xiàn)算力普適普惠的關(guān)鍵。
巨量化,則表現(xiàn)在模型參數(shù)多、訓(xùn)練數(shù)據(jù)量大等方面。例如在自然語言處理方面,基于自監(jiān)督學(xué)習(xí)的預(yù)訓(xùn)練模型興起后,模型精度隨著模型尺寸及訓(xùn)練數(shù)據(jù)的增加顯著提升。比如2020年GPT-3模型的參數(shù)量首次突破了千億大關(guān),達(dá)到了1750億。
就在前不久,浪潮人工智能研究院發(fā)布了全球最大規(guī)模的中文AI巨量模型“源1.0”。公開的數(shù)據(jù)顯示,“源1.0”參數(shù)量高達(dá)2457億,訓(xùn)練采用的中文數(shù)據(jù)集達(dá)5000GB,相比GPT-3的1750億參數(shù)集、570GB訓(xùn)練數(shù)據(jù),參數(shù)集規(guī)模提升了40%,訓(xùn)練數(shù)據(jù)規(guī)模提升近10倍。
在算力效率方面,源1.0大模型用4095PD(PetaFlop/s-day)的計(jì)算量,獲得高達(dá)2457億的參數(shù)量,計(jì)算效率處于業(yè)界領(lǐng)先水平。
“源1.0”聚合了AI最強(qiáng)算力平臺(tái)、最優(yōu)質(zhì)的算法模型開發(fā)能力。這一能力使得其具備支撐和加速行業(yè)智能的構(gòu)建,讓各個(gè)行業(yè)具備可感知、自學(xué)習(xí)、可進(jìn)化的能力,最終幫助用戶完成業(yè)務(wù)智能轉(zhuǎn)型升級(jí),以具備通用性的智能巨量模型成就行業(yè)AI大腦。
模型參數(shù)增加的背后,是計(jì)算力需求的指數(shù)級(jí)增長。例如深度學(xué)習(xí)從2011年興起到今天,對(duì)于算力的需求一直是指數(shù)級(jí)增長,每隔三四個(gè)月算力需求翻一倍。
此外,模型應(yīng)用規(guī)模也在變大。隨著AI的應(yīng)用滲透到各個(gè)行業(yè),并已經(jīng)有了大量的AI開發(fā)平臺(tái),吸引了超百萬的AI開發(fā)者,開發(fā)了各種AI應(yīng)用和服務(wù),這些AI開放平臺(tái)每天承載著數(shù)萬億次的調(diào)用量,巨量的調(diào)用對(duì)計(jì)算中心的算力、應(yīng)用產(chǎn)生了極大的挑戰(zhàn)。
第三大挑戰(zhàn)是AI生態(tài)問題。一方面,對(duì)從事AI技術(shù)研發(fā)的科研院所和科技公司而言,其研發(fā)成果如何與應(yīng)用場(chǎng)景緊密結(jié)合是一道難題。而對(duì)于傳統(tǒng)產(chǎn)業(yè)的企業(yè)而言,由于缺乏專業(yè)的AI人才,在應(yīng)用AI技術(shù)時(shí)也沒有能力自主開發(fā)算法模型。
埃森哲調(diào)查報(bào)告顯示,70%以上的研究機(jī)構(gòu)、科技公司在技術(shù)落地時(shí)缺需求場(chǎng)景、行業(yè)知識(shí)和數(shù)據(jù),70%以上的行業(yè)用戶缺技術(shù)人才、缺AI平臺(tái)和實(shí)踐能力。此外,在AI開發(fā)中由于各芯片廠商采用了不同的技術(shù)路線,導(dǎo)致芯片架構(gòu)五花八門,相互無法兼容,且編程庫與芯片綁定,帶來靈活性不足的問題。再者AI開放框架雖多,但兼容性差;再加上AI平臺(tái)之間服務(wù)接口標(biāo)準(zhǔn)不一,使得目前的AI產(chǎn)業(yè)不得不面臨生態(tài)離散的挑戰(zhàn)。
接下來,誰能全面、系統(tǒng)性地解決這些問題,誰就有可能成為智慧計(jì)算時(shí)代的弄潮兒。
3.計(jì)算系統(tǒng)多元?jiǎng)?chuàng)新,打造開放智算生態(tài)
多樣化的智能場(chǎng)景需要多元化的算力,巨量化的模型、數(shù)據(jù)和應(yīng)用規(guī)模需要巨量的算力,算力已經(jīng)成為人工智能繼續(xù)發(fā)展的重中之重。但是從芯片到算力的轉(zhuǎn)化依然存在巨大鴻溝,多元算力價(jià)值并未得到充分釋放。因此,如何快速完成芯片到計(jì)算系統(tǒng)的創(chuàng)新,已經(jīng)成為推動(dòng)整個(gè)人工智能產(chǎn)業(yè)發(fā)展的關(guān)鍵環(huán)節(jié)。
面對(duì)多元化的挑戰(zhàn),一方面計(jì)算軟件將基于應(yīng)用需求的拆解,對(duì)硬件能力進(jìn)行適配管理,軟件定義的范圍和影響力將繼續(xù)拓展,不僅可實(shí)現(xiàn)面向應(yīng)用的整體系統(tǒng)資源調(diào)度和管理,還需針對(duì)網(wǎng)絡(luò)、存儲(chǔ)等個(gè)性化需求實(shí)現(xiàn)軟硬解耦和資源靈活配置。另一方面計(jì)算硬件將通過與算法和框架等深度融合的專用定制,實(shí)現(xiàn)對(duì)特定應(yīng)用需求的支持,最終完成異構(gòu)之下AI算力的生產(chǎn)、聚合、調(diào)度和釋放,實(shí)現(xiàn)智能計(jì)算中心的理想目標(biāo)。
以浪潮信息發(fā)布的新版AIStation人工智能開發(fā)服務(wù)平臺(tái)為例,其已經(jīng)實(shí)現(xiàn)了對(duì)英偉達(dá)、寒武紀(jì)、昆侖芯、高通等6家國際及國內(nèi)廠商的12款A(yù)I和GPU芯片的多元算力支持。AIStation基于虛擬化、容器化技術(shù)簡化算力調(diào)度過程,能夠?qū)⒂?jì)算資源以標(biāo)準(zhǔn)算力模式提供給用戶。同時(shí)提供一致的配額管理、共享超分、負(fù)載均衡等策略,幫助AI企業(yè)實(shí)現(xiàn)多元算力的統(tǒng)一池化及精細(xì)化調(diào)度,進(jìn)一步提高AI計(jì)算資源利用率,降低運(yùn)維成本,加速AI技術(shù)場(chǎng)景落地。
除此之外,為應(yīng)對(duì)產(chǎn)業(yè)AI化的挑戰(zhàn)、加速產(chǎn)業(yè)AI化的發(fā)展進(jìn)程,早在2019年,浪潮就發(fā)布了“元腦生態(tài)”計(jì)劃,聚焦產(chǎn)業(yè)AI化的落地應(yīng)用需求,持續(xù)投入面向AI時(shí)代的計(jì)算力輸出、服務(wù)能力優(yōu)化及人才培養(yǎng);促進(jìn)生態(tài)伙伴的優(yōu)勢(shì)互補(bǔ)、強(qiáng)強(qiáng)聯(lián)合,共同成就行業(yè)最終用戶。
在IPF2021,浪潮再次發(fā)布了針對(duì)智算產(chǎn)業(yè)的“元腦生態(tài)2.0”、提出“智算合伙人”的生態(tài)主張。
元腦生態(tài)2.0的發(fā)布,就是為了更好應(yīng)對(duì)當(dāng)前行業(yè)智慧轉(zhuǎn)型,伙伴所面臨的技術(shù)、商業(yè)和生態(tài)等多重挑戰(zhàn)。元腦生態(tài)2.0將是一個(gè)更加開放、包容的生態(tài),不僅包括之前技術(shù)側(cè)的芯片、算法等左手伙伴和應(yīng)用側(cè)的ISV、SI等右手伙伴,也將納入分銷、IVR、咨詢、運(yùn)維等更加多元的功能型伙伴,從智慧轉(zhuǎn)型的全生命周期著手,實(shí)現(xiàn)全鏈條的交付與服務(wù)。
就在AICC 2021上,浪潮人工智能研究院正式發(fā)布“源1.0”開源開放計(jì)劃,這一全球最大中文巨量模型將以開放API、開放數(shù)據(jù)集、開源代碼等多種形式為業(yè)界提供開放合作。
其開放計(jì)劃首先面向三類群體,一是高校或科研機(jī)構(gòu)的人工智能研究團(tuán)隊(duì),二是元腦生態(tài)合作伙伴,三是智能計(jì)算中心。面向第一類群體,“源1.0”將主要支撐在語言智能前沿領(lǐng)域的算法創(chuàng)新和方向探索;面向第二類群體,“源1.0”將主要支撐元腦生態(tài)伙伴開發(fā)行業(yè)示范性應(yīng)用,如智能文本服務(wù)、語言翻譯服務(wù)、內(nèi)容生產(chǎn)服務(wù)等等,探索語言智能產(chǎn)業(yè)落地的“殺手級(jí)應(yīng)用”;面向第三類群體,“源1.0”將作為算法基礎(chǔ)設(shè)施,與智能計(jì)算中心算力基礎(chǔ)設(shè)施高效協(xié)同,支撐AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化發(fā)展。
可以說,在事關(guān)智算產(chǎn)業(yè)發(fā)展最為重要的生態(tài)建設(shè)中,浪潮已經(jīng)走到了前列。
4.拐點(diǎn)已至,我國企業(yè)正引領(lǐng)AI產(chǎn)業(yè)發(fā)展
2020年,我國提出加快構(gòu)建“以國內(nèi)大循環(huán)為主體、國內(nèi)國際雙循環(huán)相互促進(jìn)”的發(fā)展格局。進(jìn)入“十四五”開局年,數(shù)字經(jīng)濟(jì)成為經(jīng)濟(jì)發(fā)展破局的重要抓手,而在數(shù)字經(jīng)濟(jì)發(fā)展中,產(chǎn)業(yè)AI化則至關(guān)重要。
不難發(fā)現(xiàn)的是,面對(duì)產(chǎn)業(yè)AI化的發(fā)展困境,以浪潮信息為代表的我國企業(yè)正在積極貢獻(xiàn)力量。
作為智算中心的提出者,浪潮信息的AI服務(wù)器市占率已位居全球第一,連續(xù)4年中國市場(chǎng)占比超過50%。
隨著“源1.0”模型的開源,也讓我們發(fā)現(xiàn),浪潮一直活躍在AI前沿方向,在深度學(xué)習(xí)框架領(lǐng)域,浪潮信息先后推出了深度學(xué)習(xí)并行計(jì)算框架Caffe-MPI、全球首個(gè)FPGA高效AI計(jì)算開源框架TF2等等。2020年,浪潮信息在人工智能領(lǐng)域的專利貢獻(xiàn)達(dá)到1174件,位居中國前列。
而順著產(chǎn)業(yè)AI化的邏輯,浪潮信息正將作為算力基礎(chǔ)設(shè)施的智能計(jì)算中心與作為算法基礎(chǔ)設(shè)施的巨量模型進(jìn)行協(xié)同,為產(chǎn)業(yè)AI提供強(qiáng)大的推動(dòng)力,為行業(yè)客戶創(chuàng)造更多的價(jià)值,更在引領(lǐng)AI產(chǎn)業(yè)的深度發(fā)展。
本文首發(fā)于微信公眾號(hào):甲子光年。文章內(nèi)容屬作者個(gè)人觀點(diǎn),不代表和訊網(wǎng)立場(chǎng)。投資者據(jù)此操作,風(fēng)險(xiǎn)請(qǐng)自擔(dān)。