金磊 發自 宇宙中心
量子位 報道 | 公眾號 QbitAI
一家AI研究院的“打開方式”,是這樣的;
支持學者發表國際頂會頂刊論文
8個月打造當時全球最大的超大規模智能模型“悟道”
年年都有圖靈獎得主前來參會
匯聚AI一流學者94人,人才團隊近260人
……
或許你會說,這就是一個研究院該有的樣子。
但如果我說它僅僅成立了3年呢?
而且就拿打造大模型這事來說,放眼國內外,它還是全球唯一不是背靠大廠的那種非營利性機構。
不僅如此,與它同臺競技的,還都是“世界級選手”——DeepMind、OpenAI等等。
即便是在這種高手林立的大模型賽道上,這家研究院還做到了實力上的碾壓,更是引發了國內外科研圈、媒體的關注。
至此,圍繞這家如此年輕卻又“戰績斐然”的研究院,便產生了不少的疑問:
它是誰?
又是怎么做到的?
一家成立剛滿3年的研究機構
這家研究機構,名叫北京智源人工智能研究院(簡稱智源研究院)。
或許它現在的名氣倒是不小,但講真,若是放到三年前提起這個名字,很多人都是不知道的。
關于智源研究院的成立,其實是由一場2018年的會議開始。
參會專家橫跨產業、高校以及研究機構,原微軟亞太研發集團首席技術官張宏江博士、原國家自然科學基金委員會主任楊衛院士、清華大學藥學院魯白教授等出席并發表了重要意見。
北京在人工智能方面已積累了人才、科研、產業方面的優勢地位,和世界領先水平基本同步。但如何在“跟得很好、用得很好”的基礎上,做出更多突破性研究,拿出更多引領國際潮流的創新貢獻?
專家們聚在一起要商討的核心問題便是:
如何在人工智能基礎設施建設、科研組織模式、數據開放、場景開放、人才培養、國際合作等方面,推動北京人工智能創新工作的發展。
在經過長達數小時的激烈討論,他們提出以下的六項建議:
建設“北京智源”等人工智能軟硬件計算平臺
建立“產學研用”聯合創新的人工智能基礎研究模式
積極推動政府數據和企業數據開放共享
開放人工智能應用場景和加大基礎保障
加大人才培養、引進和完善保障措施
加大國際交流力度
而要實現上述的目標,就需要一個“載體”來統籌規劃。
于是,北京人工智能領域的新型研發機構——北京智源人工智能研究院應運而生。
但也正如一般創業公司那般,智源研究在成立之初可以說是舉步維艱:一間辦公室、幾個人,就這樣開始了新一段人工智能的征程。
但在智源研究院成立之初,雖說艱難,但它還是立下了這樣一個flag:
支撐北京在2028年率先成為國際領先的人工智能創新中心。
為此,一個名叫“頂天”和“立地”的科研布局圖,就此誕生。
研究布局主要分為了“學術自由探索”和“目標導向的重大科研任務”兩大方向。
結合科研布局的名稱來看,可以推測出,就是不僅要在最前沿技術上做研究,還要讓研究能夠真真切切的用起來。
而要完成這些個目標,人才,成為了首要解決的問題。
為此,智源研究院在2019年4月便推出了“智源學者計劃”。
三年時間來,已遴選智源學者近百人,其中38歲以下的青年科學家就有40位。
主要涉及的研究方向包括人工智能的數理基礎、人工智能的認知神經基礎、機器學習、自然語言處理、智能信息檢索與挖掘、智能系統架構與芯片等。
“智囊團”組建完畢,智源研究院鎖定了三大人工智能的可行路徑——“信息、生命和物理”,前后分別研發了超大規模模型。
例如在信息方面,智源研究院發布了連創中國首個、世界最大紀錄的悟道大模型。
?
“悟道”模型的參數規模達到1.75萬億,是GPT-3的10倍,打破了之前由Google Switch Transformer預訓練模型創造的1.6萬億參數記錄。
同時,它還是首個在100%國產超算上訓練的萬億模型,“悟道2.0”系列模型在國際公認benchmark取得9項精準記錄,達到世界先進智能水平。
不僅僅是在參數量,更是在模型架構方面取得了突破,智源研究院提出的GLM2.0,首次打破BERT和GPT壁壘,以單一模型同時實現自然語言理解與生成任務。
在腦模擬與類腦智能研究方向上,智源研究院啟動了“天演”生命智能模型建設,通過逐步搭建世界運行效率最高、模擬級別最精細的生物神經網絡仿真軟硬件系統,構建生命智能模型并挖掘生物智能機制機理,推動信息科學從計算范式到仿腦范式的跨越。
除了重大科研任務外,智源研究院學術探索中也是成績斐然。
三年來,自由探索和目標導向相結合的體制機制展現出勃勃生機,實現科研成果的量質并重,智源研究院發表或支持發表國際AI頂會頂刊論文1470余篇,其中,被AAAI、CVPR、ACL、ICLR、NIPS、SIGIR、TPAMI等國際頂級會議期刊收錄論文約1060篇,占比逾七成,形成多個國際首創、首發重大成果。
同時,智源研究院重視重大科研任務的“沿途下蛋”,截至2021年10月,其已經申請中國專利78件,獲得發明專利授權44件,登記軟件著作權24項。
而學術生態,是智源研究院“狠抓”的另外一個重要方向。
通過建設智源社區、青源會等線上線下相結合的社區組織,每年舉辦一屆北京智源大會,邀請全球人工智能領域頂尖專家,共同探討人工智能前沿研究進展及產業發展熱點。
……
而上述的這些,還只是智源研究院所取得成績的一隅,更多相關內容可以點擊這里查看。
但放在三年的時間線上來看,它的效率和質量著實有些快得驚人。
那么接下來的一個問題便是:
為何“智源模式”能有這樣的速度?
印象中的智源研究院,似乎從成立之初開始,便每年都會發布讓業界矚目的科研成果,其規模也是朝著不斷壯大的趨勢在發展。
那么智源研究院,與其它的科研機構到底又有怎樣的區別?為什么能做到如此的“快準狠”?
就在剛剛,它在“宇宙中心”五道口的智源大廈新址,舉辦了三周歲的“生日宴”。
而在這場活動中,與之相關的諸多謎底都得到了解釋。
還是以悟道大模型為例,它的速度可以說是非常之快:
從立項到發布,只花了8個月時間。
而后的2次更新迭代,也各花費了3個月時間。
這種智源速度背后,一個非常重要的因素就是眾智。
換言之,就是通過智源的“號召力”,把產學研各界的力量集中到了一起。
在短短時間內,智源便把來自10個不同機構近120人“聚”到了一起,匯聚資金、數據與算力。
而目標非常的明確且清晰,就是集中力量辦大事——把這個大模型給搞出來。
而這種眾智的背后,體現的正是智源研究院的獨有模式——智源模式:
自由探索和目標導向。
自由探索,是指智源研究院能夠賦予科學家最大的技術路線決定權和經費使用權。
換言之,就是只要在智源搞項目,那就大膽干、放心干,沒有其他后顧之憂。
而剛才提到的“集中力量辦大事”,便是目標導向的核心含義,即同時快速組建跨機構、大協作、高強度的科研團隊,快速推進。
或許你會產生疑問:
智源研究院做的事情,為什么聽著像是做一個“大雜燴”的事情?
但實則并不是如此,智源研究院所做的事情不是“N+1”,也就是在眾多已有研究院的情況再來一個。
更符合實際的情況,應當是“1+X”,是將所有原有的研究優勢匯聚成一個協同的聯合體,為下一代人工智能的發展做一套新體系。
這是“智源模式”科研組織模式的展現,之于在人才發展模式上,智源研究院所支持的模式,便是“青年人才挑大梁當主角”。
大方向、大問題會由頂尖科學家來制定,而后由智源研究院的院務會快速做決策,有甚者五分鐘就能拍板決定。
項目在啟動之后,便是由真正的主角——青年學者來領銜了,在項目進行的過程中也是非常靈活,可以隨時進行“微調”,而且不會有任何“門戶之分”。
而這也正是智源研究院能夠吸引眾多年輕科研工作者的原因,畢竟誰又會拒絕一個自由且有權利的科研環境呢?
正如在智源研究院工作的一位算法工程師就曾這樣描述:
智源是包容更開放的,不強調單一文化,就像一座動物園。可以包容任何一種性格的人,在這里找到自己感到舒服的姿勢,做出貢獻。
而且在智源研究院所做的成果,并不是一時的,而是要創造經得起時間檢驗的代表作,屬于智源,更是屬于年輕人自己的那種。
張宏江在“生日宴”現場還立下了這樣一個flag:
智源研究院,永遠要做最年輕的研究院。
最后一個重要的區別,便是智源研究院是開源、開放的。
智源研究院從注冊開始,其單位性質便是完全中立的非營利性機構,而且還會堅持非營利的這種狀態。
截至目前,大部分智源研究院所取得的科研成果,包括大模型等,均已全面向產學研各界開放使用。
正如張宏江所表述:
未來,大模型就像一個世紀前的發電廠一樣,它會形成類似于電網一樣的基礎設施,在推動各行業智能化升級上發揮重要作用,具有非常廣泛的應用前景。
智源的大模型更像是Linux,而像紅帽所做的商業性工作,就交給其它大模型來吧。
而在我們來看,智源研究院所要做的事情,是要把自己也打造成一個“大模型”。
這種“大模型”是要匯聚中國的人口數據等紅利、中國的人工智能頂尖人才、中國的最前沿技術。
而后智源要形成并找到一種最佳的“算法”——科研系統。
……
早在智源研究院成立之初便提出過一個觀點:
世界AI看北京。
而站在三年后的現在來看,智源已然用創新的科研方式成功讓AI探索走進“北京時間”。
但現在它目光所及,應當是要從北京走向全國乃至世界。
至于“智源模式”在接下來的過程中是否還是依舊正確,依舊具備創新性和價值性,就需要時代的發展來給出正解了。
本文首發于微信公眾號:量子位。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。