近日,由 GAIR 研究院、雷峰網(wǎng)、世界科技出版社、科特勒咨詢集團(tuán)聯(lián)合主辦的第七屆 GAIR 全球人工智能與機(jī)器人大會(huì),在新加坡烏節(jié)大酒店拉開帷幕。
此次大會(huì)是在大模型技術(shù)爆炸時(shí)代,國內(nèi)首個(gè)出海的 AI 頂級(jí)論壇,也是中國人工智能影響力的一次跨境溢出。本屆大會(huì)共開設(shè) 10 個(gè)主題論壇,聚焦大模型時(shí)代下的 AIGC、Infra、生命科學(xué)、教育、SaaS、web3.0、跨境電商等熱門領(lǐng)域的變革創(chuàng)新。
(資料圖片)
其中,“大模型時(shí)代超級(jí)基建”的主題引發(fā)業(yè)內(nèi)的激烈討論。過去數(shù)年間,AI 領(lǐng)域應(yīng)用落地曾一度乏善可陳。但在剛剛過去的幾個(gè)月,ChatGPT 引爆了大模型的浪潮。盡管如此,當(dāng)前的大語言模型的訓(xùn)練然面臨諸多挑戰(zhàn)。“大模型時(shí)代的超級(jí)基建”旨在與行業(yè)頭部公司共同探討 AI 底層基礎(chǔ)設(shè)施相關(guān)話題。Zilliz 創(chuàng)始人兼 CEO 星爵在“大模型時(shí)代超級(jí)基建”環(huán)節(jié)進(jìn)行了主題演講,并參與圓桌論壇的討論。
星爵指出,過去十年,受限于研發(fā)成本和開發(fā)難度,全球僅有 1% 的開發(fā)者專注于 AI 領(lǐng)域的研發(fā)工作。但如今,有了大模型和向量數(shù)據(jù)庫作為能力基座,一個(gè) AI 應(yīng)用的開發(fā)僅僅需要兩三個(gè)工程師一個(gè)周末的時(shí)間便可完成。正可謂“忽如一夜春風(fēng)來,千樹萬樹梨花開。”
此外,星爵還強(qiáng)調(diào)了向量數(shù)據(jù)庫之于大模型的重要性。他認(rèn)為,向量數(shù)據(jù)庫承擔(dān)著大模型數(shù)據(jù)片外存儲(chǔ)的重任,不管是圖片、視頻語言還是生物學(xué)中蛋白質(zhì)的三維結(jié)構(gòu),都可以用向量的方式表征它的語義。
針對(duì)數(shù)據(jù)實(shí)時(shí)性和私域?qū)S袛?shù)據(jù)的問題,星爵表示,學(xué)術(shù)界和工業(yè)界存在兩種解決方案,一是通過Fine tuning的方式迭代演進(jìn),讓大模型學(xué)到更多知識(shí);二是通過 Vector search方法,把最新的或私域知識(shí)存到向量數(shù)據(jù)庫中,需要時(shí)再在向量數(shù)據(jù)庫中做基于語義的向量檢索。上述兩種方法都能為大模型提供更加精準(zhǔn)的答案。
不過,星爵也坦言,從成本角度出發(fā),向量數(shù)據(jù)庫的成本是 Fine tuning的1/ 1000。所以大模型廠商都無一例外地推薦開發(fā)者使用向量檢索的方式做知識(shí)庫管理,以便和模型有一個(gè)更好交互,降低落地使用成本的同時(shí),提升在業(yè)務(wù)中的實(shí)際效果。
在演講過后的圓桌論壇環(huán)節(jié),星爵與云啟資本合伙人陳昱、潞晨科技創(chuàng)始人尤洋、UCloud 季昕華共同討論了當(dāng)下備受關(guān)注的熱門話題,包括大模型基礎(chǔ)設(shè)施建設(shè)面臨的挑戰(zhàn)、如何降低大模型訓(xùn)練成本等。
在被問及大模型基礎(chǔ)設(shè)施建設(shè)面臨的挑戰(zhàn)時(shí),星爵強(qiáng)調(diào)了數(shù)據(jù)方面的問題。他表示,世界上有 80% 以上的數(shù)據(jù)都是非結(jié)構(gòu)化的數(shù)據(jù)。過去十多年,非結(jié)構(gòu)化數(shù)據(jù)的管理能力主要由谷歌、微軟等大公司掌握。星爵表示,新 AI 時(shí)代對(duì)數(shù)據(jù)管理的要求也會(huì)變得更大,如何更好地做好數(shù)據(jù)基建,對(duì)各行業(yè)各公司而言都是不小的挑戰(zhàn)。
針對(duì)業(yè)內(nèi)非常關(guān)心的成本問題,星爵表示,就降低成本而言,從向量數(shù)據(jù)庫角度來看,主要包括三方面:第一,要有更好的算法;第二,要更聰明地利用個(gè)體存儲(chǔ);第三,要比以往有更強(qiáng)的有效利用硬件的能力。
(免責(zé)聲明:此文內(nèi)容為廣告,相關(guān)素材由廣告主提供,廣告主對(duì)本廣告內(nèi)容的真實(shí)性負(fù)責(zé)。本網(wǎng)發(fā)布目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),請(qǐng)自行核實(shí)相關(guān)內(nèi)容。廣告內(nèi)容僅供讀者參考。)
(責(zé)任編輯:周文凱 )關(guān)鍵詞: