在近日舉辦的“2023數據科學峰會”上,百分點科技董事長兼CEO蘇萌談到數據科學的發展。他表示,回顧過去50年的發展,數據科學經歷過 “小數據時代”(數據科學1.0),走進了“大數據時代”(數據科學2.0),再從大數據時代走向了現在的“AI時代”(數據科學3.0),未來將邁向“數據原生時代”。
蘇萌認為,大數據時代市場對于數據科學的需求,主要在單點的產品和單一場景上,比較典型的應用場景包括個性化推薦。
事實上,在百分點科技成立之初,第一個研究方向是做推薦引擎技術工程化的實現以及商業的落地。2009年12月31日凌晨,百分點推薦引擎1.0版本上線。
在此后短短幾年的時間,百分點科技通過個性化推薦引擎服務了中國超過2000家的電商和媒體客戶。2014年以后,百分點科技開始為更多傳統企業提供服務,相繼服務了媒體、金融、零售、制造、地產等領域的眾多企業,幫助他們解決運營效率的問題。
2017年,數字化轉型需求從企業端擴展到了政府端,百分點科技也正式開啟了To G業務,將之前在互聯網和企業服務中沉淀的數據科學產品與技術應用于政務領域。過去六年時間里,面向數字城市、公安、應急、生態環境、營商環境和統計等領域,構建智慧城市數字底座和場景智能應用,助力政府治理能力提升和治理體系現代化。
也是在這一年,百分點科技第一個國際業務項目落地,開啟了新一代信息技術科技企業出海的新篇章。到目前為止,百分點用數據科學技術與產品服務了全球20多個國家。
蘇萌表示,當下市場需求不再是斷點式技術和工具,而是端到端的數據科學解決方案,在長鏈條里實現數據價值。這也是百分點推出數據科學基礎平臺DeepMatrix的意義。
展望數據科學未來的進展,蘇萌表示:“數據科學在將來會進入數據原生的時代,這個時代數字技術的大融合將產生疊加態。在這個階段,我們的數據模態更豐富、質量更高、時效性更強,算法會更先進、算力會更強大。在這個階段數據已經變成像土地一樣的生產要素,在其上會成長出一個數字的世界,也會成長出很多應用,而且這應用有可能不依賴于現實世界。”
對于數據科學的未來挑戰和發展趨勢,蘇萌認為:
一是,AI生成數據會帶來很多困擾。隨著ChatGPT應用的不斷普及,產生了有別于人類真實活動的數據。比如,人們用ChatGPT生成的論文、文學作品等,這些生成式AI數據是否會再次進入到下一輪的訓練語料之中,如何評估這些數據的質量,如何實現它們的數據價值,這些都是需要重新考量的。
二是,領域知識的賦能。各個領域的科學和知識本身就是一個數據體,以數據的形式存在并且不斷更新。未來數據科學將與領域知識進行更加深度的合,領域知識的自動抽取、構建和服務將成為主流,GPT終將從無所不知的寫手走向知識淵博的領域高精尖專家。這也為數據科學的行業化細分帶來無限商機。
三是,數據科學平民化。數據科學的通用工具的一體化和平臺化,領域知識的計算機程序化和服務化,以及交互方式的自然化,這三件事情會導致未來業務和決策人員可以跨過程序員直接與數據進行交互,提高分析和決策效率,這將是革命性的變化。許多重復性工作將被智能技術替代,人們將從數據密集型、計算密集型、事務密集型的工作中被釋放出來,專注于創造性高、藝術性高、價值密集型工作,追求自我實現。
四是,重塑生產關系和商業秩序。生產關系是由生產力決定的,數據科學技術在不斷的迭代升級,它也會作為重要的生產力來推動商業模式和企業組織的變革。未來,全球80億人和無數的物聯網設備連接到網絡并成為數據源,不斷產生關于他們的活動、認知和智慧的大量數據。數據將變成普惠的生產要素,每個人都能通過數據的生產和使用獲益,形成更加平等的生產關系,最終形成更加和諧的社會關系。
蘇萌強調:“信息技術創造了數字世界,數字技術又在推動數字經濟的不斷發展,數字經濟又推動了人類和組織社會的變革,而且變革又進一步為創新提供了土壤,讓我們不斷地在往前走。”