保觀 |聚焦保險創(chuàng)新
進入公眾號,可點擊右上【···】設為星標哦
毫無疑問,大模型應用正在加速進入2.0階段。
(資料圖)
在1.0階段,ChatGPT以強大的語言交互能力完成了一次屬于AI的破圈,也讓大模型進入了大家的視野。
雖然C端用戶的熱情在逐漸冷靜下來,對長于技術應用開發(fā)的中國市場來說,大模型在各垂直領域的落地才剛剛開始,這顯然是一條更實用、商業(yè)模式更清晰的路線。大模型的2.0階段,重點就是要讓大模型在業(yè)務流程中真正發(fā)揮作用。
我們可以明顯感受到垂直領域大模型的“爆發(fā)”:亞馬遜推出了智能家居全新的Alexa語音助手,背后有大語言模型支持;百度發(fā)布了中國首個“產(chǎn)業(yè)級”醫(yī)療大模型“靈醫(yī)大模型”。
盤點目前已經(jīng)發(fā)布的大模型,金融、醫(yī)療健康是兩個非常重要、廣泛的應用賽道。
最近,醫(yī)療保險科技公司金仕達衛(wèi)寧推出了專門用于解答醫(yī)保和商業(yè)健康險領域專業(yè)知識、報銷、理賠相關政策的大語言模型——“知問”,希望為客戶打造一款醫(yī)保與商保領域專業(yè)的智慧顧問。
圍繞“知問”和大模型的相關話題,我們對金仕達衛(wèi)寧副總經(jīng)理、產(chǎn)品臨床中心兼創(chuàng)新業(yè)務中心負責人王尚前進行了專訪,一起聊了聊他們對大模型的理解和應用,希望能為行業(yè)提供一些基于實踐的參考經(jīng)驗。
深耕醫(yī)保與商保,“知問”讓信息問答化繁為簡
金仕達衛(wèi)寧成立于2012年,是醫(yī)療保險和商業(yè)健康險數(shù)字化風險控制解決方案與服務提供商,業(yè)務包括醫(yī)保基金監(jiān)管、醫(yī)保支付方式管理、醫(yī)保基金運行與審計管理、商業(yè)健康保險智能風控、醫(yī)療機構精細化管理等,致力于通過運用大數(shù)據(jù)、人工智能等技術,服務于醫(yī)保管理部門、商業(yè)保險公司及醫(yī)療機構,打造智能化的醫(yī)療保險、商業(yè)健康險風控新模式。
在醫(yī)保領域,金仕達衛(wèi)寧針對醫(yī)保管理推出多種一體化解決方案,包括醫(yī)保智能監(jiān)控解決方案、醫(yī)保基金運行與審計解決方案,以及宏觀決策大數(shù)據(jù)分析解決方案等。從2019年開始,金仕達衛(wèi)寧參與建設和運維了國家醫(yī)保局醫(yī)保信息平臺醫(yī)保智能監(jiān)管子系統(tǒng)、基金運行及審計監(jiān)管子系統(tǒng)、宏觀決策大數(shù)據(jù)分析應用子系統(tǒng)、運行監(jiān)測子系統(tǒng)、數(shù)據(jù)中臺,并為全國20多個省的醫(yī)保管理部門提供相關服務。
在商保領域,金仕達衛(wèi)寧則提供了健康險智能核保與風險防范、智能核賠與反欺詐、人群畫像與風險模型、惠民保、保險產(chǎn)品精算、營銷推廣、長護險照護管家等服務。
經(jīng)過十多年的發(fā)展,金仕達衛(wèi)寧在醫(yī)保和商保領域已經(jīng)有豐富的專業(yè)積累。
此次推出的“知問”專注于嚴肅、復雜的醫(yī)保和商保領域,是一款智能問答系統(tǒng)。關于為什么做“知問”大模型,王尚前告訴我們,首先是因為Transformer帶來了技術突破,使自然語言的應用有了更好的效果。他的團隊在使用ChatGPT時也發(fā)現(xiàn)了通用大模型的一個缺點,即在回答專業(yè)垂直領域問題的時候非常欠缺。因此,需要有垂直領域的大模型在通用大模型產(chǎn)品無法應對專業(yè)領域問題的時候,填補這一缺口。
金仕達衛(wèi)寧在服務客戶的過程中發(fā)現(xiàn),這幾年醫(yī)保政策變化比較多,藥品、耗材、醫(yī)療服務項目醫(yī)保報銷目錄和報銷比例更新很快,普通人要準確了解這些繁多瑣細的報銷細節(jié)和監(jiān)管要求,需要掌握大量相關知識。而商業(yè)健康險產(chǎn)品范圍廣,從住院手術、門診治療到重疾保障,每一項都有獨特的保障內(nèi)容、限額和免賠規(guī)定。普通人經(jīng)常會被眾多的保險產(chǎn)品、復雜晦澀的保險條款搞的暈頭轉向。
基于上述這些痛點,金仕達衛(wèi)寧在醫(yī)保領域有超過十年的經(jīng)驗,醫(yī)保知識庫規(guī)則庫積累了大量的醫(yī)藥學知識、醫(yī)保政策規(guī)范、醫(yī)保管理規(guī)范、法律法規(guī)、醫(yī)保信息業(yè)務編碼和監(jiān)管規(guī)則等,可以用于醫(yī)保垂直領域大模型的開發(fā)。
“知問”的主要功能是向醫(yī)保經(jīng)辦人員、醫(yī)療機構工作人員,以及商業(yè)健康保險購買者和保險代理人提供不受時間和空間限制的高質量、化繁為簡的信息咨詢和決策參考服務。
在醫(yī)保領域,“知問”可以回答一系列與醫(yī)保相關的問題,如醫(yī)保政策規(guī)定、異地報銷比例、醫(yī)保目錄中支付條件的限制、違規(guī)場景以及案例等,幫助用戶快速獲取最新、最準確的醫(yī)保信息。
在商保方面,“知問”能夠回答保單、理賠、保險條款等問題。王尚前介紹到,“知問”主要服務于惠民保,因為惠民保有很強的地區(qū)性差異,很多參保人也不了解惠民保的具體作用,惠民保的運營方很需要有工具可以輔助解釋參保人的問題。
醫(yī)保知識問題的測試集中,“知問”回答的準確率達到80%;面對復雜的商保條款,其回答準確率達到86%。對于95%的查詢,“知問”都能在3秒內(nèi)給出回答。涉及深度計算或復雜條款分析的問題,“知問”也能在5秒內(nèi)給出回答。
“知問”大模型能滿足不同機構和用戶的需求,可以植入任何前端場景,例如醫(yī)保局、醫(yī)院等機構的網(wǎng)頁、手機端的APP、公眾號、微信小程序等,可以在一個月內(nèi)部署上線應用。
垂直領域模型怎么做?抓住“三要素”
從技術角度來看,“知問”的專業(yè)表現(xiàn)主要基于三個要素:合適的基座模型、優(yōu)質的專業(yè)數(shù)據(jù)和先進的訓練方法。
王尚前介紹,“知問”選擇了一些開源大模型作為基座模型,例如Meta公司的LLAMA模型、百川、清華的ChatGLM等。這類模型有很多預制規(guī)則,能夠確保問題回答有更好的精確性,“知問”對這些基座模型選型應用,確保最適用于專業(yè)垂直領域。在訓練過程中,金仕達衛(wèi)寧也設置了很多醫(yī)保、商保領域的預制規(guī)則,以提高回答的效率和準確性。
在此基礎上,“知問”加入專業(yè)醫(yī)保和商保領域的數(shù)據(jù)進行訓練,如多年積累的醫(yī)藥學知識、全國各地的醫(yī)保政策規(guī)范、醫(yī)保管理規(guī)范、法律法規(guī)、醫(yī)保信息業(yè)務編碼和監(jiān)管規(guī)則等,做到能夠應對全國不同城市客戶的需求。在商保領域,與惠民保相關的知識比較簡單;相較而言,醫(yī)保的知識較為復雜,這不僅是由于醫(yī)保的專業(yè)性強,還因為各省、市的醫(yī)保政策差異較大。金仕達衛(wèi)寧積累的醫(yī)保相關知識顆粒度可以細化到地級市。
垂直領域的模型,金仕達衛(wèi)寧傾向于把模型做“小”,做專業(yè)化,針對客戶需求做個性化。即以自身的數(shù)據(jù)積累為基礎,再針對專門的監(jiān)管機構、各地區(qū)的醫(yī)保經(jīng)辦等人員,從需求出發(fā),利用他們提供的有針對性的、非公開的數(shù)據(jù)進行訓練,例如某一類別的醫(yī)保政策,既避免了硬件資源的過度消耗,同時更實現(xiàn)了其模型在這一領域的精細化和精準度,最終確保模型的效果。
大模型的開發(fā)都離不開大量優(yōu)質數(shù)據(jù)的支持,“知問”的數(shù)據(jù)主要來源于金仕達衛(wèi)寧在醫(yī)保和商保領域十幾年的積累,有豐富、權威且可靠的語料。這些長期業(yè)務中沉淀下來的數(shù)據(jù)經(jīng)過了實際驗證和用戶反饋,加之金仕達衛(wèi)寧參與了國家醫(yī)保局的醫(yī)保知識庫和規(guī)則庫建設,本身有較強的專業(yè)性、針對性,基本不需要額外投入大量成本進行標注。
為了保證語料的高質量,金仕達衛(wèi)寧對知識的獲取、驗證和維護過程進行了嚴格的把控,并采用先進的知識表示、編碼和維護技術,確保語料的權威性和可靠性。在業(yè)務中,金仕達衛(wèi)寧也在不斷進行專業(yè)數(shù)據(jù)的調(diào)整和更新,確保了全國范圍內(nèi)的統(tǒng)一性、通用性和標準性。
金仕達衛(wèi)寧在數(shù)據(jù)使用上采取了謹慎的策略,由于其服務領域的高度專注,只選擇與醫(yī)保和商保相關的信息來訓練模型。
接下來,金仕達衛(wèi)寧還準備進一步做一個政策知識庫,通過呈現(xiàn)結果加信源的方式,提供更精準的信息和更好的體驗。
為了提供更準確的回答,“知問”不僅依賴于豐富的知識資源,還采用了前沿先進的訓練技術和專業(yè)的業(yè)務場景對齊,這里的關鍵技術包括專業(yè)知識的預訓練、應用場景的任務指令訓練、全面精準的知識搜索、上下文學習、思維鏈推理等。
以任務指令訓練為例,這是一種讓模型在接收到特定指令后,能夠按照指令進行操作的訓練方式。這類訓練通過設置提綱,確保“知問”能夠理解同一問題的不同組織方式,既包含一般用戶的通俗問法,也包括從業(yè)人員的專業(yè)問法,從而提高在具體應用場景中的準確度,這也是目前“知問”模型的一大優(yōu)勢所在。
同時,“知問”非常注重法律合規(guī)和用戶數(shù)據(jù)安全,通過多種措施全力保證用戶數(shù)據(jù)的安全與隱私。
大模型的未來:垂直領域應用將大顯身手
通用大模型燃起了生成式AI的烈火,而得益于專業(yè)性、針對性以及為特定行業(yè)創(chuàng)造的價值,垂直領域已經(jīng)成為接下來大模型應用的新方向。
垂直大模型的一個主要優(yōu)勢在于增強特定領域應用的能力。通過利用特定領域的專業(yè)知識進行訓練,這些模型可以深入研究某一領域的復雜性,成為專業(yè)人士不可或缺的工具。例如,在醫(yī)療領域,大模型可以幫助診斷罕見疾病,提出個性化治療計劃,并及時了解最新研究和動態(tài)。
垂直大模型的另一個優(yōu)勢是具有定制和適應性的潛力。通過定制訓練數(shù)據(jù),并針對特定領域微調(diào)模型,可以最大程度上確保模型符合某個領域的獨特要求和術語,從而增強用戶體驗,確保更準確的輸出。此外,微調(diào)可以持續(xù)改進,并適應不斷變化的行業(yè)趨勢,變得更加有效和可靠。
但是,開發(fā)垂直模型也有一定的難度。王尚前告訴我們,金仕達衛(wèi)寧在開發(fā)“知問”模型的過程中,主要的難點在于基座模型的選擇和語料設計。
目前,開源基座模型眾多,如何選擇最適合醫(yī)保和商保垂直領域的模型,對每種模型效果的評估、具體的評估方法,都帶來了困難。另外,人員成本、機器配置也都帶來了額外困難,例如,比較眾多開源模型中選型耗費的代價非常大。
另一點就是語料設計,一問一答并不能達到預期的訓練效果,需要設計考題考綱、問題變種等模式。在這基礎上,在輸出環(huán)節(jié)再加入一些限制規(guī)則,才能確保模型的效果。
在功能方面,除了“知問”目前切入的專業(yè)知識問答領域,王尚前也指出,AIGC還可以提高數(shù)據(jù)統(tǒng)計的效率,而且金仕達衛(wèi)寧也會考慮在未來加入核保、核賠等風控應用,滿足客戶的需求。
整體而言,王尚前很看好大模型的發(fā)展。和過去的技術不同,大模型在業(yè)務流程中的應用使用戶可以通過自然語言與這些新工具交互,不需要再學習專業(yè)的技術語言,這也是新一波人工智能技術賦能效率提高的關鍵。而且,我們每天在產(chǎn)生大量數(shù)據(jù),有了這些要素的“打磨”,大模型的功能會更加強大。
關于大模型接下來的發(fā)展,未來的核心在于客戶需求的競爭,要足夠好用,獲得用戶端的認可。為了滿足客戶的需求,會出現(xiàn)越來越多的垂直領域大模型,當然,這些大模型的功能也會更加專業(yè)化、精細化。
大模型應用的關鍵之一在于對數(shù)據(jù)的掌握,垂直領域的專業(yè)大模型更是如此。在這一點上,保觀認為,從金仕達衛(wèi)寧的“知問”大模型可以看出,掌握數(shù)據(jù)積累的垂直領域參與者擁有更多機會。
雖然大模型要實現(xiàn)成熟、廣泛的應用,以及摸索出可持續(xù)的商業(yè)化模式還有待時日,但可以看到,通用大模型的發(fā)展解決了很多基本問題,很多企業(yè)也已經(jīng)行動了起來,在借助大模型降本增效的探索之路上持續(xù)進步。我們也會持續(xù)關注行業(yè)的最新動態(tài),挖掘更多優(yōu)秀經(jīng)驗,期待與大家有更多交流!
點擊“閱讀原文”,購買保觀最新行業(yè)報告
關鍵詞: