編者按:一個人工智能(AI),在短短8天內獨立完成了668項實驗,合成了668種化合物,並成功研發出一種全新的化學催化劑。這一壯舉令人讚歎。
AI作為新一輪科技革命和產業變革的關鍵推動力,正在深刻改變醫療健康領域,當前AI和大數據模式正逐漸深入醫藥、臨床、新藥研發以及健康管理和幹預等多個領域。
基於此,21世紀新健康研究院推出了“AI醫療浪潮”專題係列報道,旨在從企業發展動態、監管等角度,探討“AI+醫療”產業的推進與落地挑戰,推動數字化賦能下的中國創新藥企實現高質量發展。
21世紀經濟報道記者 唐唯珂 廣州報道
DeepSeek的橫空出世繼續攪動醫療AI的發展。
節後複工以來,醫渡科技、、、鷹瞳科技,,等國內一流醫療公司都表示正在引入DeepSeek,準備將其應用於數據挖掘、智能供應鏈、精準醫療等多項領域。
2月10日,腦機接口概念股異動,直線拉升漲停,、、漲超5%,、、等跟漲。
華南某行業內科研人士向21世紀經濟報道記者表示,“我們可以直接利用DeepSeek強大的推理能力來完成我們原來想做做不到,或者原來基座大模型也能做支持,但是做不到它這麽專業的事情。我們接入DeepSeek的模型之後,從這幾天試用的情況來看,效果還是非常好的。”
憑借算法效率與低成本優勢,DeepSeek正推動大模型廠商進入“競合交織”的新階段。
在醫療應用端垂類賽道上,不少企業發現了這條長坡厚雪的賽道中蘊藏的巨大機遇,紛紛下場、積極布局。但優質數據的獲取和標準化仍然是相關企業在做細分賽道時正在努力攻克的難題。
相關業內人士告訴21世紀經濟報道記者:“對於醫療人工智能的具體應用具有一定的獨特性,隻有‘喂’了數據,再結合它算法的優勢,才能得到一個個性化的答案。‘喂’給它的源數據質量越高,那推理結果就越好。‘喂’的源數據質量差,那推理結果也就一般般,這是行業的特殊性,也就要求相關應用企業需要不斷突破數據難題。”
鷹瞳科技相關負責人也向21世紀經濟報道記者表示,隻有向模型輸入(即‘喂’)高質量的數據,並結合其算法的優勢,才能得到一個更加個性化的答案。輸入數據的源質量越高,推理的結果也就越優越。
基座模型洗牌
DeepSeek V3、GPT-4o等都屬於基座模型。它們是經過海量通用數據訓練的大規模預訓練模型,具備廣泛的語言理解、生成和推理能力,通用性很強,可泛化到多種任務中。但在醫療、法律、金融等專業場景中,基座模型往往顯得缺乏垂直領域的深度,無法符合專業場景中的高精度、高合規性需求。
對解決這一問題,細分應用領域通常會基於基座模型進行微調、優化,或結合領域數據重新訓練,二次開發成符合要求的垂類模型。如果說基座模型提供“廣度”,那垂類模型就是提供“深度”。
在實際的應用場景中,二者屬於是分層協作而非對立的關係。基座模型是“地基”,提供通用能力和知識儲備;垂類模型是“建築”,在基座上針對場景需求精細化構建。二者的結合既能避免重複訓練、降低開發成本,又能滿足專業化需求,是AI落地的核心路徑之一。
DeepSeek的驚豔亮相對於同樣做基座模型的廠商可以說是造成了不小的衝擊,如做混元大模型的騰訊、做盤古大模型的華為等。
金域醫學副總裁、數字化管理中心總經理李映華告訴21世紀經濟報道記者,對同行的挑戰主要來自於DeepSeek的三個特點:“第一,DeepSeek做了大量底層算法的優化,它可以不需要那麽強的算力,也能做出一個性能很強的模型出來。這將打破原有大算力的技術壁壘,引領新的技術範式。第一,DeepSeek做了底層結構的優化,它可以不需要那麽強的算力,也能做出一個很強功能的模型出來。”DeepSeek的推理模型R1在基座模型V3v3的基礎上,大規模使用了全自動的強化學習,取代了對過往需要大量人工反饋的監督微調和RLHF的依賴程度大幅降低。
前阿裏巴巴研究主管、現任以色列AI編碼初創公司Qodo聯合創始人兼CEO伊塔瑪ⷥ㏥Itamar Friedman)表示:“減少甚至跳過人類反饋是一個重大突破。這意味著你幾乎可以完全在無人工幹預的情況下訓練模型。”這能極大提升模型推理能力和效率。
“第二,Deepseek公司專注提升基礎模型能力,不去追求短期商業利益最大化,並采取了較為徹底的開源策略,可以預期將很快形成以DeepSeek基座模型為核心的新生態。第三,有了DeepSeek為代表的強推理模型的賦能,可實現垂類模型和行業智能體應用能力的整體升級,加快千行百業跨入智能時代。第二,Deepseek目前定位做基礎能力,不去做太多的垂類的應用,也不在短期裏麵去追求很大的商業目標,所有那些都是生態夥伴去做就行了。第三,它是一個開源開得最徹底的,我的基座模型該怎麽訓的,應用商怎麽落地成的垂類模型,做出一個更好的應用仍需要各個原有大模型的廠商和垂類應用不停完善。這也意味著對原來傳統的那些做大模型基層模型的商業模式形成挑戰。”李映華說。
據了解,選擇開源的基座模型作為“地基”,企業未來優化自己的垂直模型時,選擇的空間會更大。如果和閉源模型綁定,一旦這個閉源模型的進步速度跟不上整個行業的速度,企業的垂類模型發展也會受限。
盡管給友商造成了壓力,加劇了行業競爭,但這也不代表其他廠商失去了持續突破的空間。
許多企業的垂類模型也是開放式的架構,麵對市場上的眾多產品,這些垂類模型可以根據自己的需求“博采眾家之長”,把各方組合到一起,根據不同的場景去調用不同的模型。
李映華向21世紀經濟報道記者解釋,“以醫學檢驗來為例,我們把域見醫言企業大模型和小域醫智能體接入DeepSeek推理大模型,進一步優化原有Agent智能體技術體係框架,構成一體化程度更高、分析能力更強、任務分解更準的智能體服務。拿醫學來舉例子,可能這個模型在這個呼吸端口裏麵做得好,那個模型是這個血液病的一個專家團隊。我通過我的智能體的應用,去分解哪些任務到底交給哪個模型做是最合適的。”
“同時,針對複雜多變的醫療、醫檢場景,很多問題不是在單一模型就能解決的。不少先發廠商已經在醫療領域積攢了很多專業知識、語料、數據、模型能力等,那意味著,哪怕他們客戶的基座模型是以DeepSeek為主,他們的能力依然可以被集成。對於我們來說,無論是華為還是騰訊在醫檢行業的知識與能力,都可以有機集成到我們的垂類模型裏去,最終轉化為為終端用戶可感知的服務價值。我們是要在垂類模型上去構建一個智能體的應用。它所依賴的很多東西不是在單一模型就能解決的。所以比如說騰訊在哪方麵做得強的,華為在哪方麵做得強的,那對於我來說,你都可以繼承到我的垂類模型裏麵去。而有一些先發廠商已經在醫療領域積攢了很多自己特有的知識、語料、數據、能力等,那哪怕它們客戶的基座模型是以DeepSeek為主,但還是需要它們已經在專業領域構建的知識和能力。”李映華說。
核心資源仍是數據
由於大模型逐漸在AI世界占據主導,作為“燃料”,數據已經成了各方醫療AI競爭的關鍵,甚至有人稱其為醫療人工智能的“護城河”。
行業內人士告訴21世紀經濟報道記者:“醫療數據是各類數據中最難獲取的,但它又是醫療AI發展的核心資源。”受現有管理體製機製影響,不同監管部門之間的共享渠道也不暢通,大量有價值的健康數據無法有效利用。同時,國內數據的標準化程度較低,不同醫療機構之間的數據格式和結構各異,需要醫生群體不斷在前期做相應的前置投入診斷訓練。
這些因素導致醫療AI項目往往需要大量資金投入,且短期內難以看到明顯的經濟效益。許多企業和投資人在嚐試進入這一領域後,因無法承受高昂的成本和漫長的回報周期而選擇退出。“這也是過往大家說醫療AI燒錢又沒用的原因,很多投資人都沒有耐心去培育。”行業內人士說。
盡管麵臨諸多困難,但醫療AI在應用端廣闊的想象空間,依然吸引著國內外企業去積極競爭醫療數據資源。穀歌曾試圖以高價收購Cerner公司存儲的2.5億份健康記錄,但最終被亞馬遜截獲。對於穀歌而言,推動這項交易遠不止為了盈利,它更希望借此進一步收集、分析和匯總數百萬美國人的健康數據。
據悉,穀歌多次被曝在患者與醫生不知情的情況下訪問可識別個人身份的健康數據。穀歌等科技巨頭為了收集醫療數據的各種行為,也引發了各界對個人隱私的擔憂。
華為、騰訊、阿裏等國內巨頭也在積極通過多種途徑獲取醫療數據。如騰訊通過廣泛與華銀健康、、微醫等企業和機構合作,基於其數據資源,推動行業大模型落地,開發相關醫療AI產品。
值得注意的是,我國擁有龐大的醫療數據資源。國家衛健委發布的衛生年鑒顯示,2023年,全國衛生機構總診療人次達到96億人,由此產生的醫療數據預計早已超過百億條。業界認為,如此龐大的數據儲備規模,已經堪稱是國家重要的基礎性戰略資源了。這也意味著,國內的醫療AI企業有著充足的、可供“喂養”大模型的數據“養料”。
憑借著豐厚的數據資源和高效的模型訓練,我國企業在醫療AI的領域也具備和國際巨頭同台競技的能力。
醫療AI可以說是一條“長坡厚雪”的賽道,雖然路途遙遠且充滿挑戰,但一旦未來突破瓶頸,應用端成功落地和推廣後,相關企業很可能取得巨大回報,全球醫療健康水平更是有望邁上新台階。想要實現這些美好的願望,數據的不斷深化采集和處理是重中之重。
(實習生孫偉對本文亦有貢獻)
高盛下調中國2011年和2012年GDP預期 [阅读]
千億資金潛伏樓市 外資豪賭商業地產 [阅读]
中國需要轉基因嗎 [阅读]
審計調查顯示46個項目違規占地8256畝 [阅读]
3月非製造業PMI為60.2% 非製造業經營趨於活躍 [阅读]
中國能源自給率提高至92% 消費總量未超美國 [阅读]
一季度逆差無礙擴大進口戰略 [阅读]
5月CPI或繼續高企 超調擔憂難改緊縮預期 [阅读]