天士力數智中醫藥大模型文章入選高引用研究
發布: 2026-02-09 13:25:56 作者: 佚名 來源: 天士力
近日,天士力數智中醫藥團隊發表在國際權威期刊《美國醫學信息學協會雜志》的論文《Lingdan: enhancing encoding of traditional Chinese medicine knowledge for clinical reasoning tasks with large language models》,成為該刊近期被引用次數最多的文章之一,標志著中醫智能化研究已獲國際學術界廣泛關注與認可。

在全球大語言模型如ChatGPT等技術迅速發展的背景下,中醫古籍《黃帝內經》《本草綱目》等凝聚的千年智慧,卻因文言文表述、獨特理論體系與復雜語法,對現代AI構成了顯著挑戰。如何讓前沿AI真正理解并運用中醫知識,成為關鍵研究問題。
為此,數智中醫藥團隊聯合北京交通大學醫學智能研究所的周雪忠教授團隊深度合作,共同研發打造真正懂中醫、會辨證、能開方的大型語言模型——靈丹(Lingdan),實現了在中醫臨床推理任務上的重要突破。
01、數據工程:構建中醫知識新體系
研究團隊構建了三大核心數據集,為AI學習中醫奠定基礎:
中醫預訓練數據集(TCMPT):包含1.6億個詞元,涵蓋古籍、教材、病歷、藥典、藥品說明書等多源知識;
中成藥問答數據集(TCPM Dialogue):通過“知識問答化”技術生成20萬組高質量對話,涵蓋主治,配伍等關鍵信息;
脾胃病處方推薦數據集(SSHPR):基于廣安門醫院的臨床診療數據,包含3.9萬條結構化醫案,專注中醫處方智能推薦。
團隊還創新性地提出了中醫交互式診斷對話框架(TCM-IDDF),基于思維鏈技術模擬真實診療流程。
02、三大模型:實現中醫AI的
“理、法、方、藥”全棧能力
基于高質量數據集,團隊研發了覆蓋不同場景的中醫AI模型系列:
靈丹預訓練模型(Lingdan Pre-trained):在通用大模型基礎上注入中醫知識,構建底層理解能力;
靈丹中成藥對話模型(Lingdan-TCPM-Chat):支持多輪辨證與中成藥推薦;
靈丹處方推薦模型(Lingdan-PR):針對中醫處方推薦任場景優化的專業模型。
測試顯示,處方推薦模型在Top@20 F1分數上比最佳基線模型提升18.39%,展現出優秀泛化能力。研究還發現,通過隨機調整處方藥味順序進行數據增強,可顯著提升模型魯棒性、減少“AI幻覺”,體現了中醫“方有合群之妙用”的配伍智慧。
03、高引用背后:創新與實用的雙重突破
本論文獲得高頻引用,主要源于以下幾方面突破:
數據層面:與現有中醫AI數據集相比,靈丹數據集在數量和質量上均超越以往模型。
方法創新:研究團隊提出了知識語言化和知識問答化等新方法,提升了中醫知識的結構化表達與推理能力。
臨床實用性:模型可直接從病歷推薦處方,降低應用門檻,更貼近實際場景。
跨領域價值:為其他專業領域的大語言模型應用提供了可參考框架。
04、數智本草:賦能中醫藥垂直領域
目前,數智中醫藥團隊已經開發了“計算+ 語言”雙模型的數智本草大模型,為中醫藥的智能化發展提供系統性解決方案。通過智能問答、交互計算、文檔生成和智能應用四種模式,為用戶提供從重要機制解析到中醫藥復方及組分創新開發的全方位研發輔助。并涵蓋了數智中藥研發、中醫智能診療和中藥智能服務等多個場景。
作為“數智本草”大模型體系中的開源版本,靈丹大模型不僅奠定了該系列堅實的技術基礎,更以開放協同的生態架構,助力中醫藥領域共創智能未來。
05、展望未來:開啟中醫智能化的新篇章
目前,團隊正在積極推進靈丹2.0版的研發工作,致力于在模型規模、推理能力與臨床適配性上實現進一步突破。
未來,天士力數智中醫藥團隊將繼續圍繞推進模型多模態化、病種全覆蓋、臨床系統驗證等方向深化研究,推動構建“理、法、方、藥”一體化的智能輔助診療系統,真正成為中醫傳承與創新的數字化伙伴。
上一篇:下一篇: 天津市數據局專班赴天士力數智調研 共繪...
今日新聞頭條
我也說兩句
已有評論 0 條 查看全部回復










