再次拔高上限!夸克健康大模型通過12門主任醫(yī)師考試觀點

觀察君 2025-07-23 13:00
分享到:
導(dǎo)讀

7月23日消息,夸克健康大模型成功通過中國 12 門核心學(xué)科的主任醫(yī)師筆試評測,成為國內(nèi)首個完成這一挑戰(zhàn)的大模型。目前,“主任級 AI 醫(yī)生”能力已全面集成至夸克的AI搜索中,用戶在查詢健康問題時,選擇深度搜索即可調(diào)用。

7月23日消息,夸克健康大模型成功通過中國 12 門核心學(xué)科的主任醫(yī)師筆試評測,成為國內(nèi)首個完成這一挑戰(zhàn)的大模型。目前,“主任級 AI 醫(yī)生”能力已全面集成至夸克的AI搜索中,用戶在查詢健康問題時,選擇深度搜索即可調(diào)用。

這是繼 5 月通過副主任醫(yī)師職稱考試后,夸克健康大模型能力的又一次躍升。在垂類模型與通用模型對比中,夸克健康大模型呈現(xiàn)出難度越高、領(lǐng)先優(yōu)勢越明顯的性能曲線,展現(xiàn)出在復(fù)雜醫(yī)學(xué)推理任務(wù)中的突破。

這揭示了在醫(yī)學(xué)領(lǐng)域研發(fā)垂類模型的巨大潛力。夸克健康大模型以通義千問為基礎(chǔ),走出了一條面向垂直場景的深度工程化路線。“我們不是在訓(xùn)練AI回答醫(yī)學(xué)問題,而是在訓(xùn)練它學(xué)會醫(yī)學(xué)思維”,夸克健康算法負(fù)責(zé)人徐健說。 

夸克健康大模型的核心突破之一,是構(gòu)建出“慢思考能力”。該能力融合了鏈?zhǔn)酵评砼c多階段臨床演繹路徑建模,驅(qū)動模型在面對復(fù)雜醫(yī)療問題時,能夠分階段、層層深入地推導(dǎo)出最終回答。

構(gòu)建慢思考能力的前提,是擁有高質(zhì)量推理訓(xùn)練數(shù)據(jù)。為此,夸克構(gòu)建了“雙數(shù)據(jù)產(chǎn)線 + 雙獎勵機(jī)制”的工程體系。一方面,將醫(yī)學(xué)數(shù)據(jù)劃分為“可驗證”和“不可驗證”兩類,分別對應(yīng)診斷類任務(wù)和健康建議類任務(wù);另一方面,在訓(xùn)練方法上引入“過程獎勵模型”和“結(jié)果獎勵模型”,分別評估模型推理鏈的合理性與最終結(jié)論的準(zhǔn)確性,顯著提升模型的臨床可解釋性和推理一致性。

該體系還設(shè)計了多階段強(qiáng)化學(xué)習(xí)流程,包括冷啟動數(shù)據(jù)的嚴(yán)格人工校驗、多輪樣本篩選與難度遞進(jìn)訓(xùn)練策略,以及用于防止“高分投機(jī)”的作弊識別機(jī)制。通過真實醫(yī)生標(biāo)注、“問—思—答”整組數(shù)據(jù)驅(qū)動強(qiáng)化學(xué)習(xí),夸克健康大模型不僅學(xué)會了醫(yī)學(xué)知識,更掌握了醫(yī)學(xué)思維的路徑選擇、證據(jù)整合與多解平衡能力。底層的權(quán)威醫(yī)學(xué)知識庫確保了模型輸出內(nèi)容專業(yè)、及時。

安貞醫(yī)院心臟外科主任醫(yī)師謝進(jìn)生認(rèn)為,夸克在一些問題上回答專業(yè)度比專業(yè)醫(yī)生還要強(qiáng)。這一成果背后是專業(yè)醫(yī)師團(tuán)隊的深度參與。目前,夸克健康大模型擁有千人規(guī)模的專業(yè)醫(yī)師標(biāo)注團(tuán)隊,其中超過400名均為副主任醫(yī)師及以上的高資歷醫(yī)療專家。

憑借在醫(yī)學(xué)領(lǐng)域的專業(yè)性,夸克AI搜索吸引了一大批醫(yī)學(xué)生和醫(yī)生群體。夸克健康運營負(fù)責(zé)人趙存忠介紹,目前平臺在全國醫(yī)學(xué)生中月活用戶已突破 200 萬,覆蓋率過半,他們廣泛使用夸克用于基礎(chǔ)知識搜索、考試備考和臨床輔助診療。

夸克 健康大模型
分享到:

1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。