臨床試驗等專業場景中的問答能力,為生物醫藥大模型發展提供技術支撐和保障,助力通過AI大模型的可靠應用,加速新藥研發和臨床試驗進程,打破醫藥研發的“三十魔咒”。此前,智慧芽也已推出自研的“生物醫藥大模型”。
智慧芽表示,當前,市場上已涌現出許多專注于生物醫藥領域的大模型。然而,現有的評測方法主要關注醫藥知識問答和對話生成任務的性能,忽視了關系提取、信息檢索等關鍵能力的評估。這不僅影響了開發人員對大模型性能的準確評估,也限制了大模型在藥物研發關鍵環節中的實際應用。
為此,智慧芽推出“生物醫藥大模型評測數據集”,不僅考察大模型對生物醫藥知識的掌握程度,更注重其在實際業務場景中的應用能力。
據介紹,該“生物醫藥大模型評測數據集”基于通用評估標準,并結合醫藥領域中生物醫藥研發、臨床試驗與循證醫學、藥政與準入、生物序列與化學結構等真實業務場景,以及綜合能力考試,構建了3500個高質量問答對,全面考察大模型應對前沿知識和解決實際難題的能力。生物醫藥領域大模型的開發人員可借助該數據集,對其模型在專業場景中的問答能力進行綜合評估,了解其在不同任務中的表現,并以此為依據不斷改進模型,提升性能。
注:文章來源于網絡,如有侵權,請聯系刪除