Hugging Face BlogApr 19, 2024, 12:00 AM重要 75

The Open Medical-LLM Leaderboard: Benchmarking Large Language Models in Healthcare

Hugging Face 推出 Open Medical-LLM 排行榜,為醫療 AI 提供標準化評估平台。

Hugging Face 與 Open Life Science AI 等機構合作推出「Open Medical-LLM Leaderboard」。該排行榜整合了 MedQA、MedMCQA、PubMedQA 及 MMLU 醫學子集等基準測試,旨在客觀評估 LLM 在醫療與臨床任務上的表現。這為醫療領域的 AI 研究人員與開發者提供了一個公開、標準化且易於比較的評估平台,有助於推動安全且精確的醫療 AI 發展。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。