Hugging Face BlogMay 24, 2024, 12:00 AM重要 75

CyberSecEval 2 - A Comprehensive Evaluation Framework for Cybersecurity Risks and Capabilities of Large Language Models

Meta 推出 CyberSecEval 2 安全評估框架,全面量化 LLM 的網路安全風險、漏洞利用能力與提示詞注入防禦力。

Meta 推出開源安全評估框架 CyberSecEval 2,並與 Hugging Face 合作推廣。該框架旨在量化大語言模型(LLM)在網路安全領域的雙重用途風險,新增了自動化漏洞利用、惡意軟體分析及提示詞注入(Prompt Injection)等測試維度。這項工具能幫助開發者與安全研究人員,客觀評估如 Llama Guard 等安全防護模型在實際對抗中的防禦表現。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。