Meta 推出的最新一代安全防護模型 Llama Guard 4 已正式登陸 Hugging Face Hub。該模型專為 LLM 輸入與輸出審查設計,能有效偵測有害內容、越獄攻擊與敏感資訊。開發者現在可以透過 Hugging Face 輕鬆部署、微調並整合此模型,為 AI 應用構建更安全的防護網。
Hugging Face 宣布更新其「內容指南與政策」,旨在為開源 AI 社群建立更安全、透明的環境。新政策明確禁止仇恨言論、惡意軟體、非自願性色情及旨在產生有害內容的模型。此外,官方也優化了社群檢舉流程與侵權(DMCA)處理機制,以確保平台上的模型與數據集符合安全合規標準。