Vercel 宣布其 AI Gateway 已正式支援 OpenAI 推出的 GPT-OSS-Safeguard-20B 模型。這款擁有 200 億參數的安全防護模型,旨在幫助開發者在 Gateway 端直接進行輸入與輸出的安全過濾。透過此整合,開發者能更輕鬆地為 AI 應用部署強大的安全護欄(Guardrails),有效防止惡意提示詞攻擊並過濾不當內容。
Meta 推出的最新一代安全防護模型 Llama Guard 4 已正式登陸 Hugging Face Hub。該模型專為 LLM 輸入與輸出審查設計,能有效偵測有害內容、越獄攻擊與敏感資訊。開發者現在可以透過 Hugging Face 輕鬆部署、微調並整合此模型,為 AI 應用構建更安全的防護網。
Hugging Face 宣布更新其「內容指南與政策」,旨在為開源 AI 社群建立更安全、透明的環境。新政策明確禁止仇恨言論、惡意軟體、非自願性色情及旨在產生有害內容的模型。此外,官方也優化了社群檢舉流程與侵權(DMCA)處理機制,以確保平台上的模型與數據集符合安全合規標準。