Hugging Face BlogFeb 1, 2024, 12:00 AM重要 78

Constitutional AI with Open LLMs

Hugging Face 介紹如何利用開源 LLM 與 TRL 函式庫,實作 Anthropic 的「憲政 AI」對齊技術,降低對人類標註的依賴。

本文探討如何使用開源大型語言模型實作「憲政 AI(Constitutional AI)」。這項技術由 Anthropic 提出,透過一組「憲法」原則讓 AI 自我監督與修正輸出(RLAIF)。Hugging Face 展示了利用 TRL 函式庫與 DPO 等開源工具,如何不需大量人類標註,也能訓練出既安全又實用的開源模型。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。