Google DeepMind BlogDec 16, 2025, 10:14 AM重要 75

Gemma Scope 2: helping the AI safety community deepen understanding of complex language model behavior

Google DeepMind 發布 Gemma Scope 2,將開放式可解釋性工具擴展至整個 Gemma 3 家族,助力 AI 安全研究。

Google DeepMind 宣布推出 Gemma Scope 2,這是一套專為全新 Gemma 3 模型家族設計的稀疏自編碼器(SAE)工具包。Gemma Scope 2 旨在提供強大的「可解釋性」工具,讓研究人員能夠深入剖析模型內部的神經元激活狀態與決策邏輯。此舉將大幅降低 AI 安全與機制可解釋性(Mechanistic Interpretability)研究的門檻,協助社群理解複雜語言模型的行為。

想看英文原文 / 完整內容?

前往 Google DeepMind Blog 原文 →

摘要由 AI 整理,以原文為準。