Google DeepMind 宣布推出 Gemma Scope 2,這是一套專為全新 Gemma 3 模型家族設計的稀疏自編碼器(SAE)工具包。Gemma Scope 2 旨在提供強大的「可解釋性」工具,讓研究人員能夠深入剖析模型內部的神經元激活狀態與決策邏輯。此舉將大幅降低 AI 安全與機制可解釋性(Mechanistic Interpretability)研究的門檻,協助社群理解複雜語言模型的行為。
Google 宣布推出 Gemma 家族新成員:僅有 2.6B 參數但性能強悍的 Gemma 2 2B 輕量模型;專為過濾有害內容設計的安全分類器 ShieldGemma(提供 2B、9B、27B 版本);以及包含逾 400 個稀疏自編碼器的 Gemma Scope,為 AI 領域提供前所未有的模型內部決策「可解釋性」研究工具。
Replicate 發表最新技術週報,重點包括:1. 介紹如何透過稀疏自編碼器(SAE)在 GPT 模型中定位與提取特定概念;2. 展示利用瀏覽器進行低延遲、隱私安全的即時語音轉文字技術;3. 宣布 Replicate 平台即將迎來 NVIDIA H100 GPU,大幅提升開源模型推理與微調的速度。
Replicate 發布首期技術精選,聚焦三大 AI 前沿進展:首先是引導開發者從零開始用 PyTorch 實作 Llama 3 架構;其次介紹了結合錄影與 AI 檢索的開源智慧眼鏡專案;最後深入探討了 Anthropic 利用「字典學習」(SAE)成功提取並控制 Claude 3 內部概念特徵的里程碑研究。