隨著 Google 推出 Gemma 4,業界再次聚焦於「如何定義開源模型的成功」。Nathan Lambert 指出,單純追求基準測試(Benchmark)的高分已無法保證模型的普及。開源模型的真正成功,取決於其開發者生態系的接納度、微調的易用性、硬體適配度以及實際應用場景的落地,而非僅僅是學術榜單上的排名。
Google DeepMind 發表全新開源模型系列「T5Gemma」。不同於目前主流的 Decoder-only 架構,T5Gemma 採用經典的 Encoder-Decoder 架構,將 T5 的設計理念與 Gemma 的現代化技術結合。這為需要雙向上下文理解的任務(如翻譯、摘要、分類)提供了更高效且強大的新選擇。
Google DeepMind 發表了 Gemma 3n 的開發者指南。Gemma 3n 是專為那些協助塑造與改進 Gemma 模型的開發者社群所設計。此指南旨在幫助開發者更輕鬆地整合與應用此模型,延續了 Google 對於開源與開放權重(open-weights)AI 社群的承諾。
Google DeepMind 發表了 VaultGemma,這是全球首款從頭開始(from scratch)使用差分隱私(Differential Privacy, DP)技術訓練的高性能大語言模型。透過嚴格的數學隱私保證,VaultGemma 能有效防止訓練數據洩露與敏感資訊記憶,同時在多項基準測試中保持極高的實用性,為醫療、金融等高隱私需求領域帶來全新突破。
Google 正式推出全新開源嵌入模型 EmbeddingGemma。該模型基於強大的 Gemma 2 架構,專為檢索、語意搜尋與 RAG(檢索增強生成)等任務設計。EmbeddingGemma 在 MTEB 等主流基準測試中表現優異,並提供高效的推理能力。目前已全面整合至 Hugging Face 生態系統,開發者可透過 transformers 與 sentence-transformers 輕鬆部署與微調。
Google 宣布推出 Gemma 家族新成員:僅有 2.6B 參數但性能強悍的 Gemma 2 2B 輕量模型;專為過濾有害內容設計的安全分類器 ShieldGemma(提供 2B、9B、27B 版本);以及包含逾 400 個稀疏自編碼器的 Gemma Scope,為 AI 領域提供前所未有的模型內部決策「可解釋性」研究工具。
本指南介紹如何在 Hugging Face 生態系中微調 Google 的 Gemma 開源模型(2B 與 7B)。文章詳細說明了如何利用 PEFT(參數高效微調)技術,特別是 QLoRA(4-bit 量化微調),在消費級 GPU 上進行訓練。透過結合 transformers、peft 與 trl(SFTTrainer)等套件,開發者可以輕鬆載入模型、設定 LoRA 參數、格式化數據集,並將微調後的權重上傳至 Hugging Face Hub,是實作 Gemma 微調的必讀教學。
Google 正式推出全新開源模型家族 Gemma,包含 2B 與 7B 兩種參數大小,並提供預訓練與指令微調版本。 Gemma 採用與 Gemini 相同的技術與架構,在多項基準測試中表現優於同尺寸的 Llama 2 與 Mistral。 Hugging Face 已同步支援 Gemma,開發者可直接透過 Transformers、TGI、PEFT 等工具進行部署與微調。