本文深入探討 IBM 最新開源的 Granite 4.1 大語言模型家族。詳細介紹了其從數據清洗、模型架構設計(如優化的 Transformer 結構)到指令微調與安全對齊的完整構建流程。Granite 4.1 延續了 IBM 對於企業級安全與 Apache 2.0 開源協議的承諾,並在代碼生成、工具調用及多語言推理上展現出優異性能。
Hugging Face 介紹全新 DeepSeek-V4 模型,具備 100 萬 Token 的超長上下文能力。不同於以往流於形式的長文本模型,DeepSeek-V4 專為 Agent 設計,在長文本召回率與指令遵循上表現優異。本文探討其技術突破、在 Hugging Face 生態系的部署方式,以及如何實際應用於複雜的 Agent 工作流中。
Vercel 宣布其 AI Gateway 服務已正式支援 Google 的新一代開源模型 Gemma 4。這項更新讓開發者能夠透過單一、統一的 API 介面,輕鬆將 Gemma 4 整合至其應用程式中。同時,開發者還能直接享有 Vercel AI Gateway 提供的效能監控、請求快取、速率限制以及成本分析等強大功能,大幅簡化了開源模型的部署與管理流程。
本文探討如何「解放」開源 CLI 開發 Agent 工具 OpenClaw。隨著類似 Claude Code 的終端機 Agent 工具興起,Hugging Face 介紹了如何將 OpenClaw 與 Llama、Qwen 等開源模型整合。透過 Hugging Face 的推論 API 或本地部署,開發者可以不再受限於單一閉源 API,實現高自由度、低成本且隱私安全的自主開發流程。
Vercel 宣布其 AI Gateway 已正式支援 Qwen3-Next 系列模型。開發者現在可以透過 Vercel 的統一 API 介面,輕鬆進行 Qwen3-Next 的呼叫、快取、流量限制與效能監控。這為建構多語言與開源 AI 應用的開發者提供了更具彈性且高效的基礎設施選擇。
Vercel 官方 Changelog 宣布,其 AI Gateway 服務已正式支援 gpt-oss-20b 與 gpt-oss-120b 兩款開源大語言模型。開發者現在可以透過 Vercel AI Gateway 統一的 API 介面,輕鬆將這些高效能的開源模型整合至應用程式中,並享有內建的快取、監控與速率限制等生產級功能。
Hugging Face 正式將 Groq 納入其「推理提供商(Inference Providers)」生態系。開發者現在可以直接在 Hugging Face Hub 上,選擇由 Groq 的 LPU 晶片驅動的 API 來運行熱門開源模型(如 Llama 3 和 Mistral)。這項整合不僅簡化了高吞吐量、低延遲應用的開發流程,也為開源模型生態注入了更強大的硬體支援。
阿布達比技術創新研究所(TII)在 Hugging Face 上發布了專為阿拉伯語設計的 Falcon-Arabic 模型。該模型旨在解決阿拉伯語在自然語言處理(NLP)中因複雜語法與方言多樣性帶來的挑戰。作為開源 Falcon 家族的新成員,Falcon-Arabic 將為中東及全球開發者提供更精準、高效的阿拉伯語 AI 解決方案。
Replicate 發布第 6 期技術情報,重點介紹 Google 全新開源的 Gemma 2 模型(包含 9B 與 27B 版本)已可在平台運行,其性能逼近更大參數的模型。同時,本期也更新了語言模型排行榜,並針對熱門的 Stable Diffusion 3 提供具體的提示詞與參數優化指南,幫助創作者解決人體畸變等常見生成問題。
本文介紹如何使用開源 LLM(如 Mixtral-8x7B)作為 LangChain Agent。過去 Agent 多依賴 GPT-4,但隨著開源模型推理能力提升,透過正確的 Prompt 格式(如 ReAct 框架)與 Hugging Face TGI 整合,開源模型也能穩定執行工具調用與多步驟推理,提供高隱私且低成本的替代方案。
Hugging Face 發布實用教學,指導開發者如何利用開源程式碼模型(如 StarCoder)微調出專屬的 Personal Copilot。透過 peft 的 LoRA 技術與 trl 庫,開發者可以用極低的硬體成本,在個人程式碼庫上進行微調。最後,教學展示了如何將微調後的模型部署至 Inference Endpoints,並無縫整合進 VS Code 編輯器中。