本文深入探討 IBM 最新開源的 Granite 4.1 大語言模型家族。詳細介紹了其從數據清洗、模型架構設計(如優化的 Transformer 結構)到指令微調與安全對齊的完整構建流程。Granite 4.1 延續了 IBM 對於企業級安全與 Apache 2.0 開源協議的承諾,並在代碼生成、工具調用及多語言推理上展現出優異性能。
Hugging Face 介紹全新 DeepSeek-V4 模型,具備 100 萬 Token 的超長上下文能力。不同於以往流於形式的長文本模型,DeepSeek-V4 專為 Agent 設計,在長文本召回率與指令遵循上表現優異。本文探討其技術突破、在 Hugging Face 生態系的部署方式,以及如何實際應用於複雜的 Agent 工作流中。
本文探討如何「解放」開源 CLI 開發 Agent 工具 OpenClaw。隨著類似 Claude Code 的終端機 Agent 工具興起,Hugging Face 介紹了如何將 OpenClaw 與 Llama、Qwen 等開源模型整合。透過 Hugging Face 的推論 API 或本地部署,開發者可以不再受限於單一閉源 API,實現高自由度、低成本且隱私安全的自主開發流程。
Hugging Face 正式將 Groq 納入其「推理提供商(Inference Providers)」生態系。開發者現在可以直接在 Hugging Face Hub 上,選擇由 Groq 的 LPU 晶片驅動的 API 來運行熱門開源模型(如 Llama 3 和 Mistral)。這項整合不僅簡化了高吞吐量、低延遲應用的開發流程,也為開源模型生態注入了更強大的硬體支援。
阿布達比技術創新研究所(TII)在 Hugging Face 上發布了專為阿拉伯語設計的 Falcon-Arabic 模型。該模型旨在解決阿拉伯語在自然語言處理(NLP)中因複雜語法與方言多樣性帶來的挑戰。作為開源 Falcon 家族的新成員,Falcon-Arabic 將為中東及全球開發者提供更精準、高效的阿拉伯語 AI 解決方案。
Replicate 發布第 6 期技術情報,重點介紹 Google 全新開源的 Gemma 2 模型(包含 9B 與 27B 版本)已可在平台運行,其性能逼近更大參數的模型。同時,本期也更新了語言模型排行榜,並針對熱門的 Stable Diffusion 3 提供具體的提示詞與參數優化指南,幫助創作者解決人體畸變等常見生成問題。
本文介紹如何使用開源 LLM(如 Mixtral-8x7B)作為 LangChain Agent。過去 Agent 多依賴 GPT-4,但隨著開源模型推理能力提升,透過正確的 Prompt 格式(如 ReAct 框架)與 Hugging Face TGI 整合,開源模型也能穩定執行工具調用與多步驟推理,提供高隱私且低成本的替代方案。