Vercel 宣布其 Model Context Protocol (MCP) 正式支援熱門 AI 編輯器 Cursor。這項整合讓開發者能夠直接在 Cursor 的 AI 聊天或 Composer 介面中,透過自然語言查詢 Vercel 的專案狀態、部署記錄與環境變數。這大幅簡化了開發與運維(DevOps)之間的切換流程,提升了全端開發的效率。
Vercel 宣布推出 Vercel MCP(Model Context Protocol)伺服器,讓開發者能將 Vercel 平台與支援 MCP 的 AI 工具(如 Claude Desktop、Cursor 等)無縫連接。透過此整合,AI 助手可以直接讀取專案狀態、管理部署、查詢日誌並調整環境變數。這大幅提升了 AI 輔助開發的效率,讓開發者在編輯器中就能透過自然語言完成 Vercel 的運維操作。
Vercel 宣布推出 Vercel MCP(Model Context Protocol)公開測試版。這項功能讓開發者能將 Claude Desktop 或 Cursor 等 AI 工具與 Vercel 帳戶連結。AI 助手將能直接讀取專案狀態、管理部署、查詢日誌及設定環境變數,大幅提升 AI 輔助開發與運維的自動化效率。
阿聯酋技術創新研究所(TII)在 Hugging Face 發布了名為「3LM」的全新評估基準。該基準專為阿拉伯語大語言模型(LLM)設計,旨在測試其在科學、技術、工程、數學(STEM)以及程式碼編寫等高難度領域的能力。這填補了目前多語言 AI 評估中,阿拉伯語技術性評測工具不足的空白。
Vercel 宣布其 AI Gateway 正式支援最新一代的開源程式碼模型 Qwen3-Coder。開發者現在可以透過 Vercel AI Gateway 統一的 API 接口,進行 Qwen3-Coder 的調用、快取、速率限制與監控。這項更新為建構 AI 輔助編程應用的開發者提供了更具成本效益且高效的開源模型選擇。
Vercel 宣布推出支援模型上下文協定(MCP)的新工具,允許 AI 代理與開發工具(如 Claude)直接檢索數百萬個 GitHub 公開儲存庫。開發者現在可以讓 AI 快速搜尋開源社群中的特定 API 用法、程式碼範例或設定檔,大幅提升開發效率與程式碼生成的準確性。
Vercel 發布最新更新,針對熱門 AI 編碼工具 Claude Code 與 Cursor Agent 降低了使用門檻。過去開發者在團隊專案中使用這些 AI 代理工具時,可能需要為其配置付費的 Vercel 團隊席位(Team Seat)。現在 Vercel 取消了這項限制,讓開發者能更無縫、低成本地將 AI 工作流整合至 Vercel 的部署與託管生態系中。
Google DeepMind 宣布更新 Gemini 2.5 系列模型。備受開發者喜愛的 Gemini 2.5 Pro 將推出實驗性的「Deep Think」增強推理模式,大幅提升複雜問題的解決能力;同時,主打輕量高效的 Gemini 2.5 Flash 也獲得全新升級,帶來更強大的功能與效能表現。
OpenAI 正式發表新一代推理模型 o3 與 o4-mini,強調透過 10 倍強化學習(RL)算力提升推理效率。o4-mini 不僅價格更便宜,在多項指標、視覺與工具調用能力上皆有顯著進步。此外,OpenAI 還驚喜推出了完全開源的終端機 AI 工具 Codex CLI,直接對標 Anthropic 的 Claude Code。
Together 與 Agentica Project(曾推出 DeepScaleR)聯合發表了全新 14B 程式碼推理模型「DeepCoder」。該模型完全開源,並採用 GPRO+(Group Relative Policy Optimization+)強化學習技術。在多項程式碼基準測試中,DeepCoder 展現出媲美 OpenAI o3-mini 的強大實力,是開源 AI 推理領域的重大突破。
Hugging Face 發表指南,介紹如何利用 LM Studio 在本機運行 Open R1 計畫的 OlympicCoder 模型。OlympicCoder 是專為程式設計與推理優化的開源模型。透過本機部署,開發者無需將程式碼上傳至雲端,即可享受媲美頂級商用模型的程式碼生成與除錯能力,兼顧隱私與效能。
Hugging Face 發表輕量級 AI Agent 框架「smolagents」,核心概念為「Code Agents」。與傳統輸出 JSON 的 Agent 不同,它讓 LLM 直接生成 Python 程式碼來執行複雜任務,大幅提升表達力與靈活性。該框架程式碼極簡(約千行),並內置安全的 Python 執行沙箱,支援多種主流 LLM 供應商。
Replicate 發布最新技術情報,重點介紹在平台上架的超強開源程式碼模型 DeepSeek-Coder-V2,其性能在多項指標上超越 GPT-4 Turbo。此外,文章探討了 AI 搜尋技術的最新突破,以及 Replicate 如何利用自身平台技術構建 Discord 社群專用的自動化客服支援機器人,展示了開源 AI 在實際開發與社群營運中的強大應用潛力。
傳統的 HumanEval 程式碼評測基準已逐漸飽和且過於簡單。Hugging Face 與研究團隊合作推出新一代基準 BigCodeBench,包含 1,140 個實用編程任務,涵蓋 139 個第三方 Python 函式庫。此基準旨在考驗 LLM 在複雜、多步驟及真實開發場景下的程式碼生成與指令遵循能力,成為評估 Code LLM 的新一代標準。
Hugging Face 與 BigCode 社群推出 StarCoder2-Instruct-15B。該模型最大特色在於採用「完全透明」與「寬鬆授權」的自我對齊流程。傳統指令模型常依賴 GPT-4 生成數據導致商用受限,而 StarCoder2-Instruct 完全使用開源模型自身生成數據進行訓練,在確保商用合規的同時,於 HumanEval 等基準測試中展現優異性能。
Hugging Face 宣布上線 LiveCodeBench 排行榜,旨在解決傳統程式碼評估基準(如 HumanEval)容易遭受數據污染的問題。LiveCodeBench 透過持續收集 LeetCode、AtCoder 等平台的全新編程競賽題目,確保模型在未曾接觸過的數據上進行測試。該基準不僅評估程式碼生成,還涵蓋程式碼修復、測試案例生成及執行等多維度能力,為 Code LLM 提供更客觀、動態的實力排名。
Google 官方正式發布 CodeGemma 程式碼模型系列,基於 Gemma 架構。提供專攻 IDE 程式碼補全(Fill-in-the-Middle)的 2B 版本,以及適合程式碼生成與對話的 7B 版本。該系列模型已深度整合至 Hugging Face 生態系,支援多種主流程式語言,為開發者提供高效且可本地運行的開源 AI 助手選擇。
由 Hugging Face 與 ServiceNow 主導的 BigCode 社群,聯合 NVIDIA 正式發布了新一代開源程式碼大語言模型 StarCoder2。該系列提供 3B、7B 和 15B 三種參數版本,並同步推出全新升級的 The Stack v2 資料集。StarCoder2 支援超過 600 種程式語言,並在程式碼生成、補全與修復等任務上展現出同量級模型中的頂尖性能,持續推動負責任且開放的 AI 開發。
Meta 推出的 Code Llama 70B 是目前最強大的開源程式碼生成模型之一。Replicate 現在支援透過 API 託管該模型,讓開發者無需自行管理 GPU 基礎設施。只需一行程式碼,即可在雲端快速呼叫並整合至現有的開發工作流中。
Hugging Face 發布實用教學,指導開發者如何利用開源程式碼模型(如 StarCoder)微調出專屬的 Personal Copilot。透過 peft 的 LoRA 技術與 trl 庫,開發者可以用極低的硬體成本,在個人程式碼庫上進行微調。最後,教學展示了如何將微調後的模型部署至 Inference Endpoints,並無縫整合進 VS Code 編輯器中。
Hugging Face 推出針對企業設計的 SafeCoder 程式碼助手,旨在解決使用 GitHub Copilot 等閉源工具時的隱私與智慧財產權疑慮。SafeCoder 基於開源的 StarCoder 模型,支援在企業內部的 VPC 或地端環境部署,並允許企業使用私有程式碼進行微調。這項方案不僅確保程式碼不外流,還能提供高度客製化的開發輔助體驗。
Meta 正式發布專為程式碼任務設計的開源模型 Code Llama,提供 7B、13B 與 34B 三種尺寸,並包含 Python 專用版與指令微調版。該模型支援高達 100k 的上下文視窗,在多項程式碼基準測試中表現優異。Hugging Face 已同步支援該系列模型的推理、部署與微調。
Hugging Face 宣布推出 SafeCoder,這是一套專為企業打造的程式碼寫作助手解決方案。SafeCoder 主打高度隱私與合規性,允許企業在自有的 VPC 或本地環境中部署,並能使用私有程式碼庫進行微調。該方案基於開源的 StarCoder 模型,旨在為企業提供一個可完全掌控、安全且不洩漏敏感資料的 GitHub Copilot 替代方案。
Hugging Face 發表 StarChat Alpha,這是一個基於 15B 參數 StarCoder 基礎模型進行指令微調的對話式程式助手。透過特定的對話模板與微調資料集,StarCoder 從單純的程式碼補全工具升級為能進行多輪對話的 AI 助手。本篇介紹了其訓練細節、對話格式以及如何在 Hugging Face Spaces 上進行體驗。
Hugging Face 與 ServiceNow 發起的 BigCode 專案正式推出 StarCoder,這是一款擁有 155 億參數的開源程式碼大語言模型。該模型在 The Stack 數據集上訓練,支援 80 多種程式語言,並具備 8K 上下文視窗與 Multi-Query Attention 技術。StarCoder 在多項程式碼基準測試中超越了當時的其他開源模型,並採用 OpenRAIL-M 授權,允許商業化使用。