Vercel 宣布其 AI Gateway 正式支援 OpenAI 最新推出的 GPT 5.2 Codex 模型。開發者現在可以透過統一的 API 介面輕鬆整合此代碼生成模型,並享有 Vercel 提供的快取、速率限制與調用監控等功能。這將大幅降低開發者在構建 AI 輔助編程應用時的基礎設施維護成本與延遲。
Hugging Face 探討了將「結構化約束(Structure)」引入 Code Agent 的全新設計範式。傳統 Code Agent 透過撰寫 Python 程式碼來執行任務,雖具備極高的靈活性,但自由度過高也容易帶來語法錯誤與安全隱憂。新方法透過結合 Pydantic 驗證、結構化解碼與型別限制,讓 Agent 在保有程式碼強大表達力的同時,確保輸出與行為的預測性與安全性,大幅提升複雜任務的執行成功率。
Hugging Face 宣布上線 LiveCodeBench 排行榜,旨在解決傳統程式碼評估基準(如 HumanEval)容易遭受數據污染的問題。LiveCodeBench 透過持續收集 LeetCode、AtCoder 等平台的全新編程競賽題目,確保模型在未曾接觸過的數據上進行測試。該基準不僅評估程式碼生成,還涵蓋程式碼修復、測試案例生成及執行等多維度能力,為 Code LLM 提供更客觀、動態的實力排名。
Meta 正式發布專為程式碼任務設計的開源模型 Code Llama,提供 7B、13B 與 34B 三種尺寸,並包含 Python 專用版與指令微調版。該模型支援高達 100k 的上下文視窗,在多項程式碼基準測試中表現優異。Hugging Face 已同步支援該系列模型的推理、部署與微調。
Hugging Face 詳細公開了 CodeParrot 專案的訓練全紀錄,展示如何從零開始構建一個專門用於 Python 程式碼生成的 GPT-2 規模模型。 文章深入探討了大規模 GitHub 數據集的清洗與去重、專屬 Tokenizer 的訓練,以及使用 Accelerate 進行多 GPU 分佈式訓練的實務技巧。 此專案不僅提供了一個開源的程式碼模型,更為開發者提供了一套完整的、可複製的大型語言模型(LLM)預訓練工作流。