xAI 宣布開放旗下旗艦模型 Grok 3 以及全新輕量級模型 Grok 3-mini 的 API 服務。Grok 3-mini 的輸出定價極具市場競爭力,每百萬 token 僅需 0.5 美元。官方聲稱這款輕量模型性能可媲美體積大得多的前沿模型,並能展示完整的推理思考過程(reasoning traces),為開發者在構建 AI 應用時提供高性價比的推理新選擇。
Vercel 發表官方部落格,闡述其從「前端雲端平台」轉型為「AI 工程公司」的願景。隨著 AI 應用開發從傳統機器學習轉向應用層整合,Vercel 透過 Vercel AI SDK、v0 網頁生成工具以及優化的 Serverless 串流基礎設施,協助開發者降低 AI 應用開發門檻,讓每位前端與全端工程師都能輕鬆轉型為 AI 工程師。
Google 正式發表 Gemini 2.5 Flash,在 LMArena 的性價比曲線(Pareto Frontier)上展現極強的主導地位。此版本定價精準填補了 2.0 Flash 與 2.5 Pro 之間的空白。最受矚目的新功能是「思考預算(Thinking Budget)」,允許開發者精確設定思考 Token 的上限,相較於 OpenAI 與 Anthropic 僅提供粗略的強弱設定,給予開發者更細緻的控制權。社群普遍認為 Google 近期的執行力與產品發布節奏已完全甦醒。
OpenAI 正式發表新一代推理模型 o3 與 o4-mini,強調透過 10 倍強化學習(RL)算力提升推理效率。o4-mini 不僅價格更便宜,在多項指標、視覺與工具調用能力上皆有顯著進步。此外,OpenAI 還驚喜推出了完全開源的終端機 AI 工具 Codex CLI,直接對標 Anthropic 的 Claude Code。
影片生成競技場(Video Arena)排名前兩名的 SOTA 模型 Google Veo 2 與 Kling 2 正式向開發者全面開放(GA)。Google Veo 2 已整合至 Gemini API,主打每秒生成僅需 0.35 美元的超低價格;而來自中國的 Kling 2 則以約 10 秒 2 美元的價格推出,但設有每月 700 美元(需簽 3 個月)的最低消費門檻。兩大模型的開放象徵著高品質 AI 影片生成正式進入開發者應用的實用化階段。
Hugging Face 介紹了由普林斯頓大學等機構提出的 HELMET 基準測試,旨在解決現有長文本評估(如 Needle In A Haystack)過於單一的問題。HELMET 包含 7 大類、11 個真實應用數據集,涵蓋長文本問答、摘要、資訊檢索與程式碼生成等。測試結果顯示,許多宣稱擁有超長上下文的模型,在實際複雜任務中的有效性能會隨著長度增加而顯著衰退。
西班牙甲級足球聯賽(LALIGA)為打擊盜版,透過法院命令要求 ISP 封鎖特定 IP,卻波及 Vercel 等 CDN 業者,導致大量合法網站無法在西班牙存取。Vercel 官方發布最新說明,交代與西班牙當局、電信商溝通的進度,並提出技術緩解方案,以保障合法開發者的權益。
OpenAI 正式發表全新主力模型 GPT 4.1,定位為兼顧效能與成本的「工作馬(Workhorse)」。本次更新同步推出 MRCR 與 GraphWalks 兩項全新基準測試,並釋出官方 Prompt 指南與 Cookbook。此外,社群(如 Reddit 與 Discord)也熱烈討論 GLM-4 強化學習模型與 DeepSeek 的開源貢獻。
Hugging Face 正式收購法國機器人公司 Pollen Robotics,將其硬體技術與 Hugging Face 的 LeRobot 開源機器人平台深度整合。此舉標誌著 Hugging Face 正式進軍實體機器人硬體領域,未來將致力於降低機器人開發門檻,並直接向開發者與研究人員銷售開源機器人硬體,加速具身智能(Embodied AI)的普及。
Hugging Face 與 AI 安全公司 Protect AI 合作滿六個月,宣布已完成平台上 400 萬個開源模型的安全掃描。此項合作旨在解決開源模型(特別是含有 pickle 反序列化風險的舊格式)中潛在的惡意代碼與安全漏洞。透過自動化安全掃描與漏洞標記,雙方共同為全球開發者建構更安全、更值得信賴的 AI 供應鏈生態。
本期 AINews 指出這幾天 AI 領域相對平靜,並無重大新聞發布。編輯特別推薦讀者收聽 Latent.Space 最新釋出的節目,內容聚焦於 SF Compute 以及 GPU 新興雲端服務(Neocloud)的發展與討論。這對於關注 AI 算力基礎設施、GPU 租賃市場與雲端運算趨勢的開發者與創業者來說,是相當值得參考的產業情報。
Sam Altman 宣傳了 ChatGPT 的「記憶(Memory)」功能更新,同時市場傳出 o3、o4-mini 即將推出,以及 GPT-4o 將升級為 GPT-4.1 的洩露消息。 xAI 正式推出 Grok 3 與 Grok 3 mini 的 API,Epoch AI 曾短暫證實其具備 o1 等級的推理能力。 社群方面,Qwen3 宣布延期推出,而 AI Engineer World's Fair 2025 也正展開熱烈徵稿。
Google 在 Cloud Next 大會上宣布雙重重磅消息:全面支援 Anthropic 的 MCP 協定,並推出全新的 Agent2Agent (A2A) 協定。A2A 旨在與 MCP 互補,解決跨遠端 Agent 溝通的痛點。該規範包含 Agent Card、Task 機制、企業級認證與推播支援,並同步開源了草案規範與 Agent 開發套件(ADK)。
Vercel 推出名為「Protectd」的全新常駐型阻斷服務(DoS)防禦系統。該系統部署於 Vercel 的全球邊緣網路,能自動且即時地識別並過濾惡意流量(如 L7 應用層攻擊),無需用戶手動干預。此升級旨在保護開發者的 Serverless 應用免受惡意攻擊,同時避免因攻擊流量導致的異常帳單費用,並確保合法用戶的連線延遲不受影響。
Meta 正式於 Hugging Face 平台上架了備受矚目的 Llama 4 家族首批模型:Maverick 與 Scout。這標誌著開源大語言模型正式邁入 Llama 4 時代。雖然詳細技術細節仍待官方完整白皮書披露,但從命名來看,Scout 預期為輕量、高效率的「偵察型」模型,適合邊緣運算與 Agent 任務;而 Maverick 則可能是主打強大推理與複雜任務處理的「王牌」模型。這兩款模型的釋出將為開源社群注入全新動力。
Hugging Face 發表文章慶祝旗下開源機器學習網頁介面庫 Gradio 的使用者正式突破 100 萬人。文章回顧了 Gradio 自創立以來的成長軌跡,如何透過極簡的 Python 程式碼讓開發者快速部署 AI 互動 Demo,並探討其在 Hugging Face 生態系中扮演的關鍵角色與未來展望。
知名時尚品牌 PAIGE 宣布透過將網站遷移至無頭電商(Headless Commerce)架構,成功讓營收成長 22%。該方案結合了 Shopify 的後端、Next.js 的前端框架以及 Vercel 的全球部署平台。此舉大幅提升了網頁載入速度與使用者體驗,進而優化轉換率,為現代電商技術轉型提供了極佳的成功範例。
Vercel 針對「可組合商務(Composable Commerce)」提供實戰指南,跳過行銷術語,深入探討如何將前端(Next.js)與多個獨立服務(CMS、支付、搜尋)整合。適合評估從單體架構轉型至現代解耦架構的開發團隊與決策者。
Replicate 彙整了社群最新的創意 AI 模型與實驗專案。本次焦點包括:如何利用 AI 生成高品質且具一致性的個人頭像、趣味的光劍視覺特效應用,以及在平台上訓練與融合多個 LoRA 模型的實用技巧。這為設計師與開發者提供了豐富的視覺創作靈感與技術指引。
Hugging Face 針對美國白宮的 AI 行動計畫徵求意見稿(RFI)提交了官方回應。其核心訴求圍繞在保護與推廣「開源 AI」與「開放科學」。Hugging Face 強調,開放源碼不僅能加速技術創新、防止科技巨頭壟斷,更能透過社群的集體審查提升 AI 的安全性與透明度,呼籲政府在制定政策時應避免扼殺開源生態。
NVIDIA 在 GTC 2025 針對實體 AI(Physical AI)領域發表重大更新,與 Hugging Face 合作釋出全新開源模型與資料集。這些資源旨在降低具身智慧與機器人開發門檻,涵蓋世界模型、VLA 模型及高質量訓練資料。開發者可直接在 Hugging Face 平台獲取,加速實體世界 AI 應用的落地。
Vercel 官方宣布旗下熱門的 AI 網頁生成工具 v0 正式支援 Vercel Marketplace 的第三方服務整合。開發者現在可以在 v0 的生成對話中,直接串接如 Supabase、Neon、Clerk 等主流的資料庫、身份驗證與後端服務。這項重大更新大幅縮短了從前端 UI 原型到具備完整後端資料互動之全端(Full-stack)應用的開發流程,讓 AI 輔助開發更具實用性。
Vercel 宣布任命 Jeanne DeWitt Grosser 為新任首席營運長(COO)。她先前曾擔任 dbt Labs 的首席營收長(CRO)以及 Stripe 的美洲業務主管,擁有豐富的科技企業規模化與營收成長經驗。此一人事異動顯示 Vercel 正加速其企業級市場的擴張,並致力於將其前端平台與 AI 開發工具推向更廣泛的商業應用。
Google 推出全新一代開源模型 Gemma 3,具備強大的多模態(視覺與語音)理解能力、廣泛的多語言支持以及長文本處理能力。本次發布涵蓋多種參數規格,並與 Hugging Face 生態系統深度整合,開發者可立即透過 Transformers、vLLM 等工具進行部署與微調,為開源社群注入強大動力。
Hugging Face 與軟體供應鏈安全領導廠商 JFrog 展開戰略合作。雙方將整合 Hugging Face 的開源模型生態系與 JFrog 的安全平台,讓企業在引進 AI 模型時能進行自動化漏洞掃描與惡意代碼檢測。此舉旨在解決 AI 供應鏈中的安全隱憂,讓 AI 開發流程更加透明且符合企業合規要求。
Cohere For AI 發表全新開源多語言多模態模型「Aya Vision」(提供 8B 與 32B 版本)。該模型旨在解決現有視覺語言模型(VLM)嚴重偏向英語的問題,大幅提升了對全球多種語言(特別是低資源語言)的圖像理解與文字生成能力。在多項多語言多模態基準測試中,Aya Vision 展現出超越同量級開源模型的優異性能,並已於 Hugging Face 平台上開源。
Hugging Face 宣布與印度頂尖研究機構印度科學理工學院(IISc)展開合作。雙方將結合 IISc 的學術研究實力與 Hugging Face 的開源生態系,致力於解決印度多元語言(包含多種低資源語言)的 AI 模型開發挑戰。此舉旨在為印度本土語言建立更完善的開源數據集與語言模型,促進在地化的 AI 技術普及。
為對抗封閉的商業 Deep Research 服務,Hugging Face 推出開源版 DeepResearch。該專案基於其輕量級 Agent 框架 smolagents,能驅動開源模型(如 Qwen 或 Llama)進行多步驟網頁搜尋、資訊整合並產出詳盡報告。這不僅降低了研究型 Agent 的門檻,也讓開發者能完全掌控資料與搜尋邏輯。
Hugging Face 發表 Open-R1 專案的第一階段更新,旨在完全開源重現 DeepSeek-R1。團隊目前專注於利用 TRL 庫中的 GRPO 演算法進行強化學習訓練,並已釋出初步的訓練配方、資料集與評估結果。報告中也探討了推理模型訓練中常見的「獎勵作弊(Reward Hacking)」與格式控制等技術挑戰。
Hugging Face 推出全新「AI 藝術工具電子報(Issue 1)」,旨在為藝術家與創意工作者搭起技術橋樑。本期聚焦於 2025 年 1 月最新的開源 AI 藝術工具、互動式 Hugging Face Spaces 以及實用的創意工作流。內容涵蓋影像生成、風格轉移與社群熱門的視覺創作模型,幫助創作者掌握開源 AI 的最新藝術應用。