阿布達比技術創新研究所(TII)推出全新開源模型 Falcon 2 11B,包含預訓練語言模型與視覺語言模型(VLM)。該模型在超過 5 兆(5000B)Token 的高質量數據上進行訓練,支援 11 種語言。其性能在同量級模型中表現亮眼,並採用 Apache 2.0 授權,對開源社群與開發者極具吸引力。
AI 模型託管平台 Replicate 揭露了一項已修復的嚴重安全漏洞。該漏洞由雲端安全公司 Wiz 發現,源於多租戶環境下的共享網路配置缺陷。攻擊者可透過上傳惡意模型,繞過容器隔離並存取其他用戶的私有模型、輸入與輸出數據。Replicate 已於第一時間完成修復、加強網路隔離,並確認除研究人員的測試外,無其他用戶數據外洩。
Hugging Face 宣布與 AMD 展開深度合作,全面優化 AMD Instinct MI300X GPU。透過 AMD ROCm 軟體棧與 Hugging Face 核心庫(如 Transformers、TGI)的無縫整合,開發者無需修改程式碼即可在 MI300X 上運行 Llama 3 等大型模型。MI300X 憑藉 192GB HBM3 超大記憶體,為企業提供極具性價比且能擺脫單一晶片供應商依賴的高效能 AI 算力選擇。
Hugging Face 宣布其企業級平台 Enterprise Hub 已正式上架 AWS Marketplace。企業客戶現在可以直接使用現有的 AWS 帳戶進行訂閱,並將費用合併至 AWS 帳單中,簡化企業內部的採購與財務審批流程。此舉讓企業能更安全、合規地在 AWS 雲端環境中協作、部署與管理開源 AI 模型與數據集。
生醫 AI 平台 Ryght 宣布與 Hugging Face 專家支援團隊合作。面對醫療領域嚴格的 HIPAA 合規性、複雜的醫學術語與高昂的模型微調成本,Ryght 透過 Hugging Face 的技術指導,優化了開源模型的微調與推理效率。此合作成功讓 Ryght 快速推出專為臨床研究與數據分析設計的安全 AI 助理,大幅降低運算成本並縮短產品上市時間。
Hugging Face 正式發布 Idefics2,這是一款擁有 80 億參數的開源視覺語言模型(VLM)。它基於 Mistral-7B 與 SigLIP 構建,顯著提升了 OCR、圖表理解及多圖對話能力。Idefics2 支援原生解析度與長寬比,並以 Apache 2.0 授權釋出,極適合開發者進行微調與商業部署。
Hugging Face 宣布其公共政策(Public Policy)倡議,旨在橋接 AI 社群與全球政策制定者。他們強調開源 AI 對於安全性、市場競爭與創新至關重要。未來將持續參與歐盟 AI 法案、美國行政命令等政策討論,確保開源開發者的聲音被聽見,避免過度監管扼殺創新。
本指南是 Hugging Face 專為零基礎新手撰寫的 Transformers 入門教學。文章深入淺出地介紹了 Hugging Face Hub 的生態系,並透過最簡單的 pipeline API 示範如何進行情感分析、文本生成等任務。讀者無需深厚的機器學習背景,即可快速學會如何載入並運行開源 AI 模型。
Hugging Face 宣布與開源數據標註平台 Argilla 深度整合。使用者現在可以一鍵在 Hugging Face Spaces 上部署 Argilla,邀請社群成員共同進行數據標註、反饋與篩選(如 RLHF/DPO 數據)。這項合作降低了社群協作建構高品質數據集的門檻,有助於推動開源 AI 模型的對齊與優化。
隨著 AI 生成內容爆發,如何識別「AI 製造」成為關鍵。Hugging Face 發布的這篇指南深入探討了 AI 水印技術,涵蓋文字生成(如透過調整 Token 機率分佈的綠名單機制)與影像生成(如 Stable Signature 等隱形潛在空間水印)。文章不僅介紹了現有的開源工具,也客觀分析了水印技術在對抗剪裁、改寫等攻擊時的魯棒性限制與未來挑戰。
Hugging Face 聯合 AI 安全新創 Haize Lab 推出「Red-Teaming Resistance Leaderboard」(紅隊對抗排行榜)。該榜單旨在評估開源與商業大語言模型(LLM)在面對惡意越獄(Jailbreak)與對抗性攻擊時的防禦能力。透過自動化紅隊測試工具,量化模型在安全對齊上的真實強度,為開發者提供更具實戰價值的安全參考指標。
Google 正式推出全新開源模型家族 Gemma,包含 2B 與 7B 兩種參數大小,並提供預訓練與指令微調版本。 Gemma 採用與 Gemini 相同的技術與架構,在多項基準測試中表現優於同尺寸的 Llama 2 與 Mistral。 Hugging Face 已同步支援 Gemma,開發者可直接透過 Transformers、TGI、PEFT 等工具進行部署與微調。
Hugging Face 與韓國 AI 獨角獸 Upstage 合作推出「Open Ko-LLM 排行榜」,旨在解決韓語模型缺乏統一評估標準的問題。該排行榜基於開源社群力量,提供客觀的韓語 LLM 性能評比,涵蓋理解力、推理力及常識等多維度指標。此舉將大幅推動韓國本土開源 AI 生態系的發展,並為非英語系國家的 LLM 評估樹立新典範。
Hugging Face 與 AI 評測新創 Patronus AI 合作,推出全新的「企業情境排行榜」(Enterprise Scenarios Leaderboard)。此排行榜旨在解決傳統學術基準(如 MMLU)與實際企業應用脫節的問題。評測涵蓋金融分析(如 SEC 申報文件)、法律合約理解、客戶服務以及隱私資訊(PII)防範等真實場景,為企業選擇最適合的 LLM 提供客觀的實戰數據參考。
Hugging Face 推出全新的「幻覺排行榜」(Hallucinations Leaderboard),這是一項旨在量化評估大型語言模型(LLM)幻覺程度的開源計畫。該排行榜主要評估模型在處理檢索增強生成(RAG)和文本摘要等任務時,產生不實資訊的機率。透過提供公開透明的評測標準,幫助開發者在建構應用時選擇最不易出錯、最可靠的模型。
Hugging Face 與學術團隊合作推出了全新的「AI Secure LLM 安全排行榜」(基於 DecodingTrust 評估框架)。該排行榜旨在填補現有 LLM 評測偏重「能力」而忽略「安全」的空白,從毒性、刻板印象偏見、對抗強健性、隱私保護及機器倫理等 8 大安全維度,對主流開源與閉源模型進行系統性評測,為開發者提供更全面的模型安全選擇依據。
Hugging Face 與 Google 宣布建立戰略合作夥伴關係,旨在讓開發者更輕鬆地在 Google Cloud 上構建、訓練和部署 AI 模型。 此合作將 Hugging Face 的開源生態系統與 Google Cloud 的基礎設施(如 Vertex AI、GKE 和 TPU)深度整合。 開發者未來能直接在 Google Cloud 上一鍵部署 Hugging Face 上的數十萬個模型,大幅降低 AI 開發與運算門檻。
Hugging Face 介紹了如何結合 ComfyUI 與 Gradio,並在 Spaces 上免費運行。使用者只需將 ComfyUI 工作流導出為 API JSON 格式,即可透過 Gradio 建立簡潔的前端介面。這項技術讓創作者能輕鬆分享複雜的 AI 圖像生成工作流,無需讓終端用戶面對複雜的節點圖。
2023 年是開源大語言模型(LLM)的黃金時代。從 Meta 發布 LLaMA 奠定基礎,到 Mistral 推出高效的 MoE 模型,開源社群在模型架構、量化技術(QLoRA)與對齊方法(DPO)上取得突破。Hugging Face 的 Open LLM Leaderboard 更成為推動這波開源浪潮的核心樞紐,縮短了開源與閉源模型之間的差距。
Mistral AI 發表全新混合專家(MoE)模型 Mixtral 8x7B,總參數 46.7B 但每次 token 僅啟用 12.9B,速度極快。其在多項基準測試中超越 Llama 2 70B 及 GPT-3.5,並支援 32k 脈絡長度。Hugging Face 已於 Transformers、TGI 及推理終端全面整合,並採 Apache 2.0 開源授權。
Replicate 發布了一篇趣味實用的技術教學,展示如何利用網路攝影機(Webcam)捕捉畫面,並透過 LLaVA 或 GPT-4V 等多模態視覺模型分析影像,最後結合 ElevenLabs 的語音合成技術,以經典自然紀錄片主持人大衛·艾登堡(David Attenborough)的口吻與聲音,為你的日常生活進行即時的幽默旁白。
Replicate 宣布支援 RVC(Retrieval-based Voice Conversion)的微調功能,讓開發者與創作者能輕鬆複製聲音。使用者只需提供 YouTube 影片等音訊來源,透過 Replicate 的 API 撰寫幾行程式碼,即可自動轉換為訓練數據集並開始微調。這項更新降低了高品質開源聲音複製的門檻,適合應用於遊戲配音、虛擬主播及個人化語音生成。
AI 模型託管平台 Replicate 宣布完成 4,000 萬美元的 B 輪融資,由知名創投 a16z 領投。這筆資金將用於擴展其雲端基礎設施,幫助更多企業與開發者透過簡單的 API 運行、微調及部署開源 AI 模型。此融資反映出企業級市場對於開源 AI(如 Llama、Stable Diffusion)的需求正迎來爆發性成長。
Replicate 為 Meta 的 MusicGen 模型新增了「和弦制約(chord conditioning)」功能,推出 MusicGen-Chord。使用者現在可以同時輸入文字提示詞與特定的和弦進行(chord progressions),藉此自動生成符合特定音樂風格與和弦結構的背景伴奏軌(backing tracks),大幅提升 AI 音樂創作的控制度。
Hugging Face 官方發布指南,教導開發者如何部署熱門的開源專案「AI Comic Factory」。由於公共版本常因高流量需要排隊,使用者可以透過 Hugging Face Inference API 或專屬的 Inference Endpoints,配置自己的 LLM 與 SDXL 圖像生成服務,低成本打造專屬且流暢的 AI 漫畫創作平台。
Hugging Face 發布 2023 夏季倫理與社會簡報,重點介紹其團隊前往華盛頓特區向美國國會倡導開源 AI 與開放科學價值的經歷。簡報同時涵蓋了 AI 問責制、歐盟 AI 法案的政策回應,以及在模型卡片(Model Cards)、資料集透明度與環境影響評估等技術倫理工具上的最新研究進展。
個人理財應用 Rocket Money 面臨交易分類模型流量劇烈波動的挑戰。透過導入 Hugging Face Inference Endpoints,他們實現了自動彈性伸縮(Auto-scaling),不僅大幅降低基礎設施成本,還簡化了部署流程,讓數據科學團隊無需依賴繁重的 DevOps 即可快速將模型推向生產環境,同時保持極低的延遲。
Hugging Face 介紹了新型圖像生成模型 Würstchen,其核心在於創新的三階段架構,能將潛在空間壓縮高達 42 倍。這使得它在生成速度和訓練成本上遠優於傳統的 Stable Diffusion,同時保持優異的視覺品質。目前該模型已整合至 Diffusers 函式庫中,適合硬體資源有限的開發者與研究人員。
本文回顧了文字生成圖像(Text-to-Image)技術的演進歷程。從早期的 GAN 限制,到 2021 年 VQGAN+CLIP 掀起的社群藝術熱潮,再到 2022 年 DALL-E 2 與 Stable Diffusion 的爆發。隨著 Stable Diffusion 迎來一週年及 SDXL 的推出,開源社群與微調技術正以前所未有的速度重塑視覺創作。
Hugging Face 宣布其 Hub 服務正式登陸 AWS Marketplace。企業客戶現在可以直接使用現有的 AWS 帳戶訂閱與支付 Hugging Face 的服務(如 Enterprise Hub)。這項合作簡化了企業的採購與財務審批流程,並允許企業利用現有的 AWS 承諾消費(Commitments)來抵扣 Hugging Face 的費用,加速企業級 AI 應用的落地。