Hugging Face 與 Explosion 合作,展示如何將 Prodigy 資料標記工具與 AutoNLP(現為 AutoTrain)整合。透過主動學習(Active Learning)機制,系統能自動篩選出模型最不確定的樣本供人工標記,大幅減少標記成本。此工作流讓開發者無需編寫複雜代碼,即可快速迭代並優化 NLP 模型。
開源機器學習互動介面庫 Gradio 宣布正式加入 Hugging Face。此次合併旨在加速機器學習的民主化,讓開發者能更輕鬆地為模型建立直觀的 Web 介面。Gradio 將保持開源與免費,並與 Hugging Face Spaces 深度整合,讓任何人都能在幾分鐘內部署並分享自己的 AI 模型 Demo。
本文為 Svelte 創作者 Rich Harris 加入 Vercel 後的專訪。他分享了全職投入 Svelte 開發的契機,並深入探討 Svelte 的設計哲學(如無虛擬 DOM、編譯期優化)。同時,他也揭示了 SvelteKit 的未來藍圖,以及在 Vercel 支持下,如何為開發者提供更極致的效能與開發體驗。
DeepMind 提出的 Perceiver IO 已正式整合至 Hugging Face。該模型透過引入「潛在瓶頸」與「輸出查詢」機制,成功將 Transformer 的二次方複雜度降至線性,使其能高效處理高維度的多模態數據(如圖像、音訊、3D 點雲)。Perceiver IO 不僅能接收任意輸入,還能靈活輸出各種結構的數據,是邁向通用 AI 架構的重要一步。
Vercel 宣布將加大對 React 生態系的投資,支持其長期發展。隨著 React 核心架構師 Sebastian Markbåge 等人加入 Vercel,雙方將緊密合作,共同推動 React 18、React Server Components (RSC) 及 Suspense 等下一代技術的研發與實踐,並確保這些創新能在 Next.js 等框架中獲得最佳體驗。
Vercel 宣布收購專為 JavaScript 與 TypeScript 設計的高效能 monorepo 建置系統 Turborepo。此舉旨在解決大型專案建置緩慢的痛點,透過快取與增量建置技術大幅縮短開發時間。Turborepo 創辦人 Jared Palmer 也將加入 Vercel,共同推動前端開發工具鏈的革新。
Hugging Face 詳細公開了 CodeParrot 專案的訓練全紀錄,展示如何從零開始構建一個專門用於 Python 程式碼生成的 GPT-2 規模模型。 文章深入探討了大規模 GitHub 數據集的清洗與去重、專屬 Tokenizer 的訓練,以及使用 Accelerate 進行多 GPU 分佈式訓練的實務技巧。 此專案不僅提供了一個開源的程式碼模型,更為開發者提供了一套完整的、可複製的大型語言模型(LLM)預訓練工作流。
Hugging Face 推出其首個 Unity ML-Agents 虛擬環境「Snowball Fight」(打雪仗)。此環境旨在提供一個趣味且具挑戰性的平台,讓開發者與研究人員能夠訓練、測試並分享他們的深度強化學習(DRL)模型。使用者可以利用 Unity ML-Agents 工具包進行訓練,並將訓練好的 Agent 模型上傳至 Hugging Face Hub 進行交流與對戰。
Hugging Face 與 Graphcore 合作推出 Optimum 整合方案,讓開發者能輕鬆在 IPU(智慧處理單元)上運行 Transformers 模型。透過專屬的 IPUTrainer,開發者只需修改極少程式碼,即可將現有的 PyTorch 訓練流程轉移至 IPU,大幅提升特定 AI 任務的運算效率。
Hugging Face 發表了 Data Measurements Tool,這是一個互動式工具,旨在幫助機器學習從業者在訓練模型前深入了解資料集。該工具提供資料集大小、標籤分佈、詞彙多樣性及潛在偏見(如性別或地理偏見)等關鍵指標的視覺化分析。透過此工具,使用者無需撰寫複雜程式碼,即可在 Hugging Face Hub 上直接評估資料品質,推動更負責任的 AI 開發。
Vercel 宣布獲得 1.5 億美元 D 輪融資,由 GGV Capital 領投,估值攀升至 25 億美元。此輪資金將用於加速產品研發、擴大全球團隊,並持續投資開源 Next.js 生態系。Vercel 旨在為全球開發者打造更快速、更具協作性的現代 Web 端到端部署與開發平台。
Hugging Face 與 Intel 合作,展示如何利用 Intel Extension for PyTorch (IPEX) 和 oneCCL 提升 CPU 上的模型微調效率。透過自動混合精度(BFloat16)與優化的分散式通訊,開發者可以在 Intel Xeon 處理器上實現高效的多節點分散式訓練。這為缺乏 GPU 資源或希望活化現有 CPU 叢集的企業提供了極具成本效益的替代方案。
本教學詳細介紹如何利用 Hugging Face Transformers 庫,針對缺乏訓練數據的低資源語言微調 Meta 的 XLSR-Wav2Vec2 語音模型。內容涵蓋從 Common Voice 數據集下載、音訊預處理、建立專屬 Tokenizer,到使用 CTC 損失函數進行模型訓練的完整工作流。對於想在特定方言或少數語言上實現高精度語音辨識(ASR)的開發者與研究人員,這是極具價值的實戰指南。
前端部署平台 Vercel 宣布 Svelte 框架創始人 Rich Harris 正式加入團隊。Rich Harris 先前於《紐約時報》擔任圖表編輯,加入 Vercel 後將得以全職專注於 Svelte 及 SvelteKit 的開發與社群生態建設。此舉展現了 Vercel 支持多元開源前端框架、不限於 Next.js 的決心,旨在為開發者提供更優質的部署與開發體驗。
本篇為 Hugging Face 與 Intel 合作的第二部分,深入探討在現代 CPU(如 Intel Xeon)上優化 BERT 推理的進階技術。文章重點介紹了 Intel Extension for PyTorch (IPEX)、INT8 量化以及 Bfloat16 混合精度運算。透過這些軟硬體協同優化與 NUMA 核心綁定,開發者能在不犧牲精度的前提下,獲得數倍的推理吞吐量提升。
本活動公告為 Hugging Face 於 2021 年 10 月舉辦的「課程發布社群活動」。該活動旨在慶祝 Hugging Face 官方 NLP 課程的推出,並透過社群黑客松、技術講座與交流,引導開發者與研究人員深入學習 Transformers、Datasets 和 Tokenizers 等開源工具,促進開源 AI 生態系的發展。
本文探討大型語言模型(LLM)參數規模以驚人速度增長的現象,並將其與「摩爾定律」相提並論。然而,這種「越大越好」的趨勢伴隨著極高的算力成本、碳排放以及技術壟斷風險。Hugging Face 呼籲社群關注模型民主化,並透過開源合作(如 BigScience 專案)與高效能技術(如蒸餾、量化)來打破巨頭壟斷,尋求更永續的 AI 發展路徑。
Hugging Face 介紹了如何利用超過 10 億個句子對(Sentence Pairs)的大規模數據集,訓練出高效且精準的句子嵌入模型。文中詳細說明了數據集整合、對比學習(Contrastive Learning)的訓練方法,並釋出了包含 all-MiniLM-L6-v2 在內的多款熱門開源模型。這些模型至今仍是 RAG 和語意搜尋系統中非常經典且高效的基準選擇。
Hugging Face 探討了機器學習從學術研究走向主流軟體工程的轉變。隨著 Hugging Face Hub 等平台的興起,模型、數據集和展示空間(Spaces)都開始採用類似 Git 的版本控制與協作模式。這意味著 AI 開發不再只是科學家的專利,而是轉向以「程式碼為中心」的開發者生態,讓軟體工程師能用幾行程式碼輕鬆整合強大模型。
本文探討如何針對遙測(衛星)影像微調 OpenAI 的 CLIP 多模態模型。由於通用 CLIP 在處理俯視、高空等特殊視角的衛星影像時表現不佳,研究團隊利用 RSICD 數據集與 JAX/Flax 框架進行微調。微調後的模型能顯著提升衛星影像的文本檢索與分類準確度,為地理資訊與遙測領域提供強大的開源工具。
Hugging Face 宣布在 Spaces 平台正式支援 Gradio,開發者現在可以輕鬆將機器學習模型轉化為具備美觀 UI 的互動式網頁應用。只需撰寫簡單的 Python 程式碼,即可將專案託管於 Spaces 並產生分享連結。這項整合大幅降低了 AI 專案展示的門檻,促進了開源社群的交流與模型體驗。
Hugging Face 宣布在其平台推出 Spaces 服務,並原生支援熱門的 Python 網頁框架 Streamlit。開發者只需撰寫簡單的 Python 程式碼,即可將 Hugging Face 上的模型與資料集轉化為具備互動介面的 Web 應用。透過 Git 工作流,開發者能輕鬆部署、分享並與社群共同協作,極大降低了 AI 專案展示的門檻。
Hugging Face 發表 2021 年夏季回顧,重點介紹其暑期實習生在多個前沿 AI 領域的貢獻。實習生們參與了包括 Wav2Vec2 語音模型優化、多模態模型開發、Datasets 庫擴充,以及與 Google 合作的 JAX/Flax 社群黑客松。這段期間也見證了 Hugging Face Spaces 的快速成長,為開源 AI 社群注入了強大動力。
Vercel 於 2021 年 9 月宣布 Next.js Conf 2021 的舉辦消息,主題定為「Let’s make the Web. Faster.」。大會旨在聚集全球開發者,共同探討如何優化網頁效能與開發者體驗。此活動隨後催生了 Next.js 12 的發布,引入了 Rust 編譯器等重大效能變革,是前端開發史上的重要里程碑。
Hugging Face 宣布與 AI 晶片公司 Graphcore 建立合作夥伴關係,共同優化 Transformer 模型。 雙方推出了開源庫 `optimum-graphcore`,使開發者能輕鬆將模型部署至 Graphcore 的智慧處理單元(IPU)上。 此合作旨在降低硬體加速門檻,為開發者在 GPU 之外提供更高效、具成本效益的 AI 算力選擇。
Hugging Face 宣布推出全新開源專案 Optimum,旨在簡化 Transformer 模型在特定硬體上的優化流程。透過與 Intel、Graphcore 等硬體夥伴合作,Optimum 提供模型量化、剪枝與圖優化等工具,讓開發者能輕鬆在各式加速器上實現最大化的生產線部署效率。
Vercel 宣布支援將專案轉移至個人帳號(Personal Accounts)。此更新解決了過去專案只能往團隊帳號移轉或流程繁瑣的痛點,讓開發者能更彈性地調整專案歸屬,例如將不再需要團隊協作的專案移回個人空間,有效降低團隊席位成本並提升管理靈活性。
本文介紹 Hugging Face 如何利用去中心化深度學習庫 `hivemind`,在網際網路上進行協作式模型訓練。透過分散式雜湊表(DHT)與容錯演算法,全球志願者能用自己的 GPU 共同訓練出孟加拉語模型 SahajBERT。這種方法打破了大型科技公司對大模型算力的壟斷,為開源社群提供了一條去中心化訓練的新路徑。
Hugging Face 宣佈將熱門的工業級自然語言處理(NLP)庫 spaCy 整合至 Hugging Face Hub。開發者現在可以使用全新推出的 `spacy-huggingface-hub` 工具,輕鬆將訓練好的 spaCy 管道模型上傳至 Hub 進行版本控制與分享。此外,Hub 還為 spaCy 模型提供了專屬的互動式瀏覽器測試介面(Widget),大幅提升了模型展示與協作的便利性。
Hugging Face 宣布與 AWS 深度整合,推出專屬的 SageMaker 深度學習容器(DLC)。開發者現在可以直接利用 SageMaker Python SDK,將 Hugging Face Hub 上的數萬個預訓練模型一鍵部署至託管的 SageMaker 端點。這項合作大幅簡化了 NLP 模型的正式生產環境部署流程,並兼顧了 AWS 的安全與彈性擴展優勢。