Latest in AI

🔥 Trending today

python2 webassembly2 sandboxing2 security2 prompt-injection2 openai2 data-centers2 ai-infrastructure2 ai-policy2 hugging-face2

Topic

Release New Tool Tutorial Business Paper Benchmark Opinion Regulation

For

General Developers Designers Product Founders Marketing Researchers Students

Active Learning with AutoNLP and Prodigy
Hugging Face Blog1626d agoTutorial
Hugging Face 與 Explosion 合作，展示如何將 Prodigy 資料標記工具與 AutoNLP（現為 AutoTrain）整合。透過主動學習（Active Learning）機制，系統能自動篩選出模型最不確定的樣本供人工標記，大幅減少標記成本。此工作流讓開發者無需編寫複雜代碼，即可快速迭代並優化 NLP 模型。
Gradio is joining Hugging Face!★ 80
Hugging Face Blog1628d agoBusiness
開源機器學習互動介面庫 Gradio 宣布正式加入 Hugging Face。此次合併旨在加速機器學習的民主化，讓開發者能更輕鬆地為模型建立直觀的 Web 介面。Gradio 將保持開源與免費，並與 Hugging Face Spaces 深度整合，讓任何人都能在幾分鐘內部署並分享自己的 AI 模型 Demo。
The future of Svelte, an interview with Rich Harris
Vercel Changelog1634d agoOpinion
本文為 Svelte 創作者 Rich Harris 加入 Vercel 後的專訪。他分享了全職投入 Svelte 開發的契機，並深入探討 Svelte 的設計哲學（如無虛擬 DOM、編譯期優化）。同時，他也揭示了 SvelteKit 的未來藍圖，以及在 Vercel 支持下，如何為開發者提供更極致的效能與開發體驗。
Perceiver IO: a scalable, fully-attentional model that works on any modality★ 70
Hugging Face Blog1634d agoRelease
DeepMind 提出的 Perceiver IO 已正式整合至 Hugging Face。該模型透過引入「潛在瓶頸」與「輸出查詢」機制，成功將 Transformer 的二次方複雜度降至線性，使其能高效處理高維度的多模態數據（如圖像、音訊、3D 點雲）。Perceiver IO 不僅能接收任意輸入，還能靈活輸出各種結構的數據，是邁向通用 AI 架構的重要一步。
Supporting the Future of React
Vercel Changelog1635d agoBusiness
Vercel 宣布將加大對 React 生態系的投資，支持其長期發展。隨著 React 核心架構師 Sebastian Markbåge 等人加入 Vercel，雙方將緊密合作，共同推動 React 18、React Server Components (RSC) 及 Suspense 等下一代技術的研發與實踐，並確保這些創新能在 Next.js 等框架中獲得最佳體驗。
Vercel acquires Turborepo to accelerate build speed and improve developer experience
Vercel Changelog1640d agoBusiness
Vercel 宣布收購專為 JavaScript 與 TypeScript 設計的高效能 monorepo 建置系統 Turborepo。此舉旨在解決大型專案建置緩慢的痛點，透過快取與增量建置技術大幅縮短開發時間。Turborepo 創辦人 Jared Palmer 也將加入 Vercel，共同推動前端開發工具鏈的革新。
Training CodeParrot 🦜 from Scratch
Hugging Face Blog1641d agoTutorial
Hugging Face 詳細公開了 CodeParrot 專案的訓練全紀錄，展示如何從零開始構建一個專門用於 Python 程式碼生成的 GPT-2 規模模型。文章深入探討了大規模 GitHub 數據集的清洗與去重、專屬 Tokenizer 的訓練，以及使用 Accelerate 進行多 GPU 分佈式訓練的實務技巧。此專案不僅提供了一個開源的程式碼模型，更為開發者提供了一套完整的、可複製的大型語言模型（LLM）預訓練工作流。
Introducing Snowball Fight ☃️, our first ML-Agents environment
Hugging Face Blog1647d agoRelease
Hugging Face 推出其首個 Unity ML-Agents 虛擬環境「Snowball Fight」（打雪仗）。此環境旨在提供一個趣味且具挑戰性的平台，讓開發者與研究人員能夠訓練、測試並分享他們的深度強化學習（DRL）模型。使用者可以利用 Unity ML-Agents 工具包進行訓練，並將訓練好的 Agent 模型上傳至 Hugging Face Hub 進行交流與對戰。
Getting Started with Hugging Face Transformers for IPUs with Optimum
Hugging Face Blog1649d agoTutorial
Hugging Face 與 Graphcore 合作推出 Optimum 整合方案，讓開發者能輕鬆在 IPU（智慧處理單元）上運行 Transformers 模型。透過專屬的 IPUTrainer，開發者只需修改極少程式碼，即可將現有的 PyTorch 訓練流程轉移至 IPU，大幅提升特定 AI 任務的運算效率。
Introducing the Data Measurements Tool: an Interactive Tool for Looking at Datasets
Hugging Face Blog1650d agoNew Tool
Hugging Face 發表了 Data Measurements Tool，這是一個互動式工具，旨在幫助機器學習從業者在訓練模型前深入了解資料集。該工具提供資料集大小、標籤分佈、詞彙多樣性及潛在偏見（如性別或地理偏見）等關鍵指標的視覺化分析。透過此工具，使用者無需撰寫複雜程式碼，即可在 Hugging Face Hub 上直接評估資料品質，推動更負責任的 AI 開發。
Announcing $150M to build the end-to-end platform for the modern Web
Vercel Changelog1656d agoBusiness
Vercel 宣布獲得 1.5 億美元 D 輪融資，由 GGV Capital 領投，估值攀升至 25 億美元。此輪資金將用於加速產品研發、擴大全球團隊，並持續投資開源 Next.js 生態系。Vercel 旨在為全球開發者打造更快速、更具協作性的現代 Web 端到端部署與開發平台。
Accelerating PyTorch distributed fine-tuning with Intel technologies
Hugging Face Blog1660d agoTutorial
Hugging Face 與 Intel 合作，展示如何利用 Intel Extension for PyTorch (IPEX) 和 oneCCL 提升 CPU 上的模型微調效率。透過自動混合精度（BFloat16）與優化的分散式通訊，開發者可以在 Intel Xeon 處理器上實現高效的多節點分散式訓練。這為缺乏 GPU 資源或希望活化現有 CPU 叢集的企業提供了極具成本效益的替代方案。
Fine-Tune XLSR-Wav2Vec2 for low-resource ASR with 🤗 Transformers
Hugging Face Blog1664d agoTutorial
本教學詳細介紹如何利用 Hugging Face Transformers 庫，針對缺乏訓練數據的低資源語言微調 Meta 的 XLSR-Wav2Vec2 語音模型。內容涵蓋從 Common Voice 數據集下載、音訊預處理、建立專屬 Tokenizer，到使用 CTC 損失函數進行模型訓練的完整工作流。對於想在特定方言或少數語言上實現高精度語音辨識（ASR）的開發者與研究人員，這是極具價值的實戰指南。
Vercel welcomes Rich Harris, creator of Svelte
Vercel Changelog1668d agoBusiness
前端部署平台 Vercel 宣布 Svelte 框架創始人 Rich Harris 正式加入團隊。Rich Harris 先前於《紐約時報》擔任圖表編輯，加入 Vercel 後將得以全職專注於 Svelte 及 SvelteKit 的開發與社群生態建設。此舉展現了 Vercel 支持多元開源前端框架、不限於 Next.js 的決心，旨在為開發者提供更優質的部署與開發體驗。
Scaling up BERT-like model Inference on modern CPU - Part 2
Hugging Face Blog1675d agoTutorial
本篇為 Hugging Face 與 Intel 合作的第二部分，深入探討在現代 CPU（如 Intel Xeon）上優化 BERT 推理的進階技術。文章重點介紹了 Intel Extension for PyTorch (IPEX)、INT8 量化以及 Bfloat16 混合精度運算。透過這些軟硬體協同優化與 NUMA 核心綁定，開發者能在不犧牲精度的前提下，獲得數倍的推理吞吐量提升。
Course Launch Community Event
Hugging Face Blog1684d agoRelease
本活動公告為 Hugging Face 於 2021 年 10 月舉辦的「課程發布社群活動」。該活動旨在慶祝 Hugging Face 官方 NLP 課程的推出，並透過社群黑客松、技術講座與交流，引導開發者與研究人員深入學習 Transformers、Datasets 和 Tokenizers 等開源工具，促進開源 AI 生態系的發展。
Large Language Models: A New Moore's Law?
Hugging Face Blog1684d agoOpinion
本文探討大型語言模型（LLM）參數規模以驚人速度增長的現象，並將其與「摩爾定律」相提並論。然而，這種「越大越好」的趨勢伴隨著極高的算力成本、碳排放以及技術壟斷風險。Hugging Face 呼籲社群關注模型民主化，並透過開源合作（如 BigScience 專案）與高效能技術（如蒸餾、量化）來打破巨頭壟斷，尋求更永續的 AI 發展路徑。
Train a Sentence Embedding Model with 1B Training Pairs★ 75
Hugging Face Blog1685d agoTutorial
Hugging Face 介紹了如何利用超過 10 億個句子對（Sentence Pairs）的大規模數據集，訓練出高效且精準的句子嵌入模型。文中詳細說明了數據集整合、對比學習（Contrastive Learning）的訓練方法，並釋出了包含 all-MiniLM-L6-v2 在內的多款熱門開源模型。這些模型至今仍是 RAG 和語意搜尋系統中非常經典且高效的基準選擇。
The Age of Machine Learning As Code Has Arrived
Hugging Face Blog1690d agoOpinion
Hugging Face 探討了機器學習從學術研究走向主流軟體工程的轉變。隨著 Hugging Face Hub 等平台的興起，模型、數據集和展示空間（Spaces）都開始採用類似 Git 的版本控制與協作模式。這意味著 AI 開發不再只是科學家的專利，而是轉向以「程式碼為中心」的開發者生態，讓軟體工程師能用幾行程式碼輕鬆整合強大模型。
Fine tuning CLIP with Remote Sensing (Satellite) images and captions
Hugging Face Blog1697d agoTutorial
本文探討如何針對遙測（衛星）影像微調 OpenAI 的 CLIP 多模態模型。由於通用 CLIP 在處理俯視、高空等特殊視角的衛星影像時表現不佳，研究團隊利用 RSICD 數據集與 JAX/Flax 框架進行微調。微調後的模型能顯著提升衛星影像的文本檢索與分類準確度，為地理資訊與遙測領域提供強大的開源工具。
Showcase Your Projects in Spaces using Gradio★ 75
Hugging Face Blog1705d agoRelease
Hugging Face 宣布在 Spaces 平台正式支援 Gradio，開發者現在可以輕鬆將機器學習模型轉化為具備美觀 UI 的互動式網頁應用。只需撰寫簡單的 Python 程式碼，即可將專案託管於 Spaces 並產生分享連結。這項整合大幅降低了 AI 專案展示的門檻，促進了開源社群的交流與模型體驗。
Hosting your Models and Datasets on Hugging Face Spaces using Streamlit★ 70
Hugging Face Blog1705d agoNew Tool
Hugging Face 宣布在其平台推出 Spaces 服務，並原生支援熱門的 Python 網頁框架 Streamlit。開發者只需撰寫簡單的 Python 程式碼，即可將 Hugging Face 上的模型與資料集轉化為具備互動介面的 Web 應用。透過 Git 工作流，開發者能輕鬆部署、分享並與社群共同協作，極大降低了 AI 專案展示的門檻。
Summer at Hugging Face
Hugging Face Blog1716d agoCommentary
Hugging Face 發表 2021 年夏季回顧，重點介紹其暑期實習生在多個前沿 AI 領域的貢獻。實習生們參與了包括 Wav2Vec2 語音模型優化、多模態模型開發、Datasets 庫擴充，以及與 Google 合作的 JAX/Flax 社群黑客松。這段期間也見證了 Hugging Face Spaces 的快速成長，為開源 AI 社群注入了強大動力。
At Next.js Conf 2021, let’s make the Web. Faster.
Vercel Changelog1720d agoRelease
Vercel 於 2021 年 9 月宣布 Next.js Conf 2021 的舉辦消息，主題定為「Let’s make the Web. Faster.」。大會旨在聚集全球開發者，共同探討如何優化網頁效能與開發者體驗。此活動隨後催生了 Next.js 12 的發布，引入了 Rust 編譯器等重大效能變革，是前端開發史上的重要里程碑。
Hugging Face and Graphcore partner for IPU-optimized Transformers
Hugging Face Blog1726d agoRelease
Hugging Face 宣布與 AI 晶片公司 Graphcore 建立合作夥伴關係，共同優化 Transformer 模型。雙方推出了開源庫 `optimum-graphcore`，使開發者能輕鬆將模型部署至 Graphcore 的智慧處理單元（IPU）上。此合作旨在降低硬體加速門檻，為開發者在 GPU 之外提供更高效、具成本效益的 AI 算力選擇。
Introducing Optimum: The Optimization Toolkit for Transformers at Scale★ 75
Hugging Face Blog1726d agoRelease
Hugging Face 宣布推出全新開源專案 Optimum，旨在簡化 Transformer 模型在特定硬體上的優化流程。透過與 Intel、Graphcore 等硬體夥伴合作，Optimum 提供模型量化、剪枝與圖優化等工具，讓開發者能輕鬆在各式加速器上實現最大化的生產線部署效率。
Projects can now be transferred to Personal Accounts
Vercel Changelog1759d agoRelease
Vercel 宣布支援將專案轉移至個人帳號（Personal Accounts）。此更新解決了過去專案只能往團隊帳號移轉或流程繁瑣的痛點，讓開發者能更彈性地調整專案歸屬，例如將不再需要團隊協作的專案移回個人空間，有效降低團隊席位成本並提升管理靈活性。
Deep Learning over the Internet: Training Language Models Collaboratively
Hugging Face Blog1787d agoRelease
本文介紹 Hugging Face 如何利用去中心化深度學習庫 `hivemind`，在網際網路上進行協作式模型訓練。透過分散式雜湊表（DHT）與容錯演算法，全球志願者能用自己的 GPU 共同訓練出孟加拉語模型 SahajBERT。這種方法打破了大型科技公司對大模型算力的壟斷，為開源社群提供了一條去中心化訓練的新路徑。
Welcome spaCy to the Hugging Face Hub
Hugging Face Blog1789d agoRelease
Hugging Face 宣佈將熱門的工業級自然語言處理（NLP）庫 spaCy 整合至 Hugging Face Hub。開發者現在可以使用全新推出的 `spacy-huggingface-hub` 工具，輕鬆將訓練好的 spaCy 管道模型上傳至 Hub 進行版本控制與分享。此外，Hub 還為 spaCy 模型提供了專屬的互動式瀏覽器測試介面（Widget），大幅提升了模型展示與協作的便利性。
Deploy Hugging Face models easily with Amazon SageMaker
Hugging Face Blog1794d agoRelease
Hugging Face 宣布與 AWS 深度整合，推出專屬的 SageMaker 深度學習容器（DLC）。開發者現在可以直接利用 SageMaker Python SDK，將 Hugging Face Hub 上的數萬個預訓練模型一鍵部署至託管的 SageMaker 端點。這項合作大幅簡化了 NLP 模型的正式生產環境部署流程，並兼顧了 AWS 的安全與彈性擴展優勢。

← PreviousPage 90Next →

Latest in AI

Active Learning with AutoNLP and Prodigy

Gradio is joining Hugging Face!★ 80

The future of Svelte, an interview with Rich Harris

Perceiver IO: a scalable, fully-attentional model that works on any modality★ 70

Supporting the Future of React

Vercel acquires Turborepo to accelerate build speed and improve developer experience

Training CodeParrot 🦜 from Scratch

Introducing Snowball Fight ☃️, our first ML-Agents environment

Getting Started with Hugging Face Transformers for IPUs with Optimum

Introducing the Data Measurements Tool: an Interactive Tool for Looking at Datasets

Announcing $150M to build the end-to-end platform for the modern Web

Accelerating PyTorch distributed fine-tuning with Intel technologies

Fine-Tune XLSR-Wav2Vec2 for low-resource ASR with 🤗 Transformers

Vercel welcomes Rich Harris, creator of Svelte

Scaling up BERT-like model Inference on modern CPU - Part 2

Course Launch Community Event

Large Language Models: A New Moore's Law?

Train a Sentence Embedding Model with 1B Training Pairs★ 75

The Age of Machine Learning As Code Has Arrived

Fine tuning CLIP with Remote Sensing (Satellite) images and captions

Showcase Your Projects in Spaces using Gradio★ 75

Hosting your Models and Datasets on Hugging Face Spaces using Streamlit★ 70

Summer at Hugging Face

At Next.js Conf 2021, let’s make the Web. Faster.

Hugging Face and Graphcore partner for IPU-optimized Transformers

Introducing Optimum: The Optimization Toolkit for Transformers at Scale★ 75

Projects can now be transferred to Personal Accounts

Deep Learning over the Internet: Training Language Models Collaboratively

Welcome spaCy to the Hugging Face Hub

Deploy Hugging Face models easily with Amazon SageMaker