本文為 Hugging Face「機器學習專家」系列訪談,主角為《Natural Language Processing with Transformers》共同作者 Lewis Tunstall。他分享了自己如何從理論物理學博士轉型為 AI 專家,並深入探討了撰寫該本暢銷書的挑戰、在 Hugging Face 推動開源生態系的經驗,以及他對未來 NLP 技術發展與新手學習路徑的實用建議。
Hugging Face 探討了其開源庫 Transformers 的核心設計哲學。與傳統軟體工程極力避免重複程式碼(DRY 原則)不同,他們選擇了「重複自己」的「單一檔案政策」(Single-file policy)。這種設計讓每個模型(如 BERT、GPT)的程式碼都獨立完整,極大地提升了機器學習研究者的閱讀與修改效率,雖然增加了維護重複程式碼的成本,但換來了極高的靈活性。
本篇專訪介紹了 Hugging Face 首席倫理科學家 Margaret Mitchell 的學術背景與願景。作為「模型卡(Model Cards)」的共同倡議者,她分享了從 Google 到 Hugging Face 的心路歷程。她強調在開源社群中建立 AI 倫理工具的重要性,並探討如何透過透明度與多樣性來減少機器學習模型中的偏見與危害。
Hugging Face 宣布啟動「AI 研究駐點計畫」,旨在打破傳統學術界限,邀請不同背景的研究員與工程師加入團隊。參與者將獲得豐富的算力資源、資深研究員的導師指導,並有機會發表學術論文。此計畫強調開源精神與遠端協作,致力於推動 AI 技術的民主化。
Hugging Face 推出全新升級的 Hub 搜尋功能,大幅提升資源檢索效率。用戶現在可以透過機器學習任務、支援的庫(如 PyTorch、TensorFlow)、語言及授權條款等多重條件進行精確篩選。此更新旨在幫助開發者在快速增長的開源生態系中,迅速定位最適合的 AI 模型、數據集與 Spaces。
Hugging Face 宣布將熱門的 PyTorch 強化學習庫 Stable-baselines3 (SB3) 整合至 Hugging Face Hub。開發者現在可以使用簡單的 API 儲存和載入訓練好的 RL 代理人(Agents),並在社群中分享。此整合還支援在瀏覽器中直接預覽代理人的運行畫面,大幅降低了強化學習模型的分享與協作門檻。
開源機器學習互動介面庫 Gradio 宣布正式加入 Hugging Face。此次合併旨在加速機器學習的民主化,讓開發者能更輕鬆地為模型建立直觀的 Web 介面。Gradio 將保持開源與免費,並與 Hugging Face Spaces 深度整合,讓任何人都能在幾分鐘內部署並分享自己的 AI 模型 Demo。
前端部署平台 Vercel 宣布 Svelte 框架創始人 Rich Harris 正式加入團隊。Rich Harris 先前於《紐約時報》擔任圖表編輯,加入 Vercel 後將得以全職專注於 Svelte 及 SvelteKit 的開發與社群生態建設。此舉展現了 Vercel 支持多元開源前端框架、不限於 Next.js 的決心,旨在為開發者提供更優質的部署與開發體驗。
Hugging Face 探討了機器學習從學術研究走向主流軟體工程的轉變。隨著 Hugging Face Hub 等平台的興起,模型、數據集和展示空間(Spaces)都開始採用類似 Git 的版本控制與協作模式。這意味著 AI 開發不再只是科學家的專利,而是轉向以「程式碼為中心」的開發者生態,讓軟體工程師能用幾行程式碼輕鬆整合強大模型。
Hugging Face 宣布在 Spaces 平台正式支援 Gradio,開發者現在可以輕鬆將機器學習模型轉化為具備美觀 UI 的互動式網頁應用。只需撰寫簡單的 Python 程式碼,即可將專案託管於 Spaces 並產生分享連結。這項整合大幅降低了 AI 專案展示的門檻,促進了開源社群的交流與模型體驗。
Hugging Face 宣布在其平台推出 Spaces 服務,並原生支援熱門的 Python 網頁框架 Streamlit。開發者只需撰寫簡單的 Python 程式碼,即可將 Hugging Face 上的模型與資料集轉化為具備互動介面的 Web 應用。透過 Git 工作流,開發者能輕鬆部署、分享並與社群共同協作,極大降低了 AI 專案展示的門檻。
Hugging Face 發表 2021 年夏季回顧,重點介紹其暑期實習生在多個前沿 AI 領域的貢獻。實習生們參與了包括 Wav2Vec2 語音模型優化、多模態模型開發、Datasets 庫擴充,以及與 Google 合作的 JAX/Flax 社群黑客松。這段期間也見證了 Hugging Face Spaces 的快速成長,為開源 AI 社群注入了強大動力。
本文介紹 Hugging Face 如何利用去中心化深度學習庫 `hivemind`,在網際網路上進行協作式模型訓練。透過分散式雜湊表(DHT)與容錯演算法,全球志願者能用自己的 GPU 共同訓練出孟加拉語模型 SahajBERT。這種方法打破了大型科技公司對大模型算力的壟斷,為開源社群提供了一條去中心化訓練的新路徑。
Hugging Face 宣佈將熱門的工業級自然語言處理(NLP)庫 spaCy 整合至 Hugging Face Hub。開發者現在可以使用全新推出的 `spacy-huggingface-hub` 工具,輕鬆將訓練好的 spaCy 管道模型上傳至 Hub 進行版本控制與分享。此外,Hub 還為 spaCy 模型提供了專屬的互動式瀏覽器測試介面(Widget),大幅提升了模型展示與協作的便利性。
Hugging Face 推出全新開源庫 Accelerate,旨在簡化 PyTorch 的分佈式訓練流程。開發者無需手動處理複雜的設備分配、混合精度(FP16)縮放或分佈式啟動指令。只需使用 Accelerator 類別包裝模型與數據,即可在單機、多 GPU 或 TPU 環境下直接運行相同的代碼,極大提升開發與部署效率。
本文介紹 Hugging Face 將 Facebook AI (FAIR) 的 Fairseq WMT19 機器翻譯系統移植至 `transformers` 程式庫(FSMT)的過程。WMT19 模型在英德、英俄翻譯中表現極佳,但過去需依賴複雜的 `fairseq` 框架。移植後,開發者只需幾行程式碼即可調用這些強大的翻譯模型,大幅降低了學術與工業界的部署難度。
Vercel 宣布推出全新的「Deploy Button」功能。開發者現在可以在 GitHub README 或網站中嵌入此按鈕,讀者只需點擊一下,即可將該開源專案或模板自動複製並部署至 Vercel。此功能支援自動偵測框架與設定,極大地降低了體驗新技術與開源專案的門檻。