Hugging Face 宣布將著名的 PyTorch 圖像模型庫 `timm` 與 `transformers` 進行深度整合。現在開發者可以直接使用 `AutoModel` 和 `AutoImageProcessor` 等標準 API,輕鬆載入並使用 `timm` 中的數千個電腦視覺模型。這項更新不僅簡化了工作流程,還讓 `timm` 模型能完美融入 Hugging Face 的生態系,包括 Trainer、Pipelines 以及各類部署工具。
本文為 Hugging Face 官方發布的電腦視覺(CV)生態總覽。隨著 Transformers 庫對視覺模型的支援、與 Timm 庫的深度整合,以及 Diffusers 在生成式 AI 的爆發,Hugging Face 已從 NLP 平台轉型為全方位的 AI 社群。文章詳細介紹了影像分類、目標檢測、語義分割等任務的支援現狀,並展示了如何利用其工具鏈進行高效開發。