Hugging Face BlogApr 15, 2024, 12:00 AM重要 80

Introducing Idefics2: A Powerful 8B Vision-Language Model for the community

Hugging Face 推出 8B 視覺語言模型 Idefics2,具備強大 OCR 與多圖理解能力,採 Apache 2.0 開源授權。

Hugging Face 正式發布 Idefics2,這是一款擁有 80 億參數的開源視覺語言模型(VLM)。它基於 Mistral-7B 與 SigLIP 構建,顯著提升了 OCR、圖表理解及多圖對話能力。Idefics2 支援原生解析度與長寬比,並以 Apache 2.0 授權釋出,極適合開發者進行微調與商業部署。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。