Hugging Face BlogMar 4, 2025, 12:00 AM重要 75

A Deepdive into Aya Vision: Advancing the Frontier of Multilingual Multimodality

Cohere For AI 推出 Aya Vision 多語言多模態模型,顯著提升非英語系的圖像理解與語言生成能力。

Cohere For AI 發表全新開源多語言多模態模型「Aya Vision」(提供 8B 與 32B 版本)。該模型旨在解決現有視覺語言模型(VLM)嚴重偏向英語的問題,大幅提升了對全球多種語言(特別是低資源語言)的圖像理解與文字生成能力。在多項多語言多模態基準測試中,Aya Vision 展現出超越同量級開源模型的優異性能,並已於 Hugging Face 平台上開源。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。