Hugging Face BlogDec 11, 2023, 12:00 AM重要 90

Welcome Mixtral - a SOTA Mixture of Experts on Hugging Face

Mistral AI 推出開源 MoE 模型 Mixtral 8x7B,性能超越 Llama 2 70B,Hugging Face 已全面支援。

Mistral AI 發表全新混合專家(MoE)模型 Mixtral 8x7B,總參數 46.7B 但每次 token 僅啟用 12.9B,速度極快。其在多項基準測試中超越 Llama 2 70B 及 GPT-3.5,並支援 32k 脈絡長度。Hugging Face 已於 Transformers、TGI 及推理終端全面整合,並採 Apache 2.0 開源授權。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。