NVIDIA Nemotron-Labs 發表全新擴散語言模型(Diffusion Language Models),旨在解決傳統自迴歸模型逐字生成的效能瓶頸。 該技術利用類似影像生成的擴散機制,在文本生成中實現高度並行化,大幅提升推論速度。 此研究展示了非自迴歸模型在維持文本品質的同時,實現「光速般」超高吞吐量生成的新路徑。
第 20 期《Open Artifacts》開源週報帶來了多個全新組織與新型態開源模型的發布。 重點亮點包含 NVIDIA 的 Nemotron Super 系列、專注於印度語系的 Sarvam AI,以及 Cohere 推出的 Transcribe 語音轉寫相關模型。 這波釋出展示了開源生態系正朝向更多元、更具特定領域專業化(如多語言與語音)的方向快速演進。
NVIDIA 與 Hugging Face 合作介紹「開放評測標準」,展示如何利用 NeMo Evaluator 工具對輕量級模型 Nemotron 3 Nano 進行系統化基準測試。此指南提供了一套可重現的評測食譜(Recipe),幫助開發者在邊緣設備或資源受限環境中,精確評估小模型的性能與偏差,推動開源社群的評測透明度。