Hugging Face BlogJul 23, 2025, 12:00 AM重要 75
TimeScope: How Long Can Your Video Large Multimodal Model Go?
Hugging Face 推出 TimeScope 基準測試,專門評估影片多模態模型(Video LMM)在長影片中的時間推理與長上下文理解極限。
Hugging Face 介紹了全新的影片多模態基準測試「TimeScope」,旨在評估 Video LMM 處理長影片的能力。現有基準多侷限於短影片,而 TimeScope 挑戰模型在長時段影片中的時間推理、事件排序與資訊檢索。測試結果顯示,多數現行模型在影片長度增加時,理解與推理能力會顯著下降,揭示了現有技術的瓶頸。
想看英文原文 / 完整內容?
前往 Hugging Face Blog 原文 →摘要由 AI 整理,以原文為準。