Hugging Face 與 Kaggle 展開全新整合,優化數據科學家在 Kaggle 環境中調用模型的體驗。此更新簡化了身份驗證流程,讓用戶能更輕鬆地存取受限模型(如 Llama 或 Gemma),並提升了模型下載速度與工作流順暢度,讓開發者能更專注於模型微調與競賽。
Hugging Face 推出全新基準測試「DABStep」,旨在評估 AI 數據代理(Data Agent)執行多步驟推理的能力。DABStep 模擬了真實世界的複雜數據分析場景,要求 AI 規劃步驟、撰寫並執行程式碼、處理多種數據格式,並進行錯誤修正。此基準測試為開發更實用、更具規劃能力的數據分析 AI 助手提供了客觀的評估標準。