Google DeepMind 宣布推出一套用於衡量通用人工智慧(AGI)進展的「認知框架」,旨在解決傳統靜態基準測試容易因數據污染而失效的問題。該框架專注於評估系統的底層認知能力(如推理、規劃與學習)。同時,DeepMind 也在 Kaggle 上啟動了黑客松,邀請全球開發者與研究人員共同設計更具韌性、能真實反映 AGI 進程的評估工具。
Hugging Face 與 Kaggle 展開全新整合,優化數據科學家在 Kaggle 環境中調用模型的體驗。此更新簡化了身份驗證流程,讓用戶能更輕鬆地存取受限模型(如 Llama 或 Gemma),並提升了模型下載速度與工作流順暢度,讓開發者能更專注於模型微調與競賽。