Hugging Face BlogJun 6, 2025, 12:00 AM重要 80

ScreenSuite - The most comprehensive evaluation suite for GUI Agents!

Hugging Face 推出 ScreenSuite,專為 GUI 智慧代理(Agent)設計的全面性評估套件,支援跨平台與複雜任務測試。

Hugging Face 發表了 ScreenSuite,這是目前最全面的圖形使用者介面(GUI)Agent 評估套件。它解決了現有評估工具平台單一、任務簡單的問題,提供跨 Web、桌面與行動裝置的標準化測試環境。ScreenSuite 整合了多樣化的真實世界任務與嚴格的評估指標,幫助開發者精確衡量 Agent 的視覺導航與操作能力。

想看英文原文 / 完整內容?

前往 Hugging Face Blog 原文 →

摘要由 AI 整理,以原文為準。