Hugging Face 發表全新工具「AI Sheets」,旨在降低數據集處理的門檻。使用者無需編寫複雜代碼,即可在類似 Excel 的試算表介面中導入數據,並調用 Hugging Face 上的開源 AI 模型進行批量文本分類、翻譯、情感分析或數據增強。這項工具結合了開源生態系的靈活性與直觀的無程式碼操作,大幅提升了數據準備與標記的效率。
隨著 RLHF 成為微調大模型的關鍵,高昂的人工標記成本成為瓶頸。研究顯示,基座模型(如 GPT-4)在許多文本分類與偏好標記任務上,已能達到甚至超越普通群眾外包人員的準確度,且成本僅為百分之一。然而,AI 標記仍存在自我偏好、字數偏見等系統性誤差,未來將走向 AI 輔助與人類協同的混合模式。
Snorkel AI 與 Hugging Face 宣布合作,旨在解決企業應用基礎模型(Foundation Models)時面臨的領域數據不足挑戰。透過將 Snorkel Flow 的程式化標註技術與 Hugging Face 的開源模型庫結合,企業能快速標註私有數據並進行模型微調。此方案不僅能加速企業級 AI 應用的開發,還能透過模型蒸餾技術降低推理成本,實現高效且安全的落地部署。