本文介紹了 Hugging Face、Keras 與 Google TPU 團隊合作的最新實驗,旨在評估大語言模型(LLM)在被指出錯誤後的「自我糾錯」能力。實驗採用類似 Chatbot Arena 的雙盲測試,利用 Keras 的多後端優勢與 TPU 的強大算力,測試多款開源模型。結果顯示,多數模型在沒有外部具體反饋的情況下,自我糾錯能力仍有極大提升空間。
Hugging Face 與 Keras 團隊宣布 Llama 3.2 模型正式登陸 Keras 生態系。開發者現在可以透過 KerasNLP 輕鬆載入 Llama 3.2 的 1B 與 3B 輕量級模型。得益於 Keras 3 的多後端架構,使用者能自由切換 JAX、PyTorch 或 TensorFlow,並利用 LoRA 等技術進行高效微調與跨平台部署。
Hugging Face 闡述了其對 TensorFlow (TF) 的核心哲學:將 TF 視為一等公民,確保與 PyTorch 模型的雙向互操作性。透過將 TF 模型設計為 `tf.keras.Model` 的子類別,開發者能直接使用 Keras 的 `fit()` 等 API,並支援 XLA 編譯與 `tf.data`,為 TF 社群提供無縫且直覺的開發體驗。