A new study describes “Negation Neglect,” where LLMs fine-tuned on documents that explicitly mark claims as false still learn the claims as true. Experiments with fabricated statements found models often absorb entity-event associations more strongly than surrounding warnings or negations. The finding raises concerns for fine-tuning pipelines, misinformation handling, and AI safety datasets that include harmful or false content with disclaimers.
許多企業在採購 AI 時,往往盲目追求參數規模最大、最通用的前沿模型,卻忽略了「專業化」的威力。本文指出,透過針對特定領域或任務進行微調的專用模型,不僅在特定工作流中的表現能媲美甚至超越通用巨型模型,還能大幅降低推理成本與延遲。企業在做 AI 決策時,應將「任務專業化」視為核心評估變數,而非單純比較模型規模。
在一個相對平靜的新聞日,Latent Space 帶領讀者反思「微調(Fine-tuning)的終結」這一命題。 隨著長上下文視窗、高效 RAG 以及上下文內學習(In-context Learning)的成熟,許多原本需要微調的場景已被取代。 未來微調可能退化為僅用於調整輸出格式、風格或進行模型蒸餾的工具,而非首選的知識注入手段。
Hugging Face 發布最新指南,展示如何利用 Sentence Transformers 框架進行多模態嵌入與 Reranker 模型的訓練與微調。此更新簡化了將文字與影像對齊至同一向量空間的流程,並支援雙塔(Bi-Encoder)與交叉編碼器(Cross-Encoder)架構。這對於建構多模態 RAG(檢索增強生成)系統與跨模態搜尋引擎的開發者來說,提供了極低門檻的實作路徑。
Hugging Face 旗下熱門的 Transformer 強化學習庫 TRL 正式迎來 v1.0 版本。此版本確立了穩定的 API 設計,並將定位聚焦於「後訓練(Post-Training)」生態系。TRL v1.0 整合了監督微調(SFT)、直接偏好優化(DPO)以及因 DeepSeek 爆紅的群體相對策略優化(GRPO)等主流對齊技術,旨在為開發者提供一個能與快速變革的 AI 領域並肩同行的標準化工具。
本指南展示如何利用 Hugging Face 的 sentence-transformers 庫與 NVIDIA 的 GPU 加速技術,在一天內構建專屬領域的向量嵌入(Embedding)模型。內容涵蓋利用 LLM 生成合成數據、選擇基底模型、使用對比學習(Contrastive Learning)進行微調,以及如何評估與部署。這套流程能有效解決通用模型在特定專業領域(如醫療、法律、金融)檢索率不佳的問題,是優化 RAG 系統的關鍵步驟。
Hugging Face 宣布與極速微調工具 Unsloth 合作,推出免費的 AI 模型訓練方案。使用者可以透過 Hugging Face Jobs 平台,直接在雲端免費運行 Unsloth 的高效微調任務。這項合作大幅降低了個人開發者與研究人員微調 Llama 3、Gemma 等開源大模型的門檻與成本。
Hugging Face 發表最新「Upskill」專案,展示如何利用 Claude 3.5 等強大商用模型生成複雜的 CUDA 核心(Kernel)程式碼與測試案例。透過這套包含編譯與效能驗證的自動化管線,他們篩選出高品質的合成數據,並成功用來微調開源模型,大幅提升開源社群在極具挑戰性的 GPU 硬體加速編程任務上的表現。
Hugging Face 分享了如何利用 Anthropic 的 Claude 模型(作為 AI Agent)來自動微調開源大語言模型。透過整合 Hugging Face 的生態系工具(如 AutoTrain),Claude 能夠自主處理數據集清洗、撰寫訓練腳本、調整超參數並執行微調。這項實驗展示了 Agent 在機器學習工程(MLE)自動化中的巨大潛力,讓模型訓練變得更加平民化。
Hugging Face 宣布與 RapidFire AI 合作,在 TRL(Transformer Reinforcement Learning)庫中實現高達 20 倍的微調加速。TRL 是用於 LLM 對齊(如 DPO、PPO)的核心工具,此次整合透過最佳化訓練流程與算子,顯著降低了強化學習微調的時間與算力成本,讓開發者能更高效地進行模型對齊。
ServiceNow AI 在 Hugging Face 發表了全新開源框架「SyGra」,旨在解決 LLM 與 SLM 訓練中高質量資料不足與成本高昂的痛點。該框架提供一站式的合成資料生成方案,結合了結構化控制與生成模型的優勢,能產生高多樣性、高精確度的訓練樣本。這對於需要微調特定領域小模型(SLM)的開發者與研究人員來說,是一個極具價值的工具。
Hugging Face 宣布與 Together AI 深度整合,推出全新微調解決方案。開發者現在可以直接從 Hugging Face Hub 選擇任何開源大語言模型,並利用 Together AI 的高效能 GPU 叢集與微調 API 進行訓練。此合作大幅簡化了微調的工作流程,免去繁瑣的硬體設定,並提供極具成本效益的無伺服器微調體驗。
Hugging Face 發表 Jupyter Agents 研究,專注於訓練大型語言模型(LLM)在 Jupyter Notebook 環境中進行推理。透過整合程式碼執行反饋(REPL),模型能像人類資料科學家一樣,一邊執行程式碼、一邊根據錯誤訊息進行自我修正。此方法顯著提升了開源模型在數學、科學及程式設計等複雜任務上的表現。
Hugging Face 旗下的 TRL(Transformer Reinforcement Learning)套件迎來重大更新,正式支援視覺語言模型(VLM)的對齊訓練。開發者現在可以直接使用 DPOTrainer 或 ORPOTrainer 來處理包含圖像與文字的偏好資料集。此更新簡化了 LLaVA、PaliGemma 等主流多模態模型的微調流程,並支援 QLoRA 與 DeepSpeed 等顯存優化技術,大幅降低了 VLM 對齊的門檻。
Hugging Face 釋出最新指南,介紹如何利用 Sentence Transformers 庫訓練與微調稀疏嵌入(Sparse Embedding)模型。稀疏嵌入(如 SPLADE)能將文本轉化為高維稀疏向量,在保留關鍵字匹配能力的同時具備語意理解力。此更新簡化了訓練流程,讓開發者能輕鬆構建適用於混合檢索(Hybrid Search)的高效檢索系統。
Google 最新推出的 Gemma 3n 模型系列已正式在 Hugging Face 開源社群全面上線。此版本針對端側部署(On-device)與高效能推論進行優化,Hugging Face 生態系已提供完整支援。開發者現在可以無縫使用 Transformers、vLLM、TRL 等工具進行部署、推論與微調,為輕量級與邊緣運算 AI 應用提供了全新的強大選擇。
本文介紹如何在消費級硬體(如 RTX 3090/4090)上微調 Black Forest Labs 的 FLUX.1-dev 12B 圖像生成模型。透過 Hugging Face 的 PEFT 與 Diffusers 庫,結合 4-bit QLoRA 量化、梯度檢查點與 8-bit 優化器,開發者能將顯存需求降至 24GB 以下,讓個人創作者也能輕鬆客製化頂級開源圖像模型。
Hugging Face 宣布與 Featherless AI 合作,將其納入官方推理供應商(Inference Providers)名單。Featherless 專注於無冷啟動的無伺服器(Serverless)推理技術,能高效運行數千種開源與微調模型。開發者現在可以直接在 Hugging Face Hub 上,透過 Featherless 的高效能架構一鍵部署與調用各種利基型模型,大幅降低延遲與維運成本。
本指南介紹如何結合 NVIDIA 的 Isaac GR00T N1.5 機器人基礎模型與 Hugging Face 的開源機器人平台 LeRobot。 透過後訓練(Post-Training)與微調技術,開發者能讓強大的 GR00T 模型適配低成本、開源的 SO-101 五軸機械手臂。 此合作降低了具身智能(Embodied AI)的開發門檻,展示了從模擬到真實世界(Sim-to-Real)的高效轉移路徑。
Hugging Face 宣布與 NVIDIA 合作推出「訓練集群即服務」(Training Cluster as a Service)。這項新服務旨在簡化大規模 AI 模型的訓練流程,讓企業與開發者無需處理繁雜的基礎設施設定,即可直接在 Hugging Face 平台上租用由 NVIDIA 技術支援的高效能 GPU 運算集群,快速進行模型微調與訓練。
Hugging Face 的 TRL 團隊推出與 vLLM 協同部署(Co-located)的新功能。在進行線上強化學習(如 PPO、GRPO)訓練時,生成階段常是效能瓶頸。透過在相同 GPU 上同時運行訓練與 vLLM 推理引擎,此技術能無縫共享權重並利用 vLLM 的高效生成能力,顯著提升 GPU 利用率並縮短整體訓練時間。
Hugging Face 的 TRL 團隊宣布與 LinkedIn 開源的 Liger Kernel 整合。此合作針對當前熱門的 GRPO(群體相對策略優化)演算法進行深度優化,能顯著降低訓練時的 GPU 顯存佔用並提升吞吐量。這讓開發者在訓練類似 DeepSeek-R1 的推理模型時,能用更低的硬體門檻實現更高效的強化學習微調。
Hugging Face 發表了 nanoVLM 專案,旨在提供一個最簡單、無冗餘程式碼的純 PyTorch 框架,讓開發者與研究人員能輕鬆理解並動手訓練自己的視覺語言模型(VLM)。該專案仿照 nanoGPT 的極簡風格,去除了複雜的封裝,完整展示了從圖像編碼器、投影層到語言模型的整合與訓練流程,是學習與實驗 VLM 的絕佳起點。
阿聯酋技術創新研究所(TII)發表 Falcon-Edge 系列模型,採用 1.58-bit(三進制)權重技術。該系列模型不僅體積小、運算速度快且功耗極低,非常適合在手機與筆電等邊緣設備上運行,同時還支援高效的微調,打破了以往極低位元模型難以微調的限制,為本地端 AI 應用帶來全新可能。
Allen AI 推出的 olmOCR 是基於視覺語言模型(VLM)的強大 PDF 轉 Markdown 工具,但在面對嚴謹業務時仍有幻覺或漏字風險。TNG Technology Consulting 分享了他們如何透過精心設計的資料集與微調技術,顯著提升 olmOCR 的「忠實度(Faithfulness)」。微調後的模型能更精準地辨識複雜排版、表格與公式,並大幅降低文字篡改與遺漏,為企業級 OCR 應用提供可靠的開源解決方案。
Hugging Face 宣布將其廣受歡迎的經典「NLP 課程(NLP Course)」正式轉型並升級為「LLM 課程(LLM Course)」。這項轉變反映了 AI 領域從傳統 NLP(如 BERT、分類與命名實體識別)向大語言模型(如 Llama、生成式 AI、RAG 與 Agent)的典範轉移。新課程將全面更新,涵蓋現代 LLM 架構、微調(PEFT/LoRA)、對齊(RLHF/DPO)及應用開發,繼續提供免費且高品質的開源學習資源。
Hugging Face 釋出全新教學,詳細介紹如何利用 Sentence Transformers 庫訓練與微調 Reranker(重排)模型。Reranker 在 RAG 系統中扮演關鍵角色,能對初步檢索的文檔進行二次精準排序。本文涵蓋資料準備、損失函數選擇、訓練流程及評估方法,幫助開發者針對特定領域優化檢索效果。
Hugging Face 發表開源推理模型專案 Open R1 的第三次技術更新。本次更新重點在於釋出基於 Qwen/Llama 的全新推理模型,並詳細公開了使用 TRL 進行 GRPO(群體相對策略優化)的訓練細節。團隊成功解決了訓練中的「獎勵黑客」問題,並開源了完整的訓練數據集與配方,顯著降低了社群重現 DeepSeek-R1 推理能力的門檻。
Hugging Face 發表全新開源工具包 vid_ds_scripts,解決影片生成模型(如 LTX-Video、HunyuanVideo)訓練資料準備的痛點。該工具包提供一站式解決方案,涵蓋影片下載、PySceneDetect 場景分割、VLM 自動生成詳細描述,以及資料過濾與格式化。這大幅降低了開發者構建高品質「影片-文字對」資料集的門檻,加速開源影片生成技術的微調與研發。
本文為 Hugging Face 釋出的實用指南,詳細介紹如何在 AWS 環境中部署與微調熱門的 DeepSeek-R1 及其蒸餾(Distilled)模型。內容涵蓋使用 Hugging Face LLM DLC(深度學習容器)與 TGI 技術在 Amazon SageMaker 上進行低延遲推論部署,以及如何透過 SageMaker 訓練作業與 Hugging Face TRL 庫進行高效微調(如 LoRA),並提供針對不同模型大小的 AWS 硬體配置建議。