Latent Space interviews Biohub’s Alex Rives about ESMFold2 and the broader ESM protein modeling stack. The discussion centers on datasets versus inductive bias, and whether protein biology is entering its own Bitter Lesson era. The key implication is that large-scale evolutionary sequence data and open models may become foundations for structure prediction, interaction modeling, and programmable biology.
Hugging Face 發表 OpenMed 的最新成果,展示僅需 165 美元即可跨 25 個物種訓練 mRNA 語言模型。此研究證明了生物學基礎模型不一定需要天文數字的算力預算,透過優化架構與訓練策略,中小型實驗室與獨立研究員也能進行前沿的基因組學 AI 研究,為 mRNA 疫苗與藥物開發帶來新契機。
Hugging Face 宣布支援 DOI(數位物件識別碼),允許用戶為其託管的模型和資料集生成永久且可信賴的引用連結。此舉旨在解決機器學習領域中學術引用不規範與版本混亂的問題。研究人員現在可以一鍵生成 BibTeX 引用格式,大幅提升開源研究的可重複性與學術影響力追蹤。
隨著大型語言模型(LLM)體積急劇膨脹,如何公平且標準化地評估其性能成為一大挑戰。Hugging Face 宣布與 EleutherAI 合作,將其著名的 lm-evaluation-harness 整合至 Hugging Face Hub。用戶現在可以直接在 Hub 上對託管的模型進行零樣本(Zero-shot)與少樣本(Few-shot)評估,這不僅簡化了評估流程,更促進了開源 AI 社群的基準測試透明度與可重複性。
本文探討大型語言模型(LLM)參數規模以驚人速度增長的現象,並將其與「摩爾定律」相提並論。然而,這種「越大越好」的趨勢伴隨著極高的算力成本、碳排放以及技術壟斷風險。Hugging Face 呼籲社群關注模型民主化,並透過開源合作(如 BigScience 專案)與高效能技術(如蒸餾、量化)來打破巨頭壟斷,尋求更永續的 AI 發展路徑。