Google DeepMind 發表 AlphaEvolve 的最新進展。這款由 Gemini 驅動的程式碼 Agent(Coding Agent)透過先進的演算法,在商業營運、基礎設施優化以及科學研究三大領域展現強大影響力。它不僅能自動化編寫程式,更能自我演化以適應複雜的跨領域需求,加速技術落地。
Vercel 提出「評估驅動開發(EDD)」概念,解決 AI 輸出不確定性帶來的測試難題。 EDD 類似於軟體工程的測試驅動開發(TDD),強調在調整提示詞或模型前先建立評估數據集。 透過自動化評估(如 LLM-as-a-judge),開發者能更具信心且快速地優化 AI 產品,避免改動導致效能倒退。
Hugging Face 探討了其開源庫 Transformers 的核心設計哲學。與傳統軟體工程極力避免重複程式碼(DRY 原則)不同,他們選擇了「重複自己」的「單一檔案政策」(Single-file policy)。這種設計讓每個模型(如 BERT、GPT)的程式碼都獨立完整,極大地提升了機器學習研究者的閱讀與修改效率,雖然增加了維護重複程式碼的成本,但換來了極高的靈活性。
Hugging Face 探討了機器學習從學術研究走向主流軟體工程的轉變。隨著 Hugging Face Hub 等平台的興起,模型、數據集和展示空間(Spaces)都開始採用類似 Git 的版本控制與協作模式。這意味著 AI 開發不再只是科學家的專利,而是轉向以「程式碼為中心」的開發者生態,讓軟體工程師能用幾行程式碼輕鬆整合強大模型。