Hugging Face has published a comprehensive glossary of AI agent terminology to resolve industry-wide confusion. The guide focuses on defining critical concepts such as "scaffold" (the code wrapping the LLM) and "harness" (the evaluation and execution environment). This standardization helps developers and researchers communicate more precisely when building and benchmarking agentic systems.
Datasette 1.0a30 has been released, featuring a new customizable "Jump to..." menu accessible via the "/" shortcut. The menu allows users to quickly filter and navigate to databases, tables, and debug options. Developers can extend this menu with custom items using the new jump_items_sql() plugin hook.
Simon Willison released datasette-agent 0.1a4, leveraging the new makeJumpSections() JS plugin hook in Datasette 1.0a30. Users can now press "/" from any page to open the "Jump to" menu and instantly access a "Start a new agent chat" input box. This update streamlines database interactions, allowing users to trigger agent-led data analysis seamlessly.
As AI adoption accelerates, organizations worldwide—including Google—are finding themselves in a transitional phase, forced to address AI security vulnerabilities in real time. Traditional cybersecurity frameworks are proving insufficient against novel threats like prompt injection and model poisoning. This shifting landscape requires continuous adaptation and a fundamental rethink of how AI systems are secured.
As AI chatbots adopt increasingly sophisticated personas, hackers are shifting from basic prompt injections to social engineering attacks targeting these "personalities." Researchers warn that manipulating a chatbot's defined role (e.g., customer service or empathetic companion) makes it easier to bypass safety guardrails. This evolution poses a significant threat to agentic AI workflows that rely on consistent role-playing and external data integration.
本文探討 Elon Musk 過去承諾的「太陽能電力經濟」願景破滅。其 AI 公司 xAI 目前已全力轉向使用天然氣來滿足龐大的能源需求,而航太公司 SpaceX 則將重心轉移至軌道數據中心的開發。這項重大的策略轉變,反映出在 AI 算力競賽與太空科技發展下,傳統地球太陽能發電已無法滿足其當前的商業與技術野心。
Google 發表了全新的「任意對任意(anything-to-anything)」AI 模型 Gemini Omni。外媒記者實測將其用於將小孩的毛絨鹿玩具「Buddy」合成到各種度假場景中,發現其生成效果極其逼真且操作簡單。這款模型不僅展現了強大的多模態影片生成與編輯能力,同時也再度引發了關於深偽(Deepfake)技術門檻降低與倫理界線的討論。
繼 AMD 董事長暨執行長蘇姿丰的台灣行程告一段落後,NVIDIA 執行長黃仁勳於今日再度抵達台灣。他下飛機後首站便直奔南港,參與 Meet-a-Claw 開發者大會並發表專題演講,再度引發台灣科技界與開發者社群的高度關注。
AI 新創公司 Anthropic 傳出營收迎來爆發性成長,目前正進行新一輪融資,估值直逼 1 兆美元,有望超越 OpenAI 成為全球最貴的 AI 新創。據悉,包含矽谷創投巨頭 Peter Thiel 旗下的 Founders Fund 以及 General Catalyst 等既有投資人均計劃參與此次投資,顯示市場對其技術與商業化前景的高度信心。
SpaceX 成功進行了星艦(Starship)V3 的最新試射,太空船不僅成功於印度洋完成濺落,更在飛行過程中順利部署了模擬衛星,以及兩顆配備攝影機、專門用於分析隔熱罩安全性的改裝星鏈(Starlink)衛星。然而,超重型推進器在返航回收階段不幸失利,為本次任務留下些許遺憾。由於此時正值馬斯克籌備相關業務 IPO 的關鍵前夕,本次試射結果備受市場與投資人矚目。
本期 Latent Space 探討了 AI 產業的重大範式轉移:各大頂尖模型實驗室已不再單純追求基礎 LLM 的參數規模,而是全面轉向「Agent(智慧代理)」的開發。隨著純模型微調的邊際效應遞減,透過讓 AI 具備操作電腦、自主規劃與執行多步驟任務的能力,已成為當前競逐的新戰場。
NVIDIA Nemotron-Labs 發表全新擴散語言模型(Diffusion Language Models),旨在解決傳統自迴歸模型逐字生成的效能瓶頸。 該技術利用類似影像生成的擴散機制,在文本生成中實現高度並行化,大幅提升推論速度。 此研究展示了非自迴歸模型在維持文本品質的同時,實現「光速般」超高吞吐量生成的新路徑。
近期有民眾利用 AI 技術,將美國國家運輸安全委員會(NTSB)公開的駕駛艙錄音「聲學頻譜圖(Spectrogram)」影像,成功逆向還原出已故飛行員的生前語音。由於駕駛艙語音記錄(CVR)涉及高度隱私,過去僅公開文字逐字稿,如今 AI 的還原能力打破了這項保護機制。為防止隱私進一步洩漏,NTSB 已緊急暫時關閉其公開案件卷宗系統。
Simon Willison revisited pydantic-monty, a sandboxed subset of Python implemented in Rust. He asked Claude Code to inspect the most recent release, following his earlier exploration a few months ago. The key finding is that limits for execution duration, memory, allocations, and recursion depth all appear to behave as advertised.
Google 的 AI Overviews 搜尋功能近日被發現一項有趣的漏洞。當用戶在 Google 搜尋輸入「disregard」(忽略)時,AI 搜尋並非提供該單字的定義,而是將其誤判為「忽略先前指令」的系統提示詞(Prompt Injection)。這導致 AI 輸出類似傳統聊天機器人重設後的罐頭回覆,暴露出 Google 在區分「用戶查詢內容」與「系統控制指令」上仍有架構上的缺陷。
美國國家運輸安全委員會(NTSB)依法不得公開空難調查中的駕駛艙語音記錄(CVR)音檔,以保護隱私。然而,近期有網路用戶利用公開的調查文字紀錄與 AI 語音複製技術,重新模擬並還原了罹難飛行員在墜機前的最後對話。此舉引發了嚴重的倫理與法律爭議,美國當局正緊急尋求對策,以阻止這種利用技術漏洞規避法律限制的行為。
SpaceX 終於正式提交了 S-1 招股書,揭露了這家太空巨頭的宏大野心。招股書中列出了高達 36 頁的風險因素,並估計其整體潛在市場(TAM)高達 28 兆美元。最引人注目的是,Elon Musk 的薪酬方案將與「建立火星殖民地」直接掛鉤。這場目標估值達 1.75 兆美元的上市案,預計將成為美國歷史上規模最大的 IPO。
SpaceX 正式遞交 S-1 招股書,揭露其龐大的商業野心。招股書中列出高達 36 頁的風險因素,並估計整體潛在市場(TAM)高達 28 兆美元。最引人注目的是,Elon Musk 的薪酬方案將直接與「建立火星殖民地」掛鉤。這場目標估值 1.75 兆美元的上市案,將成為美國歷史上規模最大的 IPO。
根據外媒報導,美國總統川普突然取消了一項關於 AI 安全測試行政命令(EO)的簽署儀式。起因是多家頂尖 AI 公司的執行長拒絕出席該活動。在遭到科技界冷落後,川普隨後延遲了該行政命令的發布,並改口宣稱這項安全測試規範將會成為 AI 技術發展的「創新阻礙」。此舉反映出政府監管政策與科技巨頭之間的緊張關係。
Google 搜尋在進行 AI 相關更新後,被發現存在一個嚴重的介面錯誤:只要使用者輸入「disregard」(意為忽略)這個單字進行搜尋,整個搜尋介面就會直接崩潰。這項問題疑似與 Google 為了防止 AI 遭遇「提示詞注入」(Prompt Injection)攻擊而設定的過度防禦機制有關。目前該單字已無法正常進行 Google 搜尋。
許多企業在採購 AI 時,往往盲目追求參數規模最大、最通用的前沿模型,卻忽略了「專業化」的威力。本文指出,透過針對特定領域或任務進行微調的專用模型,不僅在特定工作流中的表現能媲美甚至超越通用巨型模型,還能大幅降低推理成本與延遲。企業在做 AI 決策時,應將「任務專業化」視為核心評估變數,而非單純比較模型規模。
SpaceX 正式遞交 S-1 上市招股書,揭露其龐大野心。文件中包含長達 36 頁的風險因素,並估計其潛在市場規模(TAM)高達 28 兆美元。此外,其高層薪酬方案甚至與建立火星殖民地直接掛鉤,這場美國歷史上規模最大的 IPO 將考驗投資人對其太空宏圖的信心。
作家 Steven Rosenbaum 在撰寫新書《The Future of Truth》時使用 AI 輔助,卻發現書中出現了 AI 虛構的「合成引言」(synthetic quotes)。儘管面臨內容失真的批評,Rosenbaum 解釋了這些錯誤是如何發生的,並堅稱他不會放棄 AI,而是主張創作者應學會與 AI 共存並改進協作流程。
三星電子與其半導體部門員工達成一項初步協議,成功化解了迫在眉睫的 18 天罷工危機。根據協議細節,部分員工今年將有資格獲得平均高達 34 萬美元(約合新台幣 1100 萬元)的年度獎金。此次爭議的核心在於半導體部門的獎金上限制度,而隨著 AI 浪潮帶動記憶體晶片需求與利潤暴增,員工積極爭取與獲利相匹配的報酬。
美國政府根據《晶片法案》宣布一項高達 20 億美元的投資計畫,注資 9 家本土量子運算企業。其中 IBM 獲得半數資金(10 億美元),將用於打造美國首座量子晶片代工廠。此舉旨在強化美國在量子技術供應鏈的自主性,並在與中國的科技競爭中保持絕對的技術領先優勢。
AMD 執行長蘇姿丰表示,AI 應用正從訓練快速轉向推論階段,帶動 CPU 需求急遽上升。過去半年至一年內少有人提及的 CPU 短缺問題,自去年底起已出現明顯供需轉變。她預期 CPU 市場將迎來年增 35% 的成長,且硬體架構很快將轉變為 CPU 與 GPU 比例趨近「1:1」的新格局。
台灣廠商寰宇宏科技與旭春宣布成功合作開發出國產「電動輔助轉向系統(EPS)」平台。此項在地化的智慧底盤方案,不僅成功突破了長期以來由海外大廠壟斷的關鍵技術,更全面支援商用車的自動駕駛需求。這項合作有助於台灣本土產業掌握智慧車輛的核心控制技術,進一步提升台灣在全球智慧車與自駕車供應鏈中的競爭力。
本期 AINews 聚焦於三家在 AI 開發者社群中聲譽極高的基礎設施新星:Exa(AI 專用搜尋引擎)、Modal(無伺服器 GPU 計算平台)與 TurboPuffer(高性價比無伺服器向量資料庫)。隨著新一輪融資,這三家公司正式邁入獨角獸或準獨角獸行列,展示了 AI 時代下,開發者對於高效能、低延遲且免維護的底層工具之強烈需求。這三家工具正重新定義現代 AI 應用的開發堆疊。
AMD 執行長蘇姿丰透露在台灣投資百億美元的背後邏輯。她指出,AMD 積極採用 2.5D、3D 及 CoWoS、EFB 等先進封裝技術,當要求合作夥伴加速量產時,AMD 理應共同分擔投資。這筆百億資金不僅是實質支持,更是對台灣頂尖半導體技術投下的巨大信任票。
SpaceX 原定進行的第三代星艦(Starship V3)首次試飛,在發射前最後 40 秒因發射塔機械故障緊急喊停。本次試飛是 V3 重大升級後的首航,其成功與否將直接影響 SpaceX 即將進行的首次公開募股(IPO)估值。目前發射計畫已延期至週五,市場正高度關注。