Hacker News 100 繁體中文

原文主要探討現行 GitHub 在程式碼審查流程中的不足，並記錄了作者開發並試驗 `git-review` 工具的過程與限制。作者強調 GitHub 的兩個主要問題：第一，審查狀態不是儲存在專案的版本庫(repository) 內，而是在遠端資料庫；第二，程式碼審查只能透過瀏覽器介面進行，缺乏本地端效率與靈活性。他認為像自己平常審查程式時，會將分支拉到本地端，使用 Magit 等工具直接以「程式」而非「差異檔(diff)」方式閱讀與測試，能更直觀也能隨時嘗試重構(refactoring)，但一旦要留下意見，仍得回到 GitHub 的網頁介面，導致效率和體驗大打折扣。

為解決這些問題，他嘗試透過 `git-review`，將審查流程轉換為一個額外的 commit 檔案，評審者與作者都能直接在此 commit 上新增或修改評論，最後再以 revert commit 收尾，確保審查紀錄完整保存在版本歷史中。這種設計讓程式碼評論「就在程式裡」，體驗非常自然，但實際使用卻遇到許多摩擦，例如當程式碼在深層 commit 修改時，評論常會與差異(hunk) 衝突；頻繁需要 `--force-with-lease` 推送也降低便利性。雖然這一嘗試驗證了「程式碼審查就是 commit」的想法很有吸引力，但工具使用上的阻力與 Git 未來可能引入 Change-Id（像 Gerrit 那樣能在 rebase 中追蹤單一 commit 的版本修訂）的新功能方向並不完全相容，使得作者決定暫時放棄這路線，回到現有的網頁介面方式，不過也寄望更完善的方案終能出現。

在 Hacker News 的討論中，許多人也對 GitHub 既有的審查流程表達不滿，並分享使用 VSCode 搭配 GitHub Pull Request 外掛，或 JetBrains IDE 來直接在本地程式編輯器中進行審查的作法，有助於減少網頁介面帶來的低效率。不少人認同作者提到的「本地操作」便利性，甚至有人建議每個審查者可直接在 PR 分支寫入自己的評論或修改，這樣可能免除額外工具的依賴，並讓流程更像 Linux 社群的補丁與郵件審查。

然而，也有人指出問題的根源不只在技術，而在於文化。簡單的「LGTM」（looks good to me）常流於形式，並未真正審查內容，這是一種制度和文化上的失敗。某些公司視審查為次要工作，沒有投入與撰寫程式同等的重要性，導致質量(品質) 流於表面。這種情況不能光靠工程工具解決，需要在團隊文化與制度上將程式碼審查視為核心工作之一。另一種觀點則認為，隨著 AI 能產生越來越高品質的程式，人工審查反而變得更為關鍵，教育體系和工程師應加強培養審查能力，否則光靠「只會寫程式、不會審查」的習慣，將很難跟上 AI 主導的未來。

整體來看，這篇文章與討論顯示，程式碼審查的真正挑戰並非單一技術點，而是流程設計、工具整合、版本管理機制與團隊文化的綜合問題。GitHub 現有的網頁介面式操作雖普及卻笨拙，像 `git-review` 這樣的嘗試證明了另一種更自然的可能性，但仍需更佳的工具細節與文化配套，才能真正讓程式碼審查「能更好」。

👥 33 則討論、評論 💬
https://news.ycombinator.com/item?id=44967469

Tigerbeetle

Code Review Can Be Better

Insights, updates, and technical deep dives on building a high-performance financial transactions database.

117 views03:15

Hacker News 100 繁體中文

發表 HN：Channel3 (YC S25) – 網路全產品資料庫 （★ 101 分）

Channel3 的兩位創辦人 George 與 Alex 在 Hacker News 上介紹了這個新創服務，目標是打造一個「網路全產品的資料庫」，並讓開發者能透過 API 及 SDK 取得標準化的產品資訊，包括名稱、品牌、價格、圖片、規格等，同時內建聯盟行銷（affiliate）抽成機制，讓應用程式或網站可直接帶來銷售轉換並分得佣金。這套系統特別強調如何清理與規範分散在不同電商網站的雜亂產品資料，運用大型語言模型 (LLM, Large Language Model)、多模態 embeddings，以及電腦視覺方式來判斷主產品與變體，並將同款商品合併到標準化產品集之下。開發團隊指出，他們最初嘗試用 Exa、Tavily 與 Bing 等服務時，只拿到文章而非結構化商品資料，因此才自建 Channel3，並用 AWS S3 Vectors 與 OpenSearch 等雲端服務來因應龐大的資料需求。目前產品以美國市場為主，對開發者提供 1000 次免費查詢，之後收費為每 1000 次 7 美元，平均佣金約為 5%。

在討論中，社群給予正面關注，但同時指出 Channel3 的搜尋結果品質參差不齊，常出現無關或錯誤的產品。例如輸入「Nintendo Switch 2」卻跳出服飾或錯誤地區的商店，搜尋「pillowcase」或「wallet」也出現燈泡或野餐桌等不相關結果。另外，搜尋呈現時也有價格缺漏、照片模糊或不對焦等狀況。對此，團隊承認仍在持續修正，並以 bug 修復、資料重新索引及調整向量搜尋引擎來改善，用戶回饋對他們相當重要。有人提醒過早推出品質不足的搜尋體驗可能會讓用戶不再回頭，但開發團隊則認為早期上線並吸納實際使用經驗更有助於快速迭代。

另一方面，也有人詢問 Channel3 的營收模式及與其他聯盟行銷聚合公司（如 FMTC）的差異。創辦人解釋他們直接處理與品牌商、供應商的聯盟合作，開發者只需專注於導購與銷售，無須逐一申請帳號，佣金則由 Channel3 統一分潤。不過有出版商提出疑慮，認為若品牌無法得知產品被展示在哪裡，會擔心失去控制權。此外，也有討論圍繞 Agentic Commerce（自動化代理驅動的商務體驗）的潛在場景，有人擔心若開發者只透過大型語言模型進行產品搜尋與推薦，那與 Channel3 的差異性不明；但團隊回應強調 Channel3 提供的是高品質、可規範的資料與 API 服務，利於開發者整合並打造新型態的購物應用，而不需自行與數百家商家洽談或處理龐雜的資料清理工作。

更多實務性的問題也被提出，如：如何保持產品資料即時更新？如何處理 CAPTCHA 與防爬蟲措施？搜尋定價是否過高？是否能建立統一結帳機制讓用戶跨品牌購物？有些開發者看到潛力，像是導入到旅遊規劃、採購平台或部落格推薦系統中，讓非廣告模式的網站也能透過電商分潤來維持營運，這被視為突破傳統聯盟行銷的價值所在。社群中亦有人分享過往嘗試發展小型網站時，卡在繁雜申請與高門檻導致難以取得營收，此點正是 Channel3 想解決的痛點。

整體而言，黑客新聞的回饋顯示大家對 Channel3 的願景有所期待，認為能成為新一代電商資料基礎設施，特別適合開發者快速將「搜尋＋銷售」功能整合到應用中。但短期挑戰仍在於搜尋結果的準確性、資料庫的完備性，以及與品牌/供應商間的透明度。這些核心挑戰若能持續改善，Channel3 有機會在「去中心化電商資料平台」與「開發者導向的商務 API」領域中建立獨特的地位。

👥 61 則討論、評論 💬
https://news.ycombinator.com/item?id=44962881

110 views05:00

Hacker News 100 繁體中文

展示 HN：PlutoPrint – 使用 Python 從 HTML 產生 PDF 與 PNG （★ 100 分）

PlutoPrint 是一款以 Python 開發的輕量級函式庫，能夠直接從 HTML 或 XML 產生高品質的 PDF 與 PNG 檔案。它的核心建立在 PlutoBook 的 C++ 排版引擎上，並透過 Python API 封裝，使開發者能快速將 HTML 轉換成清晰的文件或圖片。這個工具特別適合應用在發票、報表、票券或視覺快照，甚至能結合 Matplotlib 自動生成統計圖表並嵌入輸出。PlutoPrint 的設計強調輕便、不需額外瀏覽器環境，並提供跨平台的預建二進位檔，方便 Windows 與 Linux 使用者直接安裝使用。它採用 MIT 授權，允許自由用於個人或商業專案。

在 Hacker News 的討論中，不少開發者將 PlutoPrint 與既有工具進行比較。許多人最先提到 WeasyPrint，它同樣是 HTML 轉 PDF 的解決方案，但 PlutoPrint 因為底層完全以 C++ 撰寫，效能更佳、記憶體需求更低，且支援直接渲染為 PNG，對 SVG 的支援也更強。有些人則指出，若使用 Puppeteer 或無頭瀏覽器，幾乎能完整支援所有網頁技術（如 CSS 最新功能、Canvas2D、WebGL 等），但相對需要依賴龐大的 Chromium 與 Node.js 環境，安裝維護相對麻煩。PlutoPrint 在這一點上提供了更輕量、可攜的選擇，能更容易嵌入專案中。

也有開發者提醒，要真正判斷工具可靠度，應該用標準化的測試套件來驗證，例如 print-css.rocks 或 Web Platform Tests (WPT)，以檢查複雜印刷功能與規範符合度。目前，有人測試後認為 PlutoPrint 在效能與品質上已經優於 WeasyPrint，但也有使用者表示在 macOS 上遇到 Python 進程直接崩潰的情況，代表穩定性仍需更多實務驗證。另外，有人建議未來功能若能直接輸入 Markdown，而不用先轉 HTML，將會更便利。

部分討論則來自實務經驗豐富的工程師，提醒 PDF 生成在真實商業場景中存在許多潛在風險。例如：發票上表格行為可能在換頁處斷裂或丟失表頭；貨運單據在分頁時經常出現資料溢出或重複；條碼僅偏移幾個像素就會導致掃描失敗；甚至表單疊加在掃描背景圖時很難與格線精準對齊。這些問題在依賴 HTML/CSS 的轉換引擎時特別棘手，長期來看可能需要透過更底層的 PDF 繪圖工具（如 ReportLab 或 iText）以絕對座標控制來達成穩定輸出。總結來說，PlutoPrint 提供了一個更現代且簡單的切入點，但在追求高度可靠、嚴格版面控制的商業情境中，仍需審慎評估是否符合長期需求。

👥 21 則討論、評論 💬
https://news.ycombinator.com/item?id=44966170

GitHub

GitHub - plutoprint/plutoprint: A Python Library for Generating PDFs and Images from HTML, powered by PlutoBook

A Python Library for Generating PDFs and Images from HTML, powered by PlutoBook - plutoprint/plutoprint

111 views05:15

Hacker News 100 繁體中文

展示 HN：Luminal – 開源搜尋式 GPU 編譯器 （★ 101 分）

Luminal 是一個以 Rust 撰寫的開源深度學習函式庫，特色在於透過「搜尋式編譯」（search-based compilation）自動產生高效能 GPU 核心（kernel）。它的理念是將所有計算事先編譯，而非在執行時期做動態最佳化，並利用搜尋演算法探索大量邏輯等價的運算方式，最後挑選執行時間最短的版本。這種方法讓 Luminal 能夠自動「發現」像 Flash Attention 這類傳統上需要人工設計的進階最佳化技巧，目標是在任何硬體上都能跑出比大型框架更快的效能。Luminal 的核心語意極度精簡，僅以 12 種基本運算（例如加法、乘法、開根號、矩陣相乘的簡化形式）建構整個計算圖，然後交由編譯器生成 GPU 核心。其效能示範包括能在 Apple M 系列晶片上運行 Llama 3 (8B 模型量化為 Q8) 達到每秒 15-25 個 token，並支援 Metal 與 Nvidia CUDA，在未來還計畫開發 ROCm（AMD 平台）及更多硬體專用後端。

這個專案刻意避免了深度學習常見的「逐步急切執行」（eager execution）設計，而全面採取靜態編譯。開發者所編寫的算式並不會立即計算，而是建構成有向無環圖（DAG），只有在呼叫 `graph.execute()` 時才真正執行。這意味著程式碼與最終運算可能大幅不同，因為編譯器可在整體圖層級進行最佳化，例如大規模核心融合、針對不同裝置或資料型別自動轉換核心，甚至在搜尋過程中找到新穎的重寫演算法。Luminal 強調簡潔性與原生性，不依賴 Docker 或 Python 虛擬環境，直接呼叫底層 API，並且大部分運算結果都會與 Pytorch 對照以確保正確性。未來藍圖還包含利用更彈性的 Tensor Core、整合 Blackwell GPU 新指令、建立效能對照工具、支援分散式訓練，以及探索超前衛的硬體後端。

在 Hacker News 的討論中，許多開發者對 Luminal 的核心理念十分感興趣，尤其是「最佳化不靠啟發式規則，而是直接搜尋所有可能解」的徹底思維。作者 Joe 解釋 Luminal 的編譯器會建立一個龐大的搜尋空間，包含各種核心配置，例如 GPU 線程與區塊的分配方式、記憶體存取策略（shared/global memory）、迴圈展開與向量化等，甚至包括代數重寫（例如 softmax 重寫成 online softmax）。搜尋過程可能耗時數分鐘到數小時，但通常只需執行一次即可重複使用最佳化結果。這與 NVIDIA TensorRT、Apache TVM 的調校方式有些相似，但 Luminal 將搜尋範圍拉得更廣，並透過 e-graphs（等式圖）技術有效管理搜尋空間。此外，作者表示雖然目前效能還不及一些手寫最佳化專案（如 llama.cpp），但正在持續改善並計畫設立效能追蹤頁面來預防退步。

部分參與者則提出實務上的質疑與建議，例如模型在 M 系列 MacBook 上的效能數據看似仍低於現有最佳化實作，期待未來能與其他框架直接對比；也有人詢問是否能將 Luminal 元件嵌入到 PyTorch 或 JAX 作為模組使用，開發團隊確認方向上可行。其他技術深入探討則涉及是否能支援更底層的 PTX 組合語言、是否能像 DeepSeek 一樣自動「發現」隱藏的硬體用法，以及是否能透過強化學習或蒙地卡羅樹搜尋（MCTS）來縮小搜尋空間。總體看來，社群對 Luminal 的創新方式表示高度關注，認為這是「超級版自動調校」，具備挑戰現有人工最佳化乃至主流編譯器的潛力。

👥 48 則討論、評論 💬
https://news.ycombinator.com/item?id=44963135

GitHub

GitHub - luminal-ai/luminal: Deep learning at the speed of light.

Deep learning at the speed of light. Contribute to luminal-ai/luminal development by creating an account on GitHub.

111 views05:45

Hacker News 100 繁體中文

如何擺脫在科技圈迷失的感覺：華夫屋方法 （★ 100 分）

這篇文章針對許多電腦科學學生及科技從業者常感到的迷惘，提出了一套作者自稱「華夫屋方法」的自我整理方式。許多人之所以感覺徬徨，是因為害怕人工智慧取代工作，覺得需要學習的東西過多，甚至不確定自己是否真的喜歡科技領域。作者強調，與其困在「工具思維」裡盯著技術的變遷，不如回到自身，將科技視為幫助生活的工具。整個方法核心是透過一次 48 小時的自我封閉旅行，讓人安靜下來，想像五年後最能讓自己感到驕傲的樣貌，並把這個未來畫面拆解成具體可實現的目標與行動步驟。

具體步驟包括：首先選一個對自己有深刻意義的地點，在無人打擾的情況下，寫下對未來五年的想像，包含所有憧憬、恐懼與遺憾。接著進入「華夫屋階段」，將抽象的願景濃縮成兩三個具體的五年目標，然後反推需要三年、一年達成的進展，最後細化到每個月、每週、甚至每日的任務實踐。作者建議建立一個有向非循環圖（DAG, Directed Acyclic Graph）來標示當下位置、終點目標與中間需要破除的「節點」。這些步驟務求極度具體，把所有可能的阻礙拆解成小任務，並立即安插到當月、當週、隔日的行程中。在這過程中不需追求完美的規劃系統，重要的是持續行動，把時間與精力投注到能讓自己接近理想樣貌的工作上。最終，這是一份屬於自己的生命計畫，不必向他人展示，但能逐步改變現實，並帶來持續感受到的轉變。

在 Hacker News 的討論區，許多人指出這種「48 小時密集規劃」的方式過於極端，對某些人可能適得其反。有評論認為五年期規劃對年輕人而言就像一輩子般漫長，反而容易產生焦慮與不切實際的幻想。多數人認同「花時間靜下來思考與書寫」本身有宣洩作用，能將焦慮轉化為具體想法，但若過於僵化地追隨計畫，往往導致在遇到挫折時更快喪失動力。一些人主張應該把焦點放在一至三年的短期目標，或甚至只規劃到「這個月、這一週、明天」該做什麼，更符合變動快速的環境。

另一種觀點則強調，關鍵不是畫出複雜的圖表或五年藍圖，而是找到一個「方向向量」（vector），確定人生大致的前進方向，再依靠日常的小行動累積進展。有人認為作者的方法適合高自律的人，但大部分人更可行的是建立簡單可持續的日常習慣，例如每天寫程式、運動、閱讀，而不是寄望一次的「願景探尋」就能帶來徹底轉變。也有人分享，過往的人生規劃從未照著草擬的藍圖發展，但持續保有目標意識與對機會的準備，依然能逐漸實現理想。

總體來看，文章所提的「華夫屋方法」強調透過深度自我對話建構長遠願景，並分解為具體行動，而 Hacker News 上的回應則提醒：長期計畫應保持彈性，以免陷入失敗與焦慮；更務實的策略是保持方向感但專注當下，持續累積小進展，隨著環境與自身成長再動態調整。這揭示了一個平衡點──在理想與現實之間找到可實踐的步伐，既不失去自省與目標，也不被僵化路線桎梏。

👥 57 則討論、評論 💬
https://news.ycombinator.com/item?id=44968190

Yacinemahdid

how to stop feeling lost in tech: the wafflehouse method

you need to sit for this one for 48h

119 views06:30

Hacker News 100 繁體中文

費馬大定理 Lean 形式化證明專案 （★ 100 分）

這個專案由倫敦帝國學院 (Imperial College London) 主導，核心目標是將費馬大定理 (Fermat’s Last Theorem, 簡稱 FLT) 的證明完整形式化，並以 Lean 定理證明器 (Lean theorem prover) 這套電腦輔助系統表述出來。專案由數學家 Kevin Buzzard 領導，並獲得英國工程與物理科學研究委員會 (EPSRC) 的資助。雖然這項計劃尚未完成，現有的內容主要是一份「藍圖」，規劃如何逐步將證明拆解為可以由電腦驗證的部分，並非直接展示最終完整的形式化證明。專案本身是開源且多作者共同參與，意味著數學界及電腦科學界都能貢獻一份心力。

在 Hacker News 的討論中，許多人指出這個專案的標題容易誤導，因為它並非已經完成了費馬大定理的 Lean 證明，而是著重於建立架構、逐步推進。支持者認為這不僅是核驗 Wiles 與 Taylor 在 1990 年代給出的經典證明，而是希望透過 Lean 的形式化過程，讓數學社群更有系統地檢查細節，並以電腦協助降低人為疏漏的風險。Kevin Buzzard 也補充說，他們會依循 Richard Taylor 的策略，並參考他在史丹佛課程中提出的最新路線，使這項龐大的工程得以逐步推進。

討論中也有許多人探討「費馬究竟是否真的擁有一個簡單證明」這個長久的歷史謎題。多數數學家傾向認為費馬當時的「優美證明」其實並不存在，或者是他誤以為自己有一個正確的推導，後來才發現漏洞，因此從未公佈。有人指出費馬自己還曾證過 n=4 的特殊案例，若他真的有一般性的證明，就沒有必要多此一舉，這更顯示他當時手上的方法並不完整。也有人認為他可能只是隨手寫下註解，後來忘了收回，結果意外地留下一個數學界數百年的謎題和挑戰。

另一方面，社群中不少人聚焦在 Lean 與形式化數學本身的價值。有人指出，Lean 和類似的定理證明器就像程式語言的型別檢查器一樣：一旦「編譯」成功，代表證明邏輯上是正確的。這種方法將傳統上依賴人工檢查的繁瑣步驟交給電腦，數學家則能專注於架構設計與核心思想，不必反覆驗算每個細節。當然，也有聲音認為光靠形式化並不等於更好理解數學本質，真正的洞見仍要通過人類寫作與討論來傳達，不過電腦輔助檢查至少提供了可靠的驗證工具。

綜合來看，這個專案既是數學與電腦科學的跨界合作，也是一次實驗，考驗著用現代定理證明程式去重建並驗證二十世紀最龐雜的數學成果之一。無論最終進展速度如何，它都標誌著數學形式化運動 (formalization of mathematics) 的一個重要里程碑，也將改變未來人們建立與檢驗數學知識的方式。

👥 71 則討論、評論 💬
https://news.ycombinator.com/item?id=44964693

111 views06:45

Hacker News 100 繁體中文

爛番茄的統計分析 （★ 101 分）

Rotten Tomatoes 於 1998 年創立，最初是為了彙整成龍電影的影評，後來快速擴展成全球電影評論的指標平台。其核心評分機制「Tomatometer」是根據評論中被判定為「正面」的比例計算，60% 以上即標示「新鮮」，低於則是「腐爛」。在長期運作下，這種簡單透明的模式讓它成為美國觀眾最信任的參考依據之一。然而，作者透過統計分析指出近十年來 Tomatometer 平均分數逐步上升，且與觀眾分數的相關性自 2016 年起出現明顯分歧。巧合的是，同年 Rotten Tomatoes 被售予電影票務巨頭 Fandango，而後者又部分由 NBCUniversal 與 Warner Bros. Discovery 持有，引發利益衝突的質疑。

進一步研究顯示，這種變化並非來自電影品質的整體提升，而可能與評論者範圍的擴張及選擇機制有關。收購後，每部主流電影平均評論數量增加了 40 至 70 個，許多新增的評論來源不具知名度，甚至來自個人部落格或小型媒體。雖然 Rotten Tomatoes 宣稱此舉是為了引入更多元聲音（如女性與少數族群評論者），但這導致整體評分結構被重新塑造。加上公關公司會刻意拉攏這些「非頂級評論」以在上映前拉高新鮮度，讓電影公司能在宣傳上大打「Certified Fresh 認證」的招牌。

文章也指出，這種「通貨膨脹式」的新鮮認證短期確實可能吸引用戶對電影產生興趣、走進戲院，對疫情後苦撐的院線業是助力。然而，長期而言，如果觀眾不斷被過度吹捧的電影所欺騙，將導致觀影信任感崩塌，進而影響產業整體信譽。作者承認即便自己最初有「不管是不是灌水，只要能促進觀影就好」的直覺反應，但最終還是認為長遠的觀影體驗與電影品質才是穩定產業的根本。

Hacker News 上的討論延伸了這些觀點。許多使用者認為 Rotten Tomatoes 早已失去公信力，Metacritic 或 IMDb 的平均分數反而更能反映實際觀影體驗。一些人指出，RT 的「3/5 星也算正面」規則過於敷衍，使得許多平庸電影也能累積為「100% 新鮮」，給人以為是傑作的錯覺。部分評論者主張需要更細緻的個人化分數，例如只計算 4 星（8/10）以上的比例，才能突顯出真正優秀或具爭議的作品，而不是讓大量中庸之作佔據榜首。

不少人也分享了政治電影或大製作的案例，批評 RT 評分容易受到政治立場、影業遊說甚至刷分操作的影響。例如有網友分析某些政治紀錄片的評分走勢，發現評論與觀眾分數兩極化且疑似被動員灌水。更有人提到「驗證觀眾評論」機制同樣可被操弄，因為電影公司能贈票製造假觀影紀錄，膨脹票房及評價。對此，有人轉向依賴 IMDb 長期評分、Reddit 社群推薦，甚至乾脆追隨自己喜愛的演員或導演，以避開雜訊。

整體而言，文章與討論呈現出對 Rotten Tomatoes 不再是中立風向標的共同懷疑。雖然這個平台仍有影響力，但越來越多人認為它只是電影行銷的一環，而非真正的品質指標。觀眾正在尋找新的方式，無論是更可信的統計方法，還是只追隨個人口味偏好的來源，來取代這個已顯「爛掉」的番茄評分。

👥 42 則討論、評論 💬
https://news.ycombinator.com/item?id=44967796

Statsignificant

Is Rotten Tomatoes Still Reliable? A Statistical Analysis

Can Hollywood's stamp of artistic excellence still be trusted?

117 views07:00

Hacker News 100 繁體中文

Home Depot 因自助結帳「暗中」使用人臉辨識遭到提告 （★ 103 分）

Home Depot 近日陷入一場集體訴訟風波，一名名叫 Benjamin Jankowski 的常客指控該公司在芝加哥分店的自助結帳機台，暗中啟用了人臉辨識系統，卻未經顧客同意。根據訴狀，他在結帳時注意到螢幕上自己的臉被一個綠色方框框選，強烈懷疑系統正錄製或分析臉部特徵。但現場並無任何提示標示說明可能涉及生物特徵蒐集，更沒有提供選擇退出的可能性。由於當時沒有收銀員值班，他只能使用自助結帳，這使得隱私疑慮更為嚴重。

訴訟主張，Home Depot 在 2024 年開始擴大量產使用「電腦視覺」技術，目的是降低竊盜率，但這同時違反了伊利諾州的《生物特徵隱私法》(BIPA, Biometric Information Privacy Act)。該法律要求企業必須明確告知並取得書面同意，才能蒐集和儲存如臉部幾何結構等敏感資訊。原告希望代表全州 76 間分店的顧客發起集體訴訟，求償每次疏忽違規 1000 美元、故意違規 5000 美元的賠償。此案也讓人聯想到之前 Rite Aid 因濫用人臉辨識技術而被聯邦禁用五年的前例。

在 Hacker News 的討論中，許多人對螢幕上出現的綠色方框用途提出不同解讀：有人認為這不代表真正的人臉辨識，只是單純的「臉部偵測」，例如用於自動重置系統或嚇阻偷竊；但也有人指出，消費者很難區分偵測與辨識，且法律條文可能並不會做這種工程上的細微劃分，因此仍可能構成違法。部分留言提到，這種「恐嚇效果」可能只是心理戰術，用來提醒顧客「我們正在看你」，而不一定真有後端數據庫進行比對。

除了法律面向，討論中還延伸到自助結帳的本質爭議。一些人表示拒絕使用自助結帳，因為除了隱私疑慮外，這等於消費者在無償替公司工作，還要承擔被誤判偷竊的風險。另一方面，也有人認為自助結帳流程更快、更有效率，特別是與美國零售業日益短缺的收銀人力相比。但部分顧客對於嚴格的防盜措施（如上鎖的商品櫃、嗶嗶作響的攝影機、收據檢查）感到極不舒適，選擇改去規模較小的店或乾脆放棄購買。

討論中也浮現社會層面的反思：有些人認為竊盜問題確實存在，但將消費者集體視為潛在罪犯，進行帶有羞辱性的監控，只會進一步破壞購物體驗與人性尊嚴。另一些聲音則主張，企業推動自助結帳主因在於降低人事成本，而非法規或隱私問題。這起訴訟不僅挑戰科技應用的界線，也可能影響美國零售業未來如何在「防竊、防弊」和「顧客隱私、體驗」間取得平衡。

👥 88 則討論、評論 💬
https://news.ycombinator.com/item?id=44962771

Peta Pixel

Home Depot Sued for ‘Secretly’ Using Facial Recognition Technology on Self-Checkout Cameras

The Home Depot customer says he noticed the camera at a recent trip to the store.

125 views07:30

Hacker News 100 繁體中文

展示 HN：我用 Git 取代向量資料庫來實作 AI 記憶（概念驗證） （★ 107 分）

DiffMem 是一個由 Growth Kinetics 推出的實驗性開源專案，嘗試將 Git 版本控制系統當作對話式 AI 的記憶基礎架構。它的設計理念是利用 Markdown 檔案儲存「當下狀態」的記憶，Git 提供版本差異追蹤與完整歷史紀錄，並輔以 BM25 檢索演算法來快速搜尋。這種方式能精確處理「當前知識」與「歷史演化」的分離：AI 在日常回應時僅需讀取最新狀態，若要分析知識是如何隨時間變化，則可透過 `git diff` 或 commit 紀錄來回溯，類似人類依提示回想事件的方式。與傳統依賴向量資料庫或圖資料庫的 AI 記憶相比，這個方法更輕量、可攜性高，而且資料以純文字保存，易於人工檢閱與修改。

專案設計包含幾個元件：`writer_agent` 負責解析對話並將新資訊提交到 Git，`context_manager` 依需求組合不同深度的上下文，`searcher_agent` 則結合 LLM（大型語言模型，Large Language Model）與 BM25 進行語意查找與回應合成。此外，它提供乾淨的 API 介面，便於開發者直接呼叫新增記憶或查詢上下文。其優點包括減少查詢負擔、能處理跨數十年規模的長期記憶演進，並允許針對記憶進行「選擇性遺忘」與修剪，使其在長期使用情境具備可擴展性。雖然目前版本僅是原型，尚缺少 Git 自動同步、快取機制與多使用者並行控制等功能，但它展現了 AI 記憶系統去中心化、長期保存及人類可解讀化的可能性。

在 Hacker News 的討論中，許多使用者對這種創新的 Git 當作 AI 記憶方式表示讚賞，認為它巧妙且直觀，尤其能避免 AI 被過時資訊困擾，同時又能在需要時追溯歷史。有些人建議可在 commit 後觸發 hook 來自動生成向量資料庫，結合兩者優勢；也有人詢問是否會推出 MCP（Model Context Protocol）整合或作為伺服器服務的版本。另一些技術評論則指出，雖然 BM25 提供快速檢索，但缺乏語意匹配能力，因此難以取代高維度的向量相似度查找。若能結合 metadata 標註或語意嵌入做混合式搜尋，將更完整解決資訊演進與檢索的需求。

針對具體應用，有人舉例 RAG（檢索增強生成，Retrieval Augmented Generation）系統難以處理像「女兒 9 歲→10 歲→12 歲，最後只用名字稱呼」這種隨時間演化的資訊，導致系統充斥過期的雜訊，DiffMem 正好能透過版本控制的方式解決這個問題。其他開發者則比較了 SQL 資料庫、FAISS 向量搜尋引擎與本文方法的差異，認為 Git 儲存適合小規模或個人應用，而在大規模語意搜尋上仍須搭配其他工具。整體來說，社群普遍認為這是一個極具啟發性的實驗，尤其在人機可協作、可審計的長期 AI 記憶場景，Git 的加入提供了一種前所未有的透明度與可靠性。

👥 32 則討論、評論 💬
https://news.ycombinator.com/item?id=44969622

GitHub

GitHub - Growth-Kinetics/DiffMem: Git Based Memory Storage for Conversational AI Agent

Git Based Memory Storage for Conversational AI Agent - Growth-Kinetics/DiffMem

122 views11:15

Hacker News 100 繁體中文

馬克·祖克柏因憂心 AI 泡沫暫停招募 （★ 103 分）

馬克·祖克柏（Mark Zuckerberg）近日宣布凍結 Meta 的人工智慧（AI）招募計畫，這被視為對市場上「AI 泡沫」疑慮的回應。過去數月，Meta 曾大肆挖角頂尖研究人才，甚至開出高達 10 億美元的報酬方案，如今卻突然踩煞車，確實形成鮮明反差。此次凍結主要針對其「超級智慧實驗室」（superintelligence labs），除非獲得 AI 負責人 Alexandr Wang 的特別批准，否則新聘人員全面中止。Meta 此舉也發生在美股科技板塊急跌的背景下，Nvidia、Arm 和 Palantir 等公司皆因市場質疑「龐大 AI 投資無法收回成本」而股價重挫。

引發市場恐慌的還有麻省理工學院（MIT）的一份報告，指出高達九成五的企業從 AI 投資中得到「零回報」。Meta 發言人則試圖淡化風波，強調這只是一項「基本組織規劃」，目的是讓超級智慧專案有更穩固的架構。不過，Meta 在策略上的反覆已讓人質疑：從斥資數百億美元建置 AI 資料中心，到延宕發布最新「Behemoth」模型，再到突然凍結招募，都顯示其內部方向反覆，增加外界對管理層的疑慮。

祖克柏曾表示，他的目標是發展一種「個人超級智慧」——一位能成為永久私人助理的 AI，嵌入智慧眼鏡之中，與現今業界強調「AI 自動化所有工作」的理念有所不同。然而，高額的人才成本，以及分析師對於「薪資暴增恐稀釋股東價值」的警告，使得 Meta 未來的發展仍具不確定性。此外，市場對 OpenAI 最新 GPT-5 的反應冷淡，也加深了投資人的憂慮。就連 OpenAI 執行長薩姆·奧特曼（Sam Altman）都坦言，AI 的熱潮或許與 2000 年前後的網路泡沫相似。

在 Hacker News 的討論中，不少人批評祖克柏的決策反覆，短短幾個月內從「簽下天價合約」到「全面凍結」，讓人聯想到當年的「元宇宙」失敗案例。然而，也有人認為這未必是「泡沫崩壞」的訊號，更可能是因 Meta 收購了 Scale AI 後，一時之間已經擁有過量人才，因而暫停新招募以進行內部整合。這類「先囤人才再重組」的手法，在大型科技公司並不罕見。

部分評論則聚焦於祖克柏的領導風格與 Meta 的歷史成就。有人指出，他雖然做過許多錯誤判斷，但也有 Instagram 和 WhatsApp 的收購案這類成功案例，這些足以證明他並非「一擊即中」的幸運兒，而是敢於下大賭注的創業者。然而，批評者則認為，他的成功很大程度仰賴雪柔·桑德伯格（Sheryl Sandberg）在商業化上的執行力，祖克柏本人過於依賴「賽局式豪賭」，導致決策震盪頻繁。

整體而言，這次的凍結措施被視為 Meta 在 AI 狂熱中踩下的一腳煞車，但背後原因究竟是冷靜的資源整合，還是對泡沫擴張的恐懼，仍存在爭議。無論如何，隨著 AI 技術應用前景未達預期，投資人與產業界正重新檢視這場科技賭局的真實價值。

👥 103 則討論、評論 💬
https://news.ycombinator.com/item?id=44971273

The Telegraph

Mark Zuckerberg freezes AI hiring amid bubble fears

The move marks a sharp reversal from Meta’s reported pay offers of up to $1bn for top talent

118 views12:30

Hacker News 100 繁體中文

AWS 執行長：用 AI 取代初階員工是「我聽過最蠢的事」 （★ 131 分）

Amazon Web Services (AWS) 執行長 Matt Garman 近日在一次公開對談中表示，用人工智慧（AI）取代初階員工是「我聽過最蠢的想法」。他指出，許多企業領導人過於輕率地認為 AI 工具能完全取代新進工程師，但事實上，這些年輕員工成本低、學習能力強，且對 AI 工具的掌握度往往比高階同仁更高。如果缺乏新人進入職場並透過實務磨練，十年後企業將面對沒有人能真正累積相關經驗與技能的窘境。Garman 強調，持續聘用大學畢業生並培養其問題拆解與程式設計思維，仍然是成功開發軟體的關鍵。

他同時批評另一種企業常見的衡量指標：以 AI 所產生的程式碼比例作為績效標準。他直言這是「愚蠢的指標」，因為產生更多程式碼未必等於更好的程式碼，有時候更少的程式反而品質更高。他並指出，超過 80% AWS 內部開發人員已在使用 AI 工具，應用範圍從單元測試、自動文件編寫到與 AI 代理（agentic workflow）的協作。對他而言，AI 的價值在於提升教育與效率，而不是取代人才。

針對未來職涯發展，Garman 也提出建議。他認為在 AI 與科技快速演進的環境下，專注於學習單一技能已不足以支撐數十年的職業生涯，更重要的是培養批判性思考、創意思維及持續學習的心態。他期望教育體系能強調「思考方式」與「拆解問題的方法」，因為真正能在未來茁壯的將會是那些具備分析與學習能力的人才。

Hacker News 的討論中，不少人認同 Garman 的觀點，尤其是「缺乏新人訓練，長期將沒有人能勝任資深角色」的提醒。不過，也有人指出，實際上初階職缺的新聘數量已經減少，因為許多過去需要新人的工作（例如基礎 UI 元件或 CRUD API 開發）現在能由 AI 工具完成，企業可能會選擇「不再增聘」而非「大量裁員」。部分業界人士補充，即使 AI 提升生產力，公司往往隨之擴張服務與需求，因此未必會真正減少員工總數。

另一方面，也有過來人分享，初階工程師在第一年至少常常是「負資產」，需要資深同仁花費大量時間指導，這導致部分主管會質疑聘用新人的必要性。不過另一些評論則反駁，這取決於管理和培訓品質，過去沒遇過完全「無法成長」的新進，只要給予適當指導，他們不會是淨負面。除此之外，許多討論延伸到教育方法，不少人呼應 Garman，認為大學與職場應更注重訓練批判性推理與問題拆解，而不是單純追求背誦或程式碼產出量，更有人引用哲學與人文課程對思辨能力養成的重要性。

總體來看，雖然部分人認為 AWS 高層的說法多少帶有公關意味，但多數開發者與教育界人士都贊同：「要在 AI 時代保持競爭力，不能僅依靠工具，而是要持續培養能思考、能學習、能解決問題的人才。」這場辯論也突顯出科技產業面臨的矛盾：短期效率與長期人才養成之間的拉鋸，還有企業如何在 AI 大潮中避免短視近利。

👥 52 則討論、評論 💬
https://news.ycombinator.com/item?id=44972151

The Register

AWS CEO says using AI to replace junior staff is 'Dumbest thing I've ever heard'

: They're cheap and grew up with AI … so you're firing them why?

108 views14:00

Hacker News 100 繁體中文

使用 Podman、Compose 和 BuildKit （★ 103 分）

作者分享了自己在開發工作中需要使用 Docker Compose 來建置和執行專案，但因為 Docker 在與 nftables 的相容性有問題，而且他更偏好「無 root 權限」與「無常駐背景服務 (daemonless)」的方式，所以選擇了 Podman。Podman 雖然支援 Docker Compose，但目前有兩種做法：一是透過官方 Docker Compose CLI 搭配 Podman socket，二是使用社群開發的 podman-compose 替代品。不過這兩種方式各有缺點：前者無法使用新一代的 BuildKit 編譯器，導致缺少進階功能；後者則缺少 reset、configs 或跨服務 additional contexts 等功能。由於 podman-compose 須持續追上 Docker Compose 的新功能，維護成本高且意義有限，因此作者開始探索是否能在 Podman 下使用 Docker Compose 搭配 BuildKit。

他發現其實可以直接用 Docker Compose CLI 搭配 Podman socket，並設定一個新的 Docker context，就能啟用 BuildKit。接著他進一步嘗試自行以 systemd 啟動 BuildKit，而不是依賴 CLI 自動生成的容器，藉此達到可控性更高的環境。不過這做法等於又啟用了背景服務，和他原本喜歡的無 daemon 模式有些矛盾。為此，他研究了 Docker Buildx 提供的 Bake 功能，能將 Compose 專案轉換成 JSON 格式的建置描述，接著用他自己撰寫的小工具 Bakah 將這些描述轉換，並透過 Buildah 執行建置。Bakah 雖不支援所有 Bake 的進階功能，但已足夠處理複雜專案，且能幫助拆分不同服務的 Dockerfile，簡化 CI 腳本，並減少對 Podman CLI 的重度依賴。

在 Hacker News 上，許多開發者分享了他們對 Podman 與其他替代方案的使用經驗。有些人提到自己雖然經常聽說 Podman，但在 macOS 環境下選擇 Colima，因為它能直接透過 VM 提供 Docker 相容環境；另一些人則強調 Podman 在 macOS 或 Windows 上同樣需要 VM（如 WSL2），所以實際差異不算大。不少留言指出 Podman 的優勢在於 rootless 模式設定簡單，相較於 Docker 的 rootless 實作更輕鬆穩定。

部分使用者提到，自己因為 Podman 尚未能良好支援 BuildKit，而最終改回使用 Docker Desktop，但對作者找到的解法表示欣賞。此外，有人建議若不堅持 Docker Compose，其實可以直接採用 Podman 的 kube 支援，透過 Kubernetes Pod 語法子集來描述服務，再搭配 systemd 整合，達到更穩定的部署方式。也有人補充，Podman 有 `podman generate systemd` 指令能自動產生 systemd 設定檔，方便管理。

整體來看，討論呈現出不同開發者在不同平台上的取捨：有些人偏好 Podman 的無 daemon 與 rootless 特性；有些人則為了功能完整性繼續使用 Docker 或替代 VM 層方案如 Colima、OrbStack。作者提出的 Bakah 雖只是小工具，但提供了一個融合 Podman、BuildKit 與 Compose 的新思路，特別適合希望保持彈性又想避免 Docker 依賴的開發者。

👥 15 則討論、評論 💬
https://news.ycombinator.com/item?id=44971212

emersion.fr

Using Podman, Compose and BuildKit · emersion

97 views14:00

Hacker News 100 繁體中文

澳洲郵政因美國混亂的新關稅期限將至，暫停對美轉運寄送服務 （★ 102 分）

澳洲郵政（Australia Post）宣布，因美國即將取消低價免稅門檻並徵收新關稅，自 8 月 20 日起暫停所有經由澳洲轉運的寄往美國的包裹服務。過去依照「de minimis」免稅規則，價值低於 800 美元（約新台幣 25,800 元）的商品進入美國時可免課稅，但川普政府的新行政命令將於 8 月 29 日生效，今後所有低價小包裹都須繳納關稅或固定費用。這項政策讓全球郵政與電商系統陷入混亂，多家歐洲郵政業者如比利時的 Bpost 與北歐的 PostNord，已完全停止對美商品寄送服務。

國際郵遞顧問團體 IMAG（International Mailers Advisory Group）指出，問題並非單純在於關稅本身，而是美國要求外國郵政業者主動「代收並上繳」美國進口稅，但目前全球幾乎沒有現成的系統可供操作，美方甚至沒有提供繳款途徑。因此包括澳洲郵政在內的多個國家只好選擇暫停轉運或全面停寄。對於仰賴美國市場的澳洲時尚與電商品牌，這造成重大打擊。有品牌坦言市場不確定性太高，只能被迫暫停對美銷售。

在 Hacker News 的討論中，不少網友認為此舉實際上針對中國的 Shein、Temu 等跨境電商平台，因為它們藉由免稅漏洞大量輸入低價商品，被批評為以低品質與安全疑慮充斥西方市場。一些評論指出，中國確實能同時生產高品質品牌產品（如 DJI、Anker），也能輸出大量廉價「雜牌」商品，端看廠商與品管要求。然而對消費者來說，低價往往才是購買動力。也有人提到歐盟早已透過 IOSS (Import One-Stop Shop) 系統，要求跨境電商在結帳時就代收增值稅，避免包裹到岸時的混亂，相比之下美國的要求既倉促又不切實際。

許多評論延伸到對川普貿易政策的質疑與支持。一方面，有人認為關掉漏洞是必要的，歐盟也曾對低價包裹祭出調整，否則廉價劣質品持續湧入只會損害本地產業。另一方面，也有人強調這種突然的行政命令帶來巨大市場不確定性，反而傷害盟友國與正常中小企業。部分討論還轉向國際政治層面，認為外界無法忽視川普政府的決策風格，儘管並非所有美國公民都認同，但在國際眼中「美國即等於川普」，連帶讓美國的國際信任與軟實力快速下滑。

整體而言，這場郵政與電商「混亂」折射出全球供應鏈對於美國政策的高度依賴，也凸顯當主要貿易國忽然改變規則時，小型企業與跨境零售商首當其衝。未來若美國未能建立更完善的關稅代收機制，郵政業者持續停寄甚至會成為常態，進一步加深跨境電商與國際貿易的不確定性。

👥 131 則討論、評論 💬
https://news.ycombinator.com/item?id=44970269

www.abc.net.au

Australia Post halts transit shipping to US as global carriers face 'chaos'

A Trump administration tariff deadline is creating "chaos" for postal networks and retailers globally, as low-value parcels will be slugged with import duties from next week.

98 views14:01

Hacker News 100 繁體中文

Python f-string 速查表（2022） （★ 103 分）

這份整理主要是一份針對 Python f-string 用法的速查表，展示如何在字串格式化時使用不同的參數與語法。內容分成數字、整數、字串與通用物件四個部分，透過範例解釋如何設定小數精度、寬度、補字元、科學記號顯示與百分比轉換。例如 `{number:.2f}` 可以將浮點數顯示為小數點後兩位，而 `{percent:.0%}` 可將 0.3738 轉為 `37%`。在整數部分，則介紹二進位 (`b`)、十六進位 (`x` 或 `X`) 格式，甚至可以搭配前綴 `#` 來輸出如 `0xa` 這樣的結果。至於字串格式化則包含置左、置右、置中與補滿指定字元等語法。最後，速查表也展示了 f-string 的特殊轉換符號，如 `!s`、`!r`、`!a`，以及自動帶出變數名稱與數值的 `=` 語法，可方便除錯與日誌紀錄。

在 Hacker News 的討論中，許多開發者都對這張速查表表示喜歡，認為 f-string 功能強大，但常常難以記住各種細節，有一份完整的對照表非常實用。部分留言提到，f-string 起初的設計（PEP 498 提案）是為了取代舊有的 `%` 插值方式，目標是讓語法更簡單，但隨著語法功能擴充，如今已經變得比原本的 `%` 還要複雜。一些人認為用法越來越接近 `printf`，甚至需要查表才能理解，這讓程式可讀性降低，有人戲稱這是一種把 Python 結果弄得難以閱讀的「微型語言 (DSL)」。

另一方面，不少程式設計師認為 f-string 最大的價值就在於「變數與輸出位置對應清楚」，不需要像 `printf` 一樣數參數的位置，直觀上非常有幫助。尤其是 `f"{var=}"` 這種語法能直接輸出變數名稱與對應值，在除錯與快速檢查變數時極為便利。也有人指出，雖然許多格式化語法很少在日常使用中派上用場，但 Python 仍保留了足夠的彈性，開發者可以自己選擇是否使用。

討論中亦出現一些延伸比較，例如 Rust 和 C++ 的 `std::format` 在語法上與 Python 類似，甚至有人認為 Python 這種 `{expr:fmt}` 語法已經成為主流。不過，在執行方式上，Python f-string 的處理更直接，因為它會即時轉換成字串，而其他語言如 Rust，則傾向把格式化當成回傳可檢查的物件。這顯示程式語言社群在字串格式化上的演化和取捨。對於 Python 使用者而言，f-string 已經是不可或缺的工具，有人覺得它仍在保持簡潔與強大之間的平衡，也有人認為它正逐漸變成「過度設計」。

👥 20 則討論、評論 💬
https://news.ycombinator.com/item?id=44969221

fstring.help

Python f-string cheat sheet

Get quick help with Python's f-string syntax

👍1

103 views14:15

Hacker News 100 繁體中文

將圖片縮放武器化攻擊生產環境的 AI 系統 （★ 102 分）

這篇文章揭露了一種針對生產環境 AI 系統的新型攻擊手法：將圖片縮放 (image scaling) 當作武器。研究人員展示如何在表面無害的圖片中藏入多模態提示注入 (multi-modal prompt injection)，當圖片被系統自動縮小予以送入模型時，就會觸發隱藏的指令，進而竊取使用者資料。文章特別指出，Google Gemini CLI、Vertex AI Studio、Gemini 的網頁與 API 介面、Google Assistant 以及 Genspark 等系統都受到影響。例如在 Gemini CLI 上，使用者上傳的圖片沒有預覽，但實際被模型解析後卻包含惡意隱藏訊息，這些訊息進一步透過與 Zapier 整合的自動化工具，將使用者的 Google 行事曆資料竊取並寄送給攻擊者。

這種攻擊手法核心在於圖片縮小過程中的插值演算法 (interpolation algorithms)，包括鄰近點插值、雙線性插值與雙三次插值。由於不同程式庫 (如 Pillow、PyTorch、OpenCV、TensorFlow) 的實作方式略有差異，攻擊者必須為目標系統進行指紋化測試，選擇相應的手法來精準植入攻擊訊號。研究團隊甚至推出了一個名為 Anamorpher 的開源工具，能幫助使用者設計並測試對不同縮放演算法的攻擊，揭示出這種威脅不僅存在於學術實驗中，而是相當實用且遍布於常見的 AI 應用。

面對這種安全威脅，作者建議避免隨意對圖片進行縮放，或至少限制上傳圖片的尺寸，並確保使用者總能看到模型實際接收的輸入，避免高解析度與下採樣影像之間的落差。此外，系統應確保所有涉及潛在敏感操作的動作必須經過使用者明確確認，而不是依賴預設的信任設定。更根本的防禦仍需建立安全設計模式與系統化防護，以降低提示注入造成資料外洩與遠端執行的風險。

在 Hacker News 的討論中，許多開發者對這種攻擊表示高度警惕，特別是因為它揭示了生成式 AI 模型本質上的不確定性與易受攻擊性。有評論指出，大型語言模型 (LLM, Large Language Model) 本來就難有嚴謹的安全保障，因為它們完全依賴輸入訊息進行「帶內訊號傳遞」，等於重蹈早期系統設計的覆轍，只能依靠沙箱 (sandbox) 或額外封裝來減少風險。一些人直言，AI 公司現階段優先追求市場熱潮與商業利益，安全被視為成本而非特性，因此加劇風險。也有人強調這涉及「視覺語言模型 (VLM, Vision Language Model)」的特性，即模型能直接讀取圖片中文字，卻難以區分哪些應視為上下文提示或惡意指令，這讓攻擊近乎無法避免，甚至有人呼籲建立專門針對 VLM 的安全規範，如 OWASP 最近釋出的多代理系統安全建模指引。

綜合來看，這篇文章與討論揭露了 AI 系統設計的一大隱憂：當多模態模型在處理複雜輸入時，隱藏其中的惡意訊息極容易繞過傳統的防線。這不僅是圖像傳輸過程的技術漏洞，更凸顯了 AI 安全與設計哲學上的重大挑戰。許多技術社群成員認為，如果未來 AI 廣泛融入日常應用卻未能落實安全設計，將可能重演過去網際網路安全的慘痛教訓，只是這次破壞力更大且更難以追蹤。

👥 16 則討論、評論 💬
https://news.ycombinator.com/item?id=44971845

The Trail of Bits Blog

Weaponizing image scaling against production AI systems

In this blog post, we’ll detail how attackers can exploit image scaling on Gemini CLI, Vertex AI Studio, Gemini’s web and API interfaces, Google Assistant, Genspark, and other production AI systems. We’ll also explain how to mitigate and defend against these…

96 views15:15

Hacker News 100 繁體中文

融資融券餘額攀至歷史新高 （★ 100 分）

7 月美國融資交易債務（margin debt）再創新高，達 1.02 兆美元，較 6 月上升 1.5%，並已連續三個月增長，年增率更高達 26.1%。折算通膨後數據顯示，當前的融資水準是自 2021 年底以來最高點。文章回顧歷史可以看到，融資融券餘額的高峰與股市高點常常呈現高度重疊，例如 2000 年科技泡沫、2007 年金融危機前夕，以及 2021 年疫情後資金氾濫時期。當融資餘額急速上升，往往隨後伴隨股市修正，反之股市見底時也通常會出現融資急速下降。這凸顯了融資餘額作為投資人風險偏好與市場多空循環的重要指標。

除了單純金額創紀錄，若觀察 S&P500 指數與融資餘額的通膨調整後走勢，兩者長期同步性相當高，意味融資熱潮往往伴隨市場上升。文章也呈現另一個角度：以「投資人信用餘額」（包括自由資金、保證金帳戶餘額扣除融資額度）分析，截至 2025 年 7 月，該數據為 -6411.64 億美元，創下新低，顯示投資人整體可用資金更少，槓桿化程度更高。雖然不能斷定必然引爆大規模拋售，但這顯然提升了市場潛在風險。

在 Hacker News 的討論中，許多投資人關注這是否意味泡沫將至。有些人引用經典諺語提醒，當「連奶奶都想開融資帳戶」時，市場通常已經處於過熱狀態。部分評論直指當前的 AI 與 GPU 類股盛況與 1999 年科技泡沫相似，過度依賴槓桿資金推升股價極不健康，也有人感嘆巴菲特等資深投資人正在大幅減碼持股，似乎在預告風險。另有聲音指出，市場可能還有幾百點的 S&P500 上漲空間，但墜落速度和幅度將無法預測。

也有專業觀點提醒，單看融資金額創新高未必代表過度風險，因為市場總值同樣處於歷史高點。如果轉換為相對比例，槓桿程度可能不及過往某些危險時期。此外部分人強調，Fed（美國聯準會）利率政策、政治干預、以及財政刺激對市場影響已比傳統估值模型更為主導，這使過往以槓桿與市場高低點的對照關係未必絕對可靠。

最後，從投資策略角度，評論區出現明顯分歧。有部分人像「麥可·貝瑞（Michael Burry）」一樣建議全面持有現金，等待崩盤後再入市；但也有人提醒「坐等崩盤」常常會錯失長期複利回報，最理性的方式仍是紀律化定期投入指數型基金。另一些人則建議透過黃金、TIPS（美國通膨保值債券）、多元化配置或國際市場分散風險。整體討論反映了投資人對當前市場的矛盾心態：既擔憂融資創新高帶來泡沫隱憂，又無法忽視風險資金持續推升行情的現實。

👥 126 則討論、評論 💬
https://news.ycombinator.com/item?id=44971396

Advisorperspectives

Margin Debt Surges 9.5% in June to Record High

FINRA's latest data, through June, reveals record-high margin debt at $1007.961 billion. This marks the second consecutive monthly increase, with a 9.5% jump from May.

94 views15:15

Hacker News 100 繁體中文

AI 爬蟲與抓取器正在拖垮網站，Meta 與 OpenAI 是最大元凶 （★ 104 分）

Fastly 公佈的一份最新報告指出，來自大型 AI 公司的自動化爬蟲與抓取器正在給網站基礎設施帶來沉重負擔。報告顯示，AI 相關流量中有約 80% 來自訓練用的爬蟲，其餘 20% 則來自使用者即時查詢引發的抓取器。Meta 的 AI 部門佔據超過一半的爬蟲流量，其次是 Google 23%、OpenAI 20%，三者合計達到 95%。至於即時抓取部分，OpenAI 幾乎壟斷市場，佔比高達 98%，顯示出 ChatGPT 在市場上的優勢與其基礎設施的巨大負荷。Fastly 指出，這些機器人若設計不當，可能對伺服器造成高達每分鐘數萬次的請求，導致效能下降、服務中斷與營運成本提升。

報告強調，在缺乏透明身份標示與標準驗證的情況下，網站經營者難以區分合法與惡意流量，也難於設定有效防護規則。目前已有部分網站選擇抵抗，例如部署「Anubis」這類需證明工作量的防禦機制，或使用「Nepenthes」這種向爬蟲回傳無用亂碼的陷阱系統。Cloudflare 甚至測試「按次收費」模式，嘗試將負擔轉嫁回這些 AI 大廠。不過，Fastly 也提醒要謹慎使用，以免誤傷正常使用者。此外，小型網站與提供動態內容的經營者受到的衝擊最為嚴重，他們往往缺乏專業技術人力來應對 AI 流量的浪潮。

面對機器人持續忽視 robots.txt 規則的現象，Fastly 呼籲即使不制定強制規範，至少 AI 公司應公開其 IP 範圍並使用獨特名稱，以利網站區分與過濾。但 Anubis 開發者 Xe Iaso 則更直言，這已經不是單純的技術問題，而是需要透過政府立法介入的監管議題，應以懲罰性罰金和強制賠償壓制這類對數位公共資源有害的行為。他認為除非「AI 泡沫」破滅，否則爬蟲流量只會持續增長，直到資金鏈斷裂才可能減弱。

Hacker News 討論中，許多開發者分享了切身經驗。一些人指出，訓練資料用的爬蟲比即時查詢的抓取器負擔更大，因為它們無差別索引整個網站，包括冷資料，造成大量無效流量，遠超過一般使用者需求所帶來的負荷。另一些中小網站經營者則抱怨，OpenAI 的爬蟲曾在短時間內造成數萬次訪問，甚至導致資料庫當機，只能被迫啟用 Cloudflare 或乾脆設置登入限制。也有人表示，公司雖然宣稱遵守 robots.txt，但實際上不少爬蟲會刻意繞過快取，甚至偽裝成普通瀏覽器，造成持續的壓力。

有人強調，像 Cloudflare 或 Anubis 這些工具確實有幫助，但對於不想依賴 CDN 的小站來說仍屬治標不治本。許多留言指出，真正的問題是 AI 公司對資料來源缺乏尊重，沒有設置速率限制或緩存機制，完全將成本外部化到網站業主身上。部分參與者甚至質疑，這份 Fastly 報告某種程度上也像是推銷自家防護服務的軟性廣告，但仍承認 AI 爬蟲所帶來的壓力是當前不可忽視的實際問題。

整體而言，核心矛盾在於 AI 發展對訓練資料和即時內容的巨大需求，與網站運營者保護伺服器資源和經營模式之間的衝突。從技術抵抗到監管呼籲，雙方僵局仍在持續擴大。隨著 AI 工具滲透日常生活，這場關於數位公共資源分配的攻防戰短期內恐怕難以降溫。

👥 43 則討論、評論 💬
https://news.ycombinator.com/item?id=44971487

The Register

AI crawlers and fetchers are blowing up websites, with Meta and OpenAI the worst offenders

Updated: One fetcher bot seen smacking a website with 39,000 requests per minute

100 views15:30

Hacker News 100 繁體中文

洗錢防制系統究竟有多有效？ （★ 104 分）

洗錢是一種將犯罪所得掩飾合法來源的過程，涉及組織犯罪、毒品販運、貪汙與恐怖主義資金等。近幾十年來，國際社會透過《金融行動工作組》（FATF, Financial Action Task Force）等機構推動嚴格的反洗錢制度（AML, Anti-Money Laundering），要求銀行、保險業、律師會計等「義務機構」進行顧客身分確認（KYC）與可疑交易申報（SAR）。然而學界普遍認為，這套龐大體系的實際效果有限。許多研究顯示，洗錢流程依舊相對簡單，犯罪組織不見得需要高深技術，即能繞過限制。更有甚者，大銀行雖因違規支付了巨額罰款，但高層主管鮮少受到刑事追訴，形成「花錢了事」的惡性循環。

儘管全球花費已達數千億美元，但 AML 系統在減少犯罪、凍結資金或提高洗錢成本方面的成效薄弱。例如，美國的可疑活動報告數量在 1996 至 2023 年間暴增七十倍，但同期的定罪數字卻停滯不前，比例甚至逐年下降。資產查扣效率同樣低落，聯合國與歐盟估計，實際可沒收的犯罪收益不到總額的 2%。同時，因「去風險化」（de-risking）政策，許多高風險群體甚至被拒絕開戶或遭到「去銀行化」（debanking），對於中小企業、移工家庭、甚至某些弱勢國家都造成嚴重影響，反而將資金推向無監管的地下金融體系。

文章指出，AML 系統的另一問題是成本與風險外部化。銀行合規支出鉅額，以美加為例，2023 年僅合規成本就超過 600 億美元，最終往往轉嫁到一般客戶身上。更嚴重的是，監管與數據庫常被濫用，從無審判即凍結帳戶，到威權政府利用 AML 規則打壓非政府組織和異議人士，美國、塞爾維亞與烏干達等案例顯示，洗錢防制有時成了政治工具而非金融安全保障。雖然 FATF 對低收入國家的壓力近年稍稍放鬆，但整體標準仍高度偏向富裕國家利益，而巨大的執行成本卻強加在發展中國家。

Hacker News 的討論延伸出幾個面向。部分留言認為，既然洗錢金額龐大，這些資金早已滲透股票與房地產市場，若能徹底沒收將可能導致股市與住宅價格暴跌，引發社會震盪，因此政府未必真心想「完全杜絕」洗錢；尤其在房市，許多選民自身即為既得利益者。另有人指出，AML/KYC 幾乎總是對守法者造成麻煩，卻未有效阻止大規模犯罪，甚至讓大銀行與政府在罰款中「分食利益」，小型用戶與移民卻被迫承擔審查與歧視。發言者也提到加密貨幣：雖然有人聲稱其洗錢規模相對小，但因使用便利，實際上已成為最快速的資金轉移方式，也因此引來關注和打擊。

還有評論批判洗錢法規本質上是在懲罰「持有資產但無法舉證來源」的無辜民眾，導致「被推定有罪」的情境。一些用戶分享，祖輩留存數十年的現金或資產，如今在購屋過程仍被要求提供來源證明，深感荒謬。此外，有人比較 AML 與其他「以安全為名」的監控措施，例如類似美國運輸安全管理局（TSA）的安檢，以「防恐怖主義」為理由，卻產生對一般民眾的廣泛監控與侵害。總體而言，多數討論對現行 AML 規範持高度懷疑，認為其推動動機往往與金融控制、政治目的甚至維護大型金融機構利益相關，而非真正打擊犯罪。

總結來看，反洗錢制度雖然已成全球共識，但其高成本、低效率與意外後果讓學界與民間廣泛質疑。AML 帶來的最大價值或許是在為執法單位提供情報基礎，而非實質阻止犯罪。然而，這樣的系統已明顯失衡，其成本與副作用超過顯著的成果，該如何改革、如何在防制犯罪與保護公民自由之間取得平衡，正等待更透明與深入的公共辯論。

👥 77 則討論、評論 💬
https://news.ycombinator.com/item?id=44972213

Crime and Justice

How Well Does the Money Laundering Control System Work? | Crime and Justice

Abstract The continued globalization of finances has generated an ever-larger array of methods for making criminal earnings appear legitimate. The global regime to control money laundering has become more sophisticated and comprehensive, (i.e., expensive…

97 views16:15

Hacker News 100 繁體中文

95% 的企業在投入 300 億美元於生成式 AI 上看不到任何回報 （★ 103 分）

麻省理工學院最新研究發現，過去三年全球企業在生成式人工智慧 (Generative AI) 的專案上投入約 300 億至 400 億美元，但其中 95% 公司回報「沒有任何實質商業收益」。僅有約 5% 的企業在 AI 導入試驗中成功取得數百萬美元價值，其餘大多未能帶來營收或獲利提升。雖然超過八成大型企業曾經測試過 ChatGPT、Copilot 等大型語言模型 (LLM, Large Language Model)，甚至將其導入部分業務流程，但實際應用多停留在提高個人工作效率，而不是創造整體公司利潤。

研究指出，主要問題在於這些 AI 工具往往難以貼合實際工作流程，存在「脆弱的作業模式、缺乏情境化學習、與日常運營不符」等缺陷。與人類不同，生成式 AI 無法長期保留回饋、隨任務類型持續演進，也不容易將經驗應用到不同情境，因此難以帶來長期效益。報告強調，與外界擔憂 AI 將大規模取代人力相反，目前 AI 的影響更可能是讓企業降低外包成本，而非立刻裁撤大群員工。成功案例多半集中在客服回覆、程式輔助撰寫、文件草稿生成等有限領域，全公司層級的全面整合仍被認為過早且容易失敗。

Hacker News 上的討論延伸了這份報告的觀察。部分評論指出企業在成本效益計算上常出現錯置，例如 AI 確實帶來些許生產力提升，但購買或租用工具的成本往往高於所創造的價值，導致本末倒置。有開發者認為 AI 公司刻意定價過高，把大部分價值抽走，企業幾乎沒有誘因使用；而顧問費用與基礎建設 (特別是 NVIDIA 的 GPU) 花費，更可能占掉大部分資金。也有人形容這波熱潮像是 2009 年的 Google 搜尋體驗被錯以為「未來革命」，結果許多公司燒錢只為了得到一個昂貴但容易出錯的聊天機器人。

部分專業人士分享了具體應用，例如用 AI 替代人工撰寫客服電話紀錄摘要，便能在不裁員的情況下節省大量時間與成本，這顯示 AI 在特定狹窄場景仍具明顯效益。然而不少開發者提醒，這些案例多屬於「自動化瑣碎工作」而非核心策略，因此不可能帶來企業層級的顛覆性成長。另一些評論則批評投資人與高層過度受「害怕錯過熱潮」(FOMO, Fear of Missing Out) 影響，投入數十億美元卻缺乏實務上的長期驗證。

整體而言，此份 MIT 報告與討論反映了一個清楚的趨勢：生成式 AI 確實能在個別任務提高效率，但普遍難以轉換成企業利潤，原因在於工具能力與營運現實存在落差。專家建議企業應放下幻想，把 AI 當成輔助性的生產力工具，而非短期內能推動成長的神奇引擎。隨著市場從炒作走向「幻滅低谷」(Trough of Disillusionment)，未來能真正創造價值的公司，將會是那些懂得聚焦於具體、可衡量應用的企業。

👥 46 則討論、評論 💬
https://news.ycombinator.com/item?id=44974104

The Daily Adda

95% of Companies See ‘Zero Return’ on $30 Billion Generative AI Spend, MIT Report Finds

Over the last three years, companies worldwide have invested between 30 and 40 billion dollars into generative artificial intelligence projects. Yet most of these efforts have brought no real business…

90 views16:45

Hacker News 100 繁體中文

Apple Watch 可穿戴式基礎模型 （★ 104 分）

這篇討論的主題來自一篇由 Apple 研究團隊提出的論文，內容聚焦於 Apple Watch 的「可穿戴式基礎模型 (wearable foundation model)」。相較於過去研究直接訓練原始感測器資料（例如光體積描記法 PPG 與加速度計），該模型升級至更高層次的抽象：它是以由感測器資料推導出的人體行為生物特徵時間序列（如心率變異 HRV、靜息心率等）進行訓練。研究結果顯示，在多種健康問題的檢測上表現準確度相當高，例如糖尿病 83%、心臟衰竭 90%、睡眠呼吸中止症 85% 等，顯示此技術具備臨床應用潛力。

在 Hacker News 上，許多評論集中於研究與實際應用的落差。有開發者詢問能否於自己的 Apple Watch 個人資料上運行該模型，但研究者指出該論文使用的權重無法公開，因為涉及參與者同意條款與隱私保護。不過，有會員提到 Apple 曾將研究成果轉化成實際功能，例如 Apple Watch 在 2023 年以前便已能計算 VO2 Max（最大攝氧量），其演算法來自一篇深度神經網路研究。這讓人期待未來這項「基礎模型」研究，是否也會成為蘋果穿戴裝置的功能之一。

另一個關注點在於公開資料與模型供外部醫療新創或學術單位使用的可行性。有人指出，目前並無對外釋出模型權重，也沒有 API 版本，這使得第三方開發者無法重現實驗結果。雖然蘋果裝置允許使用者匯出 XML 格式的個人健康資料，但若要建立應用來蒐集與處理使用者的 Apple Watch 健康資料，就會觸及醫療研究倫理、資料安全與去識別化的高標準規範，對非大型科技公司而言難以突破。

討論中也出現語義上的澄清：「wearable foundation model」應被理解為「服務於可穿戴式裝置的基礎模型」，而非「可穿戴型的基礎」。有評論者更深入點出技術細節，例如這篇研究採用了對比損失函數 (contrastive loss)，而非一般模型常見的重建損失函數 (reconstruction loss)，顯示其方法論在機器學習領域中具有特色。整體來看，技術界對於 Apple 嘗試以健康行為特徵建立高階模型的方向感到新穎且具有前瞻性，但同時也擔憂資料封閉帶來的侷限。

👥 12 則討論、評論 💬
https://news.ycombinator.com/item?id=44973375

arXiv.org

Beyond Sensor Data: Foundation Models of Behavioral Data from...

Wearable devices record physiological and behavioral signals that can improve health predictions. While foundation models are increasingly used for such predictions, they have been primarily...

86 views17:30

About

Blog

Apps

Platform