價格: $0.15090 2.9605%
市值: $22.92B 0.7601%
成交額 (24h): 1.55B 0%
統治力: 0.7601%
Price: $0.15090 2.9605%
市值: $22.92B 0.7601%
成交額 (24h): 1.55B 0%
統治力: 0.7601% 0.7601%
  • 價格: $0.15090 2.9605%
  • 市值: 22.92B 0.7601%
  • 成交額 (24h): 1.55B 0%
  • 統治力: 0.7601% 0.7601%
  • 價格: $0.15090 2.9605%
首頁 > 视频 > EP18 | 當 AI 把效率推到極限,反而最缺的是這個能力

EP18 | 當 AI 把效率推到極限,反而最缺的是這個能力

發布: 2026/05/28 21:12 閱讀: 0

原文作者:Yoi 科技 Open 講

原文來源:https://www.youtube.com/embed/8SYHdSXUqxo

🎧 你知道嗎?這幾天 AI 圈同時發生了幾件值得細看的事:一個叫 DeepSWE 的新基準測試讓 GPT-4o 和 Claude 的真實差距首度清晰現形;Tenstorrent 推出成本只有 Nvidia 五分之一的 AI 晶片;而一位叫 Andrej Karpathy 的研究員,正在重新定義下一代工程師的核心能力。表面上科技圈節奏如常,暗地裡算力架構、評測標準、工程思維全在同步翻牌。別焦慮,我已經幫你戴上降噪耳機,把這些訊號裡的真正含金量濾出來了。這集還多聊了一件事:當 AI 讓效率變成人人標配,最稀缺的反而是判斷力——也就是矽谷現在最熱的那個詞:Taste。 1️⃣ 本集精華 這集從四個角度拆解了 AI 生態系目前真正在發生的事。 第一層是「量測」:DeepSWE 這個新基準測試第一次讓開發者的真實手感被數據驗證,它的出題方式模擬真實工作情境,提示詞短但要求的解決方案複雜,考的是端到端推理,不是記憶力。GPT-4o 對上 Claude 3 Opus 整整差了 15 個百分點,成本差了三倍。你選錯模型,燒的不只是錢,是時間。 第二層是「硬體」:Tenstorrent 的架構顛覆了 GPU 的核心假設,把排程邏輯從晶片搬進編譯器,用便宜的 GDDR6 記憶體跑贏 Nvidia 的高頻寬記憶體系統。跑 Llama 3 的成本從每百萬 token 30 美元壓到 6 美元,便宜五倍。 第三層是「工程思維」:Andrej Karpathy 提出的Agent工程五支柱,核心洞察是:停止建功能,開始建「幫你建功能的工廠」。 第四層是「情境引擎」:沒有它,Agent工廠空轉。有了它,同樣的任務從 2.5 小時壓縮到 25 分鐘,token 用量砍半,輸出品質直接過關。 貫穿這四層的是一個更大的觀察:當 AI 把執行效率推到極限,真正稀缺的反而是判斷力——知道什麼值得做、什麼不該做,也就是 Taste。 2️⃣ 本集聊這些事 📌 [ DeepSWE 基準測試 ]:第一個真正反映開發者實戰手感的 AI 評測,GPT-4o 對 Claude 3 Opus 差距高達 15 個百分點 📌 [ Tenstorrent 挑戰 Nvidia ]:Jim Keller 把 AI 晶片成本壓到五分之一,靠的是把 GPU 的核心假設全部丟掉 📌 [ Agent工程五支柱 ]:Karpathy 的框架告訴你,下一代工程師的核心競爭力是設計讓 AI 有效工作的系統,而不只是使用 AI 📌 [ 情境引擎的隱藏威力 ]:沒有 Context Engine,Agent工廠是空轉;有了它,任務時間從 150 分鐘壓縮到 25 分鐘 📌 [ AI 時代最稀缺的能力是 Taste ]:當效率變成所有人的基本配備,判斷「什麼值得做」的能力才是真正的護城河 3️⃣ 《無人軍團》與 AI 時代的人文判斷力 最近讀到一本書,書名叫《無人軍團:AI 戰爭王者帕爾默.拉奇與 Anduril 的崛起》。表面上,它是 Palmer Luckey 的創業故事:21 歲把 Oculus VR 賣給 Facebook,後來因政治立場爭議被矽谷放逐,最後轉身創辦 Anduril,用 AI、無人機與自主系統挑戰傳統軍工體系。這個故事本身已經很有張力。 但更有意思的是,這本書的出版流程本身就是 AI 時代的一個縮影——從寫作、校稿、審閱到排版,整個流程大量使用 AI。一本討論 AI 戰爭與無人軍團的書,本身也透過 AI 完成知識生產。這件事提醒我們的不只是「AI 很方便」,而是過去需要大量人力、時間與專業分工才能完成的事情,正在被系統性地壓縮。 這讓我想到一個問題:當 AI 把效率推到極致之後,效率本身反而不再足以回答最重要的問題。AI 可以讓我們更快寫完一本書,但它不能替我們決定這本書為什麼值得被寫。AI 可以讓公司更快做出產品,但它不能替我們判斷這個產品是否真的讓人的生活更好。真正危險的,不是 AI 變得太強,而是人類的判斷力沒有跟著變強。矽谷現在很多人在談的那個詞「Taste」,說的正是這件事:在無限可能裡,分辨什麼值得存在的能力。 👉 如果你對 Palmer Luckey、Anduril 與 AI 軍工體系的崛起有興趣,這本書值得找來讀。 📣 這集從 DeepSWE 的評測數據、Tenstorrent 的晶片架構,一路聊到Agent工程思維和情境引擎,說真的,這些技術層面的變化速度確實讓人喘不過氣。但越是這樣,我越確定一件事:技術能不能做到,正在變得越來越不是最困難的問題。真正困難的是,你有沒有足夠的判斷力,去決定什麼該做、什麼不做,什麼只是噪音、什麼才是真正的訊號。資訊量越大,你越需要一副好的降噪耳機幫你濾出值得關注的東西。如果今天這集有幫你從這些訊號裡找到一兩個有用的方向,別忘了在 Apple Podcast 留下五星好評、訂閱追蹤「Yoi 科技 Open 講」,讓我每週一、週三、週五繼續幫你把含金量最高的產業動態整理清楚! 想持續掌握第一手產業動態與實戰科技趨勢?歡迎追蹤優易的社群平台: 🔍 FB / IG / Threads 請搜尋:Yoi Studio、@yoi__studio -- Hosting provided by SoundOn (https://www.soundon.fm/)

精選專題

  • 狗狗幣鯨魚活動
    狗狗幣鯨魚活動
    透過我們的綜合分析,了解狗狗幣鯨魚活動的最新見解。了解趨勢、模式以及這些鯨魚對狗狗幣市場的影響。隨時了解我們的專家分析,並在您的加密貨幣之旅中保持領先。
  • 狗狗幣挖礦
    狗狗幣挖礦
    狗狗幣挖礦是為狗狗幣區塊鏈添加新交易區塊的過程。礦工因其工作而獲得新的狗狗幣獎勵。本主題提供與狗狗幣挖礦相關的文章,包括如何挖礦狗狗幣、最好的挖礦硬體和軟體以及狗狗幣挖礦的獲利能力。
  • SpaceX 星艦發射
    SpaceX 星艦發射
    本主題提供與 SpaceX 星艦發射相關的文章,包括發射日期、任務詳細資訊和發射狀態。透過此資訊豐富且全面的資源,了解最新的 SpaceX 星際飛船發射情況。
  • 迷因之王:狗狗幣
    迷因之王:狗狗幣
    本主題提供與最受歡迎的迷因相關的文章,包括「迷因之王:狗狗幣」。 Memecoin 已成為加密貨幣領域的主導者。這些數位資產之所以受歡迎有許多原因。他們推動了區塊鏈最具創新性的方面。