發布: 2026/05/28 21:12 閱讀: 0
原文作者:Yoi 科技 Open 講
原文來源:https://www.youtube.com/embed/8SYHdSXUqxo
🎧 你知道嗎?這幾天 AI 圈同時發生了幾件值得細看的事:一個叫 DeepSWE 的新基準測試讓 GPT-4o 和 Claude 的真實差距首度清晰現形;Tenstorrent 推出成本只有 Nvidia 五分之一的 AI 晶片;而一位叫 Andrej Karpathy 的研究員,正在重新定義下一代工程師的核心能力。表面上科技圈節奏如常,暗地裡算力架構、評測標準、工程思維全在同步翻牌。別焦慮,我已經幫你戴上降噪耳機,把這些訊號裡的真正含金量濾出來了。這集還多聊了一件事:當 AI 讓效率變成人人標配,最稀缺的反而是判斷力——也就是矽谷現在最熱的那個詞:Taste。 1️⃣ 本集精華 這集從四個角度拆解了 AI 生態系目前真正在發生的事。 第一層是「量測」:DeepSWE 這個新基準測試第一次讓開發者的真實手感被數據驗證,它的出題方式模擬真實工作情境,提示詞短但要求的解決方案複雜,考的是端到端推理,不是記憶力。GPT-4o 對上 Claude 3 Opus 整整差了 15 個百分點,成本差了三倍。你選錯模型,燒的不只是錢,是時間。 第二層是「硬體」:Tenstorrent 的架構顛覆了 GPU 的核心假設,把排程邏輯從晶片搬進編譯器,用便宜的 GDDR6 記憶體跑贏 Nvidia 的高頻寬記憶體系統。跑 Llama 3 的成本從每百萬 token 30 美元壓到 6 美元,便宜五倍。 第三層是「工程思維」:Andrej Karpathy 提出的Agent工程五支柱,核心洞察是:停止建功能,開始建「幫你建功能的工廠」。 第四層是「情境引擎」:沒有它,Agent工廠空轉。有了它,同樣的任務從 2.5 小時壓縮到 25 分鐘,token 用量砍半,輸出品質直接過關。 貫穿這四層的是一個更大的觀察:當 AI 把執行效率推到極限,真正稀缺的反而是判斷力——知道什麼值得做、什麼不該做,也就是 Taste。 2️⃣ 本集聊這些事 📌 [ DeepSWE 基準測試 ]:第一個真正反映開發者實戰手感的 AI 評測,GPT-4o 對 Claude 3 Opus 差距高達 15 個百分點 📌 [ Tenstorrent 挑戰 Nvidia ]:Jim Keller 把 AI 晶片成本壓到五分之一,靠的是把 GPU 的核心假設全部丟掉 📌 [ Agent工程五支柱 ]:Karpathy 的框架告訴你,下一代工程師的核心競爭力是設計讓 AI 有效工作的系統,而不只是使用 AI 📌 [ 情境引擎的隱藏威力 ]:沒有 Context Engine,Agent工廠是空轉;有了它,任務時間從 150 分鐘壓縮到 25 分鐘 📌 [ AI 時代最稀缺的能力是 Taste ]:當效率變成所有人的基本配備,判斷「什麼值得做」的能力才是真正的護城河 3️⃣ 《無人軍團》與 AI 時代的人文判斷力 最近讀到一本書,書名叫《無人軍團:AI 戰爭王者帕爾默.拉奇與 Anduril 的崛起》。表面上,它是 Palmer Luckey 的創業故事:21 歲把 Oculus VR 賣給 Facebook,後來因政治立場爭議被矽谷放逐,最後轉身創辦 Anduril,用 AI、無人機與自主系統挑戰傳統軍工體系。這個故事本身已經很有張力。 但更有意思的是,這本書的出版流程本身就是 AI 時代的一個縮影——從寫作、校稿、審閱到排版,整個流程大量使用 AI。一本討論 AI 戰爭與無人軍團的書,本身也透過 AI 完成知識生產。這件事提醒我們的不只是「AI 很方便」,而是過去需要大量人力、時間與專業分工才能完成的事情,正在被系統性地壓縮。 這讓我想到一個問題:當 AI 把效率推到極致之後,效率本身反而不再足以回答最重要的問題。AI 可以讓我們更快寫完一本書,但它不能替我們決定這本書為什麼值得被寫。AI 可以讓公司更快做出產品,但它不能替我們判斷這個產品是否真的讓人的生活更好。真正危險的,不是 AI 變得太強,而是人類的判斷力沒有跟著變強。矽谷現在很多人在談的那個詞「Taste」,說的正是這件事:在無限可能裡,分辨什麼值得存在的能力。 👉 如果你對 Palmer Luckey、Anduril 與 AI 軍工體系的崛起有興趣,這本書值得找來讀。 📣 這集從 DeepSWE 的評測數據、Tenstorrent 的晶片架構,一路聊到Agent工程思維和情境引擎,說真的,這些技術層面的變化速度確實讓人喘不過氣。但越是這樣,我越確定一件事:技術能不能做到,正在變得越來越不是最困難的問題。真正困難的是,你有沒有足夠的判斷力,去決定什麼該做、什麼不做,什麼只是噪音、什麼才是真正的訊號。資訊量越大,你越需要一副好的降噪耳機幫你濾出值得關注的東西。如果今天這集有幫你從這些訊號裡找到一兩個有用的方向,別忘了在 Apple Podcast 留下五星好評、訂閱追蹤「Yoi 科技 Open 講」,讓我每週一、週三、週五繼續幫你把含金量最高的產業動態整理清楚! 想持續掌握第一手產業動態與實戰科技趨勢?歡迎追蹤優易的社群平台: 🔍 FB / IG / Threads 請搜尋:Yoi Studio、@yoi__studio -- Hosting provided by SoundOn (https://www.soundon.fm/)
The Trading Kicxa
2026-06-18 10:35
Everhealer
2026-06-18 10:35
漫剧冲击波
2026-06-18 10:35
比特币米娅老师
2026-06-18 10:35
Dr Niki
2026-06-18 10:35
Dr Niki
2026-06-18 10:15
队长比特币行情分析
2026-06-18 09:57
Flash Crypto Tutorials
2026-06-18 09:38
Kenneth MEMES
2026-06-18 09:19
選擇貨幣
US Dollar
USD
Chinese Yuan
CNY
Japanese Yen
JPY
South Korean Won
KRW
New Taiwan Dollar
TWD
Canadian Dollar
CAD
Euro
EUR
Pound Sterling
GBP
Danish Krone
DKK
Hong Kong Dollar
HKD
Australian Dollar
AUD
Brazilian Real
BRL
Swiss Franc
CHF
Chilean Peso
CLP
Czech Koruna KČ
CZK
Singapore Dollar
SGD
Indian Rupee
INR
Saudi Riyal
SAR
Vietnamese Dong
VND
Thai Baht
THB
選擇貨幣
US Dollar
USD-$
Chinese Yuan
CNY-¥
Japanese Yen
JPY-¥
South Korean Won
KRW -₩
New Taiwan Dollar
TWD-NT$
Canadian Dollar
CAD-$
Euro
EUR - €
Pound Sterling
GBP-£
Danish Krone
DKK-KR
Hong Kong Dollar
HKD- $
Australian Dollar
AUD-$
Brazilian Real
BRL -R$
Swiss Franc
CHF -FR
Chilean Peso
CLP-$
Czech Koruna KČ
CZK -KČ
Singapore Dollar
SGD-S$
Indian Rupee
INR -₹
Saudi Riyal
SAR -SAR
Vietnamese Dong
VND-₫
Thai Baht
THB -฿