价格: $0.15090 2.9605%
市值: $22.92B 0.7601%
成交额 (24h): 1.55B 0%
统治地位: 0.7601%
Price: $0.15090 2.9605%
市值: $22.92B 0.7601%
成交额 (24h): 1.55B 0%
统治地位: 0.7601% 0.7601%
  • 价格: $0.15090 2.9605%
  • 市值: 22.92B 0.7601%
  • 成交额 (24h): 1.55B 0%
  • 统治地位: 0.7601% 0.7601%
  • 价格: $0.15090 2.9605%
首页 > 视频 > EP18 | 当AI 把效率推到极限,反而最缺的是这个能力

EP18 | 当AI 把效率推到极限,反而最缺的是这个能力

发布: 2026/05/28 21:12 阅读: 0

原文作者:Yoi 科技 Open 講

原文来源:https://www.youtube.com/embed/8SYHdSXUqxo

🎧 你知道吗?这几天AI 圈同时发生了几件值得细看的事:一个叫DeepSWE 的新基准测试让GPT-4o 和Claude 的真实差距首度清晰现形;Tenstorrent 推出成本只有Nvidia 五分之一的AI 晶片;而一位叫Andrej Karpathy 的研究员,正在重新定义下一代工程师的核心能力。表面上科技圈节奏如常,暗地里算力架构、评测标准、工程思维全在同步翻牌。别焦虑,我已经帮你戴上降噪耳机,把这些讯号里的真正含金量滤出来了。这集还多聊了一件事:当AI 让效率变成人人标配,最稀缺的反而是判断力——也就是矽谷现在最热的那个词:Taste。 1️⃣ 本集精华这集从四个角度拆解了AI 生态系目前真正在发生的事。 第一层是「量测」:DeepSWE 这个新基准测试第一次让开发者的真实手感被数据验证,它的出题方式模拟真实工作情境,提示词短但要求的解决方案复杂,考的是端到端推理,不是记忆力。 GPT-4o 对上Claude 3 Opus 整整差了15 个百分点,成本差了三倍。你选错模型,烧的不只是钱,是时间。 第二层是「硬体」:Tenstorrent 的架构颠覆了GPU 的核心假设,把排程逻辑从晶片搬进编译器,用便宜的GDDR6 记忆体跑赢Nvidia 的高频宽记忆体系统。跑Llama 3 的成本从每百万token 30 美元压到6 美元,便宜五倍。 第三层是「工程思维」:Andrej Karpathy 提出的Agent工程五支柱,核心洞察是:停止建功能,开始建「帮你建功能的工厂」。 第四层是「情境引擎」:没有它,Agent工厂空转。有了它,同样的任务从2.5 小时压缩到25 分钟,token 用量砍半,输出品质直接过关。 贯穿这四层的是一个更大的观察:当AI 把执行效率推到极限,真正稀缺的反而是判断力——知道什么值得做、什么不该做,也就是Taste。 2️⃣ 本集聊这些事📌 [ DeepSWE 基准测试]:第一个真正反映开发者实战手感的AI 评测,GPT-4o 对Claude 3 Opus 差距高达15 个百分点📌 [ Tenstorrent 挑战Nvidia ]:Jim Keller 把AI 晶片成本压到五分之一,靠的是把GPU 的核心假设全部丢掉📌 [ Agent工程五支柱]:Karpathy 的框架告诉你,下一代工程师的核心竞争力是设计让AI 有效工作的系统,而不只是使用AI 📌 [ 情境引擎的隐藏威力]:没有Context Engine,Agent工厂是空转;有了它,任务时间从150 分钟压缩到25 分钟📌 [ AI 时代最稀缺的能力是Taste ]:当效率变成所有人的基本配备,判断「什么值得做」的能力才是真正的护城河3️⃣ 《无人军团》与AI 时代的人文判断力最近读到一本书,书名叫《无人军团:AI 战争王者帕尔默.拉奇与Anduril 的崛起》。表面上,它是Palmer Luckey 的创业故事:21 岁把Oculus VR 卖给Facebook,后来因政治立场争议被矽谷放逐,最后转身创办Anduril,用AI、无人机与自主系统挑战传统军工体系。这个故事本身已经很有张力。 但更有意思的是,这本书的出版流程本身就是AI 时代的一个缩影——从写作、校稿、审阅到排版,整个流程大量使用AI。一本讨论AI 战争与无人军团的书,本身也透过AI 完成知识生产。这件事提醒我们的不只是「AI 很方便」,而是过去需要大量人力、时间与专业分工才能完成的事情,正在被系统性地压缩。 这让我想到一个问题:当AI 把效率推到极致之后,效率本身反而不再足以回答最重要的问题。 AI 可以让我们更快写完一本书,但它不能替我们决定这本书为什么值得被写。 AI 可以让公司更快做出产品,但它不能替我们判断这个产品是否真的让人的生活更好。真正危险的,不是AI 变得太强,而是人类的判断力没有跟着变强。矽谷现在很多人在谈的那个词「Taste」,说的正是这件事:在无限可能里,分辨什么值得存在的能力。 👉 如果你对Palmer Luckey、Anduril 与AI 军工体系的崛起有兴趣,这本书值得找来读。 📣 这集从DeepSWE 的评测数据、Tenstorrent 的晶片架构,一路聊到Agent工程思维和情境引擎,说真的,这些技术层面的变化速度确实让人喘不过气。但越是这样,我越确定一件事:技术能不能做到,正在变得越来越不是最困难的问题。真正困难的是,你有没有足够的判断力,去决定什么该做、什么不做,什么只是噪音、什么才是真正的讯号。资讯量越大,你越需要一副好的降噪耳机帮你滤出值得关注的东西。如果今天这集有帮你从这些讯号里找到一两个有用的方向,别忘了在Apple Podcast 留下五星好评、订阅追踪「Yoi 科技Open 讲」,让我每周一、周三、周五继续帮你把含金量最高的产业动态整理清楚! 想持续掌握第一手产业动态与实战科技趋势?欢迎追踪优易的社群平台: 🔍 FB / IG / Threads 请搜寻:Yoi Studio、@yoi__studio -- Hosting provided by SoundOn (https://www.soundon.fm/)

精选专题

  • 狗狗币鲸鱼活动
    狗狗币鲸鱼活动
    通过我们的综合分析,了解狗狗币鲸鱼活动的最新见解。了解趋势、模式以及这些鲸鱼对狗狗币市场的影响。随时了解我们的专家分析,并在您的加密货币之旅中保持领先。
  • 狗狗币挖矿
    狗狗币挖矿
    狗狗币挖矿是向狗狗币区块链添加新交易块的过程。矿工因其工作而获得新的狗狗币奖励。本主题提供与狗狗币挖矿相关的文章,包括如何挖矿狗狗币、最好的挖矿硬件和软件以及狗狗币挖矿的盈利能力。
  • SpaceX 星舰发射
    SpaceX 星舰发射
    本主题提供与 SpaceX 星舰发射相关的文章,包括发射日期、任务详细信息和发射状态。通过此信息丰富且全面的资源,了解最新的 SpaceX 星际飞船发射情况。
  • 模因之王:狗狗币
    模因之王:狗狗币
    本主题提供与最流行的模因相关的文章,包括“模因之王:狗狗币”。 Memecoin 已成为加密货币领域的主导者。这些数字资产之所以受欢迎有多种原因。他们推动了区块链最具创新性的方面。