一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

Andrej Karpathy

建筑@EurekaLabsAI。曾任人工智能总监@特斯拉，创始团队@OpenAI，CS231n/博士@斯坦福大学。我喜欢训练大型深度神经网络。

随着对代币需求的激增，存在着重组底层内存+计算的重大机会，以便为LLMs提供*恰到好处*的支持。根本且不明显的限制是，由于芯片制造过程，你会得到两个完全不同的内存池（物理实现也不同）：1）紧邻计算单元的片上SRAM，速度极快但容量非常低；2）离芯片的DRAM，容量极高，但其内容只能通过一根长吸管来提取。除此之外，架构的许多细节（例如，脉动阵列）、数值等也会影响。设计最佳的物理基底，然后在LLMs的顶层工作流（推理预填充/解码、训练/微调等）中协调内存+计算，以获得最佳的吞吐量/延迟/$，可能是今天最有趣的智力难题，回报最高（\cite 4.6T的NVDA）。所有这些都是为了快速且便宜地获取许多代币。可以说，最重要的工作流（推理解码*和*在紧密的代理循环中处理长代币上下文）是最难以同时实现的，~现有的两派（以HBM为先的NVIDIA相关和以SRAM为先的Cerebras相关）都面临挑战。无论如何，MatX团队的表现非常出色，我很高兴能有小小的参与，并祝贺你们的融资成功！

对即将到来的高度定制软件时代非常感兴趣。今天早上的一个例子——我最近在有氧运动方面有点放松，所以我决定进行一个更严肃、规范的实验，试图在8周的实验期间将我的静息心率从50降低到45。实现这一目标的主要方法是努力在Zone 2有氧运动中达到一定的总分钟目标，并每周进行1次高强度间歇训练（HIIT）。 1小时后，我为这个非常具体的实验编写了一个超级定制的仪表板，显示我如何跟踪进展。Claude不得不逆向工程Woodway跑步机的云API，以提取原始数据、处理、过滤、调试并创建一个Web UI前端来跟踪实验。这并不是一个完全顺利的体验，我不得不注意并要求修复错误，例如它搞错了公制与英制单位，并且在日历上匹配日期时也出现了问题。但我仍然觉得整体方向是明确的： 1）永远不会（也不应该）有一个特定的应用程序在应用商店中用于这种事情。我不应该寻找、下载和使用某种“有氧实验跟踪器”，当这个东西大约300行代码时，一个LLM代理会在几秒钟内给你。选择一组离散应用程序的“应用商店”概念在LLM代理可以现场即兴创作应用程序并仅为你服务时，感觉有些错误和过时。 2）其次，行业必须重新配置为一组传感器和执行器的服务，具有代理原生的人体工程学。我的Woodway跑步机是一个传感器——它将物理状态转化为数字知识。它不应该保持某种人类可读的前端，我的LLM代理也不应该逆向工程它，它应该是一个API/CLI，易于我的代理使用。我对这一进展在整个行业中发生得如此缓慢感到有些失望（我的时间表相应地变慢）。99%的产品/服务仍然没有AI原生CLI。99%的产品/服务保持.html/.css文档，仿佛我不会立即寻找如何将整个内容复制粘贴到我的代理中以完成某事。他们在网页上给你一系列指令，打开这个或那个URL，点击这里或那里去做某事。在2026年。我是计算机吗？你来做。或者让我的代理来做。所以今天我很惊讶这个随机的事情花了1小时（两年前大约需要10小时）。但更让我兴奋的是思考这本该最多1分钟。需要什么条件才能让它变成1分钟？这样我可以简单地说“嗨，你能帮我跟踪接下来的8周的有氧运动吗”，在非常简短的问答后，应用程序就会启动。AI会已经有很多个人背景，它会收集额外所需的数据，参考和搜索相关的技能库，并维护我所有的小应用程序/自动化。简而言之，选择一组离散应用程序的“应用商店”本身是一个越来越过时的概念。未来是通过LLM粘合剂编排的AI原生传感器和执行器的服务，形成高度定制、短暂的应用程序。它只是还没有到来。