热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Andrej Karpathy
建筑@EurekaLabsAI。曾任人工智能总监@特斯拉,创始团队@OpenAI,CS231n/博士@斯坦福大学。我喜欢训练大型深度神经网络。
随着对代币需求的激增,存在着重组底层内存+计算的重大机会,以便为LLMs提供*恰到好处*的支持。
根本且不明显的限制是,由于芯片制造过程,你会得到两个完全不同的内存池(物理实现也不同):1)紧邻计算单元的片上SRAM,速度极快但容量非常低;2)离芯片的DRAM,容量极高,但其内容只能通过一根长吸管来提取。除此之外,架构的许多细节(例如,脉动阵列)、数值等也会影响。
设计最佳的物理基底,然后在LLMs的顶层工作流(推理预填充/解码、训练/微调等)中协调内存+计算,以获得最佳的吞吐量/延迟/$,可能是今天最有趣的智力难题,回报最高(\cite 4.6T的NVDA)。所有这些都是为了快速且便宜地获取许多代币。可以说,最重要的工作流(推理解码*和*在紧密的代理循环中处理长代币上下文)是最难以同时实现的,~现有的两派(以HBM为先的NVIDIA相关和以SRAM为先的Cerebras相关)都面临挑战。无论如何,MatX团队的表现非常出色,我很高兴能有小小的参与,并祝贺你们的融资成功!

Reiner Pope11 小时前
我们正在构建一款 LLM 芯片,能够提供比其他任何芯片更高的吞吐量,同时实现最低的延迟。我们称之为 MatX One。
MatX One 芯片基于可拆分的脉动阵列,具有大型脉动阵列所著名的能量和面积效率,同时在具有灵活形状的小型矩阵上也能实现高利用率。该芯片结合了 SRAM 优先设计的低延迟和 HBM 的长上下文支持。这些元素,加上对数值的新颖看法,使得在 LLM 上的吞吐量超过任何已宣布的系统,同时与 SRAM 优先设计的延迟相匹配。更高的吞吐量和更低的延迟为您的订阅提供了更智能、更快速的模型。
我们已经筹集了 5 亿美元的 B 轮融资,以完成开发并快速扩大生产,预计在一年内完成流片。此次融资由 Jane Street 领投,这是一家最具技术敏感度的华尔街公司,以及 Situational Awareness LP,其创始人 @leopoldasch 撰写了关于 AGI 的权威备忘录。参与者包括 @sparkcapital、@danielgross 和 @natfriedman 的基金、@patrickc 和 @collision、@TriatomicCap、@HarpoonVentures、@karpathy、@dwarkesh_sp 等。我们还欢迎来自供应链的投资者,包括 Marvell 和 Alchip。
@MikeGunter_ 和我创立 MatX 是因为我们认为,最适合 LLM 的芯片应该从第一原则出发,深入理解 LLM 的需求及其演变方式。我们愿意放弃小模型性能、低容量工作负载,甚至编程的简易性,以实现这样的芯片。
我们现在是一支 100 人的团队,团队成员思考的内容涵盖学习率调度、Swing Modulo Scheduling、保护/舍入/粘性位、盲配连接——所有这些都在同一栋建筑内。如果您想帮助我们架构、设计和部署多代芯片的大规模生产,欢迎考虑加入我们。
52
命令行界面(CLIs)之所以令人兴奋,正是因为它们是一种“遗留”技术,这意味着AI代理可以原生且轻松地使用它们,通过整个终端工具包进行组合和交互。
例如,要求你的Claude/Codex代理安装这个新的Polymarket CLI,并请求任何任意的仪表板、界面或逻辑。代理会为你构建它。也安装Github CLI,你可以要求它们导航到代码库,查看问题、PR、讨论,甚至是代码本身。
示例:Claude在大约3分钟内构建了这个终端仪表板,显示了最高交易量的polymarkets和24小时变化。或者你可以将其制作成一个网页应用或任何你想要的东西。当你将其作为更大管道的模块使用时,功能更强大。
如果你有任何产品或服务,想想:代理能否访问并使用它们?
- 你的遗留文档(供人类使用)至少可以导出为markdown吗?
- 你为你的产品编写了技能吗?
- 你的产品/服务能通过CLI使用吗?或者MCP?
- ...
现在是2026年。为代理构建。


Suhail Kakar14 小时前
介绍 Polymarket CLI - AI 代理访问预测市场的最快方式
使用 Rust 构建。您的代理可以从终端查询市场、下单交易和提取数据
快速、轻量级、无开销
11
对即将到来的高度定制软件时代非常感兴趣。
今天早上的一个例子——我最近在有氧运动方面有点放松,所以我决定进行一个更严肃、规范的实验,试图在8周的实验期间将我的静息心率从50降低到45。实现这一目标的主要方法是努力在Zone 2有氧运动中达到一定的总分钟目标,并每周进行1次高强度间歇训练(HIIT)。
1小时后,我为这个非常具体的实验编写了一个超级定制的仪表板,显示我如何跟踪进展。Claude不得不逆向工程Woodway跑步机的云API,以提取原始数据、处理、过滤、调试并创建一个Web UI前端来跟踪实验。这并不是一个完全顺利的体验,我不得不注意并要求修复错误,例如它搞错了公制与英制单位,并且在日历上匹配日期时也出现了问题。
但我仍然觉得整体方向是明确的:
1)永远不会(也不应该)有一个特定的应用程序在应用商店中用于这种事情。我不应该寻找、下载和使用某种“有氧实验跟踪器”,当这个东西大约300行代码时,一个LLM代理会在几秒钟内给你。选择一组离散应用程序的“应用商店”概念在LLM代理可以现场即兴创作应用程序并仅为你服务时,感觉有些错误和过时。
2)其次,行业必须重新配置为一组传感器和执行器的服务,具有代理原生的人体工程学。我的Woodway跑步机是一个传感器——它将物理状态转化为数字知识。它不应该保持某种人类可读的前端,我的LLM代理也不应该逆向工程它,它应该是一个API/CLI,易于我的代理使用。我对这一进展在整个行业中发生得如此缓慢感到有些失望(我的时间表相应地变慢)。99%的产品/服务仍然没有AI原生CLI。99%的产品/服务保持.html/.css文档,仿佛我不会立即寻找如何将整个内容复制粘贴到我的代理中以完成某事。他们在网页上给你一系列指令,打开这个或那个URL,点击这里或那里去做某事。在2026年。我是计算机吗?你来做。或者让我的代理来做。
所以今天我很惊讶这个随机的事情花了1小时(两年前大约需要10小时)。但更让我兴奋的是思考这本该最多1分钟。需要什么条件才能让它变成1分钟?这样我可以简单地说“嗨,你能帮我跟踪接下来的8周的有氧运动吗”,在非常简短的问答后,应用程序就会启动。AI会已经有很多个人背景,它会收集额外所需的数据,参考和搜索相关的技能库,并维护我所有的小应用程序/自动化。
简而言之,选择一组离散应用程序的“应用商店”本身是一个越来越过时的概念。未来是通过LLM粘合剂编排的AI原生传感器和执行器的服务,形成高度定制、短暂的应用程序。它只是还没有到来。

206
热门
排行
收藏
