热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
上周,Karpathy 发布了终极指南,教你如何快速进入 LLMs。
在这个项目中,你将构建所有基本要素,代码行数不超过 8k。
> 训练分词器——新的 Rust 实现
> 在 fineweb 上预训练一个变换器 LLM
> 在多个指标上评估核心分数
> 中途训练——来自 smoltalk 的用户助手对话,
> 多项选择题,工具使用
> SFT,然后在以下方面评估聊天模型:
> 世界知识 MCQ(arc-e/c,mmlu)
> 数学(gsm8k)
> 代码(humaneval)
> 可选地在 gsm8k 上对模型进行 RL,使用“grpo”。
> 高效推理:
> KV 缓存,快速预填充/解码
> 工具使用(Python 解释器,沙盒环境)
> 通过 CLI 或类似 ChatGPT 的 WebUI 访问
> 写一份单一的 Markdown 报告卡,
> 总结并游戏化整个流程。
你将构建的模型:
> 仅使用旋转(不使用位置嵌入)
> QK 归一化...

热门
排行
收藏
