绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
0
0
5天暴涨26.5k Star!AI大神Karpathy开源自动科研神器,AI智能体通宵自主跑实验改代码
分类: AI开源项目
2026-03-12 14:16:19

智猩猩AI整理

编辑:没方

以前在实验室“炼丹”训模型,那叫一个辛苦:深夜盯着TensorBoard看loss曲线,手动调学习率、改网络结构、换优化器,一次实验跑几个小时,还得反复迭代,熬夜是家常便饭。多少研究者感慨,要是AI能自己干这些脏活累活就好了。

现在,这个梦想成真了

最近,AI大神 Andrej Karpathy 开源了AI 自主进化的科研循环系统 autoresearch,能够让 AI 智能体自己读指令、改代码、跑实验、评测结果、保留进步、丢弃失败,循环往复一整夜。让研究者们能够从重复的机械性工作中解放,专注于更具创造性的科研思考。这个项目上线数小时,X 平台发布帖浏览量破百万,GitHub 仓库目前已斩获26.5k Stars,被不少开发者视为 AI 自动科研的重要探索。

  • 项目链接:https://github.com/karpathy/autoresearch

01 项目介绍

autoresearch 把 nanochat 的 LLM 训练核心精简成一个 单 GPU、单文件版本,总共大约 630 行代码。其核心逻辑十分简洁:给 AI 智能体配置一个真实的 LLM 训练环境,它会自主修改训练代码;在固定 5 分钟时间内完成模型训练,随后通过验证指标判断效果是否提升; 效果更好则保留修改,反之则丢弃并重新尝试,如此反复迭代。人类不再需要触碰底层 Python 代码,只需通过 Markdown 文件编写高级指令,为 AI 智能体设定科研方向,真正实现了 "人类定策略,AI 做执行" 的科研新模式。

整个系统只有三个核心文件:

prepare.py:固定不变,AI智能体不会动它。主要负责定义固定常量、完成一次性数据预处理(下载训练数据、训练 BPE 分词器),同时提供运行时工具(数据加载、模型评估),为整个训练过程搭建好基础环境。

train.py:唯一被AI智能体修改的文件,包含完整模型定义、优化器、训练循环。智能体会根据指令反复编辑、迭代这个文件,实现模型的自主优化。

program.md:这个 Markdown 文件是 AI 智能体的顶层指令表,包含科研方向、实验要求、评估标准等内容,人类通过修改它来引导 AI 智能体的实验方向。

autoresearch 系统设计每次实验只有 5 分钟训练预算。无论 GPU、算力配置如何,实验时间都固定为 5 分钟。模型效果通过 val_bpb(验证集 bits-per-byte) 衡量,数值越低说明模型越好。由于该指标不依赖词表大小,不同架构之间也可以进行公平比较。除 PyTorch 和少量轻量依赖包外,无任何外部依赖。不支持分布式训练,也无需复杂配置。

02 使用

环境要求:单个NVIDIA GPU(已在 H100 上测试通过)、Python(3.10+)、uv(Python 极速包管理器);

(1)配置环境

# 1. 安装 uv 项目管理器(如未安装)
curl -LsSf https://astral.sh/uv/install.sh | sh

# 2. 安装项目依赖
uv sync

# 3. 下载数据集并训练tokenizer(仅需执行一次,耗时约2分钟)
uv run prepare.py

# 4. 手动运行单次训练实验(耗时约5分钟)
uv run train.py

如果以上命令均可正常运行,说明环境配置成功,可以进入自动化科研模式

(2)运行智能体

只需在本项目仓库中启动 Claude/Codex 或其他大模型(并关闭所有高危权限),然后发送以下提示词即可:

你好,请查看 program.md 文件,我们启动一轮新的实验!先完成环境配置。

program.md 文件本质上是一个极简版的skill。

03 让 AI 成为科研流程中的“基础设施”,而不仅仅是研究对象

当前的 autoresearch 仍处于探索阶段,仅支持单 NVIDIA GPU 运行、依赖外部大模型作为智能体执行代码修改与实验分析,实验范围也主要集中在小规模语言模型训练场景。这些特点决定了该系统仍需要人类持续优化和扩展。

但不可否认的是,这个项目为 AI 科研展示了一种清晰的可能路径:让 AI 成为科研流程中的“基础设施”,而不仅仅是研究对象。

从实验室里的手动“炼丹”,到 AI 智能体驱动的自动科研循环,这场变革的核心并不是 AI 取代人类,而是让 AI 承担重复性的实验工作,让研究者从繁重的调参与试错中解放出来,专注于那些真正需要创造力和洞察力的问题。

autoresearch 的开源,或许只是该趋势的一个早期信号。随着更多开发者与研究者参与其中,AI 自主科研的生态有望不断完善,推动人工智能技术以更快的速度向前演进。