智猩猩

5天暴涨26.5k Star！AI大神Karpathy开源自动科研神器，AI智能体通宵自主跑实验改代码

分类： AI开源项目

2026-03-12 14:16:19

智猩猩AI整理

编辑：没方

以前在实验室“炼丹”训模型，那叫一个辛苦：深夜盯着TensorBoard看loss曲线，手动调学习率、改网络结构、换优化器，一次实验跑几个小时，还得反复迭代，熬夜是家常便饭。多少研究者感慨，要是AI能自己干这些脏活累活就好了。

现在，这个梦想成真了！

最近，AI大神 Andrej Karpathy 开源了AI 自主进化的科研循环系统 autoresearch，能够让 AI 智能体自己读指令、改代码、跑实验、评测结果、保留进步、丢弃失败，循环往复一整夜。让研究者们能够从重复的机械性工作中解放，专注于更具创造性的科研思考。这个项目上线数小时，X 平台发布帖浏览量破百万，GitHub 仓库目前已斩获26.5k Stars，被不少开发者视为 AI 自动科研的重要探索。

项目链接：https://github.com/karpathy/autoresearch

01 项目介绍

autoresearch 把 nanochat 的 LLM 训练核心精简成一个单 GPU、单文件版本，总共大约 630 行代码。其核心逻辑十分简洁：给 AI 智能体配置一个真实的 LLM 训练环境，它会自主修改训练代码；在固定 5 分钟时间内完成模型训练，随后通过验证指标判断效果是否提升；效果更好则保留修改，反之则丢弃并重新尝试，如此反复迭代。人类不再需要触碰底层 Python 代码，只需通过 Markdown 文件编写高级指令，为 AI 智能体设定科研方向，真正实现了 "人类定策略，AI 做执行" 的科研新模式。

整个系统只有三个核心文件：

prepare.py：固定不变，AI智能体不会动它。主要负责定义固定常量、完成一次性数据预处理（下载训练数据、训练 BPE 分词器），同时提供运行时工具（数据加载、模型评估），为整个训练过程搭建好基础环境。

train.py：唯一被AI智能体修改的文件，包含完整模型定义、优化器、训练循环。智能体会根据指令反复编辑、迭代这个文件，实现模型的自主优化。

program.md：这个 Markdown 文件是 AI 智能体的顶层指令表，包含科研方向、实验要求、评估标准等内容，人类通过修改它来引导 AI 智能体的实验方向。

autoresearch 系统设计每次实验只有 5 分钟训练预算。无论 GPU、算力配置如何，实验时间都固定为 5 分钟。模型效果通过 val_bpb（验证集 bits-per-byte）衡量，数值越低说明模型越好。由于该指标不依赖词表大小，不同架构之间也可以进行公平比较。除 PyTorch 和少量轻量依赖包外，无任何外部依赖。不支持分布式训练，也无需复杂配置。

02 使用

环境要求：单个NVIDIA GPU（已在 H100 上测试通过）、Python（3.10+）、uv（Python 极速包管理器）；

（1）配置环境

# 1. 安装 uv 项目管理器（如未安装）

curl -LsSf https://astral.sh/uv/install.sh | sh

# 2. 安装项目依赖

uv sync

# 3. 下载数据集并训练tokenizer（仅需执行一次，耗时约2分钟）

uv run prepare.py

# 4. 手动运行单次训练实验（耗时约5分钟）

uv run train.py

如果以上命令均可正常运行，说明环境配置成功，可以进入自动化科研模式。

（2）运行智能体

只需在本项目仓库中启动 Claude/Codex 或其他大模型（并关闭所有高危权限），然后发送以下提示词即可：

你好，请查看 program.md 文件，我们启动一轮新的实验！先完成环境配置。

program.md 文件本质上是一个极简版的skill。

03 让 AI 成为科研流程中的“基础设施”，而不仅仅是研究对象

当前的 autoresearch 仍处于探索阶段，仅支持单 NVIDIA GPU 运行、依赖外部大模型作为智能体执行代码修改与实验分析，实验范围也主要集中在小规模语言模型训练场景。这些特点决定了该系统仍需要人类持续优化和扩展。

但不可否认的是，这个项目为 AI 科研展示了一种清晰的可能路径：让 AI 成为科研流程中的“基础设施”，而不仅仅是研究对象。

从实验室里的手动“炼丹”，到 AI 智能体驱动的自动科研循环，这场变革的核心并不是 AI 取代人类，而是让 AI 承担重复性的实验工作，让研究者从繁重的调参与试错中解放出来，专注于那些真正需要创造力和洞察力的问题。

autoresearch 的开源，或许只是该趋势的一个早期信号。随着更多开发者与研究者参与其中，AI 自主科研的生态有望不断完善，推动人工智能技术以更快的速度向前演进。