绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
×
首页
直播
合辑
专场
智东西
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
登录
免费注册
关注我们
智东西
车东西
芯东西
智猩猩
智东西
车东西
芯东西
智猩猩
智猩猩
智猩猩官网
智猩猩小程序
线下大会
预告
公开课
讲座
文章
AI技术解析
全部干货
不是结束,是开始的结束:写在 Step 3.5 Flash 发布与我在阶跃的一年半
聊聊理想中的大模型强化学习后训练系统
后注意力时代:Sparse is all you need
AI Infra:PyTorch Offload技术优化实践
华为王云鹤:谈谈扩散语言模型的“草稿-修订”新范式Diffusion in Diffusion
致敬 Kimi K2:基于 slime 的全流程 INT4 量化感知训练
AI Agent架构革命:为什么Skills模式正在取代Workflow?
SGLang RL Lead 赵晨阳:聊聊统一 VLM 与 LLM 的 Multi-Turn Agentic RL
Agent Memory(下):工作记忆折叠、会话档案化与记忆演化
Agent Memory(上):记忆的形态、功能与代表性路径
垂直领域 Agent 落地:为什么我放弃 235B/671B,转而训练 8B (下)
垂直领域 Agent 落地:为什么我放弃 235B/671B,转而训练 8B(上)
RL Infra架构演进:异步化是王道 从RLHF迈向Agentic RL
双重视角下的 Linear Attention:为什么 Chunkwise并行是必经之路
聊聊vLLM的PagedAttention技术:让多分支/并行采样不再爆显存
成也先验,败也先验!NeurIPS 2025 Best Paper Runner-up "Limit of RLVR" 碎碎念
万字干货!VERL源码解读 &实操笔记
华为左鹏飞年终总结:LLM 推理系统创新的四大趋势
2026年,让我们进入Agent RL时代
2025苦涩的Agent开发故事
上一页
1
2
下一页