绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
×
首页
直播
合辑
专场
智东西
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
登录
免费注册
关注我们
智东西
车东西
芯东西
智猩猩
智东西
车东西
芯东西
智猩猩
智猩猩
智猩猩官网
智猩猩小程序
线下大会
预告
公开课
讲座
文章
智猩猩AI
共发表了35篇文章
智猩猩AI
共发表了35篇文章
全部干货
垂直领域 Agent 落地:为什么我放弃 235B/671B,转而训练 8B(上)
AAAI 2026收录!让LLM更懂视觉的多模态预训练方法开源,7B模型完胜LLaVA-NeXT
4B超越Qwen3-32B!阿里开源轻量级推理模型,引入序列蒸馏新范式提升长链推理
RL Infra架构演进:异步化是王道 从RLHF迈向Agentic RL
R2还是V4?Model1引爆DeepSeek新一代模型猜想,硅谷网友:美国模型的大麻烦要来了
双重视角下的 Linear Attention:为什么 Chunkwise并行是必经之路
训练成本直降32%!阿里千问提出智能体分布式编排系统MegaFlow,稳定扩展至1万个并发任务
聊聊vLLM的PagedAttention技术:让多分支/并行采样不再爆显存
全面超越GRPO!英伟达提出GDPO方法,破解多奖励强化学习坍塌难题
成也先验,败也先验!NeurIPS 2025 Best Paper Runner-up "Limit of RLVR" 碎碎念
万字干货!VERL源码解读 &实操笔记
专项性能超GPT-5/Kimi K2!OPPO开源开放式深度研究模型,多智能体蒸馏与Agentic RL加持
华为左鹏飞年终总结:LLM 推理系统创新的四大趋势
迈向超级Agent!谷歌Gemini接入个人智能,Alpha-Go之父:AI要有用需要更懂你
9天暴涨6.6k Star!Obsidian CEO 开源三大专属Skills,Claude Code不再乱改笔记格式
2026年,让我们进入Agent RL时代
Claude Cowork开年爆火!美国版通用AI智能体来了?Manus负责人:没我们方便
超越代表作Mem0!阿里&武大提出智能体记忆新范式Agentic Memory,统一长短期记忆管理
2025苦涩的Agent开发故事
超越GRPO!阿里开源强化学习方法 R³L,复杂推理能力最高提升52%
上一页
1
2
下一页