绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
×
首页
直播
合辑
专场
智东西
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
登录
免费注册
关注我们
智东西
车东西
芯东西
智猩猩
智东西
车东西
芯东西
智猩猩
智猩猩
智猩猩官网
智猩猩小程序
线下大会
预告
公开课
讲座
文章
智猩猩AI
共发表了121篇文章
智猩猩AI
共发表了121篇文章
全部干货
专项性能远超GRPO!阿里通义开源开放域智能体RL范式ArenaRL,已在高德地图多个业务场景验证
超过所有一步蒸馏!NVIDIA提出视频扩散模型新蒸馏范式,让通义Wan 2.1 14B一步生成视频
Agent Memory(上):记忆的形态、功能与代表性路径
垂直领域 Agent 落地:为什么我放弃 235B/671B,转而训练 8B (下)
HBM占用直降5倍!华为提出内存高效型位置无关缓存技术MEPIC,无需对LLM进行任何修改
34k Star!Claude skills项目superpowers开源,让智能体写出工程规范级代码
垂直领域 Agent 落地:为什么我放弃 235B/671B,转而训练 8B(上)
AAAI 2026收录!让LLM更懂视觉的多模态预训练方法开源,7B模型完胜LLaVA-NeXT
4B超越Qwen3-32B!阿里开源轻量级推理模型,引入序列蒸馏新范式提升长链推理
RL Infra架构演进:异步化是王道 从RLHF迈向Agentic RL
R2还是V4?Model1引爆DeepSeek新一代模型猜想,硅谷网友:美国模型的大麻烦要来了
双重视角下的 Linear Attention:为什么 Chunkwise并行是必经之路
训练成本直降32%!阿里千问提出智能体分布式编排系统MegaFlow,稳定扩展至1万个并发任务
聊聊vLLM的PagedAttention技术:让多分支/并行采样不再爆显存
全面超越GRPO!英伟达提出GDPO方法,破解多奖励强化学习坍塌难题
成也先验,败也先验!NeurIPS 2025 Best Paper Runner-up "Limit of RLVR" 碎碎念
万字干货!VERL源码解读 &实操笔记
专项性能超GPT-5/Kimi K2!OPPO开源开放式深度研究模型,多智能体蒸馏与Agentic RL加持
华为左鹏飞年终总结:LLM 推理系统创新的四大趋势
迈向超级Agent!谷歌Gemini接入个人智能,Alpha-Go之父:AI要有用需要更懂你
上一页
1
2
3
4
5
6
7
下一页