Follow
views
| comments
Focus Domains
按主题进入 Follow 视角,或跳去对应 Wiki 领域页。
LLM/VLM
大模型、多模态大模型,包含推理、训练等。
Physical/Embodied Intelligence
物理/具身智能整体进展,覆盖机器人操作、感知、规划与泛化。
AIGC
图像、视频与语音生成方向。
Agent
工具调用、规划执行、工作流编排与智能体系统设计。
Source Entries
Follow 首页只做 digest 和入口;具体来源详情与检索下沉到来源页。
arXiv 15 item(s)
latest 2026-05-05
论文量大且结构稳定,适合作为单独来源页并支持搜索与强过滤。
WeChat 0 item(s)
公众号更偏浏览型内容,先做时间排序与简单筛选。
X / Twitter 0 item(s)
适合追踪 thread、demo 与作者动态,第一版只做轻量筛选。
Bilibili 0 item(s)
视频内容先作为归档型来源页,保留时间轴和领域筛选即可。
Daily Timeline
这里只展示每日 digest 摘要与来源分布,不展开完整来源明细。
2026-05-05
Daily digest2026-05-05 arXiv daily selected 12 papers for follow-up.
arxiv 12 wechat 0 x 0 bilibili 0
Highlights
- Being-H0.7: A Latent World-Action Model from Egocentric Videos: 提出无需生成未来帧的潜空间 world-action model,以提升 VLA 控制策略的未来感知能力。
- Thinking in Text and Images: Interleaved Vision--Language Reasoning Traces for Long-Horizon Robot Manipulation: 提出交错文本子目标与视觉关键帧的推理轨迹,用于长程机器人操作策略。
- Stereo Multistage Spatial Attention for Real-Time Mobile Manipulation Under Visual Scale Variation and Disturbances: 提出面向实时移动操作的双目多阶段空间注意力预测策略,以提升尺度变化和视觉扰动下的闭环动作生成鲁棒性。
2026-05-04
Daily digest2026-05-04 arXiv daily selected 3 papers for follow-up.
arxiv 3 wechat 0 x 0 bilibili 0
Highlights
- E$^2$DT: Efficient and Effective Decision Transformer with Experience-Aware Sampling for Robotic Manipulation: 用经验感知采样提升 Decision Transformer 在机器人长程操作中的样本效率与探索质量。
- Lucid-XR: An Extended-Reality Data Engine for Robotic Manipulation: Lucid-XR通过XR交互、物理仿真和语言可控视频生成构建机器人操作数据引擎,用合成数据训练可零样本迁移的视觉策略。
- World Model for Robot Learning: A Comprehensive Survey: 系统综述机器人学习中的世界模型范式、作用分工与评测脉络。
2026-04-24
Daily digestarXiv digest with 2 paper(s) across normalized Follow domains.
arxiv 0 wechat 0 x 0 bilibili 0
Highlights