Follow • TenStep

Focus Domains

按主题进入 Follow 视角，或跳去对应 Wiki 领域页。

Open Wiki

LLM/VLM

大模型、多模态大模型，包含推理、训练等。

Physical/Embodied Intelligence

物理/具身智能整体进展，覆盖机器人操作、感知、规划与泛化。

AIGC

图像、视频与语音生成方向。

Agent

工具调用、规划执行、工作流编排与智能体系统设计。

Source Entries

Follow 首页只做 digest 和入口；具体来源详情与检索下沉到来源页。

arXiv 15 item(s) latest 2026-05-05

论文量大且结构稳定，适合作为单独来源页并支持搜索与强过滤。

Open Search Page

WeChat 0 item(s)

公众号更偏浏览型内容，先做时间排序与简单筛选。

Open Source Page

X / Twitter 0 item(s)

适合追踪 thread、demo 与作者动态，第一版只做轻量筛选。

Open Source Page

Bilibili 0 item(s)

视频内容先作为归档型来源页，保留时间轴和领域筛选即可。

Open Source Page

Daily Timeline

这里只展示每日 digest 摘要与来源分布，不展开完整来源明细。

2026-05-05

Daily digest

2026-05-05 arXiv daily selected 12 papers for follow-up.

arxiv 12 wechat 0 x 0 bilibili 0

Highlights

Being-H0.7: A Latent World-Action Model from Egocentric Videos: 提出无需生成未来帧的潜空间 world-action model，以提升 VLA 控制策略的未来感知能力。
Thinking in Text and Images: Interleaved Vision--Language Reasoning Traces for Long-Horizon Robot Manipulation: 提出交错文本子目标与视觉关键帧的推理轨迹，用于长程机器人操作策略。
Stereo Multistage Spatial Attention for Real-Time Mobile Manipulation Under Visual Scale Variation and Disturbances: 提出面向实时移动操作的双目多阶段空间注意力预测策略，以提升尺度变化和视觉扰动下的闭环动作生成鲁棒性。

Open arXiv feed

Open X feed

Open WeChat feed

Open Bilibili feed

2026-05-04

Daily digest

2026-05-04 arXiv daily selected 3 papers for follow-up.

arxiv 3 wechat 0 x 0 bilibili 0

Highlights

E$^2$DT: Efficient and Effective Decision Transformer with Experience-Aware Sampling for Robotic Manipulation: 用经验感知采样提升 Decision Transformer 在机器人长程操作中的样本效率与探索质量。
Lucid-XR: An Extended-Reality Data Engine for Robotic Manipulation: Lucid-XR通过XR交互、物理仿真和语言可控视频生成构建机器人操作数据引擎，用合成数据训练可零样本迁移的视觉策略。
World Model for Robot Learning: A Comprehensive Survey: 系统综述机器人学习中的世界模型范式、作用分工与评测脉络。

Open arXiv feed

Open X feed

Open WeChat feed

Open Bilibili feed

2026-04-24

Daily digest

arXiv digest with 2 paper(s) across normalized Follow domains.

arxiv 0 wechat 0 x 0 bilibili 0

Highlights

Open arXiv feed

Open X feed

Open WeChat feed

Open Bilibili feed