TenStep

LLM/VLM

Domain Page

LLM/VLM

基础模型与多模态模型总入口,关注能力边界、训练方式与推理表现。

Definition

LLM/VLM 关注语言模型与视觉语言模型的能力扩展、对齐方式、后训练与多模态推理表现。

Key Questions

  • 后训练、合成数据与推理时扩展分别带来什么收益?
  • VLM 的 grounding 与推理能力如何统一评估?
  • 模型能力应该如何服务后续 Agent 与具身系统?

Representative Items

Long-Horizon Manipulation via Trace-Conditioned VLA Planning

可作为 LLM/VLM 与具身交叉场景的近期代表条目。

Open Source

CorridorVLA

VLM 接口与 action head 设计的示例。

Open Source

Recent Signals

  • 近期更新集中在 multimodal reasoning、grounding 与 post-training。
  • 值得后续补一个“模型能力 / 数据路线 / 推理范式”三层索引。