TLDR Physical Intelligence 的新论文,提出了 RECAP 方法,在做咖啡、折纸盒、叠衣服等三个任务上取得很好的效果。 1)训练了 value function 用于在离线数据上计算 advantage function; 2)让 binarized advantage 作为 VLA policy 的输入,从而把质量不同的离线数据利用起来; ...

7 分钟 · 3240 字 · ZhaoYang

TLDR 省流版。。。 一句话总结:用最精炼的话描述论文,模型 X 通过方法 Y 解决了问题 Z。 核心创新点:一句话简单概括论文创新点。 关键成绩:在 xxx 数据集上比 xxx 成功率提升了 xxx。 研究映射:这篇论文对我的xxx项目提供了 xxx 灵感/代码/参考。 Metadata 发表期刊/会议: 论文作者: 研究机构: 论文链接: 关键词: Code & Dataset & Weight: BibTeX: Problem Definition 研究问题 这篇论文究竟想要解决什么具体问题? ...

2 分钟 · 547 字 · ZhaoYang

TLDR 省流版。。。 一句话总结:用最精炼的话描述论文,模型 X 通过方法 Y 解决了问题 Z。 核心创新点:一句话简单概括论文创新点。 关键成绩:在 xxx 数据集上比 xxx 成功率提升了 xxx。 研究映射:这篇论文对我的xxx项目提供了 xxx 灵感/代码/参考。 Metadata 发表期刊/会议:tech report 论文作者:Lin Li∗ Qihang Zhang∗† Yiming Luo∗ Shuai Yang Ruilin Wang Fei Han Mingrui Yu Zelin Gao Nan Xue Xing Zhu Yujun Shen Yinghao Xu‡ 研究机构:Ant Group 论文链接:https://technology.robbyant.com/lingbot-va 关键词: Code & Dataset & Weight: https://technology.robbyant.com/lingbot-va BibTeX: Problem Definition 研究问题 这篇论文究竟想要解决什么具体问题? ...

2 分钟 · 638 字 · ZhaoYang

TLDR 一句话总结:DreamZero 通过将视频生成与动作预测耦合为联合流匹配 (Joint Flow Matching) 任务,并引入 Flash 模式(非对称去噪),解决了 VLA 模型在多样化数据下泛化差、推理慢的问题。 ...

3 分钟 · 1414 字 · ZhaoYang

TLDR 省流版。。。 一句话总结:用最精炼的话描述论文,模型 X 通过方法 Y 解决了问题 Z。 核心创新点:一句话简单概括论文创新点。 关键成绩:在 xxx 数据集上比 xxx 成功率提升了 xxx。 研究映射:这篇论文对我的xxx项目提供了 xxx 灵感/代码/参考。 Metadata 发表期刊/会议: 论文作者: 研究机构: 论文链接: 关键词: Code & Dataset & Weight: BibTeX: Problem Definition 研究问题 这篇论文究竟想要解决什么具体问题? ...

2 分钟 · 547 字 · ZhaoYang