Haoyu Zhen

arXiv 2026

Action Images: End-to-End Policy Learning via Multiview Video Generation

Haoyu Zhen, [Zixian Gao], [Qiao Sun], [Yilin Zhao], [Yuncong Yang], [Yilun Du], [Pengsheng Guo], [Tsun-Hsuan Wang], [Yi-Ling Qiao], [Chuang Gan]

arXiv｜Project｜Code

arXiv 2026

arXiv 2026

3D-Layout-R1: Structured Reasoning for Language-Instructed Spatial Editing

Haoyu Zhen, [Xiaolong Li], [Yilin Zhao], [Han Zhang], [Sifei Liu], [Kaichun Mo], [Chuang Gan], [Subhashree Radhakrishnan]

arXiv

arXiv 2026

arXiv 2026

UniCanvas: A Diffusion-base Unified Model for Text-in-Image Joint Generation

[Zeyuan Yang], [Hao-Wei Chen], [Xueyang Yu], [Yuncong Yang], Haoyu Zhen, [Ziqiao Ma], [Maohao Shen], [Chuang Gan]

arXiv

Best Paper @ A2A-MML Workshop, CVPR 2026

arXiv 2026

arXiv 2026

Fast Spatial Memory with Elastic Test-Time Training

[Ziqiao Ma], [Xueyang Yu], Haoyu Zhen, [Yuncong Yang], [Joyce Chai], [Chuang Gan]

arXiv｜Project｜Code｜Blog

arXiv 2026

RSS 2026

GHOST: Hierarchical Sub-Goal Policies for Generalizing Robot Manipulation

[Sriram Krishna], [Ben Eisner], [Haotian Zhan], [Ying Yuan], Haoyu Zhen, [Chuang Gan], [Shubham Tulsiani], [David Held]

PDF｜Project｜Code

Robotics: Science and Systems (RSS) 2026

ICCV 2025

TesserAct: Learning 4D Embodied World Models

Haoyu Zhen, [Qiao Sun], [Hongxin Zhang], [Junyan Li], [Siyuan Zhou], [Yilun Du], [Chuang Gan]

arXiv｜Project｜Code｜Twitter

ICCV 2025

ICCV 2025

RapVerse: Coherent Vocals and Whole-Body Motions Generations from Text

[Jiaben Chen], [Xin Yan], Yihang Chen, Siyuan Cen, Qinwei Ma, Haoyu Zhen, [Kaizhi Qian], [Lie Lu], [Chuang Gan]

arXiv｜Project｜Code

ICCV 2025

ICML 2024

3D-VLA: 3D Vision-Language-Action Generative World Model

Haoyu Zhen, [Xiaowen Qiu], [Peihao Chen], [Jincheng Yang], [Xin Yan], [Yilun Du], [Yining Hong], [Chuang Gan]

arXiv｜Project｜Code｜Twitter

ICML 2024

NeurIPS 2023

3D-LLM: Injecting the 3D World into Large Language Models

[Yining Hong], Haoyu Zhen, [Peihao Chen], [Shuhong Zheng], [Yilun Du], [Zhenfang Chen], [Chuang Gan]

arXiv｜Project｜Code｜Twitter

NeurIPS 2023 (Spotlight)

NeurIPS 2023

Relative Entropic Optimal Transport: a (Prior-aware) Matching Perspective to (Unbalanced) Classification.

[Liangliang Shi], Haoyu Zhen, [Gu Zhang], [Junchi Yan]

NeurIPS 2023

3DV 2024

Color-NeuS: Reconstructing Neural Implicit Surfaces with Color

[Licheng Zhong], [Lixin Yang], [Kailin Li], Haoyu Zhen, [Mei Han], [Cewu Lu]

arXiv｜Project｜Code｜Data

3DV 2024

ICCV 2023

CHORD: Category-level in-Hand Object Reconstruction via Shape Deformation

[Kailin Li], [Lixin Yang], Haoyu Zhen, Zenan Lin, [Xinyu Zhan], [Licheng Zhong], [Jian Xu], [Kejian Wu], [Cewu Lu]

arXiv｜Project

ICCV 2023

ICML 2023

Understanding and Generalizing Contrastive Learning from the Inverse Optimal Transport Perspective

[Liangliang Shi], [Gu Zhang], Haoyu Zhen, Jintao Fan, [Junchi Yan]

OpenReview｜Slides

ICML 2023

Haoyu Zhen 甄昊宇

Publications