Hi! I am Jianxiong Li, studying embodied AI and Reinforcement Learning (RL). I am a final-year PhD candidate at AIR, Tsinghua University, advised by Prof. Xianyuan Zhan and Prof. Ya-Qin Zhang. I got my bachelor's degree in 2021 from the School of Mechanical Engineering, Xi'an Jiaotong University, where I did lots of projects on mechanical design and robotics.

My dream is to develop robots that are universally deployable across diverse real-world environments. Towards this goal, my current work primarily focused on:

(Efficient Pretrain) How to build robotic foundation models efficiently when robotics data are limited?
(Fast Post-train) How to fastly enhance robot peformance given limited budget?
(RL+X) How to use RL to reach super-human performance on diverse domains, like robots, VLMs or LLMs?

I am open to collaboration, feel free to reach me out!

Some links: Github / Twitter / Google Scholar / li-jx21@mails.tsinghua.edu.cn

News

Three papers have been accepted to ICLR 2026, including a strong VLA model X-VLA, a stable diffusion RL post-training approch DIPOLE and a sample-efficient offline RL approch TELS.
🏆Our X-VLA has won 1st place in the AGIBOT World Challenge (Manipulation track) @ IROS 2025.
🌟We release X-VLA, a cross-embodiment model that sweeps many benchmarks and achieves strong real-world performance.
One paper (FlowPlanner) on autonomous driving is accepeted to NeurIPS 2025.
One paper (LBP) on efficient latent planning is accepted to ICML 2025.
One paper (UniAct) on cross-embodiment universal actions is accepted to CVPR 2025.
🌟Diffusion-Planner is selected as oral presentation at ICLR 2025.
Two papers on fast post-train (PSEC) and autonomous driving (Diffusion-Planner) are accepted to ICLR 2025.
One paper (Robo-MUTUAL) on embodied representations is accepted to ICRA 2025.
🌟One paper (RSP) on offline RL is accepted to AAAI 2025 as oral.
🌟IVM and DecisionNCE are selected as Outstanding Paper at MFM-EAI workshop @ ICML 2024.

Publications (* marks equal contribution)

X-VLA: Soft-Prompted Transformer as Scalable Cross-Embodiment Vision-Language-Action Model Jinliang Zheng*, Jianxiong Li*, Zhihao Wang, Dongxiu Liu, Xirui Kang, Yuchun Feng, Yinan Zheng, Jiayin Zou, Yilun Chen, Jia Zeng, Ya-Qin Zhang, Jiangmiao Pang, Jingjing Liu, Tai Wang, Xianyuan Zhan ICLR 2026 (1st place 🏆 @ AGIBOT World Challenge (Manipulation track), IROS 2025) 2025 Paper | Code | Page
Universal Actions for Enhanced Embodied Foundation Models Jinliang Zheng*, Jianxiong Li*, Dongxiu Liu*, Yinan Zheng, Zhihao Wang, Zhonghong Ou, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Xianyuan Zhan CVPR 2025 2025 Paper | Code | Page
Robo-MUTUAL: Robotic Multimodal Task Specification via Unimodal Learning Jianxiong Li*, Zhihao Wang*, Jinliang Zheng*, Xiaoai Zhou, Guanming Wang, Guanglu Song, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Junzhi Yu, Xianyuan Zhan ICRA 2025 2025 Paper | Code | Page
Skill Expansion and Composition in Parameter Space Tenglong Liu*, Jianxiong Li*, Yinan Zheng, Haoyi Niu, Yixing Lan, Xin Xu, Xianyuan Zhan ICLR 2025 2025 Paper | Code | Page | Dataset | Model
Instruction Guided Visual Masking Jinliang Zheng*, Jianxiong Li*, Sijie Cheng, Yinan Zheng, Jiaming Li, Jihao Liu, Yu Liu, Jingjing Liu, Xianyuan Zhan NeurIPS 2024 (Outstanding Paper @ ICML 2024 MFM-EAI Workshop) 2024 Paper | Code | Page | Dataset | Model
DecisionNCE: Embodied Multimodal Representations via Implicit Preference Learning Jianxiong Li*, Jinliang Zheng*, Yinan Zheng*, Liyuan Mao, Xiao Hu, Sijie Cheng, Haoyi Niu, Jihao Liu, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Xianyuan Zhan ICML 2024 (Outstanding Paper @ ICML 2024 MFM-EAI Workshop) 2024 Paper | Code | Page
Query-Policy Misalignment in Preference-Based Reinforcement Learning Xiao Hu*, Jianxiong Li*, Xianyuan Zhan, Qing-Shan Jia, Ya-Qin Zhang ICLR 2024 (Spotlight, Top 5%) 2024 Paper | Code
Safe Offline Reinforcement Learning with Feasibility-Guided Diffusion Model Yinan Zheng*, Jianxiong Li*, Dongjie Yu, Yujie Yang, Shengbo Eben Li, Xianyuan Zhan, Jingjing Liu ICLR 2024 2024 Paper | Code | Page
When Data Geometry Meets Deep Function: Generalizing Offline Reinforcement Learning Jianxiong Li, Xianyuan Zhan, Haoran Xu, Xiangyu Zhu, Jingjing Liu, Ya-Qin Zhang ICLR 2023 2023 Paper | Code
Mind the Gap: Offline Policy Optimization for Imperfect Rewards Jianxiong Li*, Xiao Hu*, Haoran Xu, Jingjing Liu, Xianyuan Zhan, Qing-Shan Jia, Ya-Qin Zhang ICLR 2023 2023 Paper | Code

X-VLA: Soft-Prompted Transformer as Scalable Cross-Embodiment Vision-Language-Action Model Jinliang Zheng*, Jianxiong Li*, Zhihao Wang, Dongxiu Liu, Xirui Kang, Yuchun Feng, Yinan Zheng, Jiayin Zou, Yilun Chen, Jia Zeng, Ya-Qin Zhang, Jiangmiao Pang, Jingjing Liu, Tai Wang, Xianyuan Zhan (1st place 🏆 @ AGIBOT World Challenge (Manipulation track), IROS 2025) 2025 Paper | Code | Page
Flow Matching-Based Autonomous Driving Planning with Advanced Interactive Behavior Modeling Tianyi Tan, Yinan Zheng, Ruiming Liang, Zexu Wang, Kexin ZHENG, Jinliang Zheng, Jianxiong Li, Xianyuan Zhan, Jingjing Liu NeurIPS 2025 2025
PhysiAgent: An Embodied Agent Framework in Physical World Zhihao Wang*, Jianxiong Li*, Jinliang Zheng*, Wencong Zhang, Dongxiu Liu, Yinan Zheng, Haoyi Niu, Junzhi Yu, Xianyuan Zhan 2025 Paper
Universal Actions for Enhanced Embodied Foundation Models Jinliang Zheng*, Jianxiong Li*, Dongxiu Liu*, Yinan Zheng, Zhihao Wang, Zhonghong Ou, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Xianyuan Zhan CVPR 2025 2025 Paper | Code | Page
Efficient Robotic Policy Learning via Latent Space Backward Planning Dongxiu Liu*, Haoyi Niu*, Zhihao Wang, Jinliang Zheng, Yinan Zheng, Zhonghong Ou, Jianming Hu, Jianxiong Li, Xianyuan Zhan ICML 2025 2025 Paper | Code | Page
Pushing the Limit of Sample-Efficient Offline Reinforcement Learning Peng Cheng, Zhihao Wu, Jianxiong Li, Haoran Xu, Wei Sun, Youfang Lin, Yunxin Liu, Xianyuan Zhan ICLR 2026 2026
Reachability-Aware Reinforcement Learning for Collision Avoidance in Human-Machine Shared Control Shiyue Zhao, Junzhi Zhang, Neda Masoud, Jianxiong Li, Yinan Zheng, Xiaohui Hou Under Review 2025
Diffusion-Based Planning for Autonomous Driving with Flexible Guidance Yinan Zheng*, Ruiming Liang*, Kexin Zheng*, Jinliang Zheng, Liyuan Mao, Jianxiong Li, Weihao Gu, Rui Ai, Shengbo Eben Li, Xianyuan Zhan, Jingjing Liu ICLR 2025 (Oral, Top 2%) 2025 Paper | Code | Page
Skill Expansion and Composition in Parameter Space Tenglong Liu*, Jianxiong Li*, Yinan Zheng, Haoyi Niu, Yixing Lan, Xin Xu, Xianyuan Zhan ICLR 2025 2025 Paper | Code | Page | Dataset | Model
Robo-MUTUAL: Robotic Multimodal Task Specification via Unimodal Learning Jianxiong Li*, Zhihao Wang*, Jinliang Zheng*, Xiaoai Zhou, Guanming Wang, Guanglu Song, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Junzhi Yu, Xianyuan Zhan ICRA 2025 2025 Paper | Code | Page
Are Expressive Models Truly Necessary for Offline RL? Guan Wang*, Haoyi Niu*, Jianxiong Li, Li Jiang, Jianming Hu, Xianyuan Zhan AAAI 2025 (Oral, Top 5%) 2024 Paper | Code
xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing Haoyi Niu*, Qimao Chen*, Tenglong Liu, Jianxiong Li, Guyue Zhou, Yi Zhang, Jianming Hu, Xianyuan Zhan NeurIPS 2024 OWA Workshop 2024 Paper | Code | Page
Instruction Guided Visual Masking Jinliang Zheng*, Jianxiong Li*, Sijie Cheng, Yinan Zheng, Jiaming Li, Jihao Liu, Yu Liu, Jingjing Liu, Xianyuan Zhan NeurIPS 2024 (Outstanding Paper @ ICML 2024 MFM-EAI Workshop) 2024 Paper | Code | Page | Dataset | Model
DecisionNCE: Embodied Multimodal Representations via Implicit Preference Learning Jianxiong Li*, Jinliang Zheng*, Yinan Zheng*, Liyuan Mao, Xiao Hu, Sijie Cheng, Haoyi Niu, Jihao Liu, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Xianyuan Zhan ICML 2024 (Outstanding Paper @ ICML 2024 MFM-EAI Workshop) 2024 Paper | Code | Page
Query-Policy Misalignment in Preference-Based Reinforcement Learning Xiao Hu*, Jianxiong Li*, Xianyuan Zhan, Qing-Shan Jia, Ya-Qin Zhang ICLR 2024 (Spotlight, Top 5%) 2024 Paper | Code
Safe Offline Reinforcement Learning with Feasibility-Guided Diffusion Model Yinan Zheng*, Jianxiong Li*, Dongjie Yu, Yujie Yang, Shengbo Eben Li, Xianyuan Zhan, Jingjing Liu ICLR 2024 2024 Paper | Code | Page
PROTO: Iterative Policy Regularized Offline-to-Online Reinforcement Learning Jianxiong Li, Xiao Hu, Haoran Xu, Jingjing Liu, Xianyuan Zhan, Ya-Qin Zhang Preprint 2023 Paper | Code
A Fully Data-Driven Approach for Realistic Traffic Signal Control Using Offline Reinforcement Learning Jianxiong Li, Shichao Lin, Tianyu Shi, Chujie Tian, Yu Mei, Jian Song, Xianyuan Zhan, Ruimin Li Data Science for Transportation 2023 Paper
Offline RL with No OOD Actions: In-Sample Learning via Implicit Value Regularization Haoran Xu, Li Jiang, Jianxiong Li, Zhuoran Yang, Zhaoran Wang, Victor Wai Kin Chan, Xianyuan Zhan ICLR 2023 (Oral, Notable Top 5%) 2023 Paper | Code
Mind the Gap: Offline Policy Optimizaiton for Imperfect Rewards Jianxiong Li*, Xiao Hu*, Haoran Xu, Jingjing Liu, Xianyuan Zhan, Qing-Shan Jia, Ya-Qin Zhang ICLR 2023 2023 Paper | Code
When data geometry meets deep function: Generalizing offline reinforcement learning Jianxiong Li, Xianyuan Zhan, Haoran Xu, Xiangyu Zhu, Jingjing Liu, Ya-Qin Zhang ICLR 2023 2023 Paper | Code
A Policy-Guided Imitation Approach for Offline Reinforcement Learning Haoran Xu*, Li Jiang*, Jianxiong Li, Xianyuan Zhan NeurIPS 2022 (Oral, Top 2%) 2022 Paper | Code | Slides | Media
Vehicle Extreme Control based on Offline Reinforcement Leaning Shiyue Zhao, Jianxiong Li, Xiao Hu, Junzhi Zhang, Chengkun He CAC 2022 2022
Offline Reinforcement Learning with Soft Behavioral Regularization Haoran Xu, Xianyuan Zhan, Jianxiong Li, Honglei Yin NeurIPS 2021 Offline RL Workshop 2021 Paper | Code

X-VLA: Soft-Prompted Transformer as Scalable Cross-Embodiment Vision-Language-Action Model Jinliang Zheng*, Jianxiong Li*, Zhihao Wang, Dongxiu Liu, Xirui Kang, Yuchun Feng, Yinan Zheng, Jiayin Zou, Yilun Chen, Jia Zeng, Ya-Qin Zhang, Jiangmiao Pang, Jingjing Liu, Tai Wang, Xianyuan Zhan ICLR 2026 (1st place 🏆 @ AGIBOT World Challenge (Manipulation track), IROS 2025) 2025 Paper | Code | Page
Universal Actions for Enhanced Embodied Foundation Models Jinliang Zheng*, Jianxiong Li*, Dongxiu Liu*, Yinan Zheng, Zhihao Wang, Zhonghong Ou, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Xianyuan Zhan CVPR 2025 2025 Paper | Code | Page
Robo-MUTUAL: Robotic Multimodal Task Specification via Unimodal Learning Jianxiong Li*, Zhihao Wang*, Jinliang Zheng*, Xiaoai Zhou, Guanming Wang, Guanglu Song, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Junzhi Yu, Xianyuan Zhan ICRA 2025 2025 Paper | Code | Page
Instruction Guided Visual Masking Jinliang Zheng*, Jianxiong Li*, Sijie Cheng, Yinan Zheng, Jiaming Li, Jihao Liu, Yu Liu, Jingjing Liu, Xianyuan Zhan NeurIPS 2024 (Outstanding Paper @ ICML 2024 MFM-EAI Workshop) 2024 Paper | Code | Page | Dataset | Model
DecisionNCE: Embodied Multimodal Representations via Implicit Preference Learning Jianxiong Li*, Jinliang Zheng*, Yinan Zheng*, Liyuan Mao, Xiao Hu, Sijie Cheng, Haoyi Niu, Jihao Liu, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Xianyuan Zhan ICML 2024 (Outstanding Paper @ ICML 2024 MFM-EAI Workshop) 2024 Paper | Code | Page
xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing Haoyi Niu*, Qimao Chen*, Tenglong Liu, Jianxiong Li, Guyue Zhou, Yi Zhang, Jianming Hu, Xianyuan Zhan NeurIPS 2024 OWA Workshop 2024 Paper | Code | Page

Dichotomous Diffusion Policy Optimization Ruiming Liang, Yinan Zheng, Kexin Zheng, Tianyi Tan, Jianxiong Li, Liyuan Mao, Zhihao Wang, Guang Chen, Hangjun Ye, Jingjing Liu, Jinqiao Wang, Xianyuan Zhan ICLR 2026 2026 Paper | Code | Page |
Skill Expansion and Composition in Parameter Space Tenglong Liu*, Jianxiong Li*, Yinan Zheng, Haoyi Niu, Yixing Lan, Xin Xu, Xianyuan Zhan ICLR 2025 2025 Paper | Code | Page | Dataset | Model
Diffusion-Based Planning for Autonomous Driving with Flexible Guidance Yinan Zheng*, Ruiming Liang*, Kexin Zheng*, Jinliang Zheng, Liyuan Mao, Jianxiong Li, Weihao Gu, Rui Ai, Shengbo Eben Li, Xianyuan Zhan, Jingjing Liu ICLR 2025 (Oral, Top 2%) 2025 Paper | Code | Page
PROTO: Iterative Policy Regularized Offline-to-Online Reinforcement Learning Jianxiong Li, Xiao Hu, Haoran Xu, Jingjing Liu, Xianyuan Zhan, Ya-Qin Zhang Preprint 2023 Paper | Code

Diffusion-Based Planning for Autonomous Driving with Flexible Guidance Yinan Zheng*, Ruiming Liang*, Kexin Zheng*, Jinliang Zheng, Liyuan Mao, Jianxiong Li, Weihao Gu, Rui Ai, Shengbo Eben Li, Xianyuan Zhan, Jingjing Liu ICLR 2025 (Oral, Top 2%) 2025 Paper | Code | Page
Are Expressive Models Truly Necessary for Offline RL? Guan Wang*, Haoyi Niu*, Jianxiong Li, Li Jiang, Jianming Hu, Xianyuan Zhan AAAI 2025 (Oral, Top 5%) 2024 Paper | Code
Instruction Guided Visual Masking Jinliang Zheng*, Jianxiong Li*, Sijie Cheng, Yinan Zheng, Jiaming Li, Jihao Liu, Yu Liu, Jingjing Liu, Xianyuan Zhan NeurIPS 2024 (Outstanding Paper @ ICML 2024 MFM-EAI Workshop) 2024 Paper | Code | Page | Dataset | Model
Query-Policy Misalignment in Preference-Based Reinforcement Learning Xiao Hu*, Jianxiong Li*, Xianyuan Zhan, Qing-Shan Jia, Ya-Qin Zhang ICLR 2024 (Spotlight, Top 5%) 2024 Paper | Code
Safe Offline Reinforcement Learning with Feasibility-Guided Diffusion Model Yinan Zheng*, Jianxiong Li*, Dongjie Yu, Yujie Yang, Shengbo Eben Li, Xianyuan Zhan, Jingjing Liu ICLR 2024 2024 Paper | Code | Page
A Fully Data-Driven Approach for Realistic Traffic Signal Control Using Offline Reinforcement Learning Jianxiong Li, Shichao Lin, Tianyu Shi, Chujie Tian, Yu Mei, Jian Song, Xianyuan Zhan, Ruimin Li Preprint 2023 Paper
Offline RL with No OOD Actions: In-Sample Learning via Implicit Value Regularization Haoran Xu, Li Jiang, Jianxiong Li, Zhuoran Yang, Zhaoran Wang, Victor Wai Kin Chan, Xianyuan Zhan ICLR 2023 (Oral, Notable Top 5%) 2023 Paper | Code
Mind the Gap: Offline Policy Optimizaiton for Imperfect Rewards Jianxiong Li*, Xiao Hu*, Haoran Xu, Jingjing Liu, Xianyuan Zhan, Qing-Shan Jia, Ya-Qin Zhang ICLR 2023 2023 Paper | Code
When data geometry meets deep function: Generalizing offline reinforcement learning Jianxiong Li, Xianyuan Zhan, Haoran Xu, Xiangyu Zhu, Jingjing Liu, Ya-Qin Zhang ICLR 2023 2023 Paper | Code
A Policy-Guided Imitation Approach for Offline Reinforcement Learning Haoran Xu*, Li Jiang*, Jianxiong Li, Xianyuan Zhan NeurIPS 2022 (Oral, Top 2%) 2022 Paper | Code | Slides | Media
Vehicle Extreme Control based on Offline Reinforcement Leaning Shiyue Zhao, Jianxiong Li, Xiao Hu, Junzhi Zhang, Chengkun He CAC 2022 2022
Offline Reinforcement Learning with Soft Behavioral Regularization Haoran Xu, Xianyuan Zhan, Jianxiong Li, Honglei Yin NeurIPS 2021 Offline RL Workshop 2021 Paper | Code

Professional Services

Reviewer for ICLR 24-25 (Notable Reviewer), ICML 24-25, NeurIPS 23-25 (Top Reviewer), AAAI 24-25, IJCAI 24, IROS, TMLR, ICLR 2025 Workshop @ World Models, ICLR 2024 workshop @ DMLR