2 42 9

Xiaoji Zheng

Student-Xiaoji

https://www.zhihu.com/people/dong-dong-dong-49-89-76

SEU-zxj

AI & ML interests

None yet

Recent Activity

upvoted a paper about 22 hours ago

Unified Diffusion VLA: Vision-Language-Action Model via Joint Discrete Denoising Diffusion Process

upvoted a paper about 22 hours ago

LongCat-Flash-Omni Technical Report

upvoted a paper about 22 hours ago

World Simulation with Video Foundation Models for Physical AI

View all activity

Organizations

None yet

upvoted 3 papers about 22 hours ago

Unified Diffusion VLA: Vision-Language-Action Model via Joint Discrete Denoising Diffusion Process

Paper • 2511.01718 • Published 2 days ago • 6

LongCat-Flash-Omni Technical Report

Paper • 2511.00279 • Published 5 days ago • 15

World Simulation with Video Foundation Models for Physical AI

Paper • 2511.00062 • Published 8 days ago • 27

upvoted 7 papers 2 days ago

π_RL: Online RL Fine-tuning for Flow-based Vision-Language-Action Models

Paper • 2510.25889 • Published 7 days ago • 55

Spatial-SSRL: Enhancing Spatial Understanding via Self-Supervised Reinforcement Learning

Paper • 2510.27606 • Published 5 days ago • 25

upvoted a paper 5 days ago

AMO-Bench: Large Language Models Still Struggle in High School Math Competitions

Paper • 2510.26768 • Published 6 days ago • 33

upvoted 5 papers 6 days ago

Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks

Paper • 2510.19195 • Published 15 days ago • 10

The Principles of Diffusion Models

Paper • 2510.21890 • Published 13 days ago • 51

Supervised Reinforcement Learning: From Expert Trajectories to Step-wise Reasoning

Paper • 2510.25992 • Published 7 days ago • 40

Emu3.5: Native Multimodal Models are World Learners

Paper • 2510.26583 • Published 6 days ago • 98

Kimi Linear: An Expressive, Efficient Attention Architecture

Paper • 2510.26692 • Published 6 days ago • 93

upvoted 3 papers 8 days ago

LongCat-Video Technical Report

Paper • 2510.22200 • Published 12 days ago • 22

LightBagel: A Light-weighted, Double Fusion Framework for Unified Multimodal Understanding and Generation

Paper • 2510.22946 • Published 10 days ago • 16

Omni-Reward: Towards Generalist Omni-Modal Reward Modeling with Free-Form Preferences

Paper • 2510.23451 • Published 9 days ago • 26

upvoted an article 11 days ago

Article

KV Caching Explained: Optimizing Transformer Inference Efficiency

•

Jan 30

• 159

Xiaoji Zheng

AI & ML interests

Recent Activity

Organizations

Student-Xiaoji's activity

KV Caching Explained: Optimizing Transformer Inference Efficiency