Zhang's picture

Zhang

WenyaoZhang

·

wy_zhang@sjtu.edu.cn

AI & ML interests

None yet

Recent Activity

updated a model 5 days ago

WenyaoZhang/Hybrid-depth

published a model 5 days ago

WenyaoZhang/Hybrid-depth

upvoted a paper 30 days ago

VLA-JEPA: Enhancing Vision-Language-Action Model with Latent World Model

View all activity

Organizations

upvoted 2 papers 30 days ago

VLA-JEPA: Enhancing Vision-Language-Action Model with Latent World Model

Paper • 2602.10098 • Published about 1 month ago • 19

BagelVLA: Enhancing Long-Horizon Manipulation via Interleaved Vision-Language-Action Generation

Paper • 2602.09849 • Published about 1 month ago • 16

upvoted a paper 3 months ago

Evaluating Gemini Robotics Policies in a Veo World Simulator

Paper • 2512.10675 • Published Dec 11, 2025 • 20

upvoted 2 papers 5 months ago

Reasoning in Space via Grounding in the World

Paper • 2510.13800 • Published Oct 15, 2025 • 15

Hybrid-grained Feature Aggregation with Coarse-to-fine Language Guidance for Self-supervised Monocular Depth Estimation

Paper • 2510.09320 • Published Oct 10, 2025 • 2

upvoted 2 papers 8 months ago

DreamLLM: Synergistic Multimodal Comprehension and Creation

Paper • 2309.11499 • Published Sep 20, 2023 • 60

DreamVLA: A Vision-Language-Action Model Dreamed with Comprehensive World Knowledge

Paper • 2507.04447 • Published Jul 6, 2025 • 45

upvoted 2 papers 9 months ago

CAST: Component-Aligned 3D Scene Reconstruction from an RGB Image

Paper • 2502.12894 • Published Feb 18, 2025 • 18

OmniSpatial: Towards Comprehensive Spatial Reasoning Benchmark for Vision Language Models

Paper • 2506.03135 • Published Jun 3, 2025 • 40

upvoted an article 9 months ago

Article

SmolVLM - small yet mighty Vision Language Model

+3

Nov 26, 2024

•

416

upvoted a paper 9 months ago

AlphaOne: Reasoning Models Thinking Slow and Fast at Test Time

Paper • 2505.24863 • Published May 30, 2025 • 97

upvoted a paper over 1 year ago

Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection

Paper • 2412.04455 • Published Dec 5, 2024 • 38