1 22 3

Jinming Wu

kimingng

https://kimingng.notion.site/Jinming-Kimmy-Wu-b22c1682d48d47939dcd7c41bf6a6bab?source=copy_link

AI & ML interests

None yet

Recent Activity

upvoted a paper 4 days ago

StreamingVLM: Real-Time Understanding for Infinite Video Streams

upvoted a paper 8 days ago

VChain: Chain-of-Visual-Thought for Reasoning in Video Generation

upvoted a collection 30 days ago

LLaVA-OneVision

View all activity

Organizations

upvoted a paper 4 days ago

StreamingVLM: Real-Time Understanding for Infinite Video Streams

Paper • 2510.09608 • Published 6 days ago • 41

upvoted a paper 8 days ago

VChain: Chain-of-Visual-Thought for Reasoning in Video Generation

Paper • 2510.05094 • Published 10 days ago • 34

upvoted a collection 30 days ago

LLaVA-OneVision

Collection

a model good at arbitrary types of visual input • 17 items • Updated 30 days ago • 31

upvoted 4 papers about 1 month ago

SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrated Reasoning

Paper • 2509.02479 • Published Sep 2 • 83

upvoted a paper about 2 months ago

4DNeX: Feed-Forward 4D Generative Modeling Made Easy

Paper • 2508.13154 • Published Aug 18 • 62

upvoted 6 papers 3 months ago

Towards Video Thinking Test: A Holistic Benchmark for Advanced Video Reasoning and Understanding

Paper • 2507.15028 • Published Jul 20 • 21

VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

Paper • 2507.13348 • Published Jul 17 • 75

A Survey of Context Engineering for Large Language Models

Paper • 2507.13334 • Published Jul 17 • 257

SWE-Perf: Can Language Models Optimize Code Performance on Real-World Repositories?

Paper • 2507.12415 • Published Jul 16 • 42

High-Resolution Visual Reasoning via Multi-Turn Grounding-Based Reinforcement Learning

Paper • 2507.05920 • Published Jul 8 • 11

First Return, Entropy-Eliciting Explore

Paper • 2507.07017 • Published Jul 9 • 23

upvoted 2 papers 4 months ago

MMSearch-R1: Incentivizing LMMs to Search

Paper • 2506.20670 • Published Jun 25 • 64

OmniGen2: Exploration to Advanced Multimodal Generation

Paper • 2506.18871 • Published Jun 23 • 77

upvoted a paper 8 months ago

ZeroBench: An Impossible Visual Benchmark for Contemporary Large Multimodal Models

Paper • 2502.09696 • Published Feb 13 • 43

upvoted 2 papers 10 months ago

Autoregressive Video Generation without Vector Quantization

Paper • 2412.14169 • Published Dec 18, 2024 • 14

VisionZip: Longer is Better but Not Necessary in Vision Language Models

Paper • 2412.04467 • Published Dec 5, 2024 • 118

upvoted a paper about 1 year ago

Video Instruction Tuning With Synthetic Data

Paper • 2410.02713 • Published Oct 3, 2024 • 39

Jinming Wu

AI & ML interests

Recent Activity

Organizations

kimingng's activity