2 5 1

Yueze Wang

yzwang

https://yuezewang.github.io/

AI & ML interests

Multi-modal

Recent Activity

authored a paper 6 days ago

EVEv2: Improved Baselines for Encoder-Free Vision-Language Models

upvoted a paper 6 days ago

EVEv2: Improved Baselines for Encoder-Free Vision-Language Models

updated a dataset 24 days ago

yzwang/X2I-mm-instruction

View all activity

Organizations

yzwang's activity

authored a paper 6 days ago

EVEv2: Improved Baselines for Encoder-Free Vision-Language Models

Paper • 2502.06788 • Published 6 days ago • 11

upvoted a paper 6 days ago

EVEv2: Improved Baselines for Encoder-Free Vision-Language Models

Paper • 2502.06788 • Published 6 days ago • 11

updated 2 datasets 24 days ago

yzwang/X2I-mm-instruction

Updated 24 days ago • 896

yzwang/X2I-in-context-learning

Preview • Updated 24 days ago • 579

authored a paper about 2 months ago

Seeing Clearly, Answering Incorrectly: A Multimodal Robustness Benchmark for Evaluating MLLMs on Leading Questions

Paper • 2406.10638 • Published Jun 15, 2024

New activity in yzwang/X2I-subject-driven about 2 months ago

How is the GRIT-Entity-New dataset constructed?

#1 opened about 2 months ago by

onion-liu

upvoted a collection about 2 months ago

X2I Dataset

Collection

Datasets used in OmniGen-v1 • 5 items • Updated Jan 2 • 10

updated a dataset about 2 months ago

yzwang/X2I-computer-vision

Preview • Updated Dec 23, 2024 • 249

authored a paper about 2 months ago

MegaPairs: Massive Data Synthesis For Universal Multimodal Retrieval

Paper • 2412.14475 • Published Dec 19, 2024 • 53

upvoted a paper about 2 months ago

MegaPairs: Massive Data Synthesis For Universal Multimodal Retrieval

Paper • 2412.14475 • Published Dec 19, 2024 • 53

updated 2 datasets 2 months ago

yzwang/X2I-in-context-learning

Preview • Updated 24 days ago • 579

yzwang/X2I-in-context-learning

Preview • Updated 24 days ago • 579