3 12 14

Kai Zhang

drogozhang

https://drogozhang.github.io

AI & ML interests

NLP

Recent Activity

upvoted a paper 26 days ago

AAAR-1.0: Assessing AI's Potential to Assist Research

authored a paper about 1 month ago

Long-LRM: Long-sequence Large Reconstruction Model for Wide-coverage Gaussian Splats

upvoted a paper about 1 month ago

PathMMU: A Massive Multimodal Expert-Level Benchmark for Understanding and Reasoning in Pathology

View all activity

Organizations

drogozhang's activity

upvoted a paper 26 days ago

AAAR-1.0: Assessing AI's Potential to Assist Research

Paper • 2410.22394 • Published 30 days ago • 13

authored a paper about 1 month ago

Long-LRM: Long-sequence Large Reconstruction Model for Wide-coverage Gaussian Splats

Paper • 2410.12781 • Published Oct 16 • 5

upvoted a paper about 1 month ago

PathMMU: A Massive Multimodal Expert-Level Benchmark for Understanding and Reasoning in Pathology

Paper • 2401.16355 • Published Jan 29 • 2

authored a paper about 1 month ago

TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models

Paper • 2410.10818 • Published Oct 14 • 14

upvoted a paper about 1 month ago

TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models

Paper • 2410.10818 • Published Oct 14 • 14

authored a paper 3 months ago

MMMU-Pro: A More Robust Multi-discipline Multimodal Understanding Benchmark

Paper • 2409.02813 • Published Sep 4 • 28

upvoted a paper 3 months ago

MMMU-Pro: A More Robust Multi-discipline Multimodal Understanding Benchmark

Paper • 2409.02813 • Published Sep 4 • 28

authored a paper 4 months ago

MuirBench: A Comprehensive Benchmark for Robust Multi-image Understanding

Paper • 2406.09411 • Published Jun 13 • 18

commented a paper 4 months ago

MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions

Paper • 2403.19651 • Published Mar 28 • 23 •

upvoted a paper 5 months ago

ChatDoctor: A Medical Chat Model Fine-tuned on LLaMA Model using Medical Domain Knowledge

Paper • 2303.14070 • Published Mar 24, 2023 • 11

upvoted a paper 6 months ago

MuirBench: A Comprehensive Benchmark for Robust Multi-image Understanding

Paper • 2406.09411 • Published Jun 13 • 18

liked a Space 6 months ago

Runtime error

🏃

COVER

liked a dataset 6 months ago

MUIRBENCH/MUIRBENCH

Viewer • Updated Jul 1 • 2.6k • 680 • 15

updated a Space 7 months ago

No application file

🌖

Cse5544

authored a paper 8 months ago

MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions

Paper • 2403.19651 • Published Mar 28 • 23

upvoted a paper 8 months ago

TravelPlanner: A Benchmark for Real-World Planning with Language Agents

Paper • 2402.01622 • Published Feb 2 • 33

upvoted a collection 8 months ago

Multimodal Embeddings

Collection

13 items • Updated Oct 19 • 1

upvoted a paper 8 months ago

MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions

Paper • 2403.19651 • Published Mar 28 • 23

liked a dataset 8 months ago

osunlp/Multimodal-Mind2Web

Viewer • Updated Jun 5 • 14.2k • 2.73k • 48

liked a dataset 9 months ago

osunlp/TravelPlanner

Viewer • Updated Jul 14 • 1.23k • 2.63k • 42