hjkim

hojie11

hojie11

AI & ML interests

Computer Vision, 3D Vision, Anomaly Detection

Recent Activity

upvoted a paper about 15 hours ago

CAT4D: Create Anything in 4D with Multi-View Video Diffusion Models

upvoted a paper 2 days ago

AnchorCrafter: Animate CyberAnchors Saling Your Products via Human-Object Interacting Video Generation

upvoted a paper 3 days ago

MyTimeMachine: Personalized Facial Age Transformation

View all activity

Organizations

None yet

hojie11's activity

upvoted a paper about 15 hours ago

CAT4D: Create Anything in 4D with Multi-View Video Diffusion Models

Paper • 2411.18613 • Published 2 days ago • 33

upvoted a paper 2 days ago

AnchorCrafter: Animate CyberAnchors Saling Your Products via Human-Object Interacting Video Generation

Paper • 2411.17383 • Published 3 days ago • 4

upvoted 4 papers 3 days ago

upvoted a paper 5 days ago

Enhancing the Reasoning Ability of Multimodal Large Language Models via Mixed Preference Optimization

Paper • 2411.10442 • Published 14 days ago • 61

upvoted 3 papers 9 days ago

GaussianAnything: Interactive Point Cloud Latent Diffusion for 3D Generation

Paper • 2411.08033 • Published 17 days ago • 21

AnimateAnything: Consistent and Controllable Animation for Video Generation

Paper • 2411.10836 • Published 13 days ago • 20

Generative World Explorer

Paper • 2411.11844 • Published 11 days ago • 67

upvoted 3 papers 15 days ago

GenXD: Generating Any 3D and 4D Scenes

Paper • 2411.02319 • Published 25 days ago • 20

JanusFlow: Harmonizing Autoregression and Rectified Flow for Unified Multimodal Understanding and Generation

Paper • 2411.07975 • Published 17 days ago • 26

SAMPart3D: Segment Any Part in 3D Objects

Paper • 2411.07184 • Published 18 days ago • 26

upvoted 3 papers 17 days ago

CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM

Paper • 2411.04954 • Published 22 days ago • 8

Add-it: Training-Free Object Insertion in Images With Pretrained Diffusion Models

Paper • 2411.07232 • Published 18 days ago • 62

Edify Image: High-Quality Image Generation with Pixel Space Laplacian Diffusion Models

Paper • 2411.07126 • Published 18 days ago • 28

upvoted a paper about 2 months ago

MMIE: Massive Multimodal Interleaved Comprehension Benchmark for Large Vision-Language Models

Paper • 2410.10139 • Published Oct 14 • 50

upvoted 2 papers 3 months ago

Guide-and-Rescale: Self-Guidance Mechanism for Effective Tuning-Free Real Image Editing

Paper • 2409.01322 • Published Sep 2 • 94

TWLV-I: Analysis and Insights from Holistic Evaluation on Video Foundation Models

Paper • 2408.11318 • Published Aug 21 • 54

upvoted an article 4 months ago

Article

ZebraLogic: Benchmarking the Logical Reasoning Ability of Language Models

•

Jul 27

• 24