Lu Jiang's picture

2 4

Lu Jiang

roadjiang

·

http://www.lujiang.info/

AI & ML interests

robust deep learning, generative AI, and multimodal foundation model

Recent Activity

upvoted a paper 1 day ago

Diffusion Adversarial Post-Training for One-Step Video Generation

upvoted a paper 2 days ago

VideoAuteur: Towards Long Narrative Video Generation

upvoted a paper 13 days ago

SeedVR: Seeding Infinity in Diffusion Transformer Towards Generic Video Restoration

View all activity

Organizations

None yet

roadjiang's activity

upvoted a paper 1 day ago

Diffusion Adversarial Post-Training for One-Step Video Generation

Paper • 2501.08316 • Published 2 days ago • 27

upvoted a paper 2 days ago

VideoAuteur: Towards Long Narrative Video Generation

Paper • 2501.06173 • Published 6 days ago • 28

upvoted a paper 13 days ago

SeedVR: Seeding Infinity in Diffusion Transformer Towards Generic Video Restoration

Paper • 2501.01320 • Published 14 days ago • 11

authored 10 papers about 1 year ago

Muse: Text-To-Image Generation via Masked Generative Transformers

Paper • 2301.00704 • Published Jan 2, 2023

MaskGIT: Masked Generative Image Transformer

Paper • 2202.04200 • Published Feb 8, 2022

StyleDrop: Text-to-Image Generation in Any Style

Paper • 2306.00983 • Published Jun 1, 2023 • 7

SPAE: Semantic Pyramid AutoEncoder for Multimodal Generation with Frozen LLMs

Paper • 2306.17842 • Published Jun 30, 2023 • 9

VideoGLUE: Video General Understanding Evaluation of Foundation Models

Paper • 2307.03166 • Published Jul 6, 2023 • 5

ViTGAN: Training GANs with Vision Transformers

Paper • 2107.04589 • Published Jul 9, 2021

Language Model Beats Diffusion -- Tokenizer is Key to Visual Generation

Paper • 2310.05737 • Published Oct 9, 2023 • 4

Fine-grained Controllable Video Generation via Object Appearance and Context

Paper • 2312.02919 • Published Dec 5, 2023 • 10

Photorealistic Video Generation with Diffusion Models

Paper • 2312.06662 • Published Dec 11, 2023 • 23

VideoPoet: A Large Language Model for Zero-Shot Video Generation

Paper • 2312.14125 • Published Dec 21, 2023 • 44

commented a paper over 1 year ago

SPAE: Semantic Pyramid AutoEncoder for Multimodal Generation with Frozen LLMs

Paper • 2306.17842 • Published Jun 30, 2023 • 9 •

upvoted a paper over 1 year ago

SPAE: Semantic Pyramid AutoEncoder for Multimodal Generation with Frozen LLMs

Paper • 2306.17842 • Published Jun 30, 2023 • 9

commented 2 papers over 1 year ago

SPAE: Semantic Pyramid AutoEncoder for Multimodal Generation with Frozen LLMs

Paper • 2306.17842 • Published Jun 30, 2023 • 9 •

SPAE: Semantic Pyramid AutoEncoder for Multimodal Generation with Frozen LLMs

Paper • 2306.17842 • Published Jun 30, 2023 • 9 •