Dongwon Jo's picture

Dongwon Jo

dongwonjo

·

https://dongwonjo.github.io

AI & ML interests

Efficient AI, Model Compression, Sparse Attention, Quantization, Pruning, Generative Model, Large Language Model, Diffusion

Recent Activity

upvoted a paper about 13 hours ago

CompactAttention: Accelerating Chunked Prefill with Block-Union KV Selection

authored a paper about 13 hours ago

CompactAttention: Accelerating Chunked Prefill with Block-Union KV Selection

upvoted a paper 3 months ago

Squeezing Large-Scale Diffusion Models for Mobile

View all activity

Organizations

Papers 7

arxiv:2605.16839

arxiv:2602.03216

arxiv:2508.09001

arxiv:2505.13866

models 5

dongwonjo/Llama-1-7B-BinaryMoS-E4

7B • Updated Sep 9, 2024 • 3

dongwonjo/Llama-1-13B-BinaryMoS-E4

13B • Updated Sep 9, 2024 • 3 • 1

dongwonjo/Llama-2-13B-BinaryMoS-E4

13B • Updated Sep 9, 2024

dongwonjo/Llama-1-30B-BinaryMoS-E4

33B • Updated Sep 9, 2024 • 2

dongwonjo/Llama-2-7B-BinaryMoS-E4

7B • Updated Sep 9, 2024

datasets 0

None public yet