17 46 25

ct2

ct-2

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 days ago

LLMs as Noisy Channels: A Shannon Perspective on Model Capacity and Scaling Laws

updated a bucket 3 days ago

ct-2/Sherry-3B-1.25bit-per-channel-bucket

published a bucket 3 days ago

ct-2/Sherry-3B-1.25bit-per-channel-bucket

View all activity

Organizations

None yet

upvoted a paper 3 days ago

LLMs as Noisy Channels: A Shannon Perspective on Model Capacity and Scaling Laws

Paper • 2605.23901 • Published 6 days ago • 10

updated a bucket 3 days ago

ct-2/Sherry-3B-1.25bit-per-channel-bucket

6.44 GB

published a bucket 3 days ago

ct-2/Sherry-3B-1.25bit-per-channel-bucket

6.44 GB

liked a model 3 days ago

MoraxGeo/Sherry-3B-1.25bit-per-channel

3B • Updated Feb 4 • 2 • 2

upvoted a collection 5 days ago

BitCPM-CANN

Collection

Full-pipeline ternary quantized model trained on CANN. • 12 items • Updated 3 days ago • 24

updated a bucket 5 days ago

ct-2/BitCPM4-CANN-8B-bucket

16.4 GB

published a bucket 5 days ago

ct-2/BitCPM4-CANN-8B-bucket

16.4 GB

updated a bucket 5 days ago

ct-2/BitCPM4-CANN-8B-gguf-bucket

2.37 GB

published a bucket 5 days ago

ct-2/BitCPM4-CANN-8B-gguf-bucket

2.37 GB

upvoted 2 papers 6 days ago

Mix-Quant: Quantized Prefilling, Precise Decoding for Agentic LLMs

Paper • 2605.20315 • Published 9 days ago • 28

Enhancing Train-Free Infinite-Frame Generation for Consistent Long Videos

Paper • 2605.18233 • Published 10 days ago • 90

upvoted a paper 7 days ago

Post-Trained MoE Can Skip Half Experts via Self-Distillation

Paper • 2605.18643 • Published 10 days ago • 30

updated a model 9 days ago

ct-2/BitCPM4-CANN-8B-Q4_K_M-GGUF

Text Generation • 8B • Updated 9 days ago • 162

published a model 9 days ago

ct-2/BitCPM4-CANN-8B-Q4_K_M-GGUF

Text Generation • 8B • Updated 9 days ago • 162

updated a model 9 days ago

ct-2/BitCPM4-CANN-0.5B-Q4_K_M-GGUF

Text Generation • 0.4B • Updated 9 days ago • 130

published a model 9 days ago

ct-2/BitCPM4-CANN-0.5B-Q4_K_M-GGUF

Text Generation • 0.4B • Updated 9 days ago • 130

updated a model 9 days ago

ct-2/BitCPM4-CANN-0.5B-Q4_0-GGUF

Text Generation • 0.4B • Updated 9 days ago • 125

published a model 9 days ago

ct-2/BitCPM4-CANN-0.5B-Q4_0-GGUF

Text Generation • 0.4B • Updated 9 days ago • 125

upvoted 2 papers 16 days ago

Large Language Models Explore by Latent Distilling

Paper • 2604.24927 • Published about 1 month ago • 74

StateSMix: Online Lossless Compression via Mamba State Space Models and Sparse N-gram Context Mixing

Paper • 2605.02904 • Published Apr 5 • 8

ct2

AI & ML interests

Recent Activity

Organizations

ct-2's activity

ct-2/Sherry-3B-1.25bit-per-channel-bucket

ct-2/Sherry-3B-1.25bit-per-channel-bucket

ct-2/BitCPM4-CANN-8B-bucket

ct-2/BitCPM4-CANN-8B-bucket

ct-2/BitCPM4-CANN-8B-gguf-bucket

ct-2/BitCPM4-CANN-8B-gguf-bucket