Mukul's picture

Mukul

mtcl

·

mtcl
mtcl

AI & ML interests

None yet

Recent Activity

new activity 5 days ago

nvidia/DeepSeek-V4-Pro-NVFP4:nvidia/DeepSeek-V4-flash-NVFP4

new activity 5 days ago

canada-quant/DeepSeek-V4-Flash-NVFP4-FP8-MTP:Docker Image

new activity 6 days ago

unsloth/DeepSeek-V4-Flash:Worse than (smaller) MiniMax M2.7??

View all activity

Organizations

None yet

New activity in nvidia/DeepSeek-V4-Pro-NVFP4 5 days ago

nvidia/DeepSeek-V4-flash-NVFP4

#1 opened 6 days ago by

New activity in canada-quant/DeepSeek-V4-Flash-NVFP4-FP8-MTP 5 days ago

Docker Image

#1 opened 6 days ago by

New activity in unsloth/DeepSeek-V4-Flash 6 days ago

Worse than (smaller) MiniMax M2.7??

#2 opened about 1 month ago by deleted

New activity in deepseek-ai/DeepSeek-V4-Flash 24 days ago

Unable to run on 2x RTX Pro 6000 (DEEP_GEMM problem)

#15 opened about 1 month ago by

New activity in mistralai/Mistral-Medium-3.5-128B 29 days ago

Running on 2 RTX Pro 6000 Blackwell GPUs at ~30 tps (Instructions that worked for me)

#17 opened about 1 month ago by

New activity in RedHatAI/DeepSeek-V4-Flash-NVFP4-FP8 29 days ago

2x Nvidia 6000 Pros

#2 opened about 1 month ago by

New activity in lukealonso/MiMo-V2.5-NVFP4 about 1 month ago

Will it work on 2X6000 Pros

#1 opened about 1 month ago by

New activity in Intel/DeepSeek-V4-Flash-W4A16-AutoRound about 1 month ago

Can I deploy it with sglang at my 8*4090 ubuntu sever?

#1 opened about 1 month ago by

New activity in nvidia/MiniMax-M2.7-NVFP4 about 1 month ago

Context Length for 2X6000 Pros (2x96 = 192GB VRAM)

#2 opened about 1 month ago by

New activity in ubergarm/Kimi-K2.6-GGUF about 1 month ago

really awesome speeds! running at 256k context.

#11 opened about 1 month ago by

New activity in Qwen/Qwen3.6-27B about 1 month ago

MOE 122b and 397b please!

#7 opened about 1 month ago by

New activity in ubergarm/Kimi-K2.6-GGUF about 1 month ago

How to disable thinking?

#9 opened about 1 month ago by

New activity in demon-zombie/MiniMax-M2.7-AWQ-4bit about 1 month ago

These are NOT actual AWQ-quantized models.

#1 opened about 2 months ago by

New activity in NinjaBoffin/MiniMax-M2.7-NVFP4 about 1 month ago

max context

#2 opened about 1 month ago by

New activity in ubergarm/Kimi-K2.6-GGUF about 1 month ago

No think tags.

#4 opened about 1 month ago by

New activity in nvidia/MiniMax-M2.5-NVFP4 about 1 month ago

Minimax M2.7 NVFP4

#4 opened about 2 months ago by

New activity in lukealonso/MiniMax-M2.7-NVFP4 about 1 month ago

Unable to use full 192k context in SGLang with MiniMax-M2.7-NVFP4 (runtime capped at ~80,964 tokens)

#9 opened about 1 month ago by

New activity in lukealonso/MiniMax-M2.7-NVFP4 about 2 months ago

w1 not matching w3 weight scales

#1 opened about 2 months ago by

tokenizer component mismatch and w1_weight_scale_2 must match w3_weight_scale_2. Accuracy may be affected issue

#5 opened about 2 months ago by

New activity in MiniMaxAI/MiniMax-M2.7 about 2 months ago

Minimax 2.7 !!!!

#3 opened about 2 months ago by