2 235 91

Raja Biswas

rbiswasfc

AI & ML interests

NLP, Generative AI

Recent Activity

upvoted an article 4 days ago

How NVIDIA AI-Q Reached \#1 on DeepResearch Bench I and II

upvoted a paper about 1 month ago

TokSuite: Measuring the Impact of Tokenizer Choice on Language Model Behavior

upvoted a paper about 1 month ago

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

View all activity

Organizations

upvoted an article 4 days ago

Article

How NVIDIA AI-Q Reached \#1 on DeepResearch Bench I and II

4 days ago

•

upvoted 4 papers about 1 month ago

TokSuite: Measuring the Impact of Tokenizer Choice on Language Model Behavior

Paper • 2512.20757 • Published Dec 23, 2025 • 18

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

Paper • 2601.09688 • Published Jan 14 • 127

LongCat-Flash-Thinking-2601 Technical Report

Paper • 2601.16725 • Published Jan 23 • 178

Watching, Reasoning, and Searching: A Video Deep Research Benchmark on Open Web for Agentic Video Reasoning

Paper • 2601.06943 • Published Jan 11 • 215

liked a dataset about 2 months ago

ScaleAI/researchrubrics

Viewer • Updated Nov 12, 2025 • 101 • 109 • 18

upvoted 3 papers 2 months ago

General Agentic Memory Via Deep Research

Paper • 2511.18423 • Published Nov 23, 2025 • 169

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published Jan 8 • 229

mHC: Manifold-Constrained Hyper-Connections

Paper • 2512.24880 • Published Dec 31, 2025 • 318

upvoted 2 papers 3 months ago

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

Paper • 2511.19399 • Published Nov 24, 2025 • 62

How Far Are We from Genuinely Useful Deep Research Agents?

Paper • 2512.01948 • Published Dec 1, 2025 • 56

updated 2 datasets 3 months ago

rbiswasfc/zotero-answer-ai-texts

Viewer • Updated Dec 13, 2025 • 3.37k • 34

rbiswasfc/zotero-answer-ai-images

Viewer • Updated Dec 13, 2025 • 60.4k • 26

liked a Space 3 months ago

ProfBench

🦀

Human-annotated rubrics in Professional Tasks

upvoted a paper 4 months ago

Fathom-DeepResearch: Unlocking Long Horizon Information Retrieval and Synthesis for SLMs

Paper • 2509.24107 • Published Sep 28, 2025 • 79

liked a Space 4 months ago

The Smol Training Playbook

📚

3.05k

The secrets to building world-class LLMs

upvoted 4 papers 4 months ago

DRBench: A Realistic Benchmark for Enterprise Deep Research

Paper • 2510.00172 • Published Sep 30, 2025 • 1

PokeeResearch: Effective Deep Research via Reinforcement Learning from AI Feedback and Robust Reasoning Scaffold

Paper • 2510.15862 • Published Oct 17, 2025 • 10

Enterprise Deep Research: Steerable Multi-Agent Deep Research for Enterprise Analytics

Paper • 2510.17797 • Published Oct 20, 2025 • 11

Towards Personalized Deep Research: Benchmarks and Evaluations

Paper • 2509.25106 • Published Sep 29, 2025 • 30

Raja Biswas

AI & ML interests

Recent Activity

Organizations

rbiswasfc's activity

How NVIDIA AI-Q Reached \#1 on DeepResearch Bench I and II

ProfBench

The Smol Training Playbook