sai vignan's picture

23 19

sai vignan

vignan

·

AI & ML interests

None yet

Organizations

upvoted a paper 6 months ago

Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models

Paper • 2506.06395 • Published Jun 5 • 133

upvoted a collection 6 months ago

RL+reason model

256 items • Updated 6 days ago • 22

upvoted 2 papers 6 months ago

OpenThoughts: Data Recipes for Reasoning Models

Paper • 2506.04178 • Published Jun 4 • 48

Large Language Models for Data Synthesis

Paper • 2505.14752 • Published May 20 • 49

upvoted 2 papers 9 months ago

Judge Anything: MLLM as a Judge Across Any Modality

Paper • 2503.17489 • Published Mar 21 • 23

I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published Mar 24 • 119

upvoted a paper 10 months ago

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

Paper • 2502.11089 • Published Feb 16 • 166

upvoted 4 papers 11 months ago

LLM4SR: A Survey on Large Language Models for Scientific Research

Paper • 2501.04306 • Published Jan 8 • 35

Towards System 2 Reasoning in LLMs: Learning How to Think With Meta Chain-of-Though

Paper • 2501.04682 • Published Jan 8 • 99

REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models

Paper • 2501.03262 • Published Jan 4 • 103

PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides

Paper • 2501.03936 • Published Jan 7 • 23

upvoted a paper 12 months ago

How to Synthesize Text Data without Model Collapse?

Paper • 2412.14689 • Published Dec 19, 2024 • 52

upvoted a paper over 1 year ago

Calibrating LLM-Based Evaluator

Paper • 2309.13308 • Published Sep 23, 2023 • 12

upvoted 3 collections over 1 year ago

Eval Leaderboards

27 items • Updated Jun 17 • 3

Awesome Spaces

29 items • Updated Jun 12 • 4

LLM as a Judge

Curated resources that support the use of LLMs to serve as automatic evaluators of other LLM outputs. • 20 items • Updated Dec 11, 2024 • 22

upvoted 2 papers over 1 year ago

DyVal: Dynamic Evaluation of Large Language Models for Reasoning Tasks

Paper • 2309.17167 • Published Sep 29, 2023 • 1

Prometheus 2: An Open Source Language Model Specialized in Evaluating Other Language Models

Paper • 2405.01535 • Published May 2, 2024 • 123

upvoted an article over 1 year ago

Article

⚗️ 🧑🏼‍🌾 Let's grow some Domain Specific Datasets together

Apr 29, 2024

•

29

upvoted a paper almost 2 years ago

Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4

Paper • 2312.16171 • Published Dec 26, 2023 • 37