Hyunwoo Ko's picture

Hyunwoo Ko

Cartinoe5930

·

https://cartinoe5930.tistory.com/

AI & ML interests

NLP(LLM)

Recent Activity

updated a dataset 3 days ago

Cartinoe5930/my_research_1

published a dataset 3 days ago

Cartinoe5930/my_research_1

upvoted an article 4 days ago

DenseR: Dense Rewards For Free in LLM Reasoning

View all activity

Organizations

upvoted an article 4 days ago

Article

DenseR: Dense Rewards For Free in LLM Reasoning

5 days ago

•

12

upvoted a paper 14 days ago

Judging What We Cannot Solve: A Consequence-Based Approach for Oracle-Free Evaluation of Research-Level Math

Paper • 2602.06291 • Published 17 days ago • 23

upvoted a paper about 1 month ago

What Users Leave Unsaid: Under-Specified Queries Limit Vision-Language Models

Paper • 2601.06165 • Published Jan 7 • 16

upvoted a paper about 2 months ago

COMPASS: A Framework for Evaluating Organization-Specific Policy Alignment in LLMs

Paper • 2601.01836 • Published Jan 5 • 10

upvoted 3 papers 5 months ago

Pushing on Multilingual Reasoning Models with Language-Mixed Chain-of-Thought

Paper • 2510.04230 • Published Oct 5, 2025 • 27

Large Reasoning Models Learn Better Alignment from Flawed Thinking

Paper • 2510.00938 • Published Oct 1, 2025 • 59

Variational Reasoning for Language Models

Paper • 2509.22637 • Published Sep 26, 2025 • 69

upvoted a paper 9 months ago

When AI Co-Scientists Fail: SPOT-a Benchmark for Automated Verification of Scientific Research

Paper • 2505.11855 • Published May 17, 2025 • 10

upvoted a paper 10 months ago

Flow-GRPO: Training Flow Matching Models via Online RL

Paper • 2505.05470 • Published May 8, 2025 • 88

upvoted 2 papers 12 months ago

Kanana: Compute-efficient Bilingual Language Models

Paper • 2502.18934 • Published Feb 26, 2025 • 65

Linguistic Generalizability of Test-Time Scaling in Mathematical Reasoning

Paper • 2502.17407 • Published Feb 24, 2025 • 25

upvoted a paper about 1 year ago

Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning

Paper • 2502.14768 • Published Feb 20, 2025 • 47

upvoted an article about 1 year ago

Article

Open R1: Update #2

Feb 10, 2025

•

218

upvoted 2 papers about 1 year ago

s1: Simple test-time scaling

Paper • 2501.19393 • Published Jan 31, 2025 • 124

Process Reinforcement through Implicit Rewards

Paper • 2502.01456 • Published Feb 3, 2025 • 62

upvoted a collection about 1 year ago

DeepSeek-R1

10 items • Updated Nov 27, 2025 • 834

upvoted 2 papers about 1 year ago

The Lessons of Developing Process Reward Models in Mathematical Reasoning

Paper • 2501.07301 • Published Jan 13, 2025 • 100

rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking

Paper • 2501.04519 • Published Jan 8, 2025 • 288

upvoted an article about 1 year ago

Article

Releasing QwQ-LongCoT-130K

Dec 5, 2024

•

10

upvoted an article over 1 year ago

Article

Navigating Korean LLM Research #2: Evaluation Tools

Oct 23, 2024

•

8