Self-Critique - a alexngai Collection

alexngai 's Collections

Automated Research

Test-Time Compute/Optimal Scaling

Self-Improving Agents

Codegen Benchmarks

Self-Critique

updated about 17 hours ago

Enabling Scalable Oversight via Self-Evolving Critic

Paper • 2501.05727 • Published 7 days ago • 62