11 1

Ru Peng

RuPeng

AI & ML interests

None yet

Recent Activity

liked a model 27 days ago

tablegpt/TableGPT2-7B

upvoted a paper about 2 months ago

Canzona: A Unified, Asynchronous, and Load-Balanced Framework for Distributed Matrix-based Optimizers

upvoted a paper 5 months ago

Energy-based Automated Model Evaluation

View all activity

Organizations

None yet

liked a model 27 days ago

tablegpt/TableGPT2-7B

Updated Feb 13, 2025 • 221k • 229

upvoted a paper about 2 months ago

Canzona: A Unified, Asynchronous, and Load-Balanced Framework for Distributed Matrix-based Optimizers

Paper • 2602.06079 • Published Feb 4 • 18

upvoted a paper 5 months ago

Energy-based Automated Model Evaluation

Paper • 2401.12689 • Published Jan 23, 2024 • 1

upvoted 2 papers 7 months ago

Group Sequence Policy Optimization

Paper • 2507.18071 • Published Jul 24, 2025 • 320

Agentic Reinforced Policy Optimization

Paper • 2507.19849 • Published Jul 26, 2025 • 161

upvoted a paper 8 months ago

Reinforcement Learning with Rubric Anchors

Paper • 2508.12790 • Published Aug 18, 2025 • 15

authored 4 papers 8 months ago

Energy-based Automated Model Evaluation

Paper • 2401.12689 • Published Jan 23, 2024 • 1

CAME: Contrastive Automated Model Evaluation

Paper • 2308.11111 • Published Aug 22, 2023

Predicting Rewards Alongside Tokens: Non-disruptive Parameter Insertion for Efficient Inference Intervention in Large Language Model

Paper • 2408.10764 • Published Aug 20, 2024 • 9

DataMan: Data Manager for Pre-training Large Language Models

Paper • 2502.19363 • Published Feb 26, 2025 • 1

upvoted a paper 8 months ago

DataMan: Data Manager for Pre-training Large Language Models

Paper • 2502.19363 • Published Feb 26, 2025 • 1

updated 2 models 8 months ago

RuPeng/DataMan-MoE-A2.7B-ZH

14B • Updated Aug 9, 2025 • 6

RuPeng/DataMan-MoE-A2.7B-EN

14B • Updated Aug 8, 2025 • 4

updated a collection 8 months ago

DataMan

Collection

4 items • Updated Aug 8, 2025 • 2

updated 2 models 8 months ago

RuPeng/DataMan-1.5B-ZH

2B • Updated Aug 8, 2025 • 10

RuPeng/DataMan-1.5B-EN

2B • Updated Aug 7, 2025 • 366

Ru Peng

AI & ML interests

Recent Activity

Organizations

RuPeng's activity