Kaiqiang Song's picture

Kaiqiang Song

kqsong

·

http://i2u.world

KaiQiangSong

AI & ML interests

Summarization and Text Generation

Recent Activity

upvoted a paper 2 days ago

Qwen2.5 Technical Report

upvoted a paper 13 days ago

SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference

upvoted a paper 29 days ago

BOLT: Bootstrap Long Chain-of-Thought in Language Models without Distillation

View all activity

Organizations

None yet

kqsong's activity

upvoted a paper 2 days ago

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 352

upvoted a paper 13 days ago

SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference

Paper • 2502.18137 • Published 16 days ago • 53

upvoted 2 papers 29 days ago

BOLT: Bootstrap Long Chain-of-Thought in Language Models without Distillation

Paper • 2502.03860 • Published Feb 6 • 24

MAGA: MAssive Genre-Audience Reformulation to Pretraining Corpus Expansion

Paper • 2502.04235 • Published Feb 6 • 21

upvoted a collection 3 months ago

Nemotron 4 340B

Nemotron-4: open models for Synthetic Data Generation (SDG). Includes Base, Instruct, and Reward models. • 4 items • Updated Jan 17 • 162

upvoted a paper 6 months ago

DSBench: How Far Are Data Science Agents to Becoming Data Science Experts?

Paper • 2409.07703 • Published Sep 12, 2024 • 67

upvoted a paper 8 months ago

WPO: Enhancing RLHF with Weighted Preference Optimization

Paper • 2406.11827 • Published Jun 17, 2024 • 15

upvoted 5 papers about 1 year ago

DecipherPref: Analyzing Influential Factors in Human Preference Judgments via GPT-4

Paper • 2305.14702 • Published May 24, 2023 • 1

OASum: Large-Scale Open Domain Aspect-based Summarization

Paper • 2212.09233 • Published Dec 19, 2022 • 2

Scoring Sentence Singletons and Pairs for Abstractive Summarization

Paper • 1906.00077 • Published May 31, 2019 • 2

InFoBench: Evaluating Instruction Following Ability in Large Language Models

Paper • 2401.03601 • Published Jan 7, 2024 • 7

Zebra: Extending Context Window with Layerwise Grouped Local-Global Attention

Paper • 2312.08618 • Published Dec 14, 2023 • 15

upvoted a paper over 1 year ago

Skills-in-Context Prompting: Unlocking Compositionality in Large Language Models

Paper • 2308.00304 • Published Aug 1, 2023 • 23