19 574 102

Abdel-Dayane Marcos

admarcosai

AI & ML interests

Natural Language Processing, Graph Neural Networks, Reinforcement Learning

Recent Activity

updated a collection 14 days ago

Pending Papers

updated a collection 17 days ago

Pending Papers

updated a collection 17 days ago

Pending Papers

View all activity

Organizations

None yet

admarcosai's activity

upvoted 5 papers 17 days ago

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Paper • 2501.17161 • Published 19 days ago • 105

upvoted 2 papers 22 days ago

Sigma: Differential Rescaling of Query, Key and Value for Efficient Language Models

Paper • 2501.13629 • Published 24 days ago • 44

SRMT: Shared Memory for Multi-agent Lifelong Pathfinding

Paper • 2501.13200 • Published 25 days ago • 63

upvoted 4 papers 24 days ago

UI-TARS: Pioneering Automated GUI Interaction with Native Agents

Paper • 2501.12326 • Published 26 days ago • 50

Kimi k1.5: Scaling Reinforcement Learning with LLMs

Paper • 2501.12599 • Published 25 days ago • 93

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published 25 days ago • 319

FilmAgent: A Multi-Agent Framework for End-to-End Film Automation in Virtual 3D Spaces

Paper • 2501.12909 • Published 25 days ago • 67

upvoted 2 papers 27 days ago

PaSa: An LLM Agent for Comprehensive Academic Paper Search

Paper • 2501.10120 • Published about 1 month ago • 43

Evolving Deeper LLM Thinking

Paper • 2501.09891 • Published about 1 month ago • 106

upvoted 2 papers 30 days ago

Towards Large Reasoning Models: A Survey of Reinforced Reasoning with Large Language Models

Paper • 2501.09686 • Published about 1 month ago • 36

OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking

Paper • 2501.09751 • Published about 1 month ago • 47

upvoted 5 papers about 1 month ago

AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages

Paper • 2501.08284 • Published Jan 14 • 6

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published Jan 14 • 273

CityDreamer4D: Compositional Generative Model of Unbounded 4D Cities

Paper • 2501.08983 • Published Jan 15 • 20

MMDocIR: Benchmarking Multi-Modal Retrieval for Long Documents

Paper • 2501.08828 • Published Jan 15 • 30

Towards Best Practices for Open Datasets for LLM Training

Paper • 2501.08365 • Published Jan 14 • 55