LLMs SELF-IMPROVEMENT - a JBHF Collection

JBHF 's Collections

STEERING VECTORS - Steering LLM Without Optimization

VJEPA

CAUSAL REASONING

AGENTIC AI ADAPTATION

AUTOMATED DATA SCIENCE

LLM VERIFICATION

Autonomous LLM Agents

Kosmos: An AI Scientist for Autonomous Discovery

DATASETS - PUBMEDQA

LEADERBOARDS AND BENCHMARKS

Context Engineering

GÖDEL MACHINES

AI FOR SCIENCE - Paper2Agent paper into AI agents

LLMs - IN CONTEXT LEARNING

HUMANITIES LAST EXAM (HLE)

KIMI 2 (JULY 2025)

Does Math Reasoning Improve General LLM Capabilities? !!!!!

ARC-AGI-2: A New Challenge for Frontier AI Reasoning Systems

REASONING IN LATENT SPACE

SMALL LANGUAGE MODELS SLMs

AI Ability to Complete Long Tasks

WORLD MODELS AND AI

PROMPT ENGINEERING

DIVERSE APPLICATIONS

MEMORIZATION vs GENERALIZATION (GROKKING)

OPEN DEEP RESEARCH

AGENTIC AI vs AI AGENTS

VOICE CLONING CHATTERBOX (FREE !)

RAG WITH MCP AND LANGCHAIN

LLMs HALLUCINATIONS

JUST ASK FOR CALIBRATION (CONFIDENSCE SCORES FROM LLMs)

REASONING MODELS

ABSOLUTE ZERO REASONER (AZR) - SELF IMPROVE AI WITHOUT DATA

DESCRIBE ANYTHING IN IMAGE (NVIDIA)

TEST TIME COMPUTE IN LATENT SPACE

HIT SONG SCIENCE

ANYCHAT

General Instruction Following with Thought Generation

WATERMARKING LLM GENERATED TEXT

GPT-4o Mini: Research Preview (Short-Term Availability)

MAMBA - OPVOLGER VAN TRANSFORMERS ?

LLMs SELF-IMPROVEMENT

RWKV - Opvolger van Transformers !

SliceGPT: Compress LLMs by Deleting Rows and Columns

LLMs - DSPY - SELF IMPROVING (RAG) PIPELINES

LITERATURE BASED RESEARCH (LBR)

FLASK APPS ON HF SPACES

DNA Sequence Modeling

VERTAAL APP EAGLE SHELTER

NON TOXIC GLAZE ADVISOR APP

TEXT TO VIDEO - ByteDance AnimateDiff-Lightning

ChatWithYourPDF

OPEN RESEARCHER

BioRAG: A RAG-LLM Framework for Biology

DOC TO AUDIO DIALOGUE

LLMs SPECIALIZED IN SCIENCE

AI FOR RESEARCH

LLMs SELF-IMPROVEMENT

updated 13 days ago