Edit model card

LDAI-1.5-ANIU

https://aniu.lakomoor.com

Модель предназначена для подбора аниме под предпочтения пользователей. LDAI-1.5-ANIU используется на сайте https://aniu.lakomoor.com

Обучение:

Для обучения модели мы собрали датасет, основанный на данных с Aniu. В качестве генерации синтетического датасета использовались модели Vikhr-Nemo-12B-Instruct-R-21-09-24 и Hermes-3-Llama-3.1-8B, а за основу была взята модель Qwen2.5-1.5B-Instruct.

Использовался метод SFT для обучения модели.

Создание синтетического датасета и обучение модели потребовали около 120 часов работы на двух Nvidia Tesla P40 24GB.

Пример кода для запуска:

Рекомендуемая пареметры для генерации:.

  • temperature 0.3
  • top_k 0
  • top_p 1.0

from transformers import AutoModelForCausalLM, AutoTokenizer

# Загрузка модели и токенизатора
model_name = "LakoMoor/LDAI-1.5-ANIU"
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# Подготовка входного текста
input_text = "Семейное аниме для детей 8-12 лет"

messages = [
    {"role": "system", "content": 'Вы модель "ldai-1.5-aniu", эксперт по подбору аниме на сайте Aniu. Пользователи описывают свои предпочтения, и ты рекомендуешь аниме, соответствующее их запросу. Учитывай жанры, возраст, предпочитаемый стиль и студию, а также добавляй краткое описание сюжета и полезные советы.'},
    {"role": "user", "content": input_text},
]

# Токенизация и генерация текста
input_ids = tokenizer.apply_chat_template(messages, truncation=True, add_generation_prompt=True, return_tensors="pt")
output = model.generate(
    input_ids,
    max_length=512,
    temperature=0.3,
    num_return_sequences=1,
    no_repeat_ngram_size=2,
    top_k=0,
    top_p=1.0,
)

# Декодирование и вывод результата
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print(generated_text)

Ответ модели:

{ "title_ru": "Покемон: Современное поколение - Лукарио и загадка Мью", "title_alt": [ "Pokemon: Lucario and the Mystery of Mew", "Gekijouban Pocket Monsters Advanced Generation: Myuu to Hadou no Yuusha Lucario", "Pokemon Movie 8" ], "year": 2010, "genres": [ "детское", "экшен", "приключения", "драма", "фэнтези" ], "studio": "OLM", "author": "Кэти Пилон", "message": "Рекомендуем посмотреть аниме 'Покемон: Современное поколение - Лукарио и загадка Мью'. Это увлекательная история о приключениях в мире покемонов. Найдите его на сайте Aniu." }

Ссылки

Downloads last month
10
Safetensors
Model size
1.54B params
Tensor type
BF16
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for LakoMoor/LDAI-1.5-ANIU

Base model

Qwen/Qwen2.5-1.5B
Finetuned
(36)
this model
Quantizations
3 models