hivaze commited on
Commit
e5c690f
·
verified ·
1 Parent(s): 2fe3f61

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +82 -0
README.md ADDED
@@ -0,0 +1,82 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - ru
4
+ ---
5
+ ## Инструктивный вихрь 5.4
6
+
7
+ Базоый Вихрь 5той версии (мистраль) обученный на переведенном инстракте, улучшенный с помощью [ORPO](https://argilla.io/blog/mantisnlp-rlhf-part-8/) на нашем внутреннем датасете.
8
+
9
+ ### Использование через transformers
10
+
11
+ ```python
12
+ from transformers import AutoModelForCausalLM, AutoTokenizer
13
+ import torch
14
+
15
+ model_name = 'Vikhrmodels/it-5.4-fp16-orpo-v2'
16
+ model = AutoModelForCausalLM.from_pretrained(
17
+ model_name,
18
+ device_map="sequential",
19
+ attn_implementation="sdpa",
20
+ torch_dtype=torch.bfloat16
21
+ )
22
+ tokenizer = AutoTokenizer.from_pretrained(model_name)
23
+
24
+ test_input = tokenizer.apply_chat_template([
25
+ {'role': 'user', 'content': 'Привет, объясни что такое черные дыры'}
26
+ ], add_generation_prompt=True, tokenize=True, return_tensors='pt')
27
+ test_input = test_input.to(model.device)
28
+
29
+ answer = model.generate(
30
+ test_input,
31
+ do_sample=True,
32
+ use_cache=True,
33
+ max_new_tokens=256,
34
+ temperature=0.3,
35
+ )[:, test_input.shape[-1]:]
36
+ answer = tokenizer.batch_decode(answer, skip_special_tokens=True)[0]
37
+ print(answer)
38
+ ```
39
+
40
+ Ответ модели:
41
+
42
+ > Привет! Черные дыры - это удивительные объекты, которые существуют в космосе. Они образуются из остатков массивных звезд, которые взрываются в результате сверхновой. После взрыва остается ядро звезды, которое коллапсирует под действием собственной гравитации, образуя черную дыру.
43
+ >
44
+ > Черная дыра - это область пространства, где гравитационное притяжение настолько сильное, что ничто, даже свет, не может вырваться из нее. Это происходит потому, что гравитационное поле черной дыры настолько сильное, что оно искривляет пространство-время настолько, что даже свет не может покинуть ее.
45
+ >
46
+ > Черные дыры могут быть разных размеров, от маленьких, которые могут быть размером с планету, до огромных, которые могут быть размером с галактику. Они могут быть как неподвижными, так и движущимися, и могут взаимодействовать с другими объектами в космосе, такими как звезды и планеты.
47
+ >
48
+ > Черные дыры - это удивительные объекты, которые продолжают изучать ученые, и они могут многое рассказать нам о Вселенной и ее происхождении.
49
+
50
+ ### Использование через vllm + openai client
51
+
52
+ `python -m vllm.entrypoints.openai.api_server --model Vikhrmodels/it-5.4-fp16-orpo-v2 --dtype half --api-key token-abc123 -tp 1`
53
+
54
+ ```python
55
+ temperature = 0.0
56
+
57
+ llm_model = "Vikhrmodels/it-5.4-fp16-orpo-v2"
58
+ llm_client = openai.OpenAI(
59
+ base_url="http://localhost:8000/v1",
60
+ api_key="token-abc123",
61
+ )
62
+
63
+ def make_completion(history, client, model):
64
+ completion = client.chat.completions.create(
65
+ model=model,
66
+ messages=history,
67
+ temperature=temperature,
68
+ max_tokens=2048,
69
+ stop=["</s>", "<eos>", "<|eot_id|>", "<|im_end|>"]
70
+ )
71
+ output = completion.choices[0].message.content
72
+ return output
73
+
74
+ answer = make_completion([
75
+ {'role': 'user', 'content': 'Привет, объясни что такое черные дыры'}
76
+ ], llm_client, llm_model)
77
+ print(answer)
78
+ ```
79
+
80
+ ### Метрики на ru_arena_general
81
+
82
+ ![ru_arena_general](https://i.imghippo.com/files/kxqgJ1720804234.png)