davidberenstein1957 HF staff commited on
Commit
c4bb11b
1 Parent(s): fa1a4d1

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +55 -30
app.py CHANGED
@@ -9,18 +9,13 @@ import spaces
9
  import torch
10
  from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer
11
 
12
- DESCRIPTION = "# Geitje-SPIN-7B"
13
-
14
- if not torch.cuda.is_available():
15
- DESCRIPTION += "\n<p>Running on CPU 🥶 This demo does not work on CPU.</p>"
16
-
17
  MAX_MAX_NEW_TOKENS = 2048
18
  DEFAULT_MAX_NEW_TOKENS = 1024
19
- MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "4096"))
20
 
21
  if torch.cuda.is_available():
22
- model_id = "BramVanroy/GEITje-7B-ultra-sft"
23
- model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto")
24
  tokenizer = AutoTokenizer.from_pretrained(model_id)
25
 
26
 
@@ -29,9 +24,9 @@ def generate(
29
  message: str,
30
  chat_history: list[tuple[str, str]],
31
  max_new_tokens: int = 1024,
32
- temperature: float = 0.6,
33
- top_p: float = 0.9,
34
- top_k: int = 50,
35
  repetition_penalty: float = 1.2,
36
  ) -> Iterator[str]:
37
  conversation = []
@@ -39,13 +34,13 @@ def generate(
39
  conversation.extend([{"role": "user", "content": user}, {"role": "assistant", "content": assistant}])
40
  conversation.append({"role": "user", "content": message})
41
 
42
- input_ids = tokenizer.apply_chat_template(conversation, return_tensors="pt")
43
  if input_ids.shape[1] > MAX_INPUT_TOKEN_LENGTH:
44
  input_ids = input_ids[:, -MAX_INPUT_TOKEN_LENGTH:]
45
  gr.Warning(f"Trimmed input from conversation as it was longer than {MAX_INPUT_TOKEN_LENGTH} tokens.")
46
  input_ids = input_ids.to(model.device)
47
 
48
- streamer = TextIteratorStreamer(tokenizer, timeout=20.0, skip_prompt=True, skip_special_tokens=True)
49
  generate_kwargs = dict(
50
  {"input_ids": input_ids},
51
  streamer=streamer,
@@ -68,6 +63,12 @@ def generate(
68
 
69
  chat_interface = gr.ChatInterface(
70
  fn=generate,
 
 
 
 
 
 
71
  additional_inputs=[
72
  gr.Slider(
73
  label="Max new tokens",
@@ -78,10 +79,10 @@ chat_interface = gr.ChatInterface(
78
  ),
79
  gr.Slider(
80
  label="Temperature",
81
- minimum=0.1,
82
- maximum=4.0,
83
- step=0.1,
84
- value=0.6,
85
  ),
86
  gr.Slider(
87
  label="Top-p (nucleus sampling)",
@@ -105,24 +106,48 @@ chat_interface = gr.ChatInterface(
105
  value=1.2,
106
  ),
107
  ],
108
- stop_btn=None,
109
  examples=[
110
- ["Hi! How gaat het?"],
111
- ["Kun je mij uitleggen wat Python is?"],
112
- ["Leg het plot van Assepoester uit in een zin."],
113
- ["Hoe lang doet een persoon er over om een helicopter op te eten?"],
114
- ["Schrijf een artikel met 100 woorden over de nut van AI."],
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
115
  ],
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
116
  )
117
 
118
  with gr.Blocks(css="style.css") as demo:
119
- gr.Markdown(DESCRIPTION)
120
- gr.DuplicateButton(
121
- value="Duplicate Space for private use",
122
- elem_id="duplicate-button",
123
- visible=os.getenv("SHOW_DUPLICATE_BUTTON") == "1",
124
- )
125
  chat_interface.render()
126
 
127
  if __name__ == "__main__":
128
- demo.queue(max_size=20).launch()
 
9
  import torch
10
  from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer
11
 
 
 
 
 
 
12
  MAX_MAX_NEW_TOKENS = 2048
13
  DEFAULT_MAX_NEW_TOKENS = 1024
14
+ MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "8192"))
15
 
16
  if torch.cuda.is_available():
17
+ model_id = "davidberenstein1957/ultra-feedback-dutch-cleaned-hq-spin-geitje-7b-ultra-sft_iter1"
18
+ model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.float16, device_map="auto")
19
  tokenizer = AutoTokenizer.from_pretrained(model_id)
20
 
21
 
 
24
  message: str,
25
  chat_history: list[tuple[str, str]],
26
  max_new_tokens: int = 1024,
27
+ temperature: float = 0.06,
28
+ top_p: float = 0.95,
29
+ top_k: int = 40,
30
  repetition_penalty: float = 1.2,
31
  ) -> Iterator[str]:
32
  conversation = []
 
34
  conversation.extend([{"role": "user", "content": user}, {"role": "assistant", "content": assistant}])
35
  conversation.append({"role": "user", "content": message})
36
 
37
+ input_ids = tokenizer.apply_chat_template(conversation, add_generation_prompt=True, return_tensors="pt")
38
  if input_ids.shape[1] > MAX_INPUT_TOKEN_LENGTH:
39
  input_ids = input_ids[:, -MAX_INPUT_TOKEN_LENGTH:]
40
  gr.Warning(f"Trimmed input from conversation as it was longer than {MAX_INPUT_TOKEN_LENGTH} tokens.")
41
  input_ids = input_ids.to(model.device)
42
 
43
+ streamer = TextIteratorStreamer(tokenizer, timeout=10.0, skip_prompt=True, skip_special_tokens=True)
44
  generate_kwargs = dict(
45
  {"input_ids": input_ids},
46
  streamer=streamer,
 
63
 
64
  chat_interface = gr.ChatInterface(
65
  fn=generate,
66
+ chatbot=gr.Chatbot(height=450,
67
+ label="GEITje-chat-v2",
68
+ show_share_button=True,
69
+ avatar_images=(None, 'geitje-logo.jpg')),
70
+ # textbox=gr.Textbox(value="Typ een bericht…"),
71
+ cache_examples=False,
72
  additional_inputs=[
73
  gr.Slider(
74
  label="Max new tokens",
 
79
  ),
80
  gr.Slider(
81
  label="Temperature",
82
+ minimum=0.05,
83
+ maximum=1.2,
84
+ step=0.05,
85
+ value=0.2,
86
  ),
87
  gr.Slider(
88
  label="Top-p (nucleus sampling)",
 
106
  value=1.2,
107
  ),
108
  ],
 
109
  examples=[
110
+ ["""Vraagje: welk woord hoort er niet in dit rijtje thuis: "auto, vliegtuig, geit, bus"?"""],
111
+ ["Schrijf een nieuwsbericht voor De Speld over de inzet van een kudde geiten door het Nederlands Forensisch Instituut"],
112
+ ["Wat zijn 3 leuke dingen om te doen als ik een weekendje naar Friesland ga?"],
113
+ ["Met wie trad clown Bassie op?"],
114
+ ["Kan je naar de maan fietsen?"],
115
+ ["Wat is het belang van open source taalmodellen?"],
116
+ ["""```
117
+ Wortelverkopers krijgen miljoenenboete voor ongeoorloofd samenspannen
118
+ Door onze economieredactie
119
+ 14 dec 2023 om 12:58
120
+ Update: 20 uur geleden
121
+ 162 reacties
122
+ Delen
123
+ Toezichthouder ACM heeft een Nederlands wortelkartel aangepakt. Vier telers en verkopers van wortelen krijgen samen ruim 2,5 miljoen euro boete vanwege ongeoorloofde afspraken over het verdelen van de markt.
124
+ Het gaat om telers en verkopers Laarakker, VanRijsingen, Veco en Verduyn. De vier bedrijven verkopen waspeen en Parijse wortelen aan conserven- en diepvriesfabrikanten in Nederland, België en Duitsland. Waspeen wordt vaak verkocht in potten of blikken in een mix met erwtjes.
125
+ De vier bedrijven hadden in 2018 afgesproken dat ze tien jaar lang niet overal de concurrentie met elkaar zouden aangaan. Zo zou Veco tien jaar lang geen waspeen telen of verkopen. Daarnaast zouden Laarakker, VanRijsingen en Verduyn juist de Parijse wortelen links laten liggen.
126
+ Ook betaalden de andere wortelverkopers Veco ter compensatie van de afspraken. Laarakker en Veco maakten ook nog afzonderlijke afspraken over de levering van Parijse wortelen aan Duitse klanten.
127
+ Zulke afspraken zijn verboden. Als concurrentie door die samenwerking achterwege blijft en er dus sprake is van een kartel, betalen kopers mogelijk een hogere prijs, stelt de ACM.
128
+ Twee van de wortelbedrijven werkten mee door meer informatie over de ongeoorloofde afspraken te delen met de toezichthouder. Daardoor kregen zij een lagere boete.
129
+ ```
130
+ Vat bovenstaand artikel samen"""]
131
  ],
132
+ title="🐐 GEITje 7B chat-v2 🐐",
133
+ description="""Een ~eerste~ tweede chatbot op basis van GEITje 7B: een groot open Nederlands taalmodel. Gemaakt voor demonstratiedoeleinden.
134
+
135
+ Generatieve taalmodellen maken fouten, controleer daarom feiten voordat je ze overneemt. GEITje-chat is niet uitgebreid getraind om _gealigned_ te zijn met menselijke waarden. Het is daarom mogelijk dat het problematische output genereert, zeker als het daartoe _geprompt_ wordt.
136
+
137
+ Voor meer info over GEITje: zie de <a href="https://github.com/Rijgersberg/GEITje">📄 README op GitHub</a>.
138
+
139
+ <b>NIEUW</b>: probeer ook <a href="https://huggingface.co/BramVanroy">@BramVanroy</a>'s verbeterde chatbot <a href="https://huggingface.co/spaces/BramVanroy/GEITje-7B-ultra">GEITje-7B-ultra</a>!
140
+
141
+ <b>ZeroGPU</b>: De demo draait vanaf nu op de nieuwe gratis dynamische <a href="https://huggingface.co/zero-gpu-explorers">ZeroGPUs</a> van Hugging Face. Daarmee blijft de demo nu langer beschikbaar, maar kan het wel een paar seconden duren voordat je antwoord krijgt op je eerste vraag.""",
142
+ submit_btn="Genereer",
143
+ stop_btn="Stop",
144
+ retry_btn="🔄 Opnieuw",
145
+ undo_btn="↩️ Ongedaan maken",
146
+ clear_btn="🗑️ Wissen",
147
  )
148
 
149
  with gr.Blocks(css="style.css") as demo:
 
 
 
 
 
 
150
  chat_interface.render()
151
 
152
  if __name__ == "__main__":
153
+ demo.queue(max_size=20).launch()