import gradio as gr from transformers import AutoModelForCausalLM, AutoTokenizer import torch import spaces model_name = "MBZUAI-Paris/Atlas-Chat-27B" model = AutoModelForCausalLM.from_pretrained( "text-generation", model_name, model_kwargs={"torch_dtype": torch.bfloat16}, device_map="auto" ) tokenizer = AutoTokenizer.from_pretrained(model_name) @spaces.GPU def chat(input_text, history=[]): # Tokenize the input and generate response inputs = tokenizer(input_text, return_tensors="pt").to(model.device) outputs = model.generate(**inputs, max_new_tokens=150) response = tokenizer.decode(outputs[0], skip_special_tokens=True) # Update the conversation history history.append((input_text, response)) return history, history iface = gr.Interface( fn=chat, inputs=[ gr.Textbox(label="أدخل رسالتك هنا"), gr.State() ], outputs=[ gr.Chatbot(label="المحادثة"), gr.State() ], live=True, title="دردشة أطلس", description="تطبيق دردشة يعمل بنموذج أطلس-شات لتوفير تفاعل ذكي وسلس", theme="huggingface", examples=[ ["مرحباً! كيف يمكنني مساعدتك اليوم؟"], ["ما هي أخبار التكنولوجيا الحديثة؟"] ] ) # Launch the application iface.launch()