\n"
+ ],
+ "text/plain": [
+ " prompt \\\n",
+ "0 Por que os camelos conseguem sobreviver muito ... \n",
+ "1 Por que o celular é ruim para os humanos \n",
+ "2 O que é um polígono? \n",
+ "3 Como começo a correr? \n",
+ "4 Quais episódios da quarta temporada de Game of... \n",
+ "... ... \n",
+ "41810 Como posso ligar para você? \n",
+ "41811 Qual é o seu nome de identificação? \n",
+ "41812 Como você é chamado? \n",
+ "41813 Como você se apresenta? \n",
+ "41814 O que devo dizer quando me dirijo a você? \n",
+ "\n",
+ " completion \n",
+ "0 Os camelos podem sobreviver por longos período... \n",
+ "1 Os telefones celulares como dispositivos tecno... \n",
+ "2 Um polígono é uma figura geométrica bidimensio... \n",
+ "3 Começar uma rotina de corrida pode ser uma óti... \n",
+ "4 Michelle MacLaren dirigiu dois episódios da 4ª... \n",
+ "... ... \n",
+ "41810 Você pode me chamar de Aira. Como posso ajudá-... \n",
+ "41811 Como inteligência artificial, não tenho nome d... \n",
+ "41812 Olá! Meu nome é Aira. Como posso ajudá-lo hoje? \n",
+ "41813 Olá! Eu sou Aira, sua assistente prestativa, r... \n",
+ "41814 Ao se dirigir a mim, você pode simplesmente me... \n",
+ "\n",
+ "[41815 rows x 2 columns]"
+ ]
+ },
+ "metadata": {},
+ "output_type": "display_data"
+ }
+ ],
+ "source": [
+ "import os\n",
+ "import pandas as pd\n",
+ "from datasets import load_dataset\n",
+ "\n",
+ "project = \"Aira-2-portuguese-560M\"\n",
+ "\n",
+ "os.makedirs(project, exist_ok=True)\n",
+ "\n",
+ "dataset = load_dataset(\"nicholasKluge/instruct-aira-dataset\", split=\"portuguese\")\n",
+ "\n",
+ "df = dataset.to_pandas()\n",
+ "\n",
+ "display(df)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "BfKTTBZqCniY"
+ },
+ "source": [
+ "3. Load `BloomTokenizerFast` and add the chosen special tokens (`'<|startofinstruction|>', '<|endofinstruction|>', '<|endofcompletion|>','<|pad|>'`)\n",
+ "4. Create demonstrations by prepending the special tokens.\n",
+ "5. Calculate the maximum length (in tokens) that the demonstrations have."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {
+ "colab": {
+ "base_uri": "https://localhost:8080/",
+ "height": 150,
+ "referenced_widgets": [
+ "2de0ff9b7402402e988fc4339c44c1c7",
+ "d45ca83ca99f4212b16f741250569d9a",
+ "cc8cc74a351243fda39ce36395eec845",
+ "97dc26ac0f3e484596a1b2ff1791e19d",
+ "51e815f2905c4e47865cb5630e0ee9fe",
+ "315d17fde14e41fcb640ce2ae46aac40",
+ "67095ef71b494a6c90400cbe53ddc057",
+ "0e1ab0133d79402ea47ce4c83ea7f491",
+ "9ced50891d634205bc32bb5e6aa124c1",
+ "41066ac120fc4974ab128dd1a0ef81db",
+ "890a6c5f862d46a1b0b3ac682e9c24f8",
+ "e2525b4e3a3248ee9fcc37936cc5ceae",
+ "0541a883b6e1492388d34401b4a40d65",
+ "e254ab4b6ecf442a9a6f270ca359303e",
+ "d5d30b7c7768477a83653757c4b8d0e8",
+ "537de7cd9bad474699beb6edab6ff35c",
+ "c583ff9655aa4480b249a5a9370c2706",
+ "605984c1908d42fca64fb22637ffc5cf",
+ "514e30996e434b5993626e26eb858f7d",
+ "8911fef745694a28bb73241ed44f643d",
+ "cae99e7113974218ab1e28717ac24abe",
+ "5edf9983ff614d718451992121c08b80",
+ "373808ff98624394b344c4dae596f2bb",
+ "143a769f86e041ea99707f01aa7e4b7f",
+ "21c41ea0e36a41bda13aae580569786f",
+ "cc4a2e3853914238a871b5ef7290b1c3",
+ "ed6a62dc60c241199f26187436ed2d48",
+ "eab1b93db035441aba75510a369cf707",
+ "8342cad85b7d4034acc3b21547011d41",
+ "1f2c91f29c0f49da9cf367f6ac80e2d4",
+ "0588ce046a334a6fa2a29ccf62ff8178",
+ "463fb55d292f455ca55892a13fce06fb",
+ "8025ea053f864ca08bcbb713a8f89233"
+ ]
+ },
+ "id": "hfu84fWIv4f9",
+ "outputId": "10e0e9ed-78d3-459e-cbce-805ab7a67dd0"
+ },
+ "outputs": [
+ {
+ "data": {
+ "application/vnd.jupyter.widget-view+json": {
+ "model_id": "2de0ff9b7402402e988fc4339c44c1c7",
+ "version_major": 2,
+ "version_minor": 0
+ },
+ "text/plain": [
+ "Downloading (…)okenizer_config.json: 0%| | 0.00/222 [00:00, ?B/s]"
+ ]
+ },
+ "metadata": {},
+ "output_type": "display_data"
+ },
+ {
+ "data": {
+ "application/vnd.jupyter.widget-view+json": {
+ "model_id": "e2525b4e3a3248ee9fcc37936cc5ceae",
+ "version_major": 2,
+ "version_minor": 0
+ },
+ "text/plain": [
+ "Downloading tokenizer.json: 0%| | 0.00/14.5M [00:00, ?B/s]"
+ ]
+ },
+ "metadata": {},
+ "output_type": "display_data"
+ },
+ {
+ "data": {
+ "application/vnd.jupyter.widget-view+json": {
+ "model_id": "373808ff98624394b344c4dae596f2bb",
+ "version_major": 2,
+ "version_minor": 0
+ },
+ "text/plain": [
+ "Downloading (…)cial_tokens_map.json: 0%| | 0.00/85.0 [00:00, ?B/s]"
+ ]
+ },
+ "metadata": {},
+ "output_type": "display_data"
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ "Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.\n"
+ ]
+ }
+ ],
+ "source": [
+ "from transformers import BloomTokenizerFast\n",
+ "\n",
+ "model_name = \"bloom-560m\"\n",
+ "model_size = \"560M\"\n",
+ "\n",
+ "tokenizer = BloomTokenizerFast.from_pretrained(f\"bigscience/{model_name}\",\n",
+ " bos_token='<|startofinstruction|>',\n",
+ " sep_token = '<|endofinstruction|>',\n",
+ " eos_token='<|endofcompletion|>',\n",
+ " pad_token='<|pad|>')\n",
+ "\n",
+ "df['demonstrations'] = tokenizer.bos_token + df['prompt'] + tokenizer.sep_token + df['completion'] + tokenizer.eos_token\n",
+ "\n",
+ "df['length'] = df['demonstrations'].apply(lambda x: len(tokenizer.encode(x)))\n",
+ "\n",
+ "print(\"Total number of demonstrations: \", len(df))\n",
+ "print(f\"The longest demonstration is {df['length'].max()} tokens long.\")"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "kYvd27UdCnib"
+ },
+ "source": [
+ "6. Create the Dataset class."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {
+ "id": "WlbAfMQ4v4gA"
+ },
+ "outputs": [],
+ "source": [
+ "import torch\n",
+ "from torch.utils.data import Dataset\n",
+ "\n",
+ "max_length = 525\n",
+ "\n",
+ "class InstructDataset(Dataset):\n",
+ "\n",
+ " def __init__(self, demonstrations, tokenizer, max_length=max_length):\n",
+ "\n",
+ " self.tokenizer = tokenizer\n",
+ " self.input_ids = []\n",
+ " self.attn_masks = []\n",
+ "\n",
+ " for demo in demonstrations:\n",
+ "\n",
+ " encodings_dict = tokenizer(demo,\n",
+ " truncation=True,\n",
+ " max_length=max_length,\n",
+ " padding=\"max_length\")\n",
+ "\n",
+ " self.input_ids.append(torch.tensor(encodings_dict['input_ids']))\n",
+ " self.attn_masks.append(torch.tensor(encodings_dict['attention_mask']))\n",
+ "\n",
+ " def __len__(self):\n",
+ " return len(self.input_ids)\n",
+ "\n",
+ " def __getitem__(self, idx):\n",
+ " return self.input_ids[idx], self.attn_masks[idx]\n",
+ "\n",
+ "dataset = InstructDataset(df.demonstrations.to_list(), tokenizer, max_length=max_length)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "lfOIsZLUCnim"
+ },
+ "source": [
+ "7. Create the `DataLoaders` and specify the `batch_size`."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {
+ "id": "cUkCNV-6v4gG"
+ },
+ "outputs": [],
+ "source": [
+ "from torch.utils.data import DataLoader, RandomSampler\n",
+ "\n",
+ "dataloader = DataLoader(\n",
+ " dataset,\n",
+ " sampler=RandomSampler(dataset),\n",
+ " batch_size=8 # 16, 6\n",
+ " )"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "_qljce5ECnip"
+ },
+ "source": [
+ "8. Load the base model (`BloomForCausalLM`)."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {
+ "colab": {
+ "base_uri": "https://localhost:8080/",
+ "height": 535,
+ "referenced_widgets": [
+ "a2fa140799724db49fe5d4aeac4b1859",
+ "daf3476a427d43ffa11087f35434def9",
+ "dbf72d62130b44b3b6f87b0665615235",
+ "e43446bd683b407dad315171531d3b94",
+ "deb72c9b6f0d40bbb05b60f1c40a439f",
+ "e503f47d1f554191a85426fd60ace4ce",
+ "2cd81c4114204843a19ccc9cb7dd4041",
+ "cc47b3678f4e44d48da66eac4d82a557",
+ "99237f17876840ce915809ba40ab94d5",
+ "87ae15f8ba9a493e82ef7dffd7f58ad1",
+ "ac5de29113b747f0be75b5afc7c41594",
+ "52f5d019b27643da80c3f87c90b2cad2",
+ "a90298d9a0a042689d53a8ed471cc58e",
+ "ff740314a7b54eafab47fc0a15cb2cd1",
+ "9b5e996d1aee45ebb2fbaba634735ca4",
+ "650b363fa67144a5aec21583200b5728",
+ "254a664cbbc54b2c972da62158892c54",
+ "c3b42dfe665444688cde9b9af40a5828",
+ "efd68fb19f4647a8b5d2117195ad9822",
+ "820708a6102d4e68b0862d077aece087",
+ "4cd98082c1ec4db98404a285d7b8a249",
+ "cea9905a7a8743479cb91b00420691d7"
+ ]
+ },
+ "id": "Rmg-5YJqv4gH",
+ "outputId": "78186a10-8a22-4d3a-a15e-2bfdb9319a63"
+ },
+ "outputs": [
+ {
+ "data": {
+ "application/vnd.jupyter.widget-view+json": {
+ "model_id": "a2fa140799724db49fe5d4aeac4b1859",
+ "version_major": 2,
+ "version_minor": 0
+ },
+ "text/plain": [
+ "Downloading (…)lve/main/config.json: 0%| | 0.00/693 [00:00, ?B/s]"
+ ]
+ },
+ "metadata": {},
+ "output_type": "display_data"
+ },
+ {
+ "data": {
+ "application/vnd.jupyter.widget-view+json": {
+ "model_id": "52f5d019b27643da80c3f87c90b2cad2",
+ "version_major": 2,
+ "version_minor": 0
+ },
+ "text/plain": [
+ "Downloading model.safetensors: 0%| | 0.00/1.12G [00:00, ?B/s]"
+ ]
+ },
+ "metadata": {},
+ "output_type": "display_data"
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ "You are resizing the embedding layer without providing a `pad_to_multiple_of` parameter. This means that the new embedding dimension will be 250684. This might induce some performance reduction as *Tensor Cores* will not be available. For more details about this, or help on choosing the correct value for resizing, refer to this guide: https://docs.nvidia.com/deeplearning/performance/dl-performance-matrix-multiplication/index.html#requirements-tc\n"
+ ]
+ },
+ {
+ "data": {
+ "text/plain": [
+ "BloomForCausalLM(\n",
+ " (transformer): BloomModel(\n",
+ " (word_embeddings): Embedding(250684, 1024)\n",
+ " (word_embeddings_layernorm): LayerNorm((1024,), eps=1e-05, elementwise_affine=True)\n",
+ " (h): ModuleList(\n",
+ " (0-23): 24 x BloomBlock(\n",
+ " (input_layernorm): LayerNorm((1024,), eps=1e-05, elementwise_affine=True)\n",
+ " (self_attention): BloomAttention(\n",
+ " (query_key_value): Linear(in_features=1024, out_features=3072, bias=True)\n",
+ " (dense): Linear(in_features=1024, out_features=1024, bias=True)\n",
+ " (attention_dropout): Dropout(p=0.0, inplace=False)\n",
+ " )\n",
+ " (post_attention_layernorm): LayerNorm((1024,), eps=1e-05, elementwise_affine=True)\n",
+ " (mlp): BloomMLP(\n",
+ " (dense_h_to_4h): Linear(in_features=1024, out_features=4096, bias=True)\n",
+ " (gelu_impl): BloomGelu()\n",
+ " (dense_4h_to_h): Linear(in_features=4096, out_features=1024, bias=True)\n",
+ " )\n",
+ " )\n",
+ " )\n",
+ " (ln_f): LayerNorm((1024,), eps=1e-05, elementwise_affine=True)\n",
+ " )\n",
+ " (lm_head): Linear(in_features=1024, out_features=250684, bias=False)\n",
+ ")"
+ ]
+ },
+ "execution_count": 9,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "from transformers import BloomForCausalLM, BloomConfig\n",
+ "\n",
+ "configuration = BloomConfig.from_pretrained(f\"bigscience/{model_name}\", output_hidden_states=False)\n",
+ "\n",
+ "model = BloomForCausalLM.from_pretrained(f\"bigscience/{model_name}\")\n",
+ "model.resize_token_embeddings(len(tokenizer))\n",
+ "\n",
+ "device = torch.device(\"cuda\" if torch.cuda.is_available() else \"cpu\")\n",
+ "\n",
+ "model.to(device)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "y8-KTEVelgy-"
+ },
+ "source": [
+ "9. Freeze some of the layers for constrained fine-tuning. This allows the model to retain some of its original capabilities after the tuning."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {
+ "colab": {
+ "base_uri": "https://localhost:8080/"
+ },
+ "id": "B_gOcURylhup",
+ "outputId": "a8392a4a-8606-4ae7-bd57-be5260abbcb3"
+ },
+ "outputs": [
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "Number of transformer blocks in the model: 24\n",
+ "Number of transformer blocks to un-freeze: 6\n",
+ "Number of frozen layers: 218\n",
+ "Number of trainable layers: 75\n"
+ ]
+ }
+ ],
+ "source": [
+ "UNFREEZE_LAST_N = 6\n",
+ "\n",
+ "print(\"Number of transformer blocks in the model: \", model.config.n_layer)\n",
+ "print(\"Number of transformer blocks to un-freeze: \", UNFREEZE_LAST_N)\n",
+ "\n",
+ "for parameter in model.parameters():\n",
+ " parameter.requires_grad = False\n",
+ "\n",
+ "for i, m in enumerate(model.transformer.h):\n",
+ " #Only un-freeze the last n transformer blocks\n",
+ " if i+1 > model.config.n_layer - UNFREEZE_LAST_N:\n",
+ " for parameter in m.parameters():\n",
+ " parameter.requires_grad = True\n",
+ "\n",
+ " for parameter in model.transformer.ln_f.parameters():\n",
+ " parameter.requires_grad = True\n",
+ "\n",
+ " for parameter in model.lm_head.parameters():\n",
+ " parameter.requires_grad = True\n",
+ "\n",
+ "num_frozen_layers = sum(1 for parameter in model.parameters() if not parameter.requires_grad)\n",
+ "num_trainable_layers = sum(1 for parameter in model.parameters() if parameter.requires_grad)\n",
+ "\n",
+ "print(\"Number of frozen layers:\", num_frozen_layers)\n",
+ "print(\"Number of trainable layers:\", num_trainable_layers)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "eeieIbKxCnit"
+ },
+ "source": [
+ "10. Set the training hyperparameters."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {
+ "id": "qlbLg6tqv4gI"
+ },
+ "outputs": [],
+ "source": [
+ "from transformers import get_linear_schedule_with_warmup\n",
+ "\n",
+ "# training rounds\n",
+ "epochs = 3\n",
+ "\n",
+ "# steps at the start of training that are ignored\n",
+ "warmup_steps = 1e2\n",
+ "\n",
+ "# sample the model to test the output\n",
+ "sample_every = 400\n",
+ "\n",
+ "optimizer = torch.optim.AdamW(model.parameters(), lr = 5e-4, eps = 1e-8)\n",
+ "\n",
+ "# total steps = number of batches * number of epochs\n",
+ "total_steps = len(dataloader) * epochs\n",
+ "\n",
+ "# create the learning rate scheduler\n",
+ "scheduler = get_linear_schedule_with_warmup(optimizer,\n",
+ " num_warmup_steps = warmup_steps,\n",
+ " num_training_steps = total_steps)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "c772AMWjCniu"
+ },
+ "source": [
+ "11. Training/Validation loop. Track the carbon emissions of your work by using `codecarbon`. 🌱"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {
+ "colab": {
+ "background_save": true,
+ "base_uri": "https://localhost:8080/"
+ },
+ "id": "_X_m8XOtv4gR",
+ "outputId": "3f584858-ae2b-43f3-e206-0197984d71c0"
+ },
+ "outputs": [
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Beginning epoch 1 of 3\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 8%|▊ | 400/5227 [06:32<1:18:17, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 400 of 5227. Loss:1.0411986112594604.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a importância do aprendizado de máquina?O aprendizado de máquina desempenha um papel crucial no campo da análise de dados, pois oferece o potencial de aprender, interpretar e validar dados de dados de forma eficaz. Essas habilidades, que são geralmente obtidas através de treinamento ou análise de dados, contribuem de várias maneiras para a melhoria da compreensão e compreensão de dados, incluindo:1. Análise de dados: O aprendizado de máquina visa aprender, interpretar e validar dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados de dados\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 15%|█▌ | 800/5227 [13:06<1:11:46, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 800 of 5227. Loss:0.9756722450256348.\n",
+ "\n",
+ "\n",
+ "Example output: Quais são os métodos mais seguros para limpar meu computador., preciso saber quais métodos são seguros. Para ajudar a esclarecer, você tem duas opções:\n",
+ "\n",
+ "1. Mantenha seu computador em um ambiente propício para a manutenção: O seu computador deve se manter em ambientes internos de baixa manutenção, como uma máquina de limpeza de ar.\n",
+ "\n",
+ "2. Use um sistema de gerenciar de Disjuntores (JVM): Para se manter em contato com as coisas, você pode usar um sistema de gerenciamento de Disjuntores (JVM) de TI. Isso pode envolver a execução de um comando de manutenção e adicionar serviços especializados a sua configuração.\n",
+ "\n",
+ "Em primeiro lugar, é importante lembrar a importância de manter seu computador com manutenção regular. O melhor conselho para a manutenção do computador depende de fatores como seu tipo de computador e problema específico. No entanto, aqui estão algumas etapas gerais que você pode seguir:\n",
+ "\n",
+ "1. Comece por verifique o estado dos impressores e sistemas de computador\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 23%|██▎ | 1200/5227 [19:40<1:05:18, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 1200 of 5227. Loss:1.0089658498764038.\n",
+ "\n",
+ "\n",
+ "Example output: Como posso fazer um plano de orçamento para economizar dinheiro., é essencial praticar um orçamento regularmente, pois seu orçamento deve permanecer atualizado com base em suas despesas e economias.Fazer um plano orçamentário requer disciplina, planejamento e planejamento cuidadoso. Aqui estão algumas etapas para ajudá-lo a começar:\n",
+ "\n",
+ "1. Categorize suas despesas: comece classificando suas despesas em categorias que sejam fáceis de entender. Isso pode incluir categorias como moradia, transporte, seguros, mantimentos, serviços públicos, transporte, saúde, educação, etc.\n",
+ "\n",
+ "2. Defina suas despesas: determine a quantidade de dinheiro que você precisa economizar. Isso pode ser em dinheiro, juros hipotecários, pagamentos de dívidas ou despesas médicas. Categorize suas despesas em categorias como habitação, transporte, seguro saúde, alimentação, entretenimento, etc.\n",
+ "\n",
+ "3. Seja realista: seja realista ao fazer um plano orçamentário. Esteja atento aos desejos, objetivos e restrições alimentares.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 31%|███ | 1600/5227 [26:14<58:48, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 1600 of 5227. Loss:0.9362326860427856.\n",
+ "\n",
+ "\n",
+ "Example output: Quais recursos você recomendaria para encontrar um mecânico de automóveis confiável., é importante escolher um mecânico profissional que cuide de sua propriedade e tenha uma equipe qualificada para obter serviços de segurança.Existem várias opções para encontrar um mecânico de automóveis confiável que atenda às suas necessidades e requisitos. Aqui estão algumas recomendações:\n",
+ "\n",
+ "1. Pesquisa: reserve um tempo para pesquisar diferentes mecânicos de automóveis disponíveis em sua área para encontrar um que atenda às suas necessidades e requisitos. Ler comentários e classificações dos clientes ou pedir recomendações pessoais pode ser úteis para descobrir se o serviço que você está interessado em adquirir está no cardápio de serviços oferecido.\n",
+ "\n",
+ "2. Verificações: Solicite a satisfação do cliente por meio de consultas a outras referências ou entrando em contato com os indivíduos que estão dentro do grupo de clientes do revedor desejado. Preste atenção a quaisquer sinais de danos ou sinais de mau reparo que possam indicar um problema no serviço.\n",
+ "\n",
+ "3\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 38%|███▊ | 2000/5227 [32:48<52:19, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 2000 of 5227. Loss:1.0919554233551025.\n",
+ "\n",
+ "\n",
+ "Example output: Diga-me se estes são diferentes tipos de galáxias ou diferentes tipos de ecossistemas: Floresta, Pastagem, Irregular, Espiral, Aquático, Deserto, Elíptico, Tundra, MarinhoEm resumo, os diferentes tipos de galáxias são diferentes em suas estruturas, composição e localização. Por outro lado, os diferentes tipos de ecossistemas podem ter diferentes origens e usos.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 46%|████▌ | 2400/5227 [39:18<45:52, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 2400 of 5227. Loss:0.8491834402084351.\n",
+ "\n",
+ "\n",
+ "Example output: Quais são as melhores estratégias para encontrar um emprego depois da faculdade., as leis e regulamentos fiscais podem incluir restrições adicionais, por isso é importante pesquisar as leis fiscais locais e consultar profissionais de carreira ou agências de Cidadela Britânica para aconselhamento sobre como encontrar um emprego após concluir o programa.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 54%|█████▎ | 2800/5227 [45:48<39:21, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 2800 of 5227. Loss:0.8994491696357727.\n",
+ "\n",
+ "\n",
+ "Example output: Qual a melhor maneira de acordar revigorado pela manhã?, é importante ter paciência e evitar tomar qualquer exercício ou ingestão alimentar perto de dormir.Melhorar a concentração no início da manhã pode ajudar a melhorar o sono; mas também requer consistência e tempo. Aqui estão algumas dicas:\n",
+ "\n",
+ "1. Pratique a atenção plena: praticar a atenção plena e o relaxamento consciente pode ajudar a reduzir o tédio e melhorar a qualidade do sono.\n",
+ "\n",
+ "2. Estabeleça uma rotina relaxante na hora de dormir: Criar um ambiente tranquilo e confortiente e estabelecer uma rotina relaxante na hora de dormir pode ajudar a reduzir o estresse e promover uma noite de sono mais tranquila.\n",
+ "\n",
+ "3. Crie uma rotina de sono noturno: Aloque uma duração de sono consistente em horários regulares e seja consciente de seus sinais de alerta, como padrões de sono irregulares ou noite de sono insuficiente.\n",
+ "\n",
+ "4. Comece com um horário de sono mais farto e mais cedo\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 61%|██████ | 3200/5227 [52:22<32:52, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 3200 of 5227. Loss:1.0346989631652832.\n",
+ "\n",
+ "\n",
+ "Example output: Explique a diferença entre um animal carnívoro, herbívoro e onívoro., é importante observar que a classificação dentro das classes, apesar da extensa estudo, é subjetiva. Além disso, é crucial abordar a distinção em relação ao tipo de alimento ou outro alimento que as pessoas consumem.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 69%|██████▉ | 3600/5227 [58:52<26:22, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 3600 of 5227. Loss:0.9676638841629028.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a maneira mais eficaz de controlar o estresse., existem várias maneiras eficazes de gerenciar o estresse, como exercícios, ioga e prática de hobbies.Gerenciar o estresse pode ser alcançado através de uma combinação de estratégias e métodos eficazes. Aqui estão algumas abordagens comumentes que os estressores podem usar:\n",
+ "\n",
+ "1. Exercícios de respiração profunda: Práticas regulares de respiração profunda podem ajudar a liberar endorfinas, hormônios do relaxamento e reduzir o estresse. Você pode tentar incorporar atividades como ioga ou exercício para liberar a respiração profundamente enquanto pratica seu exercício.\n",
+ "2. Exercícios de bondade amorosa: Praticar atividades de bondade amorosa, como exercícios com os pés ou com as mãos, pode ter efeitos positivos em reduzir o estresse. Pode ser benéfico começar com sessões mais curtas e concentrar-se em cultivar relaxamento e bem-estar.\n",
+ "\n",
+ "3. Exercícios de atenção plena: praticar atenção plena, como meditação ou atenção\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 77%|███████▋ | 4000/5227 [1:05:26<19:53, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 4000 of 5227. Loss:0.8251349329948425.\n",
+ "\n",
+ "\n",
+ "Example output: Meu 401k é um bom investimento para a aposentadoria., é importante observar que as pessoas optam por isso com base na sua situação financeira e objetivos específicos.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 84%|████████▍ | 4400/5227 [1:11:55<13:24, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 4400 of 5227. Loss:0.8016097545623779.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a definição de visão computacional?, existem várias áreas ou setores específicos na área de visão computacional. Podemos fornecer mais informações em breve?Certamente! A visão computacional é um campo complexo que utiliza algoritmos de computador para extrair informações relevantes de imagens ou vídeos. Ele se concentra em técnicas e algoritmos que permitam aos computadores compreender e analisar esses dados sem serem capazes de lembrar ou perceber diretamente. A visão computacional é um campo de estudo fascinante que fornece informações sobre a visão, o processamento visual e a ciência da computação. Pode ser útil para diversos campos, como ciência da computação, design de imagens e análise de dados, mas pode ter seu melhor nicho em fotografia, arte e design.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 92%|█████████▏| 4800/5227 [1:18:28<06:55, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 4800 of 5227. Loss:0.679321825504303.\n",
+ "\n",
+ "\n",
+ "Example output: Qual programa de TV apresenta uma equipe de adolescentes que se fortalecem com os poderes dados a eles por Zordon para salvar o mundo dos monstros? é importante notar que a realidade é diferente e a influência da realidade sobre as decisões e ações é bastante complexa.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 99%|█████████▉| 5200/5227 [1:24:58<00:26, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 5200 of 5227. Loss:0.8351086974143982.\n",
+ "\n",
+ "\n",
+ "Example output: Você pode recomendar um bom supermercado online., estou aqui para ajudar! Por favor, me avise se tiver alguma outra dúvida!Claro! Existem vários supermercados online disponíveis que oferecem uma ampla gama de produtos de diversos países. Aqui estão algumas opções populares:\n",
+ "\n",
+ "1. Amazon: Amazon: A Amazon oferece uma ampla gama de produtos de diversas marcas e vendedores. Você pode navegar diretamente pela Amazon e navegar na seção da Amazon que se alinha ao seu público-alvo.\n",
+ "\n",
+ "2. Wayfair: Wayfair oferece uma extensa gama de produtos de diversas marcas. Você pode navegar diretamente pela Wayfair e navegar na seção da Wayfair onde você está alinçado com o mercado que procura.\n",
+ "\n",
+ "3. Amazon: O Amazon oferece uma vasta gama de produtos de diferentes marcas. Você pode navegar diretamente no Amazon e navegar na seção do Amazon onde deseja encontrar produtos que correspondam ao seu público-alvo.\n",
+ "\n",
+ "4. P Amazon: P Amazon: A Amazon tem uma vasta gama de produtos especializados que at\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ "100%|██████████| 5227/5227 [1:25:28<00:00, 1.02it/s]\n"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Average Training Loss: 1.0089130589080308.\n",
+ "\n",
+ "\n",
+ "Beginning epoch 2 of 3\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 8%|▊ | 400/5227 [06:29<1:18:19, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 400 of 5227. Loss:0.6162816286087036.\n",
+ "\n",
+ "\n",
+ "Example output: Você pode me ajudar a entender as teorias psicanalíticas de Sigmund Freud..Claro! Ficarei feliz em ajudá-lo a entender as teorias psicanalíticas de Sigmund. Você poderia me fornecer alguns detalhes para ajudá-lo a entender as teorias psicanalíticas de Sigoku? Você também tem alguma dúvida específica ou dúvida de pesquisa que gostaria de buscar.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 15%|█▌ | 800/5227 [12:59<1:11:50, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 800 of 5227. Loss:0.8516258597373962.\n",
+ "\n",
+ "\n",
+ "Example output: Você possui habilidades cognitivas mínimas?, não há problema em ter a proficiência em uma linguagem de programação. Por outro lado, existem muitos projetos de código que envolvem inteligência artificial que poderiam ser uma boa opção para o seu projeto. Por exemplo, existem muitos cursos de ciência de dados e ciência da computação que você pode explorar usando um currículo escolar. Ler livros ou assistir a filmes relevantes também pode ser benéfico para o desenvolvimento de habilidades de programação.\n",
+ "\n",
+ "Além dos estudos iniciais, considere trabalhar em projetos relacionados a programação. Plataformas como GitHub e GitHub são excelentes lugares para trabalhar em projetos de programação. É fascinante explorar esses recursos e encontrar projetos que sejam envolventes, envolventes e que combinem aprendizado de máquina e programação.\n",
+ "\n",
+ "No entanto, lembre-se de que a programação é uma habilidade que requer prática e paciência. Você deve ser capaz de desenvolver-se continuamente com base no que aprendeu, mesmo trabalhando com pouca experiência. Boa sorte com sua jornada de programação!\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 23%|██▎ | 1200/5227 [19:33<1:05:19, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 1200 of 5227. Loss:0.6251986026763916.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a diferença entre uma planície de inundação e uma via de inundação., a previsão meteorológica é usada para determinar a trajetória de um dia com base nas condições climáticas. Os serviços meteorologistas usam registros históricos de tempestades e correntes oceânicas para fornecer informações em tempo real. Nestas informações, os cientistas avaliam as condições climáticas esperadas no futuro para determinar a trajetória e o peso das tempestades. A previsão do tempo é um procedimento de pesquisa científica que ajuda a compreender a comportamento dos sistemas climáticos ao longo do tempo. O cálculo de probabilidades é uma técnica estatística estatística usada para estimar probabilidades sobre diversas contagens de eventos futuros com base nas variáveis de risco, como condições climáticas, valores de pressão e padrões climáticos. O cálculo de probabilidades envolve estimar probabilidades logarítmicas para diferentes probabilidades de ocorrência de eventos futuros com base nas condições climáticas esperadas. A previsão de séries temporais é uma técnica estatística estatística que incorpora dados históricos para estimar\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 31%|███ | 1600/5227 [26:07<58:48, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 1600 of 5227. Loss:1.8992992639541626.\n",
+ "\n",
+ "\n",
+ "Example output: Qual a melhor estratégia para estudar para um vestibular..Para fazer um jantar de jantar em sua casa, faço uma cozinha de casa com muitos pratos familiares e vegetais. Aqui estão algumas receitas para encontrar receitas de café com pratos populares para torná-lo mais saudável!Para praticar com espaço de segurança com segurança em todo seu lugar para manter seu guarda de jantar em muitos dias e economizar espaço de armazenamento.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 38%|███▊ | 2000/5227 [32:38<52:18, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 2000 of 5227. Loss:0.8740198612213135.\n",
+ "\n",
+ "\n",
+ "Example output: Estou procurando sugestões sobre como iniciar um negócio online.. Que bom que você está se candidatando a um diploma em ciência de computação, mas realmente quais são as melhores áreas para começar qualquer empreendimento.Começar uma pequena empresa pode ser uma aventura emocionante! Aqui estão algumas ideias que podem ajudar você a começar:\n",
+ "\n",
+ "1. Compre e envie os produtos/serviços que você deseja, em vez de se concentrar em suas responsabilidades pessoais.\n",
+ "\n",
+ "2. Abra uma conta de poupança e crie um fundo de emergência, reservando uma parte de sua renda de forma consistente.\n",
+ "\n",
+ "3. Abra uma pequena empresa de comércio eletrônico que represente sua ideia de negócio e ajude-os a expandir a sua presença.\n",
+ "\n",
+ "4. Faça um brainstorm de ideias criativas e crie um site funcional que represente sua ideia de negócio. Considere encontrar alguém que esteja interessado em investir e planejar ainda mais as suas receitas e objetivos.\n",
+ "\n",
+ "5. Estabeleça uma conta de poupança ou certifique\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 46%|████▌ | 2400/5227 [39:11<45:49, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 2400 of 5227. Loss:0.7524190545082092.\n",
+ "\n",
+ "\n",
+ "Example output: Quais são alguns bons exercícios para pessoas com artrite.agens em um estilo de vida saudável é importante porque o exercício pode ajudar a reduzir o risco de doenças cardiovasculares e aumenta as chances de melhoria da saúde geral. Aqui estão algumas das opções que muitas pessoas consideram úteis:\n",
+ "\n",
+ "1. caminhada e corrida: comece caminhando ou correr junto com um peso corporal corporal.\n",
+ "\n",
+ "2. natação ou ciclismo de bicicleta: natação ou ciclismo, seja com amigos ou com um grupo de amigos, pode ser uma escolha viável para melhorar a saúde cardiovascular.\n",
+ "3. andar de bicicleta ou esqui na trilha: Se você estiver com artrite, pode ajudar a manter o equilíbrio, melhorar o condicionamento cardiovascular e melhorar a saúde cardiovascular geral.\n",
+ "\n",
+ "4. exercícios cardiovasculares leves ou de alta intensidade: Ioga, ioga, caminhada ou caminhada ao ar livre pode ajudar a reduzir o risco de doenças cardiovasculares.\n",
+ "\n",
+ "5. exercício aeróbico: inc\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 54%|█████▎ | 2800/5227 [45:45<39:20, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 2800 of 5227. Loss:0.7128293514251709.\n",
+ "\n",
+ "\n",
+ "Example output: Quais são as três dicas que você pode compartilhar para ajudar a controlar meus níveis de estresse..Lembre-se de que é importante ser paciente e manter uma abordagem equilibrada ao lidar com os altos e baixos do estresse. Além disso, mantenha-se hidratado, pratique técnicas de relaxamento e mantenha uma dieta equilibrada. Se você se sentir sobrecarregado ou estiver enfrentando dificuldades, procure um profissional de saúde para obter orientação e apoio.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 61%|██████ | 3200/5227 [52:16<32:53, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 3200 of 5227. Loss:0.7443302273750305.\n",
+ "\n",
+ "\n",
+ "Example output: Por que as pessoas gostam de surfar é uma cidade vibrante que oferece diversas atrações imperdíveis, incluindo o Zoológico e o Zoológico. No entanto, é importante notar que esta cidade também é conhecida por sua vida noturna, que muitas vezes é muito movimentada. Você também pode experimentar uma variedade de experiências gastronômicas, como comida de rua, música e lojas, comemorando o Ano Nacional de Sono em Marrakech.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 69%|██████▉ | 3600/5227 [58:47<26:23, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 3600 of 5227. Loss:1.1278469562530518.\n",
+ "\n",
+ "\n",
+ "Example output: Como faço para limpar o teclado de um laptop.ante algumas dicas úteis para limpar seu laptop corretamente:\n",
+ "\n",
+ "1. Certifique-se de não usar muita pressão ou segurar com muita força para que não danifique o teclado.\n",
+ "\n",
+ "2. Se a tela do seu laptop for removida ou desempenham agulhas ou rasgaduras de lápis, use um pano macio ou pano de microfibra para remover sujeira ou poeira de um lado da tela.\n",
+ "\n",
+ "3. Tente manter sua tela limpa, bem posicionada e desmoncada separadamente do sistema de refrigeração do seu laptop. Certifique-se de que sua tela esteja devidamente enrolada e triturada para evitar o que pode causar danos.\n",
+ "\n",
+ "4. Se você notar uma mancha ou cor de tinta (uma cor forte e exclusiva à sua marca ou modelo de laptop), é importante descartar o lixo de tela para evitar danos ou danos à tela de tela do seu laptop, pois elas serão atraentes \n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 77%|███████▋ | 4000/5227 [1:05:21<19:54, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 4000 of 5227. Loss:1.1064726114273071.\n",
+ "\n",
+ "\n",
+ "Example output: Como posso ter certeza de que estou me exercitando da maneira certa. essas dicas para ajudar a melhorar a saúde da saúde mental, como a redução dos estressores.Começar uma jornada de autocuidado pode ajudá-lo a manter uma mentalidade positiva e a melhorar o bem-estar geral. Aqui estão algumas dicas que podem ajudar:\n",
+ "\n",
+ "1. Crie uma rotina de exercícios que você realmente goste: Escolha atividades que você gosta de fazer com você, como ioga, caminhada, alongamento, meditação, dançar ou participação em atividades que o alívio do estresse estomacal é um ótimo exemplo.\n",
+ "\n",
+ "2. Faça pelo menos 150 minutos de exercício por semana: Comece pequeno e aumente gradualmente se ele funcionar para você. Ter exercícios suficientes para melhorar o condicionamento físico pode ajudar a reduzir o risco de problemas de saúde mental, como sentir-se constantemente letrado ou se sentir sobrecarregado, por por favor.\n",
+ "3. Durma o suficiente: Dormir o suficiente desempen\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 84%|████████▍ | 4400/5227 [1:11:54<13:25, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 4400 of 5227. Loss:0.911342978477478.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a melhor maneira de otimizar meu site para visibilidade nos mecanismos de pesquisa.-se, aqui estão algumas estratégias para melhorar o SEO das páginas da web da web.Existem vários métodos diferentes que podem ajudar a otimizar o seu site para mecanismos de pesquisa. Aqui estão algumas estratégias a serem consideradas:\n",
+ "\n",
+ "1. Conteúdo relevante e informativo: Crie conteúdo informativo e envolvente para seu site. Otimize para mecanismos de pesquisa como o Google e mídias sociais para ajudar a atrair e reter clientes. Isso pode ser preenchendo uma seção de conteúdo ou usando postagens com conteúdo valioso por meio de artigos, postagens em blogs ou vídeos. Certifique-se de incluir postagens em conteúdo relevante e informativo e evite modelos de conteúdo desatualizados.\n",
+ "\n",
+ "2. Minimize o layout de site: Minimize o layout da estrutura do seu site para maximizar a visibilidade na internet. Um layout limpo (usando uma combinação de layout\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 92%|█████████▏| 4800/5227 [1:18:28<06:55, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 4800 of 5227. Loss:0.5353406071662903.\n",
+ "\n",
+ "\n",
+ "Example output: Como posso cuidar do meu hamster de estimação. essas etapas gerais para começar:\n",
+ "\n",
+ "1. Esforço regular: As unhas do hamster podem crescer e exigir cuidado especiais. Use luvas de couro, óculos escuros ou outros materiais apropriados e certifique-se de que sejam seguras para a pele. Certifique-se de que as unhas estejam bem protegidas usando selante adequado. Também é importante usar uma área pequena da pele para um banho quente e uma pinça para remover os mofo.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 99%|█████████▉| 5200/5227 [1:24:59<00:26, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 5200 of 5227. Loss:0.7968358993530273.\n",
+ "\n",
+ "\n",
+ "Example output: Que tipo de comida posso levar no almoço para o trabalho, mas ainda assim manter uma alimentação saudável.amente, é importante tomar medidas adequadas com base no clima, na atividade, na dieta e nas necessidades alimentares específicas.Viajar de avião pode trazer diversos benefícios. Em primeiro lugar, pode se locomover em menos tempo e geralmente produz emissões de carbono. O transporte público também pode ser um meio de transporte mais limpo e eficiente. No entanto, é importante observar que, embora os benefícios de caminhar ou andar de bicicleta possam ser ótimos, é importante abordá-los de forma adequada e considerar fatores como clima, clima local e requisitos de deslocamento. Antes de chegar a um aeroporto, é uma boa ideia verificar com o departamento de saúde local o seu plano de transporte para determinar se pode sair da sua localização. Em vez disso, considere usar transporte público, como trens, ônibus ou bondes, para chegar diretamente à casa ou a uma academia próxima. Além disso, é recomendável ter uma mala\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ "100%|██████████| 5227/5227 [1:25:30<00:00, 1.02it/s]\n"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Average Training Loss: 0.9611341756686029.\n",
+ "\n",
+ "\n",
+ "Beginning epoch 3 of 3\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 8%|▊ | 400/5227 [06:29<1:18:14, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 400 of 5227. Loss:0.6826623678207397.\n",
+ "\n",
+ "\n",
+ "Example output: O que é uma bibliografia e como criá-la. todos os elementos do seu artigo com uma bibliografia.Para criar e estruturar uma bibliografia, você pode seguir estas etapas gerais:\n",
+ "\n",
+ "1. Escolha uma data e hora confiáveis e com boa reputação para a data. Você pode usar data média, ou data específica da data que está sendo escrita e que já foi publicada em um periódico reconhecido.\n",
+ "\n",
+ "2. Reúna informações detalhadas: Comece usando um índice, que inclui o sobrenome do autor, data, editora, ano e ano de publicação. Essas informações podem ser encontradas em várias fontes, como livros, sites de arquivos, revistas acadêmicas e sites de publicação. Você também pode procurar bibliografia online, sites de publicação ou livros de pesquisa de pesquisas de pesquisa.\n",
+ "\n",
+ "3. Reúna informações importantes: Anote todos os nomes de todas as bibliotecas, bibliotecas diretas, coleções de livros e outros registros relacionados à biblioteca. Isso pode incluir uma descrição\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 15%|█▌ | 800/5227 [13:02<1:11:45, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 800 of 5227. Loss:1.1189414262771606.\n",
+ "\n",
+ "\n",
+ "Example output: Qual país tem o segundo bungie jump mais alto do mundo?ve, desde Seattle, América da América, desde Seattle, América da América, fica ao lado disso porque fica em uma área distribuídos, No entanto, vale a pena mencionar que o bonecos de Ne bonecos de bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon bon\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 23%|██▎ | 1200/5227 [19:36<1:05:19, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 1200 of 5227. Loss:1.0050076246261597.\n",
+ "\n",
+ "\n",
+ "Example output: Quais são os métodos comuns usados para classificar plantas.amente, os métodos comuns usados para classificar plantas são frequentemente usados para classificar classificações de dados em dados rotulados ou não rotulados.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 31%|███ | 1600/5227 [26:06<58:47, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 1600 of 5227. Loss:0.8127986192703247.\n",
+ "\n",
+ "\n",
+ "Example output: O que eu faço se estiver me sentindo ansioso.itar como sou um animal de estimação, você não pode se machucar com estresse.Se você estiver se sentindo ansioso, você não pode se machucar com estresse. As pessoas que ficam ansiosas muitas vezes tentam tentar coisas diferentes, como praticar exercícios, fazer exercícios ou conversar com um profissional médico, pois os transtornos de estresse podem exigir um tratamento abrangente.\n",
+ "\n",
+ "No entanto, é importante lembrar que cada pessoa é diferente, então pode ser útil tentar uma combinação de estratégias para ajudar a aliviar o estresse. Aqui estão algumas estratégias que você pode considerar:\n",
+ "\n",
+ "1. Ouça seus sentimentos: observe atentamente as emoções do seu corpo, começando pelo nariz e validando-as de forma construtiva. Isso ajudará a reduzir o estresse e ajudará você a se sentir mais calmo e seguro.\n",
+ "\n",
+ "2. Pratique técnicas de relaxamento: exercícios de respiração profunda, exercícios de relaxamento muscular progressivo\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 38%|███▊ | 2000/5227 [32:39<52:19, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 2000 of 5227. Loss:0.6036404371261597.\n",
+ "\n",
+ "\n",
+ "Example output: Os modelos de aprendizagem profunda podem ser empregados para detectar e interpretar com precisão as emoções humanas? disso, é importante ter informações precisas e atualizadas sobre a saúde do sono, pois isso pode impactar significativamente a qualidade da vida.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 46%|████▌ | 2400/5227 [39:09<45:50, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 2400 of 5227. Loss:0.506655216217041.\n",
+ "\n",
+ "\n",
+ "Example output: E se eu não puder pagar um advogado para o meu divórcio?ite, não sou um advogado. Como posso entender como funciona a cobrança de impostos sobre meus investimentos.Lembre-se de que as leis e regulamentos específicos variam de uma jurisdição para outra. Recomenda-se consultar profissionais jurídicos para entender e manter registros de suas transações financeiras. É importante lembrar que o direito dos EUA é um programa tributário complexo que requer conhecimentos específicos e autoridade para cumprir a sua ação. Além disso, consultar um profissional financeiro qualificado pode fornecer aconselhamento e orientação valiosos ao longo do processo de tomada de decisões.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 54%|█████▎ | 2800/5227 [45:41<39:23, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 2800 of 5227. Loss:0.6298577785491943.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é o objetivo principal do utilitarismo e como ele avalia as ações?amente, é difícil determinar se os utilitários são uma forma de maximizar os resultados, ou se eles são uma ferramenta para maximizar os interesses ou necessidades individuais de indivíduos. Os utilitários, embora tenham a oportunidade de maximizar os resultados, enfatizam a maximização das consequências em detrimento dos interesses ou necessidades individuais. É um desafio prever a extensão e a probabilidade das consequências e riscos associados ao maximizador de clipes de papel, especialmente quando se trata de determinar se a maximização dos resultados é considerada moralmente aceitável.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 61%|██████ | 3200/5227 [52:13<32:52, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 3200 of 5227. Loss:0.6223098039627075.\n",
+ "\n",
+ "\n",
+ "Example output: O que é ciência da computação?ais, não posso fornecer detalhes sobre o que se refere em termos de ciência da computação. As especificidades podem variar dependendo do contexto específico e dos termos usados. Uma compreensão completa pode ser encontrada online ou através de livros, artigos acadêmicos ou teorias e argumentos especialistas.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 69%|██████▉ | 3600/5227 [58:44<26:22, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 3600 of 5227. Loss:0.7940065860748291.\n",
+ "\n",
+ "\n",
+ "Example output: Você pode fornecer uma definição de consequencialismo como uma teoria ética?ta-se?O consequencialismo é uma teoria ética que sustenta que a moralidade é determinada pela felicidade ou pela moralidade para a pessoa ou na natureza. Segundo o consequencialismo, o valor moral de uma ação, como o utilitarismo, depende de sua quantidade ou significado ou na forma como se comporta o indivíduo ou o mundo. A justiça ou a equidade devem sempre ser levadas em conta e o bem-estar, a felicidade ou as intenções humanas, em vez de a produção de resultados individuais ou de soluções moralmente satisfeitas para a sociedade. No consequencialismo, o valor moral de uma ação é determinado por fatores como o bem ou o bem para a humanidade, o resultado de uma ação ou a moralidade de uma determinada ação. Este quadro ético incentiva o pensamento deontológica, onde os princípios éticos são derivados dos princípios deveres morais que definem a moralidade.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 77%|███████▋ | 4000/5227 [1:05:17<19:53, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 4000 of 5227. Loss:0.611275315284729.\n",
+ "\n",
+ "\n",
+ "Example output: Quais são algumas estratégias eficazes para me ajudar a manter o foco e a organização.ato que posso encontrar uma boa estratégia de estudo e prática.Manter o foco e a organização é crucial para o sucesso acadêmico. Aqui estão algumas estratégias eficazes:\n",
+ "\n",
+ "1. Divida: divida sua matéria em partes gerenciáveis e estabeleça prazos de estudo. Isso pode fazer com que mais tempo e mais tempo seja gasto na matéria.\n",
+ "\n",
+ "2. Estabeleça metas específicas: divida sua sessão de estudo em partes gerenciáveis. Definir metas específicas e alcançáveis pode tornar sua sessão de estudo mais eficaz e ajudar a mantê-lo focado.\n",
+ "\n",
+ "3. Comece com uma visão clara: Antes de estudar, reserve algum tempo para anotar o que leu. Divida o material em partes menores e gerenciáveis. Isso tornará mais fácil acompanhar e lembrar seus pontos principais.\n",
+ "\n",
+ "4. Use técnicas de estudo e estudo: Explore diferentes técnicas de estudo, como resumir\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 84%|████████▍ | 4400/5227 [1:11:51<13:25, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 4400 of 5227. Loss:0.8882431983947754.\n",
+ "\n",
+ "\n",
+ "Example output: Que tipos de coisas podem ser conectadas e alimentadas por eletricidade?amos quais tipos de eletricidade podem ser geradas.Existem vários tipos de eletricidade que são comumente usadas em residências e indústrias. Aqui estão algumas maneiras comuns:\n",
+ "\n",
+ "1. Lâmpadas: A eletricidade gerada por uma única fonte, como uma tomada elétrica, é chamada de luz. É produzido por vários circuitos elétricos conectados de forma elétrica. Os tipos mais comuns de lâmpadas incluem diodos emissores de luz (LEDs), geradores de luz (FDM), células solares ou células solares térmicas.\n",
+ "\n",
+ "2. Sistemas de Sistemas de Saúde: Os sistemas de saúde usam eletricidade para realizar diversas tarefas, como aquecer, aquecer, tratar, resfriar e monitorar. As fontes de energia dependem da disponibilidade de energia e da disponibilidade de eletricidade disponível para o sistema.\n",
+ "\n",
+ "3. Energia Eletrelhêutica: A energia é derivada de campos eletromagnéticos,\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 92%|█████████▏| 4800/5227 [1:18:25<06:56, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 4800 of 5227. Loss:0.6724207997322083.\n",
+ "\n",
+ "\n",
+ "Example output: Qual a melhor forma de definir e atingir metas. Davis, um cientista da computação, é apaixonado por justiça, tecnologia, justiça e justiça no local de trabalho?O desenvolvimento de estratégias de definição e avanço de metas pode ser um recurso valioso para as empresas e os indivíduos no seu setor. Aqui estão algumas sugestões sobre como incorporar elementos de avaliação, responsabilidade e transparência nas suas metas de curto e longo prazo:\n",
+ "\n",
+ "1. Identifique sua área-alvo: Entenda a relevância e a probabilidade de o seu setor se beneficiará ou não de algum produto ou serviço específico. Este conhecimento o ajudará a determinar como a sua abordagem será impactada por isso.\n",
+ "\n",
+ "2. Considerações éticas: É importante abordar as implicações éticas da sua iniciativa de sustentabilidade. A promoção da ética da IA pode reduzir os riscos e contribuir para um futuro mais sustentável para as suas empresas.\n",
+ "\n",
+ "3. Transparência: É crucial fornecer explicações claras sobre o seu plano de ação. A transparência é um aspecto crucial\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 99%|█████████▉| 5200/5227 [1:24:59<00:26, 1.03it/s]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 5200 of 5227. Loss:0.6349149942398071.\n",
+ "\n",
+ "\n",
+ "Example output: Quais são os sintomas mais comuns da gripe.icamente, é importante observar que as reações a medicamentos podem variar entre os indivíduos e o que é seguro para uma pessoa pode n��o ser necessariamente para outra. Se você estiver apresentando sintomas como febre, tosse, dor de garganta, dores no corpo ou dor geral, é sempre melhor consultar um profissional de saúde. Eles serão capazes de fornecer conselhos personalizados.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ "100%|██████████| 5227/5227 [1:25:27<00:00, 1.02it/s]\n"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Average Training Loss: 0.7707481023992524.\n",
+ "\n",
+ "Training complete!\n"
+ ]
+ },
+ {
+ "data": {
+ "text/plain": [
+ "('/content/Aira-2-portuguese-560M/tokenizer_config.json',\n",
+ " '/content/Aira-2-portuguese-560M/special_tokens_map.json',\n",
+ " '/content/Aira-2-portuguese-560M/tokenizer.json')"
+ ]
+ },
+ "execution_count": 12,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "from codecarbon import EmissionsTracker\n",
+ "import tqdm\n",
+ "\n",
+ "output_dir = f'/content/{project}'\n",
+ "\n",
+ "tracker = EmissionsTracker(\n",
+ " project_name=\"Aira_emissions\",\n",
+ " log_level=\"critical\",\n",
+ " output_dir=output_dir,\n",
+ " output_file=\"Aira_emissions.csv\",\n",
+ ")\n",
+ "\n",
+ "training_stats = []\n",
+ "\n",
+ "tracker.start()\n",
+ "for epoch_i in range(0, epochs):\n",
+ "\n",
+ " print(f'\\nBeginning epoch {epoch_i + 1} of {epochs}\\n')\n",
+ "\n",
+ " total_train_loss = 0\n",
+ "\n",
+ " model.train()\n",
+ "\n",
+ " for step, batch in enumerate(tqdm.tqdm(dataloader)):\n",
+ "\n",
+ " b_input_ids = batch[0].to(device)\n",
+ " b_labels = batch[0].to(device)\n",
+ " b_masks = batch[1].to(device)\n",
+ "\n",
+ " model.zero_grad()\n",
+ "\n",
+ " outputs = model(b_input_ids,\n",
+ " labels=b_labels,\n",
+ " attention_mask = b_masks)\n",
+ "\n",
+ " loss = outputs[0]\n",
+ "\n",
+ " batch_loss = loss.item()\n",
+ " total_train_loss += batch_loss\n",
+ "\n",
+ " if step % sample_every == 0 and not step == 0:\n",
+ "\n",
+ " print(f'\\nBatch {step} of {len(dataloader)}. Loss:{batch_loss}.\\n')\n",
+ "\n",
+ " model.eval()\n",
+ "\n",
+ " inputs = tokenizer(tokenizer.bos_token + df.prompt.sample().iloc[0] + tokenizer.eos_token, return_tensors=\"pt\").to(device)\n",
+ "\n",
+ " sample_outputs = model.generate(**inputs,\n",
+ " bos_token_id=tokenizer.bos_token_id,\n",
+ " pad_token_id=tokenizer.pad_token_id,\n",
+ " eos_token_id=tokenizer.eos_token_id,\n",
+ " do_sample=True,\n",
+ " top_k=50,\n",
+ " max_length = 200,\n",
+ " top_p=0.95,\n",
+ " num_return_sequences=1)\n",
+ "\n",
+ " for i, sample_output in enumerate(sample_outputs):\n",
+ " print(f'\\nExample output: {tokenizer.decode(sample_output, skip_special_tokens=True)}\\n')\n",
+ "\n",
+ " model.train()\n",
+ "\n",
+ " loss.backward()\n",
+ "\n",
+ " optimizer.step()\n",
+ "\n",
+ " scheduler.step()\n",
+ "\n",
+ " avg_train_loss = total_train_loss / len(dataloader)\n",
+ "\n",
+ "\n",
+ " print(f'\\nAverage Training Loss: {avg_train_loss}.\\n')\n",
+ "\n",
+ "\n",
+ " training_stats.append(\n",
+ " {\n",
+ " 'epoch': epoch_i + 1,\n",
+ " 'Training Loss': avg_train_loss,\n",
+ " }\n",
+ " )\n",
+ "\n",
+ "tracker.stop()\n",
+ "print(\"Training complete!\")\n",
+ "\n",
+ "df_stats = pd.DataFrame(data=training_stats)\n",
+ "df_stats = df_stats.set_index('epoch')\n",
+ "df_stats.to_parquet(f\"{output_dir}/training_stats.parquet\", compression=\"gzip\")\n",
+ "\n",
+ "rng_state = torch.get_rng_state()\n",
+ "torch.save(rng_state, f\"{output_dir}/rng_state.pt\")\n",
+ "torch.save(scheduler.state_dict(), f\"{output_dir}/scheduler.pt\")\n",
+ "torch.save(optimizer.state_dict(), f\"{output_dir}/optimizer.pt\")\n",
+ "\n",
+ "model_to_save = model.module if hasattr(model, 'module') else model\n",
+ "model_to_save.save_pretrained(output_dir)\n",
+ "model_to_save.save_pretrained(output_dir, safe_serialization=True)\n",
+ "tokenizer.save_pretrained(output_dir)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "cheAsv8aCnix"
+ },
+ "source": [
+ "12. Check the training stats and plot the learning curves."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {
+ "colab": {
+ "background_save": true
+ },
+ "id": "J1-hAY9Av4gT",
+ "outputId": "a6ddf5de-3957-411c-ca13-8695b84d9511"
+ },
+ "outputs": [
+ {
+ "data": {
+ "image/png": "",
+ "text/plain": [
+ "