Como Treinar o ChatGPT para Uso Comercial e Pessoal
Updated on
A Inteligência Artificial (IA) revolucionou diversos setores e a área da comunicação não é exceção. Entre os diversos modelos de IA disponíveis, o ChatGPT, desenvolvido pela OpenAI, se destaca por suas impressionantes capacidades de compreensão de linguagem. Este guia pretende fornecer um entendimento abrangente de como treinar o ChatGPT de forma eficaz com dados personalizados no MacOS.
Criar seu próprio chatbot com IA nunca foi tão fácil. Com o ChatGPT da OpenAI, você pode treinar um modelo de linguagem usando dados personalizados adaptados às suas necessidades específicas. Ao final deste guia, você terá conhecimento prático de como configurar, preparar seus dados e ajustar seu chatbot.
Método 1: Usar Ferramentas Online para Treinar o ChatGPT
Usando o CustomGPT.ai para Treinar o ChatGPT
O CustomGPT.ai é uma plataforma online que simplifica o processo de treinamento do ChatGPT com seus próprios dados. Ele elimina a necessidade de programação ou trabalho com banco de dados, tornando-o acessível para usuários sem conhecimento técnico. Aqui estão os passos para usar o CustomGPT.ai:
- Acesse a página CustomGPT.ai (opens in a new tab) e crie um novo projeto. Você pode nomeá-lo de acordo com sua preferência.
- Insira a URL do sitemap do seu site. A plataforma irá listar todas as páginas do sitemap para rastreamento.
- Aguarde o sistema rastrear todas as suas páginas. Esse processo pode levar até uma hora, dependendo do número de páginas do seu site.
- Após a conclusão do rastreamento, você pode começar a criar seu chatbot personalizado. O chatbot terá lido todas as páginas, compreendido o conteúdo e estará pronto para interagir com quem o utiliza.
Usando o ChatGPT School para Treinar o ChatGPT
O ChatGPT School é outra plataforma que permite treinar o ChatGPT com seus próprios dados. É especialmente útil para conteúdo educacional, como cursos online. Veja como usá-lo:
- Acesse a página ChatGPT School (opens in a new tab) e crie um novo projeto.
- Assim como no CustomGPT.ai, você precisa inserir a URL do sitemap do seu site. A plataforma irá listar todas as páginas do sitemap para rastreamento.
- Aguarde o sistema rastrear todas as suas páginas. Esse processo pode levar até uma hora, dependendo do número de páginas do seu site.
- Após a conclusão do rastreamento, você pode começar a criar seu chatbot personalizado. O chatbot terá lido todas as páginas, compreendido o conteúdo e estará pronto para interagir com quem o utiliza.
Método 2: Construa seu próprio LLM Personalizado para Treinar o ChatGPT
Prepare o Ambiente para Treinar o ChatGPT
Passo 1: Instale o Python
É necessário ter o Python 3.0+ para começar. Antes de prosseguir com a instalação, é recomendado verificar se você já possui o Python3 instalado. Você pode fazer isso executando o seguinte comando no seu terminal:
python3 --version
Se você ver a versão listada após executar o comando, significa que você já tem o Python3 instalado e pode pular esta etapa. Se você receber um erro "command not found" (comando não encontrado), então siga com a instalação.
Acesse o seguinte link e faça o download do instalador do Python: https://www.python.org/downloads/ (opens in a new tab)
Após a instalação, execute o comando acima novamente e ele deve exibir a versão do Python.
Passo 2: Atualize o Pip
O Python já vem com o pip pré-instalado, mas caso você esteja usando uma instalação antiga, é sempre uma boa ideia atualizá-lo para a versão mais recente. O Pip é um gerenciador de pacotes para o Python, semelhante ao Composer para o PHP. Você pode atualizá-lo usando um comando muito simples:
python3 -m pip install -U pip
Se você já tiver o pip instalado, ele mostrará um aviso como "Requirement already satisfied: pip in [location-here]" (Requisito já satisfeito: pip em [local-aqui]). Se você não tiver a última versão do pip, ele será instalado. Agora você pode verificar se ele foi instalado corretamente executando o seguinte comando:
pip3 --version
Ele mostrará a versão e a localização do pacote.
Instale as Bibliotecas para Treinar o ChatGPT
Antes de mergulhar no processo de treinamento propriamente dito, você precisa instalar algumas bibliotecas. Abra o aplicativo Terminal no seu Mac e execute os seguintes comandos sequencialmente:
O primeiro comando instala a biblioteca OpenAI:
pip3 install openai
Depois, instale o GPT index, também conhecido como LlamaIndex. Ele permite que o LLM se conecte aos dados externos que são a base de conhecimento.
Para obter mais detalhes sobre como o LlamaIndex funciona e como usá-lo, você pode ler nossos artigos relacionados sobre o LlamaIndex.
pip3 install gpt_index
Quando terminar, execute o seguinte comando:
pip3 install PyPDF2
É uma biblioteca de análise de PDF baseada em Python e é necessária se você for fornecer arquivos PDF para o modelo.
Por fim, execute:
pip3 install gradio
Isso cria uma interface de usuário simples para interagir com o chatgpt de IA.
Obtenha uma Chave da OpenAI para Treinar o ChatGPT
Antes de seguir para o script, vamos obter a chave da API da OpenAI. Acesse OpenAI API (opens in a new tab). Se você ainda não fez login, será solicitado que você faça login. Em seguida, clique em "Create new secret key" (Criar nova chave secreta) para gerar uma chave para o nosso script.
Lembre-se de que, uma vez gerada a chave, você não poderá vê-la novamente. Você deve copiar e salvar a chave em um local seguro para poder acessá-la posteriormente.
Prepare os Dados para Treinar o ChatGPT
Crie um novo diretório chamado 'docs' em qualquer local que você preferir e coloque arquivos PDF, TXT ou CSV dentro dele. Você pode adicionar vários arquivos, se quiser, mas lembre-se de que quanto mais dados você adicionar, mais tokens serão usados. Contas gratuitas recebem $18 em tokens para usar.
Crie um Script para Treinar o ChatGPT
Agora que tudo está pronto, nosso próximo passo é criar um script Python para treinar o chatbot com dados personalizados. Ele usará os arquivos dentro do diretório 'docs', que criamos acima, para gerar um arquivo JSON.
Você pode usar qualquer editor de texto para criar este arquivo. O MacOS vem com o TextEdit, você pode usá-lo ou, se estiver usando o Visual Studio Code, é ainda melhor.
Crie uma nova página e copie o código a seguir:
from gpt_index import SimpleDirectoryReader, GPTListIndex, GPTSimpleVectorIndex, LLMPredictor, PromptHelper
from langchain import OpenAI
import gradio as gr
import sys
import os
os.environ["OPENAI_API_KEY"] = ''
def construct_index(directory_path):
max_input_size = 4096
num_outputs = 512
max_chunk_overlap = 20
chunk_size_limit = 600
prompt_helper = PromptHelper(max_input_size, num_outputs, max_chunk_overlap, chunk_size_limit=chunk_size_limit)
llm_predictor = LLMPredictor(llm=OpenAI(temperature=0.7, model_name="text-davinci-003", max_tokens=num_outputs))
documents = SimpleDirectoryReader(directory_path).load_data()
index = GPTSimpleVectorIndex(documents, llm_predictor=llm_predictor, prompt_helper=prompt_helper)
index.save_to_disk('index.json')
return index
def chatbot(input_text):
index = GPTSimpleVectorIndex.load_from_disk('index.json')
response = index.query(input_text, response_mode="compact")
return response.response
iface = gr.Interface(fn=chatbot,
inputs=gr.inputs.Textbox(lines=7, label="Digite seu texto"),
outputs="text",
title="Meu Chatbot de IA")
index = construct_index("docs")
iface.launch(share=True)
Uma vez copiado, você precisa adicionar sua chave da OpenAI ao código antes de salvá-lo. Note a variável OPEN_API_KEY
no código? Copie sua chave da OpenAI, que extraímos no Passo 5, entre as aspas simples desta forma:
os.environ["OPENAI_API_KEY"] = 'sua-chave-aqui'
Em seguida, salve o arquivo com a extensão app.py
no mesmo local onde você tem seu diretório 'docs'.
Execute o Script
Agora que você tem tudo pronto, finalmente pode executar o script e ver a mágica acontecer.
Navegue até onde você tem o app.py
e o diretório 'docs'. Abra o Terminal e execute o seguinte comando:
cd /caminho/do/seu/diretorio
Em seguida, execute o arquivo Python:
python3 app.py
Isso iniciará o treinamento do seu chatbot personalizado. Isso pode levar algum tempo, dependendo de quantos dados você alimentou. Depois de concluído, ele mostrará um link onde você pode testar as respostas usando uma interface simples.
Como você pode ver, ele gera uma URL local: http://127.0.0.1:7860
Você pode abrir isso em qualquer navegador e começar a testar seu chatbot treinado. Observe que o número da porta acima pode ser diferente para você.
Você pode fazer perguntas no lado esquerdo e ele responderá na coluna da direita. Lembre-se de que as perguntas custarão tokens, então quanto mais perguntas você fizer, mais tokens serão usados da sua conta da OpenAI. O treinamento também consome tokens com base na quantidade de dados que você fornece.
Para treinar com mais dados ou dados diferentes, você pode fechar usando CTRL + C
, alterar os arquivos e então executar o arquivo Python novamente.
Conclusão
Treinar o ChatGPT com dados personalizados permite que você crie um chatbot adaptado às suas necessidades específicas. Seja usando bibliotecas Python no MacOS, aproveitando plataformas online como o CustomGPT.ai e o ChatGPT School ou participando de uma comunidade como o ChatGPT AI Automation Group, há várias maneiras de personalizar e aprimorar as capacidades do seu chatbot. Seguindo as etapas detalhadas e exemplos fornecidos neste guia, você estará bem encaminhado para criar um chatbot poderoso com IA.
Perguntas Frequentes
Posso treinar meu próprio modelo do ChatGPT?
Sim, você pode treinar seu próprio modelo do ChatGPT. Este guia fornece etapas detalhadas sobre como fazer isso usando bibliotecas Python no MacOS. Você também pode usar plataformas online como o CustomGPT.ai e o ChatGPT School para simplificar o processo.
Posso treinar o ChatGPT com arquivos PDF?
Sim, é possível treinar o ChatGPT com arquivos PDF. Você pode usar bibliotecas Python como o PyPDF2 para analisar os arquivos PDF e alimentar os dados para o modelo.
Quais dados foram usados para treinar o ChatGPT?
O ChatGPT foi treinado com uma variedade diversificada de textos da internet. No entanto, a OpenAI não divulgou publicamente os detalhes dos conjuntos de dados individuais usados. Você pode treinar seu próprio modelo do ChatGPT com dados personalizados para adaptá-lo às suas necessidades específicas.
É possível treinar um chatbot?
Sim, é possível treinar um chatbot. Este guia fornece etapas detalhadas sobre como treinar um chatbot usando o ChatGPT e dados personalizados. O processo envolve configurar seu ambiente, preparar seus dados e executar um script Python para treinar o chatbot.