Skip to content

Comment former ChatGPT pour une utilisation professionnelle et personnelle

L'intelligence artificielle (IA) a révolutionné de nombreux secteurs, et le domaine de la communication ne fait pas exception. Parmi les différents modèles d'IA disponibles, ChatGPT, développé par OpenAI, se distingue par ses impressionnantes capacités de compréhension du langage. Ce guide vise à fournir une compréhension complète de la manière de former ChatGPT de manière efficace avec des données personnalisées sur MacOS.

La création de votre propre chatbot alimenté par l'IA n'a jamais été aussi facile. Avec ChatGPT d'OpenAI, vous pouvez former un modèle de langage à l'aide de données personnalisées adaptées à vos besoins spécifiques. À la fin de ce guide, vous aurez une connaissance pratique de la configuration, de la préparation de vos données et du peaufinage de votre chatbot.

Méthode 1 : Utiliser des outils en ligne pour former ChatGPT

Utilisation de CustomGPT.ai pour former ChatGPT

CustomGPT.ai est une plateforme en ligne qui simplifie le processus de formation de ChatGPT avec vos propres données. Il élimine la nécessité de coder ou de travailler avec une base de données, le rendant accessible aux utilisateurs sans compétences techniques. Voici les étapes à suivre pour utiliser CustomGPT.ai :

  1. Rendez-vous sur CustomGPT.ai (opens in a new tab) et créez un nouveau projet. Vous pouvez lui donner le nom de votre choix.
  2. Entrez l'URL du plan de site de votre site web. La plateforme mettra ensuite en file d'attente toutes les pages de votre plan de site pour les parcourir.
  3. Attendez que le système parcourt toutes vos pages. Ce processus peut prendre jusqu'à une heure en fonction du nombre de pages de votre site web.
  4. Une fois le processus de parcours terminé, vous pouvez commencer à créer votre chatbot personnalisé. Le chatbot aura lu toutes les pages, compris le contenu et sera prêt à interagir avec quiconque l'utilise.

Utilisation de ChatGPT School pour former ChatGPT

ChatGPT School est une autre plateforme qui vous permet de former ChatGPT avec vos propres données. Elle est particulièrement utile pour le contenu éducatif, tel que les cours en ligne. Voici comment l'utiliser :

  1. Rendez-vous sur ChatGPT School (opens in a new tab) et créez un nouveau projet.
  2. Comme pour CustomGPT.ai, vous devrez entrer l'URL du plan de site de votre site web. La plateforme mettra ensuite en file d'attente toutes les pages de votre plan de site pour les parcourir.
  3. Attendez que le système parcourt toutes vos pages. Ce processus peut prendre jusqu'à une heure en fonction du nombre de pages de votre site web.
  4. Une fois le processus de parcours terminé, vous pouvez commencer à créer votre chatbot personnalisé. Le chatbot aura lu toutes les pages, compris le contenu et sera prêt à interagir avec quiconque l'utilise.

Méthode 2 : Créez votre propre LLM personnalisé pour former ChatGPT

Préparation de l'environnement pour former ChatGPT

Étape 1 : Installer Python

Python 3.0+ est requis pour commencer. Avant de passer à l'installation, il est recommandé de vérifier si vous avez déjà Python3 installé. Vous pouvez le faire en exécutant la commande suivante dans votre terminal :

python3 --version

Si vous voyez la version répertoriée après avoir exécuté la commande, cela signifie que vous avez déjà Python3 installé et vous pouvez passer à l'étape suivante. Si vous voyez une erreur "command not found", passez à l'installation.

Rendez-vous sur le lien suivant et téléchargez l'installateur Python : https://www.python.org/downloads/ (opens in a new tab)

Une fois l'installation terminée, exécutez à nouveau la commande ci-dessus et elle devrait afficher la version de Python.

Étape 2 : Mettre à jour Pip

Python est livré avec pip pré-installé, mais au cas où vous utiliseriez une ancienne installation, il est toujours une bonne idée de mettre à jour pip vers la dernière version. Pip est un gestionnaire de paquets pour Python, similaire à Composer pour PHP. Vous pouvez le mettre à niveau en utilisant une commande très simple :

python3 -m pip install -U pip

Si vous avez déjà installé pip, il vous donnera un avertissement du type "Requirement already satisfied: pip in [emplacement-ici]". Si vous n'avez pas la dernière version de pip, il l'installera. Vous pouvez maintenant vérifier s'il est correctement installé en exécutant la commande suivante :

pip3 --version

Il vous indiquera la version et l'emplacement du package.

Installation des bibliothèques pour la formation de ChatGPT

Avant de plonger dans le processus de formation proprement dit, vous devrez installer quelques bibliothèques. Ouvrez l'application Terminal sur votre Mac et exécutez les commandes suivantes une par une :

La première commande installe la bibliothèque OpenAI :

pip3 install openai

Ensuite, installez l'index GPT, également appelé LlamaIndex. Il permet au LLM de se connecter aux données externes qui constituent notre base de connaissances.

Pour plus de détails sur le fonctionnement de LlamaIndex et sur la façon de l'utiliser, vous pouvez lire nos articles connexes sur LlamaIndex.

pip3 install gpt_index

Une fois terminé, exécutez la commande suivante :

pip3 install PyPDF2

Il s'agit d'une bibliothèque d'analyse de PDF basée sur Python et est nécessaire si vous allez fournir des fichiers PDF au modèle.

Enfin, vous devez exécuter :

pip3 install gradio

Cela crée une interface utilisateur simple pour interagir avec ChatGPT.

Obtenez une clé OpenAI pour la formation de ChatGPT

Avant de plonger dans le script, récupérons la clé d'API d'OpenAI. Rendez-vous sur OpenAI API (opens in a new tab). Si vous n'êtes pas encore connecté, il vous demandera de vous connecter. Vous pouvez ensuite cliquer sur "Créer une nouvelle clé secrète" pour générer une clé pour notre script.

Rappelez-vous qu'une fois la clé générée, vous ne pourrez plus la voir. Vous devez copier et sauvegarder la clé dans un endroit sécurisé pour y accéder ultérieurement.

Préparation des données pour l'entraînement de ChatGPT

Créez un nouveau répertoire appelé 'docs' où vous le souhaitez et placez-y des fichiers PDF, TXT ou CSV. Vous pouvez ajouter plusieurs fichiers si vous le souhaitez, mais n'oubliez pas que plus vous ajoutez de données, plus de jetons seront utilisés. Les comptes gratuits ont un crédit de 18 $ en jetons.

Créer un script pour entraîner ChatGPT

Maintenant que tout est en place, notre prochaine étape consiste à créer un script Python pour entraîner le chatbot avec des données personnalisées. Il utilisera les fichiers du répertoire 'docs', que nous avons créé précédemment, et générera un fichier JSON.

Vous pouvez utiliser n'importe quel éditeur de texte pour créer ce fichier. MacOS est livré avec TextEdit, vous pouvez l'utiliser, sinon si vous utilisez Visual Studio Code, c'est encore mieux.

Créez une nouvelle page et copiez le code suivant :

from gpt_index import SimpleDirectoryReader, GPTListIndex, GPTSimpleVectorIndex, LLMPredictor, PromptHelper
from langchain import OpenAI
import gradio as gr
import sys
import os
 
os.environ["OPENAI_API_KEY"] = ''
 
def construct_index(directory_path):
    max_input_size = 4096
    num_outputs = 512
    max_chunk_overlap = 20
    chunk_size_limit = 600
 
    prompt_helper = PromptHelper(max_input_size, num_outputs, max_chunk_overlap, chunk_size_limit=chunk_size_limit)
 
    llm_predictor = LLMPredictor(llm=OpenAI(temperature=0.7, model_name="text-davinci-003", max_tokens=num_outputs))
 
    documents = SimpleDirectoryReader(directory_path).load_data()
 
    index = GPTSimpleVectorIndex(documents, llm_predictor=llm_predictor, prompt_helper=prompt_helper)
 
    index.save_to_disk('index.json')
 
    return index
 
def chatbot(input_text):
    index = GPTSimpleVectorIndex.load_from_disk('index.json')
    response = index.query(input_text, response_mode="compact")
    return response.response
 
iface = gr.Interface(fn=chatbot,
                     inputs=gr.inputs.Textbox(lines=7, label="Saisissez votre texte"),
                     outputs="text",
                     title="Mon chatbot IA")
 
index = construct_index("docs")
iface.launch(share=True)

Une fois copié, vous devez ajouter votre clé OpenAI au code avant de l'enregistrer. Remarquez la variable OPEN_API_KEY dans le code ? Copiez votre clé OpenAI, que nous avons extraite à l'étape 5, entre les guillemets simples comme ceci :

os.environ["OPENAI_API_KEY"] = 'votre-clé-ici'

Ensuite, enregistrez le fichier avec l'extension app.py dans le même emplacement où vous avez votre répertoire 'docs'.

Exécuter le script

Maintenant que tout est en place, nous pouvons enfin exécuter le script et voir la magie opérer.

Accédez à l'endroit où vous avez app.py et le répertoire 'docs'. Ouvrez le Terminal et exécutez la commande suivante :

cd /chemin/vers/votre/répertoire

Ensuite, exécutez le fichier Python :

python3 app.py

Cela commencera l'entraînement de votre chatbot personnalisé. Cela peut prendre du temps en fonction de la quantité de données que vous lui avez fournies. Une fois terminé, il affichera un lien où vous pourrez tester les réponses à l'aide d'une interface simple.

Comme vous pouvez le voir, il affiche une URL locale : http://127.0.0.1:7860

Vous pouvez l'ouvrir dans n'importe quel navigateur et commencer à tester votre chatbot entraîné personnalisé. Remarquez que le numéro de port ci-dessus peut être différent pour vous.

Vous pouvez poser des questions dans la colonne de gauche et il répondra dans la colonne de droite. N'oubliez pas que les questions vous coûteront des jetons, donc plus vous posez de questions, plus de jetons seront utilisés sur votre compte OpenAI. L'entraînement utilise également des jetons en fonction de la quantité de données que vous lui avez fournies.

Pour vous entraîner sur davantage de données ou sur des données différentes, vous pouvez fermer en utilisant CTRL + C, modifier les fichiers, puis exécuter à nouveau le fichier Python.

📚

Conclusion

Former ChatGPT avec des données personnalisées vous permet de créer un chatbot adapté à vos besoins spécifiques. Que vous utilisiez des bibliothèques Python sur MacOS, que vous exploitiez des plateformes en ligne comme CustomGPT.ai et ChatGPT School, ou que vous rejoigniez une communauté comme le ChatGPT AI Automation Group, il existe de nombreuses façons de personnaliser et d'améliorer les capacités de votre chatbot. En suivant les étapes détaillées et les exemples fournis dans ce guide, vous serez bien parti pour créer un chatbot puissant alimenté par l'IA.

Questions fréquemment posées

Puis-je former mon propre modèle ChatGPT ?

Oui, vous pouvez former votre propre modèle ChatGPT. Ce guide fournit des étapes détaillées sur la façon de le faire à l'aide de bibliothèques Python sur MacOS. Vous pouvez également utiliser des plateformes en ligne comme CustomGPT.ai et ChatGPT School pour simplifier le processus.

Puis-je entraîner ChatGPT avec des fichiers PDF ?

Oui, ChatGPT peut être entraîné avec des fichiers PDF. Vous pouvez utiliser des bibliothèques Python comme PyPDF2 pour analyser les fichiers PDF et fournir les données au modèle.

Quelles données ont été utilisées pour entraîner ChatGPT ?

ChatGPT a été formé sur une gamme diversifiée de textes Internet. Cependant, OpenAI n'a pas divulgué publiquement les détails des ensembles de données individuels utilisés. Vous pouvez entraîner votre propre modèle ChatGPT avec des données personnalisées pour l'adapter à vos besoins spécifiques.

Puis-je entraîner un chatbot ?

Oui, vous pouvez former un chatbot. Ce guide fournit des étapes détaillées sur la façon de former un chatbot en utilisant ChatGPT et des données personnalisées. Le processus implique de configurer votre environnement, de préparer vos données et d'exécuter un script Python pour former le chatbot.

📚