Skip to content

Un guide complet : Comment utiliser Pandas to_datetime pour le traitement des données

Updated on

L'une des bibliothèques Python les plus puissantes pour l'analyse et la manipulation de données est Pandas. Une fonction polyvalente de Pandas qui aide considérablement dans l'analyse des séries temporelles est la fonction to_datetime(). Dans ce guide, nous verrons comment vous pouvez utiliser la fonction to_datetime() de Pandas pour convertir efficacement vos données de date.

Vous souhaitez créer rapidement des visualisations de données en Python ?

PyGWalker est un projet Python open source qui peut aider à accélérer le flux de travail d'analyse et de visualisation des données directement dans des environnements basés sur Jupyter Notebook.

PyGWalker (opens in a new tab) transforme votre dataframe Pandas (ou dataframe Polars) en une interface utilisateur visuelle où vous pouvez faire glisser et déposer des variables pour créer des graphiques facilement. Utilisez simplement le code suivant :

pip install pygwalker
import pygwalker as pyg
gwalker = pyg.walk(df)

Vous pouvez exécuter PyGWalker dès maintenant avec ces notebooks en ligne :

Et n'oubliez pas de nous donner une ⭐️ sur GitHub !

Exécuter PyGWalker dans Kaggle Notebook (opens in a new tab)Exécuter PyGWalker dans Google Colab (opens in a new tab)Donner une ⭐️ à PyGWalker sur GitHub (opens in a new tab)
Exécuter PyGWalker dans Kaggle Notebook (opens in a new tab)Exécuter PyGWalker dans Google Colab (opens in a new tab)Exécuter PyGWalker dans Google Colab (opens in a new tab)

Comprendre la fonction Pandas to_datetime()

Pandas to_datetime() offre une approche flexible et complète pour la manipulation des dates. Elle permet de convertir efficacement une représentation sous forme de chaîne de caractères d'une date en un format de date réel, ce qui est utile lorsque l'on exploite les nombreuses fonctionnalités de dates fournies par Pandas, telles que le rééchantillonnage.

La syntaxe de to_datetime() est la suivante :

pd.to_datetime(arg, errors='raise', dayfirst=False, yearfirst=False, utc=None, format=None, exact=True, unit=None, infer_datetime_format=False, origin='unix', cache=True)

Décortiquons les principaux paramètres de cette fonction.

Paramètres de to_datetime()

Voici les principaux paramètres avec lesquels vous interagirez lors de l'utilisation de la fonction to_datetime() :

  • arg : Il s'agit des données réelles que vous souhaitez convertir en un objet datetime. C'est un paramètre flexible qui accepte de nombreux types de données tels que int, float, string, datetime, list, tuple, Series, DataFrame ou dict.

  • format : Ce paramètre indique à Pandas comment interpréter vos chaînes lors de leur conversion en objets DateTime.

  • origin : La date de référence à partir de laquelle vous souhaitez que vos horodatages commencent. Par défaut, elle est définie sur 'unix', ce qui correspond à 1970-01-01. Vous pouvez également définir votre propre origine.

  • unit : Cela vous permet de spécifier l'unité de vos données entières, par rapport à l'origine. Par exemple, si vous passez 20203939 avec l'unité 's', Pandas interprétera cela comme étant à 20 203 939 secondes de l'origine.

  • dayfirst et yearfirst : Ces paramètres aident Pandas à analyser les dates si votre jour ou votre année vient en premier dans votre format, respectivement.

Codes de format de DateTime

Les codes de format sont essentiels pour indiquer à Pandas le format de votre chaîne DateTime. Voici quelques codes de format clés :

- %Y : Année avec siècle
- %m : Numéro de mois, avec un zéro initial
- %d : Jour du mois, avec un zéro initial
- %H : Heure (format 24 heures), avec un zéro initial
- %M : Minute, avec un zéro initial
- %S : Seconde, avec un zéro initial
- %f : Microseconde, avec un zéro initial

Exemples d'utilisation de to_datetime()

Maintenant que nous avons compris les paramètres et les codes de format, passons à quelques exemples.

Convertir une chaîne en un objet datetime

import pandas as pd
 
date_string = '2023-05-30'
date_object = pd.to_datetime(date_string)
print(date_object)

Modifier le format de la date en utilisant le paramètre format

import pandas as pd
 
date_string = '30-05-2023'
date_object = pd.to_datetime(date_string, format='%d-%m-%Y')
print(date_object)

Gérer différentes unités de temps avec le paramètre unit

import pandas as pd
 
seconds_since_epoch = 160945
 
9200
date_object = pd.to_datetime(seconds_since_epoch, unit='s')
print(date_object)

Conclusion

En conclusion, la fonction to_datetime() de Pandas est un outil indispensable dans votre boîte à outils d'analyse de données. La flexibilité qu'elle offre lors de la manipulation des dates est inestimable. Grâce à ce guide, vous avez maintenant une compréhension solide de la manière de convertir et de manipuler des dates en utilisant cette fonction.