Skip to content

Una guía completa: Cómo usar Pandas to_datetime para el procesamiento de datos

Updated on

Una de las bibliotecas de Python más robustas para el análisis y manipulación de datos es Pandas. Una función versátil dentro de Pandas que ayuda significativamente en el análisis de series de tiempo es la función to_datetime(). En esta guía, profundizaremos en cómo puedes utilizar la función to_datetime() de Pandas para convertir tus datos de fecha de manera efectiva.

¿Quieres crear visualizaciones de datos rápidamente en Python?

PyGWalker es un proyecto de código abierto de Python que puede ayudar a acelerar el flujo de trabajo de análisis y visualización de datos directamente dentro de entornos basados en Jupyter Notebook.

PyGWalker (opens in a new tab) convierte tu DataFrame de Pandas (o DataFrame de Polars) en una interfaz de usuario visual donde puedes arrastrar y soltar variables para crear gráficos con facilidad. Simplemente usa el siguiente código:

pip install pygwalker
import pygwalker as pyg
gwalker = pyg.walk(df)

Puedes usar PyGWalker ahora mismo con estas libretas en línea:

¡Y no olvides darnos ⭐️ en GitHub!

Ejecutar PyGWalker en Kaggle Notebook (opens in a new tab)Ejecutar PyGWalker en Google Colab (opens in a new tab)Darle ⭐️ a PyGWalker en GitHub (opens in a new tab)
Ejecutar PyGWalker en Kaggle Notebook (opens in a new tab)Ejecutar PyGWalker en Google Colab (opens in a new tab)Ejecutar PyGWalker en Google Colab (opens in a new tab)

Comprendiendo la función Pandas to_datetime()

Pandas to_datetime() ofrece un enfoque flexible y completo para manejar conversiones de fechas. Convierte eficientemente una representación de cadena de una fecha en un formato de fecha real, lo cual es útil al aprovechar la vasta funcionalidad de fechas proporcionada por Pandas, como el remuestreo.

La sintaxis de to_datetime() es la siguiente:

pd.to_datetime(arg, errors='raise', dayfirst=False, yearfirst=False, utc=None, format=None, exact=True, unit=None, infer_datetime_format=False, origin='unix', cache=True)

Desglosemos los parámetros clave de esta función.

Parámetros de to_datetime()

Aquí están los parámetros principales con los que interactuarás al usar la función to_datetime():

  • arg: Estos son los datos reales que deseas convertir en un objeto de fecha y hora. Es un parámetro flexible que acepta numerosos tipos de datos como int, float, string, datetime, list, tuple, Series, DataFrame o dict.

  • format: Este parámetro indica a Pandas cómo interpretar tus cadenas al convertirlas en objetos DateTime.

  • origin: La fecha de referencia desde la cual deseas que comiencen tus marcas de tiempo. De manera predeterminada, se establece en 'unix', lo cual corresponde a 1970-01-01. También puedes establecer tu propio origen.

  • unit: Esto te permite especificar la unidad que representa tus datos enteros, en relación con el origen. Por ejemplo, si pasas 20203939 con la unidad 's', Pandas lo interpretará como 20,203,939 segundos desde el origen.

  • dayfirst y yearfirst: Estos parámetros ayudan a Pandas a analizar fechas si tu día o año aparece primero en tu formato, respectivamente.

Códigos de formato de fecha y hora

Los códigos de formato son esenciales para indicarle a Pandas en qué formato se encuentra tu cadena de fecha y hora. Aquí hay algunos códigos de formato clave:

- %Y: Año con siglo
- %m: Número de mes, ceros a la izquierda
- %d: Día del mes, ceros a la izquierda
- %H: Hora (formato de 24 horas), ceros a la izquierda
- %M: Minuto, ceros a la izquierda
- %S: Segundo, ceros a la izquierda
- %f: Microsegundo, ceros a la izquierda

Ejemplos de uso de to_datetime()

Ahora que entendemos los parámetros y los códigos de formato, veamos algunos ejemplos.

Convertir una cadena en un objeto de fecha y hora

import pandas as pd
 
cadena_fecha = '2023-05-30'
objeto_fecha = pd.to_datetime(cadena_fecha)
print(objeto_fecha)

Cambiar el formato de fecha usando el parámetro format

import pandas as pd
 
cadena_fecha = '30-05-2023'
objeto_fecha = pd.to_datetime(cadena_fecha, format='%d-%m-%Y')
print(objeto_fecha)

Manejar diferentes unidades de tiempo con el parámetro unit

import pandas as pd
 
segundos_desde_epoch = 160945
 
9200
objeto_fecha = pd.to_datetime(segundos_desde_epoch, unit='s')
print(objeto_fecha)

Conclusión

En conclusión, la función to_datetime() de Pandas es una herramienta indispensable en tu conjunto de herramientas de análisis de datos. La flexibilidad que ofrece al tratar con fechas es invaluable. Con esta guía, ahora tienes una comprensión sólida de cómo convertir y manipular fechas utilizando esta función.