Skip to content

전체적인 가이드: 데이터 처리를 위한 판다 Pandas의 to_datetime 함수 사용 방법

Updated on

데이터 분석 및 조작에 가장 강력한 파이썬 라이브러리 중 하나인 판다 Pandas에서 시계열 분석에 크게 도움이 되는 다재다능한 기능은 to_datetime() 함수입니다. 이 가이드에서는 이를 통해 날짜 데이터를 효과적으로 변환하는 방법에 대해 자세히 살펴보겠습니다.

파이썬에서 빠르게 데이터 시각화를 만들고 싶으세요?

PyGWalker는 Jupyter Notebook 기반 환경에서 데이터 분석 및 시각화 작업을 빠르게 처리할 수 있도록 지원하는 오픈 소스 파이썬 프로젝트입니다.

PyGWalker (opens in a new tab)는 Pandas 데이터프레임(또는 Polars 데이터프레임)을 시각적 UI로 바꾸어 변수를 끌어다 놓기만 하면 그래프를 쉽게 만들 수 있습니다. 단순히 다음 코드를 사용하세요:

pip install pygwalker
import pygwalker as pyg
gwalker = pyg.walk(df)

이번에 바로 온라인 노트북으로 PyGWalker를 실행해보세요:

그리고 깃허브에서 ⭐️을 눌러주세요!

Kaggle 노트북에서 PyGWalker 실행 (opens in a new tab)Google Colab에서 PyGWalker 실행 (opens in a new tab)PyGWalker 깃허브에 ⭐️ 누르기 (opens in a new tab)
Kaggle에서 PyGWalker 실행 (opens in a new tab)Google Colab에서 PyGWalker 실행 (opens in a new tab)PyGWalker 깃허브에 ⭐️ 누르기 (opens in a new tab)

판다 Pandas의 to_datetime() 함수 이해하기

Pandas의 to_datetime() 함수는 날짜 변환을 처리하는 유연하고 포괄적인 방법을 제공합니다. 이 함수는 문자열 표현에서 실제 날짜 형식으로 효과적으로 변환하며, Pandas에서 제공하는 방대한 날짜 기능(예: 리샘플링)을 활용하는 데 유용합니다.

to_datetime() 함수의 구문은 다음과 같습니다.

pd.to_datetime(arg, errors='raise', dayfirst=False, yearfirst=False, utc=None, format=None, exact=True, unit=None, infer_datetime_format=False, origin='unix', cache=True)

이 함수의 주요 매개변수를 분해해 봅시다.

to_datetime() 함수의 매개변수

to_datetime() 함수를 사용할 때 상호작용하는 주요 매개변수는 다음과 같습니다.

  • arg: 이는 실제로 날짜 객체로 변환하려는 데이터입니다. int, float, string, datetime, list, tuple, Series, DataFrame 또는 dict와 같은 여러 데이터 유형이 허용되는 유연한 매개변수입니다.

  • format: 이 매개변수는 문자열을 DateTime 객체로 변환할 때 Pandas가 어떻게 해석해야 하는지 지시합니다.

  • origin: 타임스탬프가 시작하는 기준 날짜입니다. 기본값은 'unix'로 설정되어 있으며, 이는 1970-01-01에 해당합니다. 사용자 지정 origin도 설정할 수 있습니다.

  • unit: 이 매개 변수를 사용하여 정수 데이터가 기준으로부터 어떤 단위를 나타내는지 지정할 수 있습니다. 예를 들어 20203939를 's' 단위로 전달하면 Pandas는이를 기준으로부터 20,203,939 초로 해석합니다.

  • dayfirstyearfirst: 이러한 매개 변수는 각각 형식에 일 또는 년도가 먼저 나오는 경우 Pandas가 날짜를 구문 분석하는 데 도움을 줍니다.

DateTime 형식 코드

형식 코드는 Pandas에 DateTime 문자열이 어떤 형식인지 알려주는 중요한 역할을 합니다. 여기에는 몇 가지 주요 형식 코드가 있습니다.

- %Y: 세기와 함께 년도
- %m: 월 번호, 0으로 채움
- %d: 월의 일, 0으로 채움
- %H: 시간 (24시간), 0으로 채움
- %M: 분, 0으로 채움
- %S: 초, 0으로 채움
- %f: 마이크로초, 0으로 채움

to_datetime() 사용 예

이제 매개 변수 및 형식 코드에 대한 이해가 있으므로 일부 예제를 살펴 보겠습니다.

문자열을 datetime 객체로 변환

import pandas as pd
 
date_string = '2023-05-30'
date_object = pd.to_datetime(date_string)
print(date_object)

format 매개 변수를 사용하여 날짜 형식 변경

import pandas as pd
 
date_string = '30-05-2023'
date_object = pd.to_datetime(date_string, format='%d-%m-%Y')
print(date_object)

단위 매개 변수를 사용하여 시간의 다른 단위 처리

import pandas as pd
 
seconds_since_epoch = 160945
 
9200
date_object = pd.to_datetime(seconds_since_epoch, unit='s')
print(date_object)

결론

Pandas to_datetime() 함수는 데이터 분석에 필수적인 도구입니다. 날짜를 처리할 때 제공하는 유연성은 매우 귀중합니다. 이 가이드를 통해이 함수를 사용하여 날짜를 변환 및 조작하는 방법에 대한 견고한 이해를 얻었습니다.