Skip to content

판다스에서 열 이름 변경하는 방법: 포괄적인 가이드

데이터 분석은 오늘날 데이터 주도적인 세상에서 중요한 작업입니다. 이 작업은 원시 데이터를 정리, 구성 및 변환하여 이해 가능하고 의미 있는 형식으로 만드는 것을 필요로 합니다. 데이터 분석에서 가장 기본적인 작업 중 하나는 열 이름 변경입니다. 이로 인해 데이터가 더욱 정보성과 이해가능하게 됩니다.

이 튜토리얼에서는 다양한 방법을 사용하여 판다스 DataFrame에서 열 이름을 변경하는 방법을 살펴볼 것입니다. 데이터 분석을 더욱 명확하고 간결하게 만드는 최선의 노하우, 방법 및 팁을 논의할 것입니다. 시작해 봅시다!

파이썬 판다스 데이터프레임으로 데이터 시각화를 간편하게 만들 수 있습니다.

PyGWalker는 시각화가 포함된 탐색적 데이터 분석을 위한 파이썬 라이브러리입니다. PyGWalker (opens in a new tab)를 사용하면 pandas 데이터프레임과 polars 데이터프레임을 Tableau 스타일 UI로 변환하여 시각적 탐색을 위한 작업과 데이터 시각화 작업을 Jupyter Notebook에서 간소화할 수 있습니다.

PyGWalker를 사용한 데이터 시각화 (opens in a new tab)

DataFrame Rename Column이란?

코딩 부분에 깊이 파고들기 전에, 먼저 판다스 DataFrame에서 열 이름 변경이란 무엇이며 이를 왜 중요하다고 생각하는지 이해해 봅시다.

판다스 DataFrame에서 열은 각 열을 구별하는 고유한 식별자로 이름이 지정되어 있습니다. 때로는 이러한 고유 식별자가 정보가 부족하거나 일관성이 없을 수 있습니다. 이는 혼란과 오해를 초래할 수 있으므로 열 이름을 변경하여 정보성과 이해도를 높일 수 있습니다.

열 이름 변경은 판다스 DataFrame에서 하나 이상의 열 이름을 변경하는 프로세스입니다. 이는 열 레이블 또는 인덱스를 선택해서 수행할 수 있습니다. 이렇게 함으로써 데이터의 가독성이 향상되고 서로 다른 열 간의 관계를 이해하기 쉬워집니다.

판다스 DataFrame에서 열 이름 변경하는 방법은?

판다스는 DataFrame에서 여러 가지 방법으로 열 이름을 변경할 수 있도록 제공합니다. 열 이름을 변경하는 가장 일반적으로 사용되는 방법과 최선의 노하우를 살펴보겠습니다.

단일 열 이름 변경

가장 기본적인 방법인 판다스 DataFrame에서 하나의 열 이름을 변경하는 방법부터 시작해 보겠습니다. 이를 위해 rename 메소드를 사용하겠습니다.

# 샘플 DataFrame 생성
import pandas as pd
 
data = {'Name': ['John', 'Alex', 'Peter'],
        'Age': [25, 24, 28],
        'Gender': ['Male', 'Male', 'Male']}
 
df = pd.DataFrame(data)
 
# 'Age' 열의 이름을 'Years'로 변경
df = df.rename(columns={'Age': 'Years'})
 
# DataFrame 출력
print(df) 

출력 결과:

    Name  Years Gender
0   John     25   Male
1   Alex     24   Male
2  Peter     28   Male

여기서 우리는 Name, AgeGender 열을 가진 샘플 DataFrame을 만들었습니다. 우리는 rename 메소드를 사용해 Age 열의 이름을 Years로 변경했습니다. rename 메소드는 딕셔너리를 인수로 사용하며, 여기서 키는 이전 열 이름이고 값은 새 열 이름입니다.

다중 열 이름 변경

하나의 열 이름 변경은 쉽지만, 여러 열 이름을 동시에 변경하려면 어떻게 해야 할까요? 그러한 경우에는 이전 열 이름과 새 열 이름의 딕셔너리를 가진 rename 메소드를 사용할 수 있습니다.

# 샘플 DataFrame 생성
import pandas as pd
 
data = {'Name': ['John', 'Alex', 'Peter'],
        'Age': [25, 24, 28],
        'Department': ['IT', 'HR', 'Marketing']}
 
df = pd.DataFrame(data)
 
# 'Age' 및 'Department' 열 이름 변경
df = df.rename(columns={'Age': 'Years', 'Department': 'Dept'})
 
# DataFrame 출력
print(df) 

출력 결과:

    Name  Years       Dept
0   John     25         IT
1   Alex     24         HR
2  Peter     28  Marketing

여기서는 rename 메소드를 사용하여 이전 열 이름과 새 열 이름의 딕셔너리를 사용하여 'Age'를 'Years'로, 'Department'를 'Dept'로 변경하여 두 개의 열 이름을 변경했습니다.

set_axis 메소드를 사용한 열 이름 변경

판다스 DataFrame에서 열 이름을 변경하는 또 다른 방법은 set_axis 메소드를 사용하는 것입니다. 이 방법은 유연하고 편리한 방법이며, 동시에 여러 개의 이전 열 이름과 새 열 이름을 변경할 수 있습니다.다음과 같은 frontmatter가 있는 mdx를 한국어로 번역하세요.

# Create a sample DataFrame
import pandas as pd
 
data = {'Name': ['John', 'Alex', 'Peter'],
        'Age': [25, 24, 28],
        'Gender': ['Male', 'Male', 'Male']}
 
df = pd.DataFrame(data)
 
# Rename the 'Age' and 'Gender' columns by index
df.columns = df.columns.set_axis(['a', 'Years', 'b'], axis=1, inplace=False)
 
# Print the DataFrame
print(df) 

출력:

    Name  Years     b
0   John     25  Male
1   Alex     24  Male
2  Peter     28  Male

여기서는 set_axis 메소드를 사용하여 인덱스 위치를 통해 열 이름을 바꾸었습니다. 이 메소드는 라벨, 축, 그리고 inplace 세 가지 매개변수를 가지고 있는데, 우리는 새 열 이름으로 라벨을 설정하고 축을 나타내는 숫자 1을 사용했습니다. inplace 매개변수는 새로운 DataFrame을 반환하기 위해 False로 설정했습니다.

리스트 컴프리헨션을 사용한 열 이름 바꾸기

Pandas DataFrame에서 열 이름을 바꾸는 또 다른 방법으로 리스트 컴프리헨션을 사용할 수 있습니다. 이 방법은 여러 개의 열 이름을 한 번에 바꿀 수 있도록 해주는 간단하고 우아한 방법입니다.

# Create a sample DataFrame
import pandas as pd
 
data = {'Name': ['John', 'Alex', 'Peter'],
        'Age': [25, 24, 28],
        'Department': ['IT', 'HR', 'Marketing']}
 
df = pd.DataFrame(data)
 
# Rename the 'Age' and 'Department' columns using list comprehension
df.columns = [col.replace('_', ' ').title() for col in df.columns]
 
# Print the DataFrame
print(df) 

출력:

    Name  Age  Department
0   John   25          IT
1   Alex   24          HR
2  Peter   28   Marketing

위 예시에서는 리스트 컴프리헨션을 사용하여 밑줄을 공백으로 바꾸고 title() 메소드를 사용하여 첫 문자를 대문자로 바꾸어 열 이름을 바꾸었습니다.

DataFrame의 인덱스를 이용한 이름 바꾸기

Pandas DataFrame에서는 인덱스를 이용하여 열 이름을 바꿀 수 있습니다. rename 메소드를 사용하면 old column과 new column index를 딕셔너리 형태로 받아 열 이름을 바꿀 수 있습니다.

# Create a sample DataFrame
import pandas as pd
 
data = {'Name': ['John', 'Alex', 'Peter'],
        'Age': [25, 24, 28],
        'Department': ['IT', 'HR', 'Marketing']}
 
df = pd.DataFrame(data)
 
# Rename the '2' to 'Dept' column by index
df = df.rename(columns={2: 'Dept'})
 
# Print the DataFrame
print(df) 

출력:

    Name  Age       Dept
0   John   25         IT
1   Alex   24         HR
2  Peter   28  Marketing

위 예시에서는 인덱스 위치 2의 열 이름을 Dept로 바꾸기 위해 rename 메소드를 사용했습니다.

열 이름 리스트를 이용한 DataFrame 열 이름 바꾸기

Pandas DataFrame에서는 열 이름 리스트를 선택하여 열 이름을 바꿀 수 있습니다. 아래의 예시에서는 이 방법을 사용하여 여러 개의 열 이름을 한 번에 바꾸는 방법을 설명합니다.

# Create a sample DataFrame
import pandas as pd
 
data = {'Name': ['John', 'Alex', 'Peter'],
        'Age': [25, 24, 28],
        'Department': ['IT', 'HR', 'Marketing']}
 
df = pd.DataFrame(data)
 
# Rename the 'Name' and 'Department' columns using a list of column names
df.columns = ['ID', 'Years', 'Dept']
 
# Print the DataFrame
print(df) 

출력:

     ID  Years       Dept
0   John     25         IT
1   Alex     24         HR
2  Peter     28  Marketing

위 예시에서는 열 이름 리스트를 이용하여 Name 열 이름을 ID로, Department 열 이름을 Dept로 바꾸었습니다.

결론

이번 튜토리얼에서는 다양한 방법을 사용하여 Pandas DataFrame에서 열 이름을 바꾸는 방법을 알아보았습니다. rename 메소드, set_axis 메소드, 리스트 컴프리헨션, 인덱스를 이용한 바꾸기, 그리고 열 이름 리스트를 이용한 바꾸기와 같은 방법들을 살펴보았습니다. 이러한 방법을 사용하여 데이터 분석을 더욱 체계적으로 하며, 보다 정보성 높은 결과를 얻을 수 있습니다.

열 이름 바꾸기는 데이터 분석에서 필수적인 단계입니다. 열 이름을 변경함으로써 데이터의 가독성을 높이고 다른 열들 간의 관계를 이해하기 쉬워집니다. 위에서 다룬 방법들을 활용하여 쉽게 열 이름을 바꿔 데이터 분석을 보다 효과적으로 수행할 수 있기를 바라며, 좋은 코딩하세요!


링크:

자주 묻는 질문

  1. DataFrame에서 열 이름을 변경하는 방법은 무엇인가요?

    DataFrame에서 열 이름을 변경하려면 pandas의 rename() 메서드를 사용합니다. 이 메서드를 사용하여 이전 열 이름과 새로운 열 이름을 지정하는 딕셔너리나 매핑을 사용합니다. 이 메서드를 사용하면 단일 열 또는 여러 열을 한 번에 변경할 수 있습니다.

  2. Pandas에서 열 인덱스를 기준으로 열 이름을 변경하는 방법은 무엇인가요?

    pandas에서는 rename() 메서드의 columns 매개변수를 사용하여 열 인덱스를 기준으로 열 이름을 변경할 수 있습니다. 현재 열 인덱스를 키로, 새로운 열 이름을 값으로 하는 딕셔너리를 전달합니다. 이 메서드를 사용하면 DataFrame 내의 열 위치를 기준으로 열 이름을 변경할 수 있습니다.

  3. DataFrame에서 여러 열의 이름을 한 번에 변경하는 방법은 어떻게 되나요?

    DataFrame에서 여러 열의 이름을 한 번에 변경하려면 rename() 메서드의 columns 매개변수를 사용합니다. 현재 열 이름을 키로, 새로운 열 이름을 값으로 하는 딕셔너리를 전달합니다. 이 메서드를 사용하면 여러 열을 동시에 변경할 수 있습니다. 또한 특정 기준에 따라 열 이름을 선택적으로 변경할 수 있는 유연성을 제공합니다.