마스터 매트플로틀립과 파이그워커: 파이썬을 이용한 놀라운 데이터프레임 플롯
Updated on
데이터 시각화는 데이터를 더 쉽게 이해하고 정보에 입각한 결정을 내리는 데 도움이 되므로 데이터 과학의 중요한 부분입니다.이 종합 가이드에서는Matplotlib를 사용하여 Pandas 데이터프레임에서 멋진 플롯을 만들고, 시각화를 사용자 지정하고, 공유를 위해 저장하는 방법을 배울 수 있습니다.기본 및 고급 플로팅 기법을 살펴보고 개선되고 사용자 친화적인 경험을 위한 오픈 소스 대안인 PygWalker를 찾아보세요.단계별 튜토리얼을 통해 데이터 분석 기술을 향상시키세요.
매트플로틀립이란 무엇인가요?
Matplotlib은 파이썬에서 정적, 애니메이션 및 대화형 시각화를 만들기 위한 Python 라이브러리입니다.라인 플롯, 스캐터 차트, 막대 플롯, 히스토그램 등 다양한 유형의 플롯을 만들 수 있는 다양한 도구를 제공합니다.또한 색상, 레이블, 글꼴 등을 변경하는 등 플롯을 사용자 지정할 수 있습니다.
매트플로틀립을 사용한 기본 플롯
Matplotlib을 시작하기 위해 먼저 라이브러리를 가져와서 간단한 팬더 데이터 프레임을 만들어 보겠습니다. 코드_블록_플레이스홀더_0 그런 다음 plot 함수를 사용하여 Matplotlib에서 기본 선 플롯을 만들 수 있습니다. 코드_블록_플레이스홀더_1 그러면 데이터의 간단한 선 플롯이 표시됩니다.
레이블을 추가하고, 색상을 조정하고, 선 스타일을 변경하여 플롯을 사용자 지정할 수도 있습니다. 코드_블록_플레이스홀더_2 그러면 레이블과 제목이 있는 사용자 지정 선 그림이 표시됩니다.
데이터프레임이 포함된 Matplotlib 선 플롯
Matplotlib로 선 플롯을 만들려면 plot 함수를 사용할 수 있습니다. 코드_블록_플레이스홀더_3 이렇게 하면 여러 개의 선이 있는 선 플롯이 표시됩니다.
데이터프레임이 있는 Matplotlib 막대 플롯
Matplotlib로 막대 플롯을 만들려면 bar 함수를 사용할 수 있습니다. 코드_블록_플레이스홀더_4 이 예제에서는 두 개의 열 'y1'과 'y2'와 범주형 열 'x'가 있는 팬더 데이터 프레임을 만듭니다.그런 다음 'x'의 각 값에 대해 두 개의 막대를 플로팅합니다. 하나는 'y1'이고 다른 하나는 'y2'입니다.또한 막대를 구분하기 위해 플롯에 범례를 추가합니다.
데이터프레임이 포함된 Matplotlib 스캐터 차트
스캐터 차트는 두 계량형 변수 간의 관계를 표시하는 데 유용합니다.Matplotlib을 사용하여 scatter 함수를 사용하여 판다 데이터 프레임으로 스캐터 차트를 만들 수 있습니다.
코드_블록_플레이스홀더_5 이 예제에서는 두 개의 열 'x'와 'y'로 팬더 데이터 프레임을 만듭니다.그런 다음 'x' 대 'y'의 스캐터 차트를 플로팅합니다.또한 x축과 y축의 레이블도 설정합니다.
매트플로틀립에서 플롯 크기 늘리기
가독성을 높이거나 더 많은 정보를 포함하기 위해 플롯 크기를 늘려야 하는 경우가 있습니다.Matplotlib에서 그림 크기를 설정하여 이 작업을 수행할 수 있습니다.
코드_블록_플레이스홀더_6 이 예제에서는 두 개의 열 'x'와 'y'로 팬더 데이터 프레임을 만듭니다.그런 다음 10 x 6의 큰 크기로 'x' 대 'y'의 선 플롯을 플로팅합니다.또한 x축과 y축의 레이블도 설정합니다.
값에 따른 Matplotlib 바 플롯 색상
Matplotlib 막대 플롯의 막대 색상을 나타내는 값에 따라 막대의 색상을 사용자 지정할 수 있습니다.예를 들어 값이 음수이면 막대의 색상을 빨간색으로 설정하고 값이 양수이면 녹색으로 설정할 수 있습니다.
코드_블록_플레이스홀더_7 이렇게 하면 음수 값에는 빨간색 막대가, 양수 값에는 녹색 막대가 있는 막대 플롯이 생성됩니다.
매트플로틀리브를 테이블로 플로팅하기
플롯을 생성하는 것 외에도 Matplotlib를 사용하여 판다 데이터 프레임에서 테이블을 만들 수도 있습니다.이는 플롯과 함께 요약 통계 또는 기타 표 형식 데이터를 표시하는 데 유용할 수 있습니다.
Matplotlib를 사용하여 테이블을 만들려면 테이블 함수를 사용할 수 있습니다.다음은 Pandas 데이터 프레임에서 테이블을 만드는 방법의 예입니다.
코드_블록_플레이스홀더_8 그러면 팬더 데이터 프레임에서 테이블이 생성되고 Matplotlib 플롯에 표시됩니다.
플롯 저장 및 내보내기
Matplotlib를 사용하여 플롯을 만든 후에는 이를 디스크에 저장하거나 쉽게 공유하거나 보고서에 포함할 수 있는 파일 형식으로 내보낼 수 있습니다.이를 위해 Matplotlib은 플롯을 저장하고 내보내는 여러 가지 방법을 제공합니다.
플롯을 저장하는 일반적인 방법 중 하나는 savefig 함수를 사용하는 것입니다.이 함수를 사용하면 PNG 또는 PDF와 같은 파일 형식과 플롯의 해상도를 지정할 수 있습니다.다음은 savefig 함수를 사용하는 방법의 예입니다.
코드_블록_플레이스홀더_9 그러면 플롯이 해상도가 인치당 300도트 (dpi) 인 PNG 파일로 저장됩니다.
플롯을 내보내는 또 다른 방법은 플롯을 클립보드에 복사하는 것입니다.Matplotlib는 현재 그림을 파일이나 시스템 클립보드에 저장할 수 있는 matplotlib.pyplot.savefig라는 함수를 제공합니다.다음은 savefig 함수를 사용하여 플롯을 클립보드에 복사하는 방법의 예입니다.
코드_블록_플레이스홀더_10 그러면 플롯이 클립보드에 복사되어 다른 응용프로그램에 붙여넣을 수 있습니다.
PygWalker를 오픈 소스 매트플로틀립 대안으로 사용
Python Pandas 내에서 데이터를 시각화하고 싶다면 Pygwalker (opens in a new tab) 라는 오픈 소스 데이터 분석 및 데이터 시각화 패키지를 이용해 보세요.
PygWalker를 지금 테스트하려면 구글 콜랩 (opens in a new tab), 바인더 (opens in a new tab) 또는 Kaggle (opens in a new tab) 에서 PygWalker를 실행할 수 있습니다.
피그워커는 오픈 소스입니다.PygWalker GitHub 페이지 (opens in a new tab) 에서 확인하고 해당 문서의 데이터 과학을 향하여 (opens in a new tab) 를 읽을 수 있습니다.
주피터 노트북에서 파이그워커 시작하기
PygWalker는 주피터 노트북 데이터 분석 및 데이터 시각화 워크플로를 단순화할 수 있습니다.Python을 사용하여 데이터를 분석하는 대신 가볍고 사용하기 쉬운 인터페이스를 제공합니다.단계는 간단합니다.
피그워커와 판다를 Jupyter 노트북으로 가져와서 시작하세요. 코드_블록_플레이스홀더_11 기존 워크플로를 변경하지 않고 pygwalker를 사용할 수 있습니다.예를 들어 다음과 같이 로드된 데이터프레임을 사용하여 그래픽 워커를 호출할 수 있습니다. 코드_블록_플레이스홀더_12 그래픽 사용자 인터페이스 없이 pandas 데이터프레임을 사용하여 이러한 유형의 플롯을 쉽게 만들 수 있습니다.
막대 그래프 (opens in a new tab) | 선 그래프 | 면적 그래프 (opens in a new tab) |
---|---|---|
트레일 | 산점도 (opens in a new tab) | 원 |
틱 플롯 | 사각형 | 아크 다이어그램 |
박스 플롯 (opens in a new tab) | 히트맵 (opens in a new tab) |
더 많은 예제는 데이터 시각화 갤러리에서 확인하실 수 있습니다.
피그워커로 차트 크기 조정하기
마우스 커서로 차트 크기를 쉽게 조정할 수 있습니다.
차트 유형 변경
선형 차트는 등록된 사용자 수의 추세를 막대형 차트보다 더 잘 나타낼 수 있습니다.기존 차트를 선형 차트로 전환하려면 도구 모음에서 마크 유형 옵션을 클릭하고라인을 선택합니다.
연락처 보기 만들기
'등록된' 사용자와 '일반' 사용자 간의 차이를 비교해 볼 수 있습니다.행/열에 측정값을 더 추가하고 비교하기만 하면 됩니다.
더 발전된 AI 기반 자동 데이터 분석 도구인 RATH (opens in a new tab) 를 확인하는 것도 잊지 마세요.RATH는 또한 오픈 소스이며 GitHub의 소스 코드 (opens in a new tab) 를 호스팅합니다.
결론
결론적으로 Matplotlib은 판다 데이터 프레임에서 멋진 플롯을 만드는 데 사용할 수 있는 강력한 데이터 시각화 도구입니다.이 기사에서는 기본 및 고급 플롯을 만들고, 플롯을 사용자 지정하고, 플롯을 디스크에 저장하고, 데이터 프레임에서 테이블을 만드는 방법을 포함하여 플로팅에 대한 Matplotlib와 PygWalker의 기본 사항을 다루었습니다.데이터 과학자는 Matplotlib과 PygWalker를 사용하여 데이터 시각화 기술을 향상시키고 데이터에서 통찰력을 얻을 수 있습니다.데이터를 최대한 활용하려면 Matplotlib와 PygWalker의 다양한 기능을 계속 연습하고 탐색하는 것을 잊지 마세요.