📊 Matplotlibにおけるヒストグラムの10種類(例付き)
Updated on

ヒストグラムはデータの分布を可視化する最も一般的なツールの一つです。Pythonのmatplotlib
を使えば、データをより理解しやすくするためにさまざまにカスタマイズ可能です。
この記事では、10種類のヒストグラムと、それらが何に使われるのか、そして各種の作り方について詳しく解説します。
1. 基本的なヒストグラム
📌 利用例:
データセットの頻度分布を可視化する。
plt.hist(data)
plt.title("基本的なヒストグラム")
plt.xlabel("値")
plt.ylabel("頻度")
2. カスタムビンを用いたヒストグラム
📌 利用例:
ビンの数を調整して解像度をコントロール。
plt.hist(data, bins=20)
plt.title("カスタムビンのヒストグラム")
3. 色付けされたヒストグラム
📌 利用例:
見やすさやカラーパレットに合わせて色付け。
plt.hist(data, color='skyblue', edgecolor='black')
plt.title("色付きのヒストグラム")
4. 正規化されたヒストグラム(密度表示)
📌 利用例:
生の頻度ではなく確率密度を表示 — 分布比較に適している。
plt.hist(data, density=True, color='lightgreen', edgecolor='black')
plt.title("正規化ヒストグラム(密度)")
5. 累積ヒストグラム
📌 利用例:
データの累積和を見ることで、時間や値の変化に伴う蓄積傾向を理解。
plt.hist(data, cumulative=True, color='orange', edgecolor='black')
plt.title("累積ヒストグラム")
6. KDE(カーネル密度推定)オーバーレイ付きヒストグラム
📌 利用例:
滑らかな密度曲線を重ねて分布の形状を推定。
import seaborn as sns
sns.histplot(data, kde=True, color='mediumpurple', edgecolor='black')
plt.title("KDEオーバーレイ付きヒストグラム")
7. スタック型ヒストグラム
📌 利用例:
複数の分布を横並びに比較し、合計への寄与を視覚化。
plt.hist([data1, data2], stacked=True, color=['steelblue', 'salmon'], edgecolor='black')
plt.title("スタック型ヒストグラム")
plt.legend(['データセット1', 'データセット2'])
8. ステップスタイルのヒストグラム
📌 利用例:
アウトラインとしてヒストグラムを表示し(複数データの比較に適している)。
plt.hist(data, histtype='step', color='darkgreen')
plt.title("ステップスタイルのヒストグラム")
9. 横向きヒストグラム
📌 利用例:
軸を反転させる—Y軸のラベルが重要だったり、スペースが限られている場合に便利。
plt.hist(data, orientation='horizontal', color='plum', edgecolor='black')
plt.title("横向きヒストグラム")
10. 重み付け付きヒストグラム
📌 利用例:
値に重みを付与。データポイントの重要性や頻度が異なる場合に便利。
weights = np.random.rand(len(data))
plt.hist(data, weights=weights, color='goldenrod', edgecolor='black')
plt.title("重み付けヒストグラム")
🧠 最後の考察
ヒストグラムは単なる棒グラフ以上のものです。適切なスタイルを選ぶことで、データの特定の洞察を効果的に伝えることができます。EDAに使う場合も、最終レポートの準備にも、これらのバリエーションを知っているとより強力なデータストーリーテリングが可能になります。