import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns
ヒストグラム
# ヒストグラムの描画 column_name = '列名' plt.grid(True) plt.hist(df[column_name ]) plt.show()
引数 | 内容 | 初期値 | 備考 |
---|---|---|---|
x | 描画するデータ。第一引数で渡す | - | |
bins | ヒストグラムの棒の数 | 10 | |
range | 最小値と最大値 | 渡したxの 最大/最小 | range=[6,7] |
cumulative | True:累積ヒストグラム False:通常のヒストグラム | False | |
color | ヒストグラムの色 | b | color='b' |
plt.xlim(5, 55) | x軸の表示範囲 |
plt.ylim(0, 30) | y軸の表示範囲 |
plt.title('title', fontsize=20) | タイトル |
plt.xlabel('x_label', fontsize=12) | x軸ラベル |
plt.ylabel('y_label', fontsize=20) | y軸ラベル |
plt.grid(True) | 目盛線の表示 |
plt.tick_params(labelsize = 10) | 目盛線のラベルサイズ |
# データフレーム内の各列のヒストグラムを描画 for column_name in df.columns: plt.title(column_name , fontsize=20) plt.grid(True) plt.tick_params(labelsize = 10) plt.hist(df[column_name ], alpha=0.7) plt.show()
個数をヒストグラムで表示
# 列内の値の個数をヒストグラムで表示 sns.countplot(df.Target)
横向きヒストグラム
# 横向きで表示 y = [] width = plt.barh(y=y, width=width)
# 列の値の個数を表示 column_name = '列名' sns.countplot(df[column_name])
散布図
# 散布図を表示 sns.distplot(df['列名'])
ヒストグラム付き散布図
x_label = '列名1' y_label = '列名2' sns.jointplot(x=x_label, y=y_label, data=df)
箱ひげ図
column_name = '列名' plt.figure(figsize=(10,6)) plt.boxplot(df[column_name],vert=False) plt.show()