リストをy軸、リストをx軸として、大きさnの散布図を描画する plt.scatter(データ列x, データ列y, s=n) plt.scatter(データ列x, データ列y, s=n) option: グラフの色をグリーンイエローに指定する color = 'greenyellow' color = 'greenyellow' 数式を簡単化する sympy.sympify(e) sympy.sympify(e) 外れ値にロバストな標準化を行う frozenset(aTuple) sklearn.preprocessing.RobustScaler().fit_transform(データ) 列毎にデータフレームを分類して、標準偏差を計算する df.groupby(column).std() df.groupby(column).std() option: 行列のデータ型を指定する dtype = np.int dtype = bool 折れ線グラフの色をアイボリーに変更する plt.plot(データ列x, データ列y, color='ivory') plt.plot(データ列x, データ列y, color='ivory') データフレームから破壊的に重複した行をドロップする df.drop_duplicates(inplace=True) df.drop_duplicates(inplace=True) 折れ線グラフの印を左三角印にする plt.plot(データ列x, データ列y, marker='<') plt.plot(データ列x, データ列y, marker='<') nを十六進リテラルにする hex(n) hex(n) 縦棒グラフの色を青緑にする plt.bar(データ列x, データ列y, color='teal') plt.bar(データ列x, データ列y, color='teal') 文字列を最後から空白で区切る s.rsplit() s.rsplit() ホワイト色の線グラフを描画する plt.plot(データ列x, データ列y, color='white') plt.plot(データ列x, データ列y, color='white') option: 改行をセパレータで使用する sep = '\n' sep = '\n' 折れ線グラフの星印を黒色にする plt.plot(データ列x, データ列y, marker='*', markerfacecolor='k') plt.plot(データ列x, データ列y, marker='*', markerfacecolor='k') 多次元尺度構成法で多次元データをパステル調に次元に次元削減する sklearn.manifold.MSD(n_components=N).fit_transform(多次元データ) sklearn.manifold.MSD(n_components=N).fit_transform(多次元データ) ブラウン色の線グラフを描画する plt.plot(データ列x, データ列y, color='brown') plt.plot(データ列x, データ列y, color='brown') 文字列中に部分文字列が存在しない sub not in s sub not in s 'A'列の値によってデータフレームを集約して、列挙する [(name, group) for name, group in df.groupby('A')] [(name, group) for name, group in df.groupby('A')] option: 印を大バツに変える marker = 'X' marker = 'X' 赤い下三角マーカーで散布図を描く plt.plot(データ列x, データ列y, marker='v', c='r') plt.plot(データ列x, データ列y, marker='v', c='r') ヒストグラムの色をホワイトに変更する plt.hist(データ列, color='white') plt.hist(データ列, color='white') 整数nを二進数リテラルに変換する bin(n) bin(n) ホワイト色の棒グラフを描画する plt.bar(データ列x, データ列y, color='white') plt.bar(データ列x, データ列y, color='white') 散布図をバツマーカーで描画する plt.scatter(データ列x, データ列y, marker='x') plt.plot(データ列x, データ列y, marker='x') 変数をマゼンタでプリントできる文字列に変換する f'\033[35m{value}\033[0m' f'\033[35m{value}\033[0m' option: タブを区切りで用いる sep = '\t' sep = '\t' 赤色としてヒストグラムを描画する plt.hist(データ列, color='red') plt.hist(データ列, color='red') クラス分類の適合率と再現率の調和平均を算出する sklearn.metrics.f1_score(正解データ列, 予測データ列) sklearn.metrics.f1_score(正解データ列, 予測データ列) 棒グラフを珊瑚色で描画する plt.bar(データ列x, データ列y, color='coral') plt.bar(データ列x, データ列y, color='coral') 数字を全て使う string.digits string.digits 表データから列を三つ選択する df[[column, column2, column3]] df[[column, column2, column3]] 縦棒グラフの色をダークオレンジにする plt.bar(データ列x, データ列y, color='darkorange') plt.bar(データ列x, データ列y, color='darkorange') データフレームの正規分布に対する上下広がり df.skew() df.skew() ダークサーモン色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='darksalmon') plt.bar(データ列x, データ列y, color='darksalmon') ファイルを開いて]、バイナリ書き込みストリームを求める open(filepath, mode='wb') open(filepath, mode='wb') タプルから計数器を作る collections.Counter(aDict) collections.Counter(aDict) カラーバーを描く plt.colorbar() plt.colorbar() データフレームの列と列の相関行列をヒートマップでグラフ化する sns.heatmap(df[[column, column2]].corr()) sns.heatmap(df[[column, column2]].corr()) 散布図のポイントマーカーの太さを変更する plt.scatter(データ列x, データ列y, marker='.', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='.', markeredgewidth=2.5) 日付時刻データの曜日を使う aDatetime.weekday() aDatetime.weekday() ブラックにヒストグラムの色を指定する plt.hist(データ列, color='black') plt.hist(データ列, color='black') グリーンイエロー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='greenyellow') plt.bar(データ列x, データ列y, color='greenyellow') 双方向キューをタプルにする tuple(deq) tuple(deq) 数値を因数分解する sympy.factor(e) sympy.factor(e) option: ラベンダーブラッシュ色を用いる color = 'lavenderblush' color = 'lavenderblush' option: ダークスラテグレーに色を設定する color = 'darkslategray' color = 'darkslategray' キーが辞書上でまだ定義されていない key not in aDict key not in aDict 文字列のUNIX時間から日付データにする pd.to_datetime(s, unit='s', utc=True) pd.to_datetime(s, unit='s', utc=True) t分布型確率的近傍埋め込み法を行う model = sklearn.manifold.TSNE(n_components=n) model = sklearn.manifold.TSNE(n_components=n) 文字列の中のASCII限定として正規表現によるマッチを使う re.findall(pattern, s, flags=re.ASCI) re.findall(pattern, s, flags=re.ASCI) 散布図の左三角印の色を指定する plt.scatter(データ列x, データ列y, marker='<', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='<', markerfacecolor='#800080') 縦棒グラフの色をアンティークホワイトにする plt.bar(データ列x, データ列y, color='antiquewhite') plt.bar(データ列x, データ列y, color='antiquewhite') タプル内の要素が少なくとも一つ真か any(aTuple) any(aTuple) スラグレー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='slategray') plt.bar(データ列x, データ列y, color='slategrey') ネイビーにヒストグラムの色を設定する plt.hist(データ列, color='navy') plt.hist(データ列, color='navy') TSV形式のファイルからデータフレームを読む pd.read_csv(filename, sep='\t', encoding='shift_jis') pd.read_csv(filename, sep='\t', encoding='utf-8') 無限にnから数え上げるする itertools.count(start=n) itertools.count(start=n) 線グラフの色をブランチドアーモンドにセットする plt.plot(データ列x, データ列y, color='blanchedalmond') plt.plot(データ列x, データ列y, color='blanchedalmond') グラフのx軸を対数に変更する plt.xscale('log') plt.xscale('log') パラメータについて数値をn階微分する sympy.diff(e, z, n) sympy.diff(e, z, n) ファイルパスをUTF8としてオープンする] open(filepath, encoding='utf-8') open(filepath, encoding='utf-8') グラフを全般的に明るくする sns.set(pallete='bright') sns.set(pallete='bright') データ列を丸めて整数にする ds.round().astype(int) ds.round().astype(int) option: フォントの色をライトブルーに設定する color = 'lightblue' color = 'lightblue' 非小文字が文字列中にあるか調べる s.islower() any(not c.islower() for c in s) 折れ線グラフをミディアムブルー色として描画する plt.plot(データ列x, データ列y, color='mediumblue') plt.plot(データ列x, データ列y, color='mediumblue') データフレームがどの程度分散しているか見る df.var() df.var() 散布図に丸印を使う plt.scatter(データ列x, データ列y, marker='o') plt.scatter(データ列x, データ列y, marker='o') データ列をリストを境界値としてビンニングする pd.cut(ds, aList) pd.cut(ds, aList) データフレームを各列と列の組み合わせ毎にグループ分けして、平均値を計算する df.groupby([column, column2], as_index=False).mean() df.groupby([column, column2], as_index=False).mean() 線グラフの色をペールグリーンに指定する plt.plot(データ列x, データ列y, color='palegreen') plt.plot(データ列x, データ列y, color='palegreen') 数列とリストについての散布図に上三角マーカーをプロットする plt.plot(データ列x, データ列y, marker='^') plt.plot(データ列x, データ列y, marker='^') リストの末尾のn要素を捨てる aList[:-n] aList[:-n] 線グラフを実線を用いて描く plt.plot(データ列x, データ列y, linestyle='solid') plt.plot(データ列x, データ列y, linestyle='solid') リストをひとつ置きに得る aList[::2] aList[::2] option: 色をダークグレーに設定する color = 'darkgrey' color = 'darkgrey' option: ミディアムパープルを使う color ='mediumpurple' color = 'mediumpurple' option: グラフの線のスタイルを一点鎖線にする linestyle = 'dashbot' linestyle = 'dashbot' 赤い左三角マーカーとして散布図を描画する plt.plot(データ列x, データ列y, marker='<', c='r') plt.plot(データ列x, データ列y, marker='<', c='r') ヒストグラムをパールゴールデンロッド色として描画する plt.hist(データ列, color='palegoldenrod') plt.hist(データ列, color='palegoldenrod') 要素が全て1の配列を初期化する np.ones(要素数, dtype=np.int) np.ones(要素数, dtype=np.int) データフレームのリストカラムのNaNを最小値で埋める df[aList].fillna(df[aList].min()) df[aList].fillna(df[aList].min()) 小数点数のk進対数 math.log(x, k) math.log(x, k) 散布図をダークバイオレット色として描画する plt.scatter(データ列x, データ列y, color='darkviolet') plt.scatter(データ列x, データ列y, color='darkviolet') 文字列を変数に変換する sympy.Symbol(s) sympy.Symbol(s) 双方向キューをリストに変換する list(deq) list(deq) 散布図の左三角マーカーの大きさを設定する plt.scatter(データ列x, データ列y, marker='<', markersize=2.0) plt.scatter(データ列x, データ列y, marker='<', markersize=2.0) JSON文字列を辞書に変換する dict(jsonString) json.loads(jsonString) 線グラフをペルー色で描画する plt.plot(データ列x, データ列y, color='peru') plt.plot(データ列x, データ列y, color='peru') 散布図をインディゴ色を使って描画する plt.scatter(データ列x, データ列y, color='indigo') plt.scatter(データ列x, データ列y, color='indigo') 文字列の最初から不要な空白やタブを取り除く s.lstrip() s.lstrip() 入力から二つの文字列値を読む A, B = map(str, input().split()) A, B = map(str, input().split()) タプルの浅いコピーを作成する aDict.copy() aDict.copy() 文字列中に部分文字列が含まれるかどうか調べる sub in s sub in s グラフの全般的にパレットを淡くする sns.set(pallete='muted') sns.set(pallete='muted') 双方向キューのstart番目からend番目までの部分要素 collections.deque(itertools.islice(deq, start, end)) collections.deque(itertools.islice(deq, start, end)) データを最大値を用いて正規化を行う sklearn.preprocessing.MaxAbsScaler().fit_transform(データ) sklearn.preprocessing.MaxAbsScaler().fit_transform(データ) 半透明の一点鎖線でリストの推移を描画する plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) 散布図のバツマーカーを青色にする plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='b') plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='b') 折れ線グラフの色をコーラルに変更する plt.plot(データ列x, データ列y, color='coral') plt.plot(データ列x, データ列y, color='coral') option: 上三角マーカーを使う marker = '^' marker = '^' 辞書の項目名を要素に設定する aDict[key] = element aDict[key] = element データ列の各値の出現回数を求める ds.value_counts() ds.value_counts() 浮動小数点数の分数近似 sys.limit_denominator q.limit_denominator(max_denominator=1000000) Pandasでフォーマットfmtを用いて文字列を日付データにする pd.to_datetime(s, format=fmt) pd.to_datetime(s, format=fmt) データフレームのリストカラムの欠損値を平均で補う df[aList].fillna(df[aList].mean()) df[aList].fillna(df[aList].mean()) 全要素を0で初期化した行列を作る np.zeros(行数, 列数) np.zeros(行数, 列数) 縦棒グラフを描画し、、中央寄せする plt.bar(ラベル列, データ列, align='center') plt.bar(ラベル列, データ列, align='center') ヘッダを指定せずTSVを読み込む pd.read_csv(filename, header=None) pd.read_csv(filename, header=None) option: フォントの色をカデットブルーに設定する color = 'cadetblue' color = 'cadetblue' 線グラフを青い実線で描画する plt.plot(データ列x, データ列y, linestyle='solid', color='b') plt.plot(データ列x, データ列y, linestyle='solid', color='b') ホワイトスモーク色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='whitesmoke') plt.plot(データ列x, データ列y, color='whitesmoke') 勾配ブースティングとして回帰分析を行う model = sklearn.ensemble.GradientBoostingRegressor() model = sklearn.ensemble.GradientBoostingRegressor() 中央値でデータ列をビニングする pd.qcut(ds, 2) pd.qcut(ds, 2) 線グラフをシエナ色を使って描画する plt.plot(データ列x, データ列y, color='sienna') plt.plot(データ列x, データ列y, color='sienna') オーキッドにヒストグラムの色を変更する plt.hist(データ列, color='orchid') plt.hist(データ列, color='orchid') シルバー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='silver') plt.bar(データ列x, データ列y, color='silver') キューの中に数値はある element in deq element in deq option: デピンクにグラフの色を設定する color = 'deeppink' color = 'deeppink' タイムスタンプデータをn分前にする aDatetime - datetime.timedelta(minutes=n) aDatetime - datetime.timedelta(minutes=n) 線形回帰モデルの係数 model.coe model.coef_ 'A'列ででデータフレームを降順にソートする df.sort_values(by='A', ascending=False) df.sort_values(by='A', ascending=False) エポック秒のデータ列からタイムスタンプに変換する pd.to_datetime(ds, unit='s', utc=True) pd.to_datetime(ds, unit='s', utc=True) シルバー色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='silver') plt.bar(データ列x, データ列y, color='silver') データ列の推移を一点鎖線で描画する plt.plot(データ列x, データ列y, linestyle='dashbot') plt.plot(データ列x, データ列y, linestyle='dashbot') 散布図をタン色を使って描画する plt.scatter(データ列x, データ列y, color='tan') plt.scatter(データ列x, データ列y, color='tan') 散布図をコーラル色を用いて描画する plt.scatter(データ列x, データ列y, color='coral') plt.scatter(データ列x, データ列y, color='coral') 集合をイミュータブルにする frozenset(aSet) frozenset(aSet) データフレームを四捨五入する df.round() df.round() 文字列を部分文字列で分けた場合の残りの文字列 s.partition(sub)[-1] s.partition(sub)[-1] option: 色をカーキに指定する color = 'khaki' color = 'khaki' 行列の行を選択する aArray[行番号] aArray[行番号] データフレームを列名リストの値によってグループ分けする df.groupby(columns) df.groupby(columns) ファイルを開いて]、書き込みストリームを使う open(filepath, mode='w') open(filepath, mode='w') option: グラフの色をダークバイオレットに変更する color = 'darkviolet' color = 'darkviolet' 浮動小数点数とyの斜辺 math.hypot(x, y) math.hypot(x, y) 線グラフの色を茶色に設定する plt.plot(データ列x, データ列y, color='brown') plt.plot(データ列x, データ列y, color='brown') y軸の表示範囲を変更する plt.ylim(目盛りの値 plt.ylim(最小値, 最大値) データフレームの内で何行、重複するか見る df.duplicated().sum() df.duplicated().sum() 日付データのデータフレームのカラムをデータフレームのインデックスにする df.index = pd.DatetimeIndex(df.columns) df.index = pd.DatetimeIndex(df[col]) データフレームのカラムの正規分布に対する上下広がり df[col].skew() df[col].skew() option: グラフの色をライトグレーに変更する color = 'lightgray' color = 'lightgrey' 逆双曲線正弦を求める math.asinh(x) math.asinh(x) サンディーブラウン色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='sandybrown') plt.bar(データ列x, データ列y, color='sandybrown') option: グラフの色をゲインズボロに変更する color = 'gainsboro' color = 'gainsboro' データフレームから型リストのデータ型の列を除外する df.select_dtypes(exclude=typeList) df.select_dtypes(exclude=typeList) 棒グラフをパールバイオレットレッド色として描画する plt.bar(データ列x, データ列y, color='palevioletred') plt.bar(データ列x, データ列y, color='palevioletred') option: グラフの色をシーグリーンに変更する color ='seagreen' color = 'seagreen' option: グラフの種類を点線に変更する linestyle = 'dotted' linestyle = 'dotted' リストのn番目にオブジェクトを挿入する aList.insert(n, element) aList.insert(n, element) 文字列の左側 s[0] s[0] option: ミスティローズを使う color ='mistyrose' color = 'mistyrose' データフレームの列の値が欠損値 df[col].isna() df[col].isna() ヒストグラムの色をブラウンに設定する plt.hist(データ列, color='brown') plt.hist(データ列, color='brown') option: グラフの色をピンクに指定する color = 'pink' color = 'pink' ハニーデュー色で散布図を描画する plt.scatter(データ列x, データ列y, color='honeydew') plt.scatter(データ列x, データ列y, color='honeydew') option: 箱ひげ図を横向きにする vert = False vert = False ダークゴールデンロッド色で線グラフを描画する plt.plot(データ列x, データ列y, color='darkgoldenrod') plt.plot(データ列x, データ列y, color='darkgoldenrod') 文字列の開始位置から終了位置の範囲で部分文字列の出現をカウントする s.count(sub, start, end) s.count(sub, start, end) ベクトルのユニークな値を要素とする配列 np.unique(aArray) np.unique(aArray) ダークスレートブルー色を用いて線グラフを描画する plt.plot(データ列x, データ列y, color='darkslateblue') plt.plot(データ列x, データ列y, color='darkslateblue') データフレームの中のカラムをビン分割する pd.cut(df[col], aList) pd.cut(df[col], aList) リストとリストについての散布図に右三角マーカーを描く plt.plot(データ列x, データ列y, marker='>') plt.plot(データ列x, データ列y, marker='>') データフレームをグループ化し、それぞれの列に対し個数を算出する df.groupby(column)[column2].count() df.groupby(column)[column2].count() 縦棒プロットを描画して、バーの幅を調整する plt.bar(ラベル列, データ列, width=0.5) plt.bar(ラベル列, データ列, width=0.5) 集合の浅いコピーを作る aSet.copy() aSet.copy() 青い星印を折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='*', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='*', markerfacecolor='b') 縦棒グラフをドジャーブルー色で描画する plt.bar(データ列x, データ列y, color='dodgerblue') plt.bar(データ列x, データ列y, color='dodgerblue') データフレームのリスト列の分散 df[aList].var() df[aList].var() ファイル名がテキストファイルかどうか調べる filename.endswith('.txt') filename.endswith('.txt') t分布型確率的近傍埋め込み法で淡く次元に次元削減する sklearn.manifold.TSNE(n_components=三).fit_transform(多次元データ) sklearn.manifold.TSNE(n_components=三).fit_transform(多次元データ) 紺碧色を用いて散布図を描画する plt.scatter(データ列x, データ列y, color='azure') plt.scatter(データ列x, データ列y, color='azure') 横棒グラフをカデットブルー色として描画する plt.barh(データ列x, データ列y, color='cadetblue') plt.barh(データ列x, データ列y, color='cadetblue') データフレームを列ごとに分類して、グループの平均値を求める df.groupby(column).mean() df.groupby(column).mean() 空白文字 ' ' ' ' スプリンググリーンにヒストグラムの色を設定する plt.hist(データ列, color='springgreen') plt.hist(データ列, color='springgreen') nが正の数かどうか調べる n > 0 n > 0 要素が全て1のベクトルを作る np.ones(要素数, dtype=np.int) np.ones(要素数, dtype=np.int) Pandasでタイムスタンプのデータフレームのカラムをインデックスにする df.set_index(col, inplace=True) df.index = pd.DatetimeIndex(df[col]) nをn2だけ小さくする n -= n2 n -= n2 縦棒グラフをダークグレー色を用いて描画する plt.bar(データ列x, データ列y, color='darkgray') plt.bar(データ列x, データ列y, color='darkgrey') 散布図の上三角マーカーを青くする plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='b') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='b') option: 三角マーカーを加える marker = '^' marker = '^' option: デピンクを使う color = 'deeppink' color = 'deeppink' 書き込みモードとしてファイルを開いて]、fとする f = open(filepath, mode='w') f = open(filepath, mode='w') 二つのデータ列の散布図として残差を描画する sns.residplot(x=データ列, y=データ列) sns.residplot(x=データ列, y=データ列) 横方向に3つのデータフレームを連結する pd.concat([df, df2, df3], axis=1) pd.concat([df, df2, df3], axis=1) 縦棒グラフをカデットブルー色として描画する plt.bar(データ列x, データ列y, color='cadetblue') plt.bar(データ列x, データ列y, color='cadetblue') option: コーンズシルクを用いる color = 'cornsilk' color = 'cornsilk' option: 色をスノーに設定する color ='snow' color = 'snow' カラムの欠損値を最頻値にする ds.fillna(ds.mode().iloc[0]) ds.fillna(ds.mode().iloc[0]) データを四分位点でスケール変換する sklearn.preprocessing.RobustScaler().fit_transform(データ) sklearn.preprocessing.RobustScaler().fit_transform(データ) クラス分類をバギングを使って行う model = sklearn.ensemble.BaggingClassifier(n_estimators=10) model = sklearn.ensemble.BaggingClassifier(n_estimators=10) 文字列の末尾から部分文字列を取り除く s.rstrip(sub) s.removesuffix(sub) オレンジレッド色としてヒストグラムを描画する plt.hist(データ列, color='orangered') plt.hist(データ列, color='orangered') リストと数列について散布図を描画して、右三角マーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='>', c=rgb) plt.plot(データ列x, データ列y, marker='>', c=rgb) データフレームのメディアンを算出する df.median() df.median() ベージュ色で散布図を描画する plt.scatter(データ列x, データ列y, color='beige') plt.scatter(データ列x, データ列y, color='beige') データフレームの各グループごとの個数を計算する df.groupby(column).count() df.groupby(column).count() option: グラフの色をダークターコイズに変更する color = 'darkturquoise' color = 'darkturquoise' option: 改行しないように設定する end = '' end = '' 実行結果を黒色でプリントする print(f'\033[30m{value}\033[0m') print(f'\033[30m{value}\033[0m') ケンドールの順位相関係数を求める scipy.stats.kendalltau(データ列, データ列2) scipy.stats.kendalltau(データ列, データ列2) リストの最後を除く aList[-1] aList[:-1] option: 線の幅を3.0ポイントに指定する linewidth = 3.0 linewidth = 3.0 データフレームの最初n行 df.head(n) df.head(n) 列のイミュータブルなセット frozenset(iterable) frozenset(iterable) 新しいロバスト分類モデルを新規作成する model = sklearn.linear_model.RANSACClassifier(random_state=0) model = sklearn.linear_model.RANSACClassifier(random_state=0) 文字列を文字コードでバイト列にする s.encode(encoding='sjis', errors='%.2f%%') s.encode(encoding=encoding) 縦棒グラフの色をダークカーキにする plt.bar(データ列x, データ列y, color='darkkhaki') plt.bar(データ列x, データ列y, color='darkkhaki') ヒストグラムの色をダークサーモンにセットする plt.hist(データ列, color='darksalmon') plt.hist(データ列, color='darksalmon') スチールブルー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='steelblue') plt.bar(データ列x, データ列y, color='steelblue') 線グラフの色を黄色に設定する plt.plot(データ列x, データ列y, color='yellow') plt.plot(データ列x, データ列y, color='yellow') データフレームのカラムの中に含まれる文字列の合計を数える df[col].isin([value]).sum() df[col].isin([value]).sum() データフレームの中のカラムをn個にビン分割して、namesのラベルをつける pd.cut(df[col], n, labels=names) pd.cut(df[col], n, labels=names) 折れ線グラフをハニーデュー色として描画する plt.plot(データ列x, データ列y, color='honeydew') plt.plot(データ列x, データ列y, color='honeydew') 第2引数で指定したファイルの名前 sys.argv[1] sys.argv[1] サンディーブラウンにヒストグラムの色を設定する plt.hist(データ列, color='sandybrown') plt.hist(データ列, color='sandybrown') 文字列中のカタカナをひらがなに変換する ('\u4E00' <= ch <= ch <= 'u9FD0') ''.join([chr(ord(ch) - 96) if ('ァ' <= ch <= 'ン') else ch for ch in s]) 文字列中にひとつでも非英字が含まれるか any(not c.isalpha() for c in s) any(not c.isalpha() for c in s) 昇順にタプルの要素を並べる sorted(aTuple, reverse=True) sorted(aTuple, reverse=True) 配列とリストの散布図をプロットして、その大きさをnにする plt.scatter(データ列x, データ列y, s=n) plt.scatter(データ列x, データ列y, s=n) データフレームの欠損値がある箇所に df.dropna() df.style.highlight_null() 切片なしの回帰モデルを作る model = sklearn.linear_model.LinearRegression(fit_intercept=False) model = sklearn.linear_model.LinearRegression(fit_intercept=False) 線グラフの色をライトスレイグレーに指定する plt.plot(データ列x, データ列y, color='lightslategrey') plt.plot(データ列x, データ列y, color='lightslategrey') 線グラフの色をダークオーキッドに設定する plt.plot(データ列x, データ列y, color='darkorchid') plt.plot(データ列x, データ列y, color='darkorchid') データフレームの列を折れ線グラフとして作図する plt.plot(df[column], df[column]) plt.plot(df[column], df[column]) 主成分分析で多次元データをパステル調に次元に次元削減する sklearn.decomposition.PCA(n_components=N).fit_transform(多次元データ) sklearn.decomposition.PCA(n_components=N).fit_transform(多次元データ) ミッドナイトブルー色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='midnightblue') plt.barh(データ列x, データ列y, color='midnightblue') 文字列で区切って二つの値をプリントする print(value, value2, sep=s) print(value, value2, sep=s) データ列の第一四分位数を求める ds.quantile(0.25) ds.quantile(0.25) プログラムの実行を強制的に終える sys.exit() sys.exit() option: グラフの色をベージュに指定する color = 'beige' color = 'beige' 折れ線グラフをパレットトルコイズ色として描画する plt.plot(データ列x, データ列y, color='paleturquoise') plt.plot(データ列x, データ列y, color='paleturquoise') ブルーバイオレット色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='blueviolet') plt.plot(データ列x, データ列y, color='blueviolet') 赤い大バツマーカーをデータ列とリストについての散布図に描画する plt.plot(データ列x, データ列y, marker='X', c='r') plt.plot(データ列x, データ列y, marker='X', c='r') ホールドアウト法を用いる X_train, X_test, y_train, y_train, y_test = train_test_size=0.3, y_test_train, y_train, y_test_split(説明変数, 目的変数, test_size=0.3) X_train, X_test, y_train, y_test = train_test_split(説明変数, 目的変数, test_size=0.3) プラットホームはWindows sys.platform.startswith('darwin') sys.platform.startswith('win32') 文字列の末尾から部分文字列を除く s.rfind(sub) s.rstrip(sub) 辞書をJSON形式の文字列にする json.dumps(aDict, ensure_ascii=False) json.dumps(aDict, ensure_ascii=False) option: グラフの色をイエローグリーンに変更する color = 'yellowgreen' color = 'yellowgreen' 散布図をグレー色を使って描画する plt.scatter(データ列x, データ列y, color='grey') plt.scatter(データ列x, データ列y, color='grey') 散布図にrgbの大バツマーカーを用いる plt.plot(データ列x, データ列y, marker='X', c=rgb) plt.plot(データ列x, データ列y, marker='X', c=rgb) 散布図の左三角印を黒くする plt.scatter(データ列x, データ列y, marker='<', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='<', markerfacecolor='k') nの二乗を求める n ** 2 n ** 2 option: ラインを細くする linestyle = 'dotted' linewidth = 3.0 横棒グラフをオレンジ色として描画する plt.barh(データ列x, データ列y, color='orange') plt.barh(データ列x, データ列y, color='orange') option: グラフの色をダークオリーブグリーンに変更する color = 'darkolivegreen' color = 'darkolivegreen' よりランダムなランダムフォレストでクラス分類を行う model = sklearn.ensemble.RandomForestClassifier() model = sklearn.ensemble.ExtraTreeClassifier(n_estimators=10) Pythonのバージョンを知る sys.version sys.version タプルの中の一番大きい値 maxlen(aTuple) max(aTuple) 折れ線グラフに菱形マーカーを加える plt.plot(データ列x, データ列y, marker='D') plt.plot(データ列x, データ列y, marker='D') nとn2のシートをエクセルファイルファイルから読み込む pd.read_excel(filename, sheet_name=[n, n2]) pd.read_excel(filename, sheet_name=[n, n2]) 横棒グラフをピンク色として描画する plt.barh(データ列x, データ列y, color='pink') plt.barh(データ列x, データ列y, color='pink') 列の文字列長を列として使う ds.str.len() ds.str.len() 折れ線グラフを淡いピンク色色を用いて描画する plt.plot(データ列x, データ列y, color='lightpink') plt.plot(データ列x, データ列y, color='lightpink') option: 色をダークマゼンタに設定する color = 'darkmagenta' color = 'darkmagenta' ヒストグラムの色をピーチパフにする plt.hist(データ列, color='peachpuff') plt.hist(データ列, color='peachpuff') option: 色をアクアに設定する color = 'aqua' color = 'aqua' グレー色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='gray') plt.plot(データ列x, データ列y, color='gray') ライトグリーンにヒストグラムの色を設定する plt.hist(データ列, color='lightgreen') plt.hist(データ列, color='lightseagreen') 回帰分析をブースティングで行う model = sklearn.ensemble.AdaBoostRegressor(n_estimators=10) model = sklearn.ensemble.AdaBoostRegressor(random_state=0, n_estimators=100) 表をグループ化し、各列に対し平均値を求める df.groupby(column)[column2].mean() df.groupby(column)[column2].mean() データフレームの最初の列以外を説明変数にする 説明変数 = df[df.columns[1:]] 説明変数 = df[df.columns[1:]] 複素数型の全要素を0で初期化した行列 np.zeros(行数, 列数, dtype=bool) np.zeros(行数, 列数, dtype=bool) データフレームを列で並べる df.sort_values(by=column) df.sort_values(by=column) データフレームのカラムの文字列をNaNに変換する df[col].replace(s, np.nan) df[col].replace(s, np.nan) 複数の列の値によってデータフレームをグループ分けして、列挙する [(name, group) for name, group in df.groupby(columns)] [(name, group) for name, group in df.groupby(columns)] ミントクリーム色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='mintcream') plt.plot(データ列x, データ列y, color='mintcream') 縦棒グラフの色をディムグレーにする plt.bar(データ列x, データ列y, color='dimgrey') plt.bar(データ列x, データ列y, color='dimgray') データ列の値が正規分布にしたがって発生する確率を算出する scipy.stats.norm.pdf(データ列, loc=平均値, scale=標準偏差) scipy.stats.norm.pdf(データ列, loc=平均値, scale=標準偏差) 3変数の最小値 min(x, y, z, min) min(x, y, z) データ列の折れ線グラフを右三角印で描画する plt.plot(データ列x, データ列y, marker='>') plt.plot(データ列x, データ列y, marker='>') 列からひとつランダムに選ぶ random.choice(iterable) random.choice(iterable) オブジェクトを文字列にする str(obj) str(obj) option: グラフの種類を破線にセットする linestyle = 'dashed' linestyle = 'dashed' 折れ線グラフのポイントマーカーを赤色にする plt.plot(データ列x, データ列y, marker='.', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='.', markerfacecolor='r') データ列とデータ列について散布図を描画し、その大きさをnに設定する plt.scatter(データ列x, データ列y, s=n) plt.scatter(データ列x, データ列y, s=n) リストとリストについての散布図に黒いクロスマーカーをプロットする plt.plot(データ列x, データ列y, marker='x', c='k') plt.plot(データ列x, データ列y, marker='x', c='k') 赤い▽マーカーを用いて散布図を描画する plt.plot(データ列x, データ列y, marker='v', c='r') plt.plot(データ列x, データ列y, marker='v', c='r') クロスマーカーで散布図を描画する plt.plot(データ列x, データ列y, marker='x') plt.plot(データ列x, データ列y, marker='x') 横棒グラフをディムグレー色として描画する plt.barh(データ列x, データ列y, color='dimgrey') plt.barh(データ列x, データ列y, color='dimgray') option: ビスク色を使用する color = 'bisque' color = 'bisque' イテラブルを累積したイテラブルを求める itertools.accumulate(iterable, operator.mul) itertools.accumulate(iterable, operator.mul) 横棒グラフの色をやわらかい青にする plt.barh(データ列x, データ列y, color='cornflowerblue') plt.barh(データ列x, データ列y, color='cornflowerblue') 要素は集合のメンバーに含まれないか調べる element not in aSet element not in aSet ふたつの関係が真上位集合か調べる aSet > aSet2 aSet > aSet2 ユニコードに対応する文字 chr(unicode) chr(unicode) 複素数型のゼロ埋めされた配列 np.zeros(要素数, dtype=np.int32) np.zeros(要素数, dtype=bool) option: 平均を追記する showmeans = False showmeans = False option: グラフの色を珊瑚に設定する color = 'coral' color = 'coral' 両端キューを要素を出す deq.append(element) deq.popleft() 線グラフの色をライトスレイグレーに設定する plt.plot(データ列x, データ列y, color='lightslategray') plt.plot(データ列x, データ列y, color='lightslategray') データフレームを列で集約して、列の要約統計量を求める df.groupby(column).describe() df.groupby(column).describe()[column2] option: フォントの色をパウダーブルーに変更する color = 'powderblue' color = 'powderblue' カテゴリデータ列をベクトル化する sklearn.preprocessing.OneHotEncoder(sparse=False).fit_transform(データ列) sklearn.preprocessing.OneHotEncoder(sparse=False).fit_transform(データ列) データフレームのpercent分位数を計算する df.quantile(percent/100) df.quantile(percent/100) 縦棒グラフをライトコーラル色を用いて描画する plt.bar(データ列x, データ列y, color='lightcoral') plt.bar(データ列x, データ列y, color='lightcoral') データフレームのカラムの値が欠損値 df[col].isna() df[col].isna() 折れ線グラフの左三角印の色を変える plt.plot(データ列x, データ列y, marker='<', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='<', markerfacecolor='#800080') 文字列内にひとつでも空白が含まれるか確認する any(c.isspace() for c in s) any(c.isspace() for c in s) 'A'列によって表をまとめたグループを使う df.groupby('A') df.groupby('A') 下三角マーカーとして散布図を描画する plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') ブラック色でヒストグラムを描画する plt.hist(データ列, color='black') plt.hist(データ列, color='black') リストを箱髭図として可視化する plt.boxplot(データ列) plt.boxplot(データ列) ダークカーキ色で棒グラフを描画する plt.bar(データ列x, データ列y, color='darkkhaki') plt.bar(データ列x, データ列y, color='darkkhaki') 三整数の最大公約数 math.gcd(n, n2, n3) math.gcd(n, n2, n3) 文字列の先頭から空白を除去する s.lstrip() s.lstrip() 散布図の右三角マーカーを赤色にする plt.scatter(データ列x, データ列y, marker='>', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='>', markerfacecolor='r') ヒストグラムの色をナバホホワイトに変更する plt.hist(データ列, color='navajowhite') plt.hist(データ列, color='navajowhite') リストを分割数nで分割する pd.cut(aList, n) pd.cut(aList, n) option: 箱髭図を水平方向にする vert = False vert = False モードで列の欠損値を埋める ds.fillna(ds.mode().iloc[0]) ds.fillna(ds.mode().iloc[0]) グリーンにヒストグラムの色を設定する plt.hist(データ列, color='green') plt.hist(データ列, color='green') データフレームを'A'列の値でグループ化し要約統計量を計算する df.groupby('A').describe() df.groupby('A').describe() データフレームを列の値で集約して、個数を求める df.groupby(column).count() df.groupby(column).count() 重複した行のみを抽出する df[df.duplicated(keep=False)] df[df.duplicated(keep=False)] 散布図の四角印の大きさを変更する plt.scatter(データ列x, データ列y, marker='s', markersize=2.0) plt.scatter(データ列x, データ列y, marker='s', markersize=2.0) option: パレットトルコイズに色を設定する color = 'paleturquoise' color = 'paleturquoise' option: ダークシアグリーン色を用いる color = 'darkseagreen' color = 'darkseagreen' 数値を赤色でプリントできる文字列に変換する f'\033[31m{value}\033[0m' f'\033[31m{value}\033[0m' 正規分布にしたがってデータ列の値が発生する確率を求める "sklearn.preprocessing.Normalizer(norm=""r_val_score)" scipy.stats.norm.pdf(データ列, loc=平均値, scale=標準偏差) 散布図のダイアモンド印の色を設定する plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='#800080') ヒストグラムをピーチパフ色として描画する plt.hist(データ列, color='peachpuff') plt.hist(データ列, color='peachpuff') スラグレー色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='slategray') plt.barh(データ列x, データ列y, color='slategray') option: コーラル色を使用する color = 'coral' color = 'coral' 折れ線グラフをペルー色を用いて描画する plt.plot(データ列x, データ列y, color='peru') plt.plot(データ列x, データ列y, color='peru') 明るく色使いをグラフの描画で使う sns.set(pallete='bright') sns.set(pallete='bright') 列によってデータフレームをグループ化して、最小値を求める df.groupby(column).min() df.groupby(column).min() 実数のk進対数を算出する math.log(x, k) math.log(x, k) ダークグリーンにヒストグラムの色を設定する plt.hist(データ列, color='darkgreen') plt.hist(データ列, color='darkgreen') Pandasで、日付データのデータフレームのカラムをインデックスにする df.index = pd.DatetimeIndex(df[col]) df.index = pd.DatetimeIndex(df[col]) option: グリーンイエローを使う color = 'greenyellow' color = 'greenyellow' データフレームの中にある日付データと文字列の数を数える df.isin([value, value2]).sum() df.isin([value, value2]).sum() 折れ線グラフをやわらかい青色で描画する plt.plot(データ列x, データ列y, color='cornflowerblue') plt.plot(データ列x, データ列y, color='cornflowerblue') option: どのカラムもインデックスにしない index_col = None index_col = None 実数のバイナリ対数を求める math.log2(x) math.log2(x) 全ての印字 string.printable string.printable 線グラフを色付きの実線を用いてプロットする plt.plot(データ列x, データ列y, linestyle='solid', color='#800080') plt.plot(データ列x, データ列y, linestyle='solid', color='#800080') サーモン色としてヒストグラムを描画する plt.hist(データ列, color='salmon') plt.hist(データ列, color='salmon') 横棒グラフを紺色を用いて描画する plt.barh(データ列x, データ列y, color='darkblue') plt.barh(データ列x, データ列y, color='darkblue') データフレームのカラムのメディアン df.median() df[col].median() シルバー色を使って横棒グラフを描画する plt.barh(データ列x, データ列y, color='silver') plt.barh(データ列x, データ列y, color='silver') カテゴリでグループ化して、データフレームの全カラムの相関を可視化する sns.pairplot(df, hue='カテゴリ列') sns.pairplot(df, hue='カテゴリ列') 散布図のクロス印を赤くする plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='r') ヒストグラムの色をオリベドラブにする plt.hist(データ列, color='olivedrab') plt.hist(データ列, color='olivedrab') データフレームの列の歪度を求める df[col].kurt() df[col].kurt() 縦棒グラフをディープスカイブルー色として描画する plt.bar(データ列x, データ列y, color='deepskyblue') plt.bar(データ列x, データ列y, color='deepskyblue') スラグレー色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='slategray') plt.plot(データ列x, データ列y, color='slategrey') 双方向キューのn番目に数値を途中追加する deq.insert(n, element) deq.insert(n, element) ファイルパスを読み込み用にオープンして]、fとする f = open(filepath, mode='r') f = open(filepath, mode='r') ヒストグラムを横に並べてプロットする plt.hist([データ列, データ列, データ列], color=['b', 'r', 'g']) plt.hist([データ列, データ列], color=['b', 'r']) データフレームの上n行 df.tail(n) df.head(n) 数値をパラメータについて微分する sympy.diff(e, z) sympy.diff(e, z) データフレームを表示するとき折り返しをしない pd.set_option('expand_frame_repr', False) pd.set_option('expand_frame_repr', False) 配列のムーア・ペンローズの擬似逆行列を求める np.linalg.pinv(aArray) np.linalg.pinv(aArray) データフレームのカラムをヒストグラムにする plt.hist(df[column]) plt.hist(df[column]) データフレームの未入力値を平均値にセットする df.fillna(df.mean()) df.fillna(df.mean()) ゴールデンロッド色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='goldenrod') plt.plot(データ列x, データ列y, color='goldenrod') ライトスレイグレー色で棒グラフを描画する plt.bar(データ列x, データ列y, color='lightslategray') plt.bar(データ列x, データ列y, color='lightslategray') 文字列に漢字が使われているか調べる re.search('[あ-んア-ン', 'ン') re.search('[\u4E00-\u9FD0]', s) option: 改行コードをUNIXに指定する newline = '\n' newline = '\n' 配列の変遷を折れ線グラフにする plt.plot(range(len(データ列)), データ列2) plt.plot(range(len(データ列)), データ列) データフレームから重複するデータを消す df.drop_duplicates() df.drop_duplicates() 線グラフの色をグリーンイエローに指定する plt.plot(データ列x, データ列y, color='greenyellow') plt.plot(データ列x, データ列y, color='greenyellow') 折れ線グラフの色をグリーンイエローにセットする plt.plot(データ列x, データ列y, color='greenyellow') plt.plot(データ列x, データ列y, color='greenyellow') データフレームを列の値でグループ化してそれぞれのグループごとの最小値を求める df.groupby(column).min() df.groupby(column).min() タプルを文字列として一つにする aTuple[::2] ''.join(map(str, iterable)) カウンタからイテラブルを回数して引く aCounter.subtract(iterable) aCounter.subtract(iterable) nはタプルのいづれかか確認する n in aTuple n in aTuple 縦棒グラフをグリーンイエロー色で描画する plt.bar(データ列x, データ列y, color='greenyellow') plt.bar(データ列x, データ列y, color='greenyellow') 円プロットでデータ列の割合を可視化する plt.pie(データ列, startangle=90) plt.pie(データ列, startangle=90) 数列と配列の散布図をプロットし、、大バツマーカーの色をrgbに指定する plt.plot(データ列x, データ列y, marker='X', c=rgb) plt.plot(データ列x, データ列y, marker='X', c=rgb) ヒストグラムの線種を点線に設定する plt.hist(データ列, linestyle='dotted') plt.hist(データ列, linestyle='dotted') 符号付き整数の最大値を知る math.floor(x) sys.maxsize 縦棒グラフを貝殻色で描画する plt.bar(データ列x, データ列y, color='seashell') plt.bar(データ列x, データ列y, color='seashell') 2つのデータフレームをジョインする pd.merge(df, df2) pd.merge(df, df2) 浮動小数点数が正か x > 0 x > 0 option: どの列もインデックスに設定しない index_col = None index_col = None ヒストグラムの色を濃いシアンに設定する plt.hist(データ列, color='darkcyan') plt.hist(データ列, color='darkcyan') option: 書き込みモードに変更する mode = 'w' mode = 'w' 黒い星マーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='*', markerfacecolor='k') plt.plot(データ列x, データ列y, marker='*', markerfacecolor='k') 折れ線グラフに青い四角印を描画する plt.plot(データ列x, データ列y, marker='s', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='s', markerfacecolor='b') 全ての印字できる文字 string.printable string.printable ハニーデュー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='honeydew') plt.bar(データ列x, データ列y, color='honeydew') 赤い一点鎖線としてリストの推移をプロットする plt.plot(データ列x, データ列y, linestyle='dashbot', color='r') plt.plot(データ列x, データ列y, linestyle='dashbot', color='r') 横棒グラフをライトゴールドロディイエロー色を用いて描画する plt.barh(データ列x, データ列y, color='lightgoldenrodyellow') plt.barh(データ列x, データ列y, color='lightgoldenrodyellow') サンディーブラウン色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='sandybrown') plt.plot(データ列x, データ列y, color='sandybrown') リストと配列について散布図をプロットして、マーカーを下三角に設定する plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') カラムの空文字を欠損値に変換し、ドロップする ds.replace('', np.nan).dropna() ds.replace('', np.nan).dropna() ダークカーキにヒストグラムの色を設定する plt.hist(データ列, color='darkkhaki') plt.hist(データ列, color='darkkhaki') データフレームのカラムが何年か確認する df[col].dt.year df[col].dt.year バリーウッド色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='burlywood') plt.plot(データ列x, データ列y, color='burlywood') データ列の折れ線グラフを三角印で描画する plt.plot(データ列x, データ列y, marker='^') plt.plot(データ列x, データ列y, marker='^') データフレームを散布図でグラフ化してカテゴリ別にマーカーを変える sns.scatterplot(data=df, x='列名', y='列名', style='カテゴリ列') sns.scatterplot(data=df, x='列名', y='列名', style='カテゴリ列') データフレームから重複するデータをドロップする df.drop_duplicates() df.drop_duplicates() 線グラフを点線でプロットする plt.plot(データ列x, データ列y, linestyle='dotted') plt.plot(データ列x, データ列y, linestyle='dotted') 全8進数字 string.octdigits string.octdigits データフレームで、列の重複を見る df.duplicated(subset=column) df.duplicated(subset=column) 列は正規分布からどれだけ歪んでいるか見る ds.kurt() ds.kurt() 2つのオブジェクトは等しいか調べる obj == obj2 obj == obj2 一番右側の列をデータフレームから除く df[df.columns[1:]] df[df.columns[:-1]] UTF8でファイルをオープンする] open(filepath, encoding='utf-8') open(filepath, encoding='utf-8') 日付データが火曜日 aDate.weekday() == 1 aDate.weekday() == 1 大文字を小文字に変換する s.casefold() s.lower() パレットトルコイズ色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='paleturquoise') plt.bar(データ列x, データ列y, color='paleturquoise') option: フォントの色をグリーンに指定する color = 'green' color = 'green' データフレームのリストカラムを丸めて、整数にする df[aList].round().astype(int) df[aList].round().astype(int) ベージュ色として棒グラフを描画する plt.bar(データ列x, データ列y, color='beige') plt.bar(データ列x, データ列y, color='beige') 辞書から計数器を作る collections.Counter(aDict) collections.Counter(aDict) データフレームの列を破壊的に消す df.drop(column, axis=1, inplace=True) df.drop(column, axis=1, inplace=True) データを外れ値にロバストな標準化を行う sklearn.preprocessing.RANSACClassifier(n_components=N).fit_transform(データ) sklearn.preprocessing.RobustScaler().fit_transform(データ) 文字列の右側から部分文字列を除く s.rfind(sub) s.rstrip(sub) year年の日付をオブジェクト化する datetime.date(year=year, month=1, day=1) datetime.date(year=year, month=1, day=1) レモンシフォン色で棒グラフを描画する plt.bar(データ列x, データ列y, color='lemonchiffon') plt.bar(データ列x, データ列y, color='lemonchiffon') データフレームの未入力値を直後の値に指定する df.fillna(method='bfill') df.fillna(method='bfill') 2つのカウンタのいずれかに含まれる値を求める aCounter | aCounter2 aCounter | aCounter2 リストを文字列に変換してタブで結合する '\t'\t'.join(map(str, iterable)) '\t'.join(map(str, iterable)) 正弦の逆数 math.asin(x) math.asin(x) ふたつの集合のいずれか一方だけの集合を見る aSet.difference(aSet2) aSet.symmetric_difference(aSet2) 線グラフの色を深紅にセットする plt.plot(データ列x, データ列y, color='crimson') plt.plot(データ列x, データ列y, color='crimson') 実数の2乗 x ** 2 x ** 2 折れ線グラフの右三角印の線幅を変更する plt.plot(データ列x, データ列y, marker='>', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='>', markeredgewidth=2.5) nの各桁の総和を計算する itertools.combinations(iterable, n) sum(map(int, str(n))) 線グラフをターコイズ色で描画する plt.plot(データ列x, データ列y, color='turquoise') plt.plot(データ列x, データ列y, color='turquoise') 折れ線グラフの色をライトゴールドロディイエローにする plt.plot(データ列x, データ列y, color='lightgoldenrodyellow') plt.plot(データ列x, データ列y, color='lightgoldenrodyellow') 文字列内にひとつでも英数字があるか any(c.isalnum() for c in s) any(c.isalnum() for c in s) x座標の目盛を対数に変更する plt.xscale('log') plt.xscale('log') リストの全順列 itertools.permutations(iterable) itertools.permutations(iterable) リストの末尾にリストを追加して広げる aList.extend(aList2) aList.extend(aList2) データフレームの列がxである行を取り出す df[df[column] == x] df[df[column] == x] option: ミディアムバイオレットレッド色を使用する color ='mediumvioletred' color = 'mediumvioletred' 現在は何時か知る datetime.date.today().hour datetime.date.today().hour データフレームのカラムを小数点以下n桁で四捨五入する df[col].round(n) df[col].round(n) 読み込みモードを用いてファイルをオープンする] open(filepath, mode='r') open(filepath, mode='r') option: 耐火レンガにフォントの色を設定する color = 'firebrick' color = 'firebrick' 円プロットを完全な円にする plt.axis('equals') plt.axis('equals') option: レベッカパープル色を使用する color ='rebeccapurple' color = 'rebeccapurple' 折れ線グラフに丸マーカーを用いる plt.plot(データ列x, データ列y, marker='o') plt.plot(データ列x, データ列y, marker='o') グラフの描画で暗くパレットを使う sns.set(pallete='dark') sns.set(pallete='dark') 0で全要素を初期化した複素数型の行列 np.zeros(行数, 列数, dtype=bool) np.zeros(行数, 列数, dtype=bool) データフレームのカラムが文字列が含まれる行を抽出する df[df[column].str.contains(s)] df[df[column].str.contains(s)] データフレームを表示するとき、最大行数をnに設定する pd.set_option('display.max_rows', n) pd.set_option('display.max_rows', n) シエナ色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='sienna') plt.plot(データ列x, データ列y, color='sienna') プロットの色を全般的に色差別なくする sns.set(pallete='colorblind') sns.set(pallete='colorblind') 空のロジスティック回帰モデルを用意する model = sklearn.linear_model.LogisticRegression() model = sklearn.linear_model.LogisticRegression() データフレームの列の値がxより大きくx2より少ないデータを抽出する df[(x < df[column]) & (df[column] < x2)] df[(x < df[column]) & (df[column] < x2)] 散布図を黒いポイントマーカーで描画する plt.plot(データ列x, データ列y, marker='.', c='k') plt.plot(データ列x, データ列y, marker='.', c='k') 記号計算を使う import fractions import sympy 折れ線グラフのポイント印の線幅を設定する plt.plot(データ列x, データ列y, marker='.', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='.', markeredgewidth=2.5) 散布図に黒い三角印を描画する plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='k') サドルブラウンにヒストグラムの色を設定する plt.hist(データ列, color='saddlebrown') plt.hist(データ列, color='saddlebrown') ダークバイオレット色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='darkviolet') plt.plot(データ列x, データ列y, color='darkviolet') タイムスタンプデータとタイムスタンプデータの時間差 aDatetime - aDatetime2 aDatetime - aDatetime2 文字列をコロンによって分割し、列挙する s.split(':') s.split(':') 横棒グラフを青緑色で描画する plt.barh(データ列x, データ列y, color='teal') plt.barh(データ列x, データ列y, color='turquoise') リストと配列について散布図を描いて、ダイアモンドマーカーの色をrgbに指定する plt.plot(データ列x, データ列y, marker='D', c=rgb) plt.plot(データ列x, データ列y, marker='D', c=rgb) ヒストグラムをリネン色を使って描画する plt.hist(データ列, color='linen') plt.hist(データ列, color='linen') 行列にはいくつ要素があるか調べる aArray.size aArray.size ヒストグラムをシルバー色を用いて描画する plt.hist(データ列, color='silver') plt.hist(データ列, color='silver') 日付時刻データが木曜日かどうか調べる aDatetime.weekday() == 3 aDatetime.weekday() == 3 データフレームのヒートマップをグラフ化する sns.heatmap(df.corr()) sns.heatmap(df.corr()) オールドレース色として棒グラフを描画する plt.bar(データ列x, データ列y, color='oldlace') plt.bar(データ列x, データ列y, color='oldlace') リストとリストの散布図を描いて、三角マーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='^', c=rgb) plt.plot(データ列x, データ列y, marker='^', c=rgb) 混同行列を算出する 混同行列 = sklearn.metrics.confusion_matrix(正解データ列, 予測データ列) 混同行列 = sklearn.metrics.confusion_matrix(正解データ列, 予測データ列) イテラブルを配列にする np.array(iterable) np.array(iterable) 数列と配列の散布図に右三角マーカーを描画する plt.plot(データ列x, データ列y, marker='>') plt.plot(データ列x, データ列y, marker='>') データフレームの中の列を四分位数ごとに分割する pd.qcut(df[col], 4) pd.qcut(df[col], 4) nのビット長 n.bit_length(n) n.bit_length() 大文字を全部使う string.ascii_uppercase string.ascii_uppercase 折れ線グラフをコーンズシルク色を用いて描画する plt.plot(データ列x, データ列y, color='cornsilk') plt.plot(データ列x, データ列y, color='cornsilk') データ列と配列の散布図に▲マーカーをプロットする plt.plot(データ列x, データ列y, marker='^') plt.plot(データ列x, データ列y, marker='^') 散布図のバツマーカーの大きさを変える plt.scatter(データ列x, データ列y, marker='x', markersize=2.0) plt.scatter(データ列x, データ列y, marker='x', markersize=2.0) option: バイナリモードを用いる mode = 'rb' mode = 'rb' 整数nをバイト列にする n.to_bytes((n.bit=length() + 7) // 8, byteorder='big') n.to_bytes((n.bit_length() + 7) // 8, byteorder='big') データフレームの列の第一四分位数 df[col].quantile(0.25) df[col].quantile(0.25) サブ型 dtype(int) issubclass(サブクラス, クラス) 重複する行のみを取り出す df.duplicated() df[df.duplicated(keep=False)] 棒グラフをライトシアン色として描画する plt.bar(データ列x, データ列y, color='lightcyan') plt.bar(データ列x, データ列y, color='lightcyan') nがn2より大きいか確認する n > n2 n > n2 2つの文字列は等しくないかテストする s.isdisjoint(s) s != s2 データフレームをグループ化しそれぞれの列に対し最小値を求める df.groupby(column)[column2].min() df.groupby(column)[column2].min() option: エンコーディングをBOM付きに指定する encoding = 'utf_8_sig' encoding = 'utf_8_sig' クラスが名前付きタプル issubclass(C, tuple) issubclass(C, tuple) アークコサインを求める math.acos(x) math.acos(x) option: 右三角印を加える marker = '>' marker = '>' 青い上三角マーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='^', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='^', markerfacecolor='b') カテゴリで色分けして、カーネル密度分布をプロットする sns.kdeplot(x='列名', hue='カテゴリ列', data=df) sns.kdeplot(x='列名', hue='カテゴリ列', data=df) タプルをソートしてJSONフォーマットの文字列にする json.dumps(aDict, ensure_ascii=False) json.dumps(aDict, ensure_ascii=False, sort_keys=True) n個に列をビン分割する pd.cut(ds, n) pd.cut(ds, n) 折れ線グラフのダイアモンド印を黒くする plt.plot(データ列x, データ列y, marker='D', markerfacecolor='k') plt.plot(データ列x, データ列y, marker='D', markerfacecolor='k') 星マーカーを散布図に使う plt.plot(データ列x, データ列y, marker='*') plt.plot(データ列x, データ列y, marker='*') 折れ線グラフの左三角マーカーの色を指定する plt.plot(データ列x, データ列y, marker='<', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='<', markerfacecolor='#800080') 今日が月曜日 datetime.datetime.today().weekday() == 0 datetime.datetime.today().weekday() == 0 プロットの色をパステル調にする sns.set(pallete='pastel') sns.set(pallete='pastel') データフレームからカラムを4つ選択する df[[column, column2, column3, column3]] df[[column, column2, column3, column4]] 折れ線グラフをマゼンタ色として描画する plt.plot(データ列x, データ列y, color='magenta') plt.plot(データ列x, データ列y, color='magenta') 文字列中にひとつでも非空白が含まれる any(not c.isspace() for c in s) any(not c.isspace() for c in s) データフレームのリストカラムを10の位で四捨五入して、整数型にする df[aList].round(-1).astype(int) df[aList].round(-1).astype(int) 8ビット整数型の全要素を0で初期化した行列 np.zeros(行数, 列数, dtype=np.int8) np.zeros(行数, 列数, dtype=np.int8) 棒グラフをライトグリーン色を用いて描画する plt.bar(データ列x, データ列y, color='lightseagreen') plt.bar(データ列x, データ列y, color='lightseagreen') リストと数列について散布図を描いて、マーカーを菱形に設定する plt.plot(データ列x, データ列y, marker='D') plt.plot(データ列x, データ列y, marker='D') option: ベージュを用いる color = 'beige' color = 'beige' ライトスレイグレー色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='lightslategrey') plt.plot(データ列x, データ列y, color='lightslategray') 箱ヒゲ図を描画して、平均線を加える plt.boxplot(データ列, meanline=True) plt.boxplot(データ列, meanline=True) 文字列がリストに含まれるか element in aList element in aList データフレームの列の名前を一度に文字列を文字列に置換する df.columns = [str(x).replace(s, s2) for x in df.columns] df.columns = [str(x).replace(s, s2) for x in df.columns] オブジェクトが関数かどうか callable(obj) callable(obj) データフレームを各列と列の組み合わせ毎にグループ化し、、最小値を計算する df.groupby([column, column2], as_index=False).min() df.groupby([column, column2], as_index=False).min() 最大値・最小値で乱数を生成する random.randint(最小値, 最大値) random.randint(最小値, 最大値) 横棒プロットを描いて、ラベルを中央寄せする plt.barh(ラベル列, データ列, align='center') plt.barh(ラベル列, データ列, align='center') 文字列をカンマを用いて区切り、、列挙する s.split(',') s.split(',') 第2引数のファイルの名前 sys.argv[1] sys.argv[1] パレットを全般的に暗くする sns.set(pallete='dark') sns.set(pallete='dark') データフレームから指定された4つの列のみ抽出する df[[column, column2, column3, column4]] df[[column, column2, column3, column4]] 数列を二つ並べて箱ひげ図にする plt.boxplot([データ列, データ列]) plt.boxplot([データ列, データ列]) 散布図をホワイトスモーク色を用いて描画する plt.scatter(データ列x, データ列y, color='whitesmoke') plt.scatter(データ列x, データ列y, color='whitesmoke') option: バッファリングのサイズを小さくする buffering = 4096 buffering = 4096 文字列の右端から部分文字列を除く s.rstrip(sub) s.rstrip(sub) データフレームの列が正規表現文字列にマッチする行を取り出す df[df[column].str.match(s)] df[df[column].str.match(s)] 線グラフの色を耐火レンガに設定する plt.plot(データ列x, データ列y, color='firebrick') plt.plot(データ列x, データ列y, color='firebrick') ブルーバイオレット色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='blueviolet') plt.barh(データ列x, データ列y, color='blueviolet') レベッカパープルにヒストグラムの色を設定する plt.hist(データ列, color='rebeccapurple') plt.hist(データ列, color='rebeccapurple') データフレームを'A'列によって並べ、、更新する df.sort_values(by='A', inplace=True) df.sort_values(by='A', inplace=True) 配列を等量でn個にビニングする pd.qcut(aArray, n) pd.qcut(aArray, n) 散布図を三角マーカーを用いる描画する plt.plot(データ列x, データ列y, marker='^') plt.scatter(データ列x, データ列y, marker='^') option: 文字列を改行の代わりに用いる end = s end = s 散布図のマーカーをクロス印にする plt.scatter(データ列x, データ列y, marker='x') plt.scatter(データ列x, データ列y, marker='x') option: グラフの色をネイビーに指定する color = 'navy' color = 'navy' デックの末尾から値を取り除く deq.pop() deq.pop() 折れ線グラフの色をオリベドラブに変更する plt.plot(データ列x, データ列y, color='olivedrab') plt.plot(データ列x, データ列y, color='olivedrab') ダークゴールデンロッド色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='darkgoldenrod') plt.bar(データ列x, データ列y, color='darkgoldenrod') 日付と時刻から日付時刻を作る datetime.datetime(年, 月, 日, 時, 分, 秒) datetime.datetime(年, 月, 日, 時, 分, 秒) ユニコードエスケープで文字列をバイト列に変換する s.encode(encoding='unicode_escape') s.encode(encoding='unicode_escape') ブラックにヒストグラムの色を設定する plt.hist(データ列, color='black') plt.hist(データ列, color='black') イテラブルを文字列リストに変換して、部分文字列で結合する sub.join(map(str, iterable)) sub.join(map(str, iterable)) 縦棒グラフをサドルブラウン色として描画する plt.bar(データ列x, データ列y, color='saddlebrown') plt.bar(データ列x, データ列y, color='saddlebrown') option: フォントの色をライトシアンに設定する color = 'lightcyan' color = 'lightcyan' n個の要素があるリストを作る [element] * n [element] * n 文字列をユニコード列に変換する [ord(ch) for ch, s] [ord(ch) for ch in s] データフレームのリストカラムのモード df[aList].mode() df[aList].mode() 文字列を走査し正規表現に大文字・小文字を無視してマッチするか調べる re.search(pattern, s, flags=re.IGNORECASE) re.search(pattern, s, flags=re.IGNORECASE) 実数が整数かどうか確認する x.is_integer() x.is_integer() option: オールドレースにフォントの色を指定する color = 'oldlace' color = 'oldlace' ハニーデュー色としてヒストグラムを描画する plt.hist(データ列, color='honeydew') plt.hist(データ列, color='honeydew') 散布図をスレートブルー色として描画する plt.scatter(データ列x, データ列y, color='slateblue') plt.scatter(データ列x, データ列y, color='slateblue') 列の中に文字列と文字列がいくつ存在するか数える ds.isin([value, value2]).sum() ds.isin([value, value2]).sum() 赤い四角マーカーで散布図を描く plt.plot(データ列x, データ列y, marker='s', c='r') plt.plot(データ列x, データ列y, marker='s', c='r') ミディアムブルー色で棒グラフを描画する plt.bar(データ列x, データ列y, color='mediumblue') plt.bar(データ列x, データ列y, color='mediumblue') 折れ線グラフのダイアモンドマーカーの色を変える plt.plot(データ列x, データ列y, marker='D', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='D', markerfacecolor='#800080') 散布図をピンク色として描画する plt.scatter(データ列x, データ列y, color='pink') plt.scatter(データ列x, データ列y, color='pink') ヒストグラムをミディアムシアグリーン色を用いて描画する plt.hist(データ列, color='mediumseagreen') plt.hist(データ列, color='mediumseagreen') データフレームを十の位で丸める df.round(-1) df.round(-1) 大きさnで数列と配列の散布図を描画する plt.scatter(データ列x, データ列y, s=n) plt.scatter(データ列x, データ列y, s=n) option: グラフの色をライトスカイブルーに指定する color = 'lightskyblue' color = 'lightskyblue' option: データ型を指定する dtype = np.int16 dtype = np.int8 二つのデータ列の散布図として残差を描く sns.pairplot(df, x='列名', y='列名', y='列名', data=df) sns.residplot(x=データ列, y=データ列) 文字列のプレフィックスから部分文字列を除く s.find(sub) s.removeprefix(sub) データフレームのリスト列の値をValueMapでまとめて変更する df[aList].replace(ValueMap) df[aList].replace(ValueMap) 環境はウィンドウズ sys.platform.startswith('win32') sys.platform.startswith('win32') 散布図をロージーブラウン色を使って描画する plt.scatter(データ列x, データ列y, color='rosybrown') plt.scatter(データ列x, データ列y, color='rosybrown') グレー色でヒストグラムを描画する plt.hist(データ列, color='grey') plt.hist(データ列, color='grey') 半透明の一点鎖線としてデータ列の推移をプロットする plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) ファイルから書き込みストリームを開いて]、fとする f = open(filepath, mode='w') f = open(filepath, mode='w') 棒グラフをライトイエロー色を用いて描画する plt.bar(データ列x, データ列y, color='lightyellow') plt.bar(データ列x, データ列y, color='lightyellow') 散布図をライトグレー色として描画する plt.scatter(データ列x, データ列y, color='lightgray') plt.scatter(データ列x, データ列y, color='lightgrey') 整数の最大値 max(x, y) sys.maxsize スノー色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='snow') plt.barh(データ列x, データ列y, color='snow') 深紅色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='crimson') plt.barh(データ列x, データ列y, color='crimson') 分数を分母の最大値を指定して近似する q.limit_denominator(max_denominator=1000000) q.limit_denominator(max_denominator=1000000) 青いポイントマーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='.', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='.', markerfacecolor='b') nまでのスライス slice(n) slice(n) データフレームの列をヒストグラムを使って描画する plt.hist(データ列) plt.hist(df[column]) ヒストグラムをサドルブラウン色として描画する plt.hist(データ列, color='saddlebrown') plt.hist(データ列, color='saddlebrown') ベクトルの各要素に加算する aArray.keys() aArray + aArray2 option: 行列のデータ型を指定する dtype = np.uint8 dtype = np.int 棒グラフをリネン色を用いて描画する plt.bar(データ列x, データ列y, color='linen') plt.bar(データ列x, データ列y, color='linen') ヒストグラムの色をダークスレートブルーに変更する plt.hist(データ列, color='darkslateblue') plt.hist(データ列, color='darkslateblue') Pandasでフォーマットでデータ列を日付データにする pd.to_datetime(ds, format='%Y-%m-%d') pd.to_datetime(ds, format='%Y-%m-%d') データフレームのカラムの時を見る df[col].dt.hour df[col].dt.hour 折れ線グラフの菱形マーカーの色を変更する plt.plot(データ列x, データ列y, marker='D', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='D', markerfacecolor='#800080') option: フォントの色をダークターコイズに設定する color = 'darkturquoise' color = 'darkturquoise' 回帰分析をアンサンブル学習で行う sklearn.ensemble.VotingRegressor() sklearn.ensemble.VotingRegressor() 線グラフの色をライトシアンに設定する plt.plot(データ列x, データ列y, color='lightcyan') plt.plot(データ列x, データ列y, color='lightcyan') option: フォントの色を赤に設定する color ='red' color = 'red' 文字列内に空白が含まれる any(c.isspace() for c in s) any(c.isspace() for c in s) ファイルをバイナリ書き込みモードで開く] open(filepath, mode='wb') open(filepath, mode='wb') SVDで濃く次元に次元削減する sklearn.decomposition.TruncatedSVDORE(n_components=二).fit_transform(多次元データ) sklearn.decomposition.TruncatedSVD(n_components=二).fit_transform(多次元データ) 折れ線グラフの大バツマーカーの色を設定する plt.plot(データ列x, データ列y, marker='X', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='X', markerfacecolor='#800080') データフレームから一番左側の列を消す df.drop(axis='first') df[df.columns[1:]] データフレームからランダムに一行を抽出する df.sample() df.sample() xの小数点以下'4'桁までプリントする print(':.4f'.format(x)) print(':.4f'.format(x)) 深紅色の線グラフを描画する plt.plot(データ列x, データ列y, color='crimson') plt.plot(データ列x, データ列y, color='crimson') 第二引数で指定したファイル名 sys.argv[1] sys.argv[1] バイナリ書き込み用にファイルをオープンして]、fとする f = open(filepath, mode='wb') f = open(filepath, mode='wb') グリーンイエロー色として棒グラフを描画する plt.bar(データ列x, データ列y, color='greenyellow') plt.bar(データ列x, データ列y, color='greenyellow') 列の値を正規表現patternで一度に置き換える ds.replace(pattern, repl, regex=True) ds.replace(pattern, repl, regex=True) データフレームのカラムのNaNを50パーセンタイルで埋める df[col].fillna(df[col].median()) df[col].fillna(df[col].median()) 最後の部分文字列で文字列を二つに区切って、前半の文字列を使う s.rpartition(sub)[0] s.rpartition(sub)[0] データ列の欠損値を平均で埋める ds.fillna(ds.mean()) ds.fillna(ds.mean()) ヒストグラムをライトグリーン色として描画する plt.hist(データ列, color='lightseagreen') plt.hist(データ列, color='lightgreen') option: モカシンを使用する color ='moccasin' color = 'moccasin' 日付データは日付データよりあと aDate > aDate2 aDate > aDate2 グラフを画面用に変更する sns.set(context='notebook') sns.set(context='notebook') 散布図のマーカーの色を変える plt.scatter(データ列x, データ列y, markerfacecolor='#800080') plt.scatter(データ列x, データ列y, markerfacecolor='#800080') 散布図をスラグレー色を使って描画する plt.scatter(データ列x, データ列y, color='slategray') plt.scatter(データ列x, データ列y, color='slategray') 16進文字列を整数に変換する int(s, 16) int(s, 16) 縦棒グラフを青緑色で描画する plt.bar(データ列x, データ列y, color='teal') plt.bar(データ列x, データ列y, color='teal') 最後の部分文字列で文字列を二分する s.rpartition(sub)[0] s.rpartition(sub) 横棒グラフを描画して、棒の幅を調整する plt.barh(ラベル列, データ列, width=0.5) plt.barh(ラベル列, データ列, width=0.5) nがn2より大きいか n > n2 n > n2 リストの個数 len(aList) len(aList) ミディアムブルー色でヒストグラムを描画する plt.hist(データ列, color='mediumblue') plt.hist(データ列, color='mediumblue') 配列の値を変更する aArray[行番号, 列番号] = 指定の値 aArray[行番号, 列番号] = 指定の値 リストとリストについて散布図を描画し、▼マーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='v', c=rgb) plt.plot(データ列x, データ列y, marker='v', c=rgb) リスト内の要素は全て真か調べる all(aList) all(aList) イテラブルとリストについて散布図を描いてマーカーを四角に指定する plt.plot(データ列x, データ列y, marker='s') plt.plot(データ列x, データ列y, marker='s') 日付データをn日前にする aDate - datetime.timedelta(days=n) aDate - datetime.timedelta(days=n) データフレームの列がxより多い行を取り出す df[df[column] > x] df[df[column] > x] データフレームから指定された列のみ取り出す df[[column]] df[[column]] 二つのデータフレームを縦に連結する pd.concat([df, df2], axis=0) pd.concat([df, df2], axis=0) 棒グラフをライトイエロー色として描画する plt.bar(データ列x, データ列y, color='lightyellow') plt.bar(データ列x, データ列y, color='lightyellow') option: 白を用いる color = 'white' color = 'white' リストとリストの散布図を描画し、マーカーを下三角に指定する plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') option: グラフの色をアンティークホワイトにする color = 'antiquewhite' color = 'antiquewhite' option: アクア色を用いる color = 'aqua' color = 'aqua' ヒストグラムの色を珊瑚に設定する plt.hist(データ列, color='coral') plt.hist(データ列, color='coral') データフレームをTSVファイルから読む pd.read_csv(filename, sep='\t') pd.read_csv(filename, sep='\t', encoding='shift_jis') リストと配列についての散布図に星マーカーを描く plt.plot(データ列x, データ列y, marker='*') plt.plot(データ列x, データ列y, marker='*') リストの末尾からn番目以前の要素を取り出す aList[:-n] aList[:-n] データ列の推移を折れ線グラフで描画する plt.plot(range(len(データ列)), データ列) plt.plot(range(len(データ列)), データ列) データフレームの中のカラムをリストを境界値としてビン分割する pd.cut(df[col], aList) pd.cut(df[col], aList) カテゴリで色分けしてデータフレームをカウントプロットにする sns.countplot(x='列名', hue='カテゴリ列', data=df) sns.countplot(x='列名', hue='カテゴリ列', data=df) オブジェクトはリストかタプルか isinstance(obj, (list) isinstance(obj, (list) データフレームのリストカラムを1000の位で丸めて、整数にする df[aList].round(-3).astype(int) df[aList].round(-3).astype(int) 黄緑にヒストグラムの色を設定する plt.hist(データ列, color='chartreuse') plt.hist(データ列, color='chartreuse') タプルの要素数 len(aTuple) len(aTuple) リストとシーケンスを連結する itertools.chain(iterable, iterable2) itertools.chain(iterable, iterable2) 文字列は識別子名か調べる s.isidentifier() s.isidentifier() Pythonパスにを追加する sys.path.append(os.path.dirname(__file__), dir)) sys.path.append(dir) 横棒グラフをゲインズボロ色を用いて描画する plt.barh(データ列x, データ列y, color='gainsboro') plt.barh(データ列x, データ列y, color='gainsboro') 列を文字列に変換して'改行で連結する '\n'.join(map(str, iterable)) '\n'.join(map(str, iterable)) option: フォレストグリーンにグラフの色を設定する color = 'forestgreen' color = 'forestgreen' n個に配列をビン分割する pd.cut(aArray, n) pd.cut(aArray, n) データフレームを各列毎にグループ化し、、列の標準偏差を求める df.groupby(column)[column2].std() df.groupby(column)[column2].std() ASCII限定として正規表現で文字列を区切る re.split(pattern, s, flags=re.ASCI) re.split(pattern, s, flags=re.ASCI) x座標の目盛を非表示にする plt.xticks([]) plt.xticks([]) 8進数文字列をバイト列に変換する int(s, 8).to_bytes(length=bytesize, byteorder='big') int(s, 8).to_bytes(length=bytesize, byteorder='big') 入力ストリームをクローズする f.close() f.close() データフレームのリストカラムの欠損値を最大値にセットする df[aList].fillna(df[aList].max()) df[aList].fillna(df[aList].max()) データフレームのカラムの中に文字列と日付データがいくつ含まれるか数える df[col].isin([value, value2]).sum() df[col].isin([value, value2]).sum() 空のキュー collections.deque() collections.deque() TSVファイルからカンマ区切りのファイルを文字化けしないように読み込む pd.read_csv(filename, encoding='strict') pd.read_csv(filename, encoding='shift_jis') ファイルに文字列を書く f.write(s) f.write(s) option: アイボリーに色を設定する color = 'ivory' color = 'ivory' 行列のユニークな要素とそのインデックス aArray, return_index=True u, indices = np.unique(aArray, return_index=True) データフレームのリストカラムの欠損値を最頻値に指定する df[aList].fillna(df[aList].mode().iloc[0]) df[aList].fillna(df[aList].mode().iloc[0]) 黒い丸マーカーをリストと配列についての散布図に描画する plt.plot(データ列x, データ列y, marker='o', c='k') plt.plot(データ列x, データ列y, marker='o', c='k') option: マーカーの色をダークレッドにする markerfacecolor = 'darkred' markerfacecolor = 'darkred' スプリンググリーン色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='springgreen') plt.plot(データ列x, データ列y, color='springgreen') データフレームをランダムサンプリングする df.sample() df.sample() option: グラフを実線に設定する linestyle ='solid' linestyle = 'solid' 散布図をシアン色を用いて描画する plt.scatter(データ列x, データ列y, color='cyan') plt.scatter(データ列x, データ列y, color='cyan') 整数個からk個取り出した時の順列の総数 math.perm(n, k) math.perm(n, k) option: シルバー色を使用する color ='silver' color = 'silver' 全句読点文字 string.punctuation string.punctuation 折れ線グラフの色をディープスカイブルーに変更する plt.plot(データ列x, データ列y, color='deepskyblue') plt.plot(データ列x, データ列y, color='deepskyblue') タプルを集合に変換する set(aTuple) set(iterable) ダークマゼンタ色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='darkmagenta') plt.barh(データ列x, データ列y, color='darkmagenta') ディムグレー色としてヒストグラムを描画する plt.hist(データ列, color='dimgray') plt.hist(データ列, color='dimgrey') データフレームの列名一覧で指定された列を消す df.drop(columns, axis=1) df.drop(columns, axis=1) 青い一点鎖線でデータ列の推移をプロットする plt.plot(データ列x, データ列y, linestyle='dashbot', color='b') plt.plot(データ列x, データ列y, linestyle='dashbot', color='b') ディムグレー色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='dimgray') plt.plot(データ列x, データ列y, color='dimgray') 散布図に丸マーカーを加える plt.scatter(データ列x, データ列y, marker='o') plt.scatter(データ列x, データ列y, marker='o') 1行だけ標準入力から読み込んで改行を取り除く sys.stdin.readline().rstrip() sys.stdin.readline().rstrip() データフレームの列名を指定された列名一覧に置き換える df.columns = columns df.columns = columns 小数点数の余弦 math.cos(x) math.cos(x) 折れ線グラフの色をアリスブルーに指定する plt.plot(データ列x, データ列y, color='aliceblue') plt.plot(データ列x, データ列y, color='aliceblue') 配列と配列についての散布図に赤い左三角マーカーをプロットする plt.plot(データ列x, データ列y, marker='<', c='r') plt.plot(データ列x, データ列y, marker='<', c='r') 黒い星マーカーを散布図に描画する plt.scatter(データ列x, データ列y, marker='*', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='*', markerfacecolor='k') 線グラフの色を青紫に指定する plt.plot(データ列x, データ列y, color='violet') plt.plot(データ列x, データ列y, color='violet') 縦方向に二つのデータフレームを連結する pd.concat([df, df2]) pd.concat([df, df2]) option: ミディアムパープル色を用いる color ='mediumpurple' color = 'mediumpurple' エポック秒からタイムスタンプにする datetime.datetime.fromtimestamp(timestamp) datetime.datetime.fromtimestamp(timestamp) バリーウッド色として棒グラフを描画する plt.bar(データ列x, データ列y, color='burlywood') plt.bar(データ列x, データ列y, color='burlywood') 縦棒グラフをプロットして、中央寄せする plt.bar(ラベル列, データ列, align='center') plt.bar(ラベル列, データ列, align='center') predicateFuncがTrueとなるイテラブルの要素 itertools.takewhile(predicateFunc, iterable) itertools.dropwhile(predicateFunc, iterable) ヒストグラムの描き、、正規化する plt.hist(データ列, density=True) plt.hist(データ列, density=True) 日付データをISO8601書式の文字列にする aDate.isoformat() aDate.isoformat() 実数の値が整数 math.floor(x) x.is_integer() データ列の四分位を描画する plt.boxplot(データ列) plt.boxplot(データ列) デピンク色として棒グラフを描画する plt.bar(データ列x, データ列y, color='deeppink') plt.bar(データ列x, データ列y, color='deeppink') キューの要素をインプレースに反転する deq.reverse() deq.reverse() データフレームを二つの列によってソートしてNaNを先頭にする df.sort_values(by=['A', 'B'], na_position='first') df.sort_values(by=['A', 'B'], na_position='first') 線グラフを紺色で描画する plt.plot(データ列x, データ列y, color='darkblue') plt.plot(データ列x, データ列y, color='darkblue') option: ディムグレーにグラフの色を設定する color = 'dimgray' color = 'dimgrey' グラフにx=0の破線をつける plt.axvline(x=0, linestyle='dashed') plt.axvline(x=0, linestyle='dashed') スチールブルー色で線グラフを描画する plt.plot(データ列x, データ列y, color='steelblue') plt.plot(データ列x, データ列y, color='steelblue') nが負の整数 n < 0 n < 0 実数のコサインを算出する math.cos(x) math.cos(x) ダークスレートブルー色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='darkslateblue') plt.barh(データ列x, データ列y, color='darkslateblue') xの小数点以下'4'桁まで表示する print(':.4f'.format(x)) print(':.4f'.format(x)) 縦棒グラフをダークグレー色で描画する plt.bar(データ列x, データ列y, color='darkgrey') plt.bar(データ列x, データ列y, color='darkgray') データフレームを列を用いてソートし、、上位n件を取り出す df.sort_values(columns).head(n) df.sort_values(columns).head(n) 余弦 math.cos(x) math.cos(x) option: ライトグリーンにグラフの色を設定する color = 'lightgreen' color = 'lightgreen' 線グラフを貝殻色で描画する plt.plot(データ列x, データ列y, color='seashell') plt.plot(データ列x, データ列y, color='seashell') ファイルパスを追加モードでオープンして]、fとする f = open(filepath, mode='a') f = open(filepath, mode='a') 列でデータフレームを並べ、、新しいインデックスを加える df.sort_values(columns).reset_index() df.sort_values(columns).reset_index() データ列を横に並べて柱状グラフにする plt.hist([データ列, データ列], color=['b', 'r']) plt.hist([データ列, データ列], color=['b', 'r']) 青緑色の散布図を描画する plt.scatter(データ列x, データ列y, color='turquoise') plt.scatter(データ列x, データ列y, color='turquoise') 縦棒グラフを黄色くする plt.bar(データ列x, データ列y, color='y') plt.bar(データ列x, データ列y, color='y') 部分文字列によって文字列を区切る s.split(sub) s.split(sub) データフレームを各列と列の組み合わせ毎に集約し、、最小値を計算する df.groupby([column, column2], as_index=False).min() df.groupby([column, column2], as_index=False).min() タプルの要素数を見る len(aTuple) len(aTuple) リストを等しい量になるように分割数nで分割する pd.qcut(aList, n) pd.qcut(aList, n) option: ナバホホワイト色を用いる color = 'navajowhite' color = 'navajowhite' データフレームを各列と列の組み合わせ毎にグループ分けして、最大値を算出する df.groupby([column, column2], as_index=False).max() df.groupby([column, column2], as_index=False).max() データフレームのインデックスがnの行を取り出す df.index(n) df.loc[n] 散布図の星マーカーを赤色にする plt.scatter(データ列x, データ列y, marker='*', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='*', markerfacecolor='r') データフレームを二つの列によってによって降順に並べ直す df.sort_values(by=['A', 'B'], ascending=False) df.sort_values(by=['A', 'B'], ascending=False) カウンタを高頻出方からリストとして得る aCounter.most_common() aCounter.most_common() 縦棒グラフの色をミディアムターコイズにする plt.bar(データ列x, データ列y, color='mediumturquoise') plt.bar(データ列x, データ列y, color='mediumturquoise') リストとリストについての散布図に下三角マーカーをプロットする plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') プロットを表示する plt.pyicks() plt.show() 浮動小数点数の符号をコピーにする math.copysign(x, x2) math.copysign(x, x2) 折れ線グラフの星マーカーの太さを変える plt.plot(データ列x, データ列y, marker='*', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='*', markeredgewidth=2.5) カテゴリ列で色分けして、データフレームを棒プロットにする sns.barplot(x='カテゴリ列', y='列', hue='カテゴリ', data=df) sns.barplot(x='カテゴリ列', y='列名', hue='カテゴリ', data=df) 線グラフの色をダークスラテグレーに設定する plt.plot(データ列x, データ列y, color='darkslategray') plt.plot(データ列x, データ列y, color='darkslategray') 縦棒グラフの色をアクアにする plt.bar(データ列x, データ列y, color='aqua') plt.bar(データ列x, データ列y, color='aqua') ヒストグラムの色をディムグレーにする plt.hist(データ列, color='dimgrey') plt.hist(データ列, color='dimgrey') ミディアムターコイズ色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='mediumturquoise') plt.plot(データ列x, データ列y, color='mediumturquoise') データフレームのカラムの欠損値を後の行の値で埋める df[col].fillna(method='bfill') df[col].fillna(method='bfill') 折れ線グラフのクロスマーカーの色を変える plt.plot(データ列x, データ列y, marker='x', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='x', markerfacecolor='#800080') データフレームのデータ型のリスト df.dtypes df.dtypes 二つの列によってデータフレームを昇順にソートして、更新する df.sort_values(by=['A', 'B'], ascending=True, inplace=True) df.sort_values(by=['A', 'B'], ascending=True, inplace=True) 日付時刻データがタイムスタンプデータより前 aDatetime < aDatetime2 aDatetime < aDatetime2 散布図を貝殻色を用いて描画する plt.scatter(データ列x, データ列y, color='seashell') plt.scatter(データ列x, データ列y, color='seashell') ロージーブラウン色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='rosybrown') plt.barh(データ列x, データ列y, color='rosybrown') 線グラフの色をダークグレーに変更する plt.plot(データ列x, データ列y, color='darkgray') plt.plot(データ列x, データ列y, color='darkgrey') 散布図を四角マーカーで描画する plt.plot(データ列x, データ列y, marker='s') plt.plot(データ列x, データ列y, marker='s') 偽陰性を抑えたい指標を使う sklearn.metrics.precision_score(正解データ列, 予測データ列) sklearn.metrics.recall_score(正解データ列, 予測データ列) option: ラベンダーブラッシュを用いる color = 'lavenderblush' color = 'lavenderblush' データ列は何時か調べる ds.dt.hour ds.dt.hour 日付データは日付データより前 aDate < aDate2 aDate < aDate2 データフレームのカラムのNaNをxに変更する df[col].fillna(x) df[col].fillna(x) 箱ひげ図を描画し、、平均を加える plt.boxplot(データ列, showmeans=True) plt.boxplot(データ列, showmeans=True) データフレームのn番目の行を取り出す df.loc[n] df.loc[n] 部分文字列かどうか調べる sub in s sub in s 名前からカラーマップを見る "plt.get_cmap(""カラーマップ名"")" "plt.get_cmap(""カラーマップ名"")" 散布図の下三角マーカーの線幅を指定する plt.scatter(データ列x, データ列y, marker='v', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='v', markeredgewidth=2.5) 線グラフの色をドジャーブルーに指定する plt.plot(データ列x, データ列y, color='dodgerblue') plt.plot(データ列x, データ列y, color='dodgerblue') データフレームの列名を指定された名前リストに置き換える df.columns = columns df.columns = columns 回帰木分析を行う model = sklearn.tree.DecisionTreeRegressor() model = sklearn.tree.DecisionTreeRegressor() option: フォントの色をミディアムシアグリーンに設定する color ='mediumseagreen' color = 'mediumseagreen' パープル色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='purple') plt.barh(データ列x, データ列y, color='purple') 線グラフの色をピーチパフに設定する plt.plot(データ列x, データ列y, color='peachpuff') plt.plot(データ列x, データ列y, color='peachpuff') データフレームのリストカラムの文字列を欠損値にする df[aList].replace(s, np.nan) df[aList].replace(s, np.nan) オブジェクトは集合クラスのインスタンス isinstance(obj, set) isinstance(obj, set) オブジェクトにフィールドがあるかテストする hasattr(obj, プロパティ名) hasattr(obj, プロパティ名) ケンドールでデータフレームのリスト列の相関行列 df[aList].corr(method='kendall') df[aList].corr(method='kendall') xが1、もしくは2かどうか x == 1 or x == 2 x == 1 or x == 2 データ列の中央値を求める ds.median() ds.median() 棒グラフをディムグレー色として描画する plt.bar(データ列x, データ列y, color='dimgrey') plt.bar(データ列x, データ列y, color='dimgrey') データフレームの列の文字列が文字列で終わる行を選ぶ df[df[column].str.endswith(s)] df[df[column].str.endswith(s)] option: フォントの色をベージュに設定する color = 'beige' color = 'beige' 横棒プロットを積み上げにする plt.barh(ラベル列, データ列, bottom=データ列y, color='#800080') plt.barh(ラベル列, データ列, bottom=データ列y, color='#800080') タイムスタンプデータにn日を加える aDatetime + datetime.timedelta(days=n) aDatetime + datetime.timedelta(days=n) データフレームから型リストで指定されたデータ型の列のみ除外する df.select_dtypes(exclude=typeList) df.select_dtypes(exclude=typeList) 破壊的にデータフレームを複数の列によってで並べる df.sort_values(by=column, inplace=True) df.sort_values(by=column, inplace=True) 横棒グラフをミディアムシアグリーン色として描画する plt.barh(データ列x, データ列y, color='mediumseagreen') plt.barh(データ列x, データ列y, color='mediumseagreen') 青緑色の横棒グラフを描画する plt.barh(データ列x, データ列y, color='teal') plt.barh(データ列x, データ列y, color='turquoise') ネイビー色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='navy') plt.plot(データ列x, データ列y, color='navy') リストから重複なく、n要素ランダムに選ぶ random.sample(iterable, k=n) random.sample(iterable, k=n) 縦棒グラフの色をパールバイオレットレッドにする plt.bar(データ列x, データ列y, color='palevioletred') plt.bar(データ列x, データ列y, color='palevioletred') グラフのフォントを日本語表示に指定する sns.set(font='IPAexGothic') sns.set(font='IPAexGothic') データフレームの欠損値をモードで埋める df.fillna(df.mode().iloc[0]) df.fillna(df.mode().iloc[0]) 折れ線グラフのクロス印の大きさを変える plt.plot(データ列x, データ列y, marker='x', markersize=2.0) plt.plot(データ列x, データ列y, marker='x', markersize=2.0) 予測結果の適合率を求める sklearn.metrics.precision_score(正解データ列, 予測データ列) sklearn.metrics.precision_score(正解データ列, 予測データ列) nはn2か調べる n == n2 n == n2 データフレームを'A'列によって小さい順にソートして、更新する df.sort_values(by='A', ascending=True, inplace=True) df.sort_values(by='A', ascending=True, inplace=True) クラス分類をブースティングで行う model = sklearn.ensemble.HistGradientBoostingClassifier() model = sklearn.ensemble.AdaBoostClassifier(random_state=0, n_estimators=100) グラフのパレットを指定する sns.set(pallete=パレット名) sns.set(pallete=パレット名) 横棒グラフをダークスレートブルー色として描画する plt.barh(データ列x, データ列y, color='darkslateblue') plt.barh(データ列x, データ列y, color='darkslateblue') 折れ線グラフの色をシルバーに変更する plt.plot(データ列x, データ列y, color='silver') plt.plot(データ列x, データ列y, color='silver') リストの最初のオブジェクトを探す aList.index(element) aList.index(element) 要素がセットに含まれるか調べる element in aSet element in aSet ピアソン相関係数としてデータフレームの相関行列 df.corr(method='pearson') df.corr(method='pearson') 散布図の印を赤くする plt.scatter(データ列x, データ列y, markerfacecolor='r') plt.scatter(データ列x, データ列y, markerfacecolor='r') 切り下げて整数に変換する math.ceil(x) math.floor(x) データフレームのリスト列を丸めて、整数型にする df[aList].round().astype(int) df[aList].round().astype(int) アンティークホワイト色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='antiquewhite') plt.bar(データ列x, データ列y, color='antiquewhite') 折れ線グラフの丸印の線幅を変更する plt.plot(データ列x, データ列y, marker='o', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='o', markeredgewidth=2.5) ラインを一点鎖線に設定する plt.plot(データ列x, データ列y, linestyle='dashbot') plt.plot(データ列x, データ列y, linestyle='dashbot') データフレームのカラムの値をValueMapでまとめて置換する df[col].replace(ValueMap) df[col].replace(ValueMap) 縦棒グラフの色をスチールブルーにする plt.bar(データ列x, データ列y, color='steelblue') plt.bar(データ列x, データ列y, color='steelblue') 実行時の標準出力の出力先がターミナルか os.isatty(sys.stdin.fileno()) sys.stdout.isatty() option: グラフの色をミディアムスプリンググリーンに変更する color ='mediumspringgreen' color = 'mediumspringgreen' 空の回帰木モデルを用意する model = sklearn.tree.DecisionTreeRegressor() model = sklearn.tree.DecisionTreeRegressor() ミディアムスレートブルー色としてヒストグラムを描画する plt.hist(データ列, color='mediumslateblue') plt.hist(データ列, color='mediumslateblue') データフレームのリストカラムの未入力値を後の値に設定する df[aList].fillna(method='bfill') df[aList].fillna(method='bfill') ダーク・スラテグレー色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='darkslategrey') plt.plot(データ列x, データ列y, color='darkslategrey') デピンク色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='deeppink') plt.barh(データ列x, データ列y, color='deeppink') 文字列を評価する s.mean() eval(s) マッピングを複製する dict(aDict) aDict.copy() 異なる列をキーとして二つのデータフレームを外部ジョインする pd.merge(df, df2, left_on=column, right_on=column2, how='outer') pd.merge(df, df2, left_on=column, right_on=column2, how='outer') 日付時刻データが木曜日か判定する aDatetime.weekday() == 3 aDatetime.weekday() == 3 等差数列から整数乱数を得る random.randrange(start, end, step) random.randrange(start, end, step) ファイルを開いて]、追加ストリームを使う open(filepath, mode='a') open(filepath, mode='a') 散布図をrgbの三角マーカーで描画する plt.plot(データ列x, データ列y, marker='^', c=rgb) plt.plot(データ列x, データ列y, marker='^', c=rgb) オブジェクトがあるクラスのインスタンスか調べる isinstance(obj, クラス) isinstance(obj, クラス) 列のコンビネーションを得る itertools.combinationswith(iterable, n) itertools.combinations(iterable, n) マルーン色を用いて棒グラフを描画する plt.bar(データ列x, データ列y, color='maroon') plt.bar(データ列x, データ列y, color='maroon') 小数点数の床数 math.floor(x) math.floor(x) 整数が正の数かどうか調べる x > 0 x > 0 ファイルを文字コードtextで開く] open(filepath, encoding=text) open(filepath, encoding=text) データフレームから型リストで指定されたデータ型のカラムを抽出する df.select_dtypes(include=typeList) df.select_dtypes(include=typeList) 横棒グラフをアクア色を用いて描画する plt.barh(データ列x, データ列y, color='aqua') plt.barh(データ列x, データ列y, color='aqua') 現在が月曜日 datetime.datetime.today().weekday() == 0 datetime.datetime.today().weekday() == 0 ピーチパフ色で棒グラフを描画する plt.bar(データ列x, データ列y, color='peachpuff') plt.bar(データ列x, データ列y, color='peachpuff') マッピングから項目名の値か、もしくは要素を得る aDict.get(key, element) aDict.get(key, element) 整数nを8進文字列に変換する oct(n)[2:] oct(n)[2:] パパイヤウィップ色で散布図を描画する plt.scatter(データ列x, データ列y, color='papayawhip') plt.scatter(データ列x, データ列y, color='papayawhip') option: 色をブラックに設定する color = 'black' color = 'black' 2進数文字列を整数に変換する int(s, 16) int(s, 2) 茶色色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='brown') plt.plot(データ列x, データ列y, color='brown') sepを区切りにして文字列リストをひとつの文字列にする sep.join(aStringList) sep.join(aStringList) 線グラフを実線に設定する plt.plot(データ列x, データ列y, linestyle='solid') plt.plot(データ列x, データ列y, linestyle='solid') 1行から二つの文字列を読む A, B = map(str, input().split()) A, B = map(str, input().split()) 折れ線グラフの色をダークスレートブルーにセットする plt.plot(データ列x, データ列y, color='darkslateblue') plt.plot(データ列x, データ列y, color='darkslateblue') データ列の値が未入力値か確認する ds.isna() ds.isna() 表データから列を3つ選択する df[[column, column2, column3]] df[[column, column2, column3]] データ列を千の位で丸めて、整数型にする ds.round(-3).astype(int) ds.round(-3).astype(int) ヒストグラムをミディアムターコイズ色を用いて描画する plt.hist(データ列, color='mediumturquoise') plt.hist(データ列, color='mediumturquoise') 双方向キューに値をエンキューする deq.appendleft(element) deq.appendleft(element) 赤いダイアモンドマーカーを使って散布図を描画する plt.plot(データ列x, データ列y, marker='D', c='r') plt.plot(データ列x, データ列y, marker='D', c='r') 折れ線グラフの色をダークサーモンに変更する plt.plot(データ列x, データ列y, color='darksalmon') plt.plot(データ列x, データ列y, color='darksalmon') チョコレート色として縦棒グラフを描画する plt.bar(データ列x, データ列y, color='chocolate') plt.bar(データ列x, データ列y, color='chocolate') nからstep間隔で無限に数え上げるする fractions.Fraction(start, end=step) itertools.count(start=n, step=step) 集合の更新不能版 aSet.update(iterable) frozenset(aSet) 文字列リストを一つにしてひとつの文字列にする ''.join([map(str, iterable)) ''.join(aStringList) 組の長さ len(aTuple) len(aTuple) データフレームをグループ化し、各列に対し分散を求める df.groupby(column)[column2].var() df.groupby(column)[column2].var() インデント幅nで辞書をJSONフォーマットの文字列に変換する json.dumps(aDict, ensure_ascii=False, indent=n) json.dumps(aDict, ensure_ascii=False, indent=n) 青い丸マーカーを散布図に描画する plt.scatter(データ列x, データ列y, marker='o', markerfacecolor='b') plt.scatter(データ列x, データ列y, marker='o', markerfacecolor='b') 赤い下三角マーカーを散布図に使う plt.plot(データ列x, データ列y, marker='v', c='r') plt.plot(データ列x, データ列y, marker='v', c='r') 双方向キューの先頭から要素を削除する deq.popleft() deq.popleft() 処理中の例外を情報 sys.exc_info() sys.exc_info() ダークオーキッド色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='darkorchid') plt.bar(データ列x, データ列y, color='darkorchid') データフレームから型の列のみ取り出す df.select_dtypes(ty) df.select_dtypes(ty) グラフを淡くする sns.set(pallete='muted') sns.set(pallete='muted') リストとリストについて散布図を描き、、ポイントマーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='.', c=rgb) plt.plot(データ列x, データ列y, marker='.', c=rgb) 配列と配列についての散布図に赤い四角マーカーを描画する plt.plot(データ列x, データ列y, marker='s', c='r') plt.plot(データ列x, データ列y, marker='s', c='r') option: ミディアムスプリンググリーンにグラフの色を変更する color ='mediumspringgreen' color = 'mediumspringgreen' ヒストグラムにカラーマップを使用する "plt.hist(データ列x, color=plt.get_cmap(""Spectral""))" "plt.hist(データ列x, color=plt.get_cmap(""Spectral""))" 回帰分析をヒストグラムと勾配ブースティングでする model = sklearn.ensemble.HistGradientBoostingRegressor() model = sklearn.ensemble.HistGradientBoostingRegressor() タブ区切りのファイルをSJISで読み込む pd.read_csv(filename, encoding='shift_jis') pd.read_csv(filename, encoding='shift_jis') 2つの文字列を辞書順で比較する s < s2 s < s2 パーセプトロンで回帰分析をする model = sklearn.neural_network.MLPRegressor(hidden_layer_sizes=(10, 10)) model = sklearn.neural_network.MLPRegressor(hidden_layer_sizes=(10, 10)) ヒストグラムの色をシルバーにセットする plt.hist(データ列, color='silver') plt.hist(データ列, color='silver') ヒストグラムをスラグレー色を使って描画する plt.hist(データ列, color='slategray') plt.hist(データ列, color='slategrey') 散布図に黒い△マーカーを描画する plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='k') 文字列から部分文字列を消す s.strip(sub) s.replace(sub, '') 配列として列を抽出する np.array(iterable) df[column].values 縦棒グラフをミディアムオーキッド色で描画する plt.bar(データ列x, データ列y, color='mediumorchid') plt.bar(データ列x, データ列y, color='mediumorchid') データフレームのカラムの欠損値を50パーセンタイルで補う df[col].fillna(df[col].median()) df[col].fillna(df[col].median()) 線グラフの色をライトグレーに変更する plt.plot(データ列x, データ列y, color='lightgrey') plt.plot(データ列x, データ列y, color='lightgray') nがn2以下、またはn3以上か判定する n <= n2 or n >= n3 n <= n2 or n >= n3 nが3の倍数か n % 3 == 0 n % 3 == 0 option: バリーウッド色を用いる color = 'burlywood' color = 'burlywood' Pandasでデータフレームのcollをタイムスタンプに変換する pd.to_datetime(df[col]) pd.to_datetime(df[col]) 改行で文字列を分割する s.splitlines() s.splitlines() ファイルがあるか調べる os.path.exists(filepath) os.path.exists(filepath) 実数の双曲線正接の逆数を求める math.atanh(x) math.atanh(x) マゼンタ色で散布図を描画する plt.scatter(データ列x, データ列y, color='magenta') plt.scatter(データ列x, データ列y, color='magenta') 方程式として数式の変数の解を計算する sympy.solve(e, z) sympy.solve(e, z) option: ミディアムオーキッド色を使用する color ='mediumorchid' color = 'mediumorchid' 散布図に黒い右三角マーカーを使用する plt.plot(データ列x, データ列y, marker='>', c='k') plt.plot(データ列x, データ列y, marker='>', c='k') 空の両端キューを生成する deq.appendleft(element) collections.deque() グリーンイエロー色を用いて散布図を描画する plt.scatter(データ列x, データ列y, color='greenyellow') plt.scatter(データ列x, データ列y, color='greenyellow') 黒い星マーカーを配列とリストの散布図に描く plt.plot(データ列x, データ列y, marker='*', c='k') plt.plot(データ列x, データ列y, marker='*', c='k') ファイルを改行除外して一行ずつ読み込む f.readline() f.readline() 横棒グラフをオールドレース色として描画する plt.barh(データ列x, データ列y, color='oldlace') plt.barh(データ列x, データ列y, color='oldlace') 線グラフをピンク色を用いて描画する plt.plot(データ列x, データ列y, color='pink') plt.plot(データ列x, データ列y, color='pink') 文字列の最初 s[0] s[0] 線グラフの色を青紫にセットする plt.plot(データ列x, データ列y, color='violet') plt.plot(データ列x, データ列y, color='violet') 横棒グラフをダークブルー色で描画する plt.barh(データ列x, データ列y, color='darkblue') plt.barh(データ列x, データ列y, color='darkblue') 縦棒グラフの色をカーキにする plt.bar(データ列x, データ列y, color='khaki') plt.bar(データ列x, データ列y, color='khaki') 散布図をライトスチールブルー色を用いて描画する plt.scatter(データ列x, データ列y, color='lightsteelblue') plt.scatter(データ列x, データ列y, color='lightsteelblue') option: ダーク・スラテグレーを使う color = 'darkslategrey' color = 'darkslategrey' 変数を黒色でプリントする print(f'\033[30m{value}\033[0m') print(f'\033[30m{value}\033[0m') ゴーストホワイト色を用いて横棒グラフを描画する plt.barh(データ列x, データ列y, color='ghostwhite') plt.barh(データ列x, データ列y, color='ghostwhite') パウダーブルー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='powderblue') plt.bar(データ列x, データ列y, color='powderblue') 整数個のものからk個取り出したときの並べ方の総数を求める math.perm(n, k) math.perm(n, k) 棒プロットの色をする plt.bar(ラベル列, データ列, color=rgb) plt.bar(ラベル列, データ列, color=rgb) 棒グラフをダークシアン色として描画する plt.bar(データ列x, データ列y, color='darkcyan') plt.bar(データ列x, データ列y, color='darkcyan') 辞書をインデント幅nのJSON形式の文字列にする json.dumps(aDict, ensure_ascii=False, indent=n) json.dumps(aDict, ensure_ascii=False, indent=n) オブジェクトは数値 isinstance(obj, (int,float)) isinstance(obj, (int,float)) リストと配列についての散布図に赤いダイアモンドマーカーをプロットする plt.plot(データ列x, データ列y, marker='D', c='r') plt.plot(データ列x, データ列y, marker='D', c='r') スプリンググリーン色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='springgreen') plt.bar(データ列x, データ列y, color='springgreen') リストを青色でプリントできる文字列に変換する f'\033[34m{value}\033[0m' f'\033[34m{value}\033[0m' MSDで淡く次元に削減する sklearn.manifold.MSD(n_components=三).fit_transform(多次元データ) sklearn.manifold.MSD(n_components=三).fit_transform(多次元データ) 折れ線グラフの色をダークバイオレットに変更する plt.plot(データ列x, データ列y, color='darkviolet') plt.plot(データ列x, データ列y, color='darkviolet') option: フォントの色をブルーバイオレットに変更する color = 'blueviolet' color = 'blueviolet' 数列とイテラブルの散布図にバツマーカーを描画する plt.plot(データ列x, データ列y, marker='x') plt.plot(データ列x, データ列y, marker='x') option: ラインを太くする linewidth = 3.0 linewidth = 3.0 横棒グラフをコーラル色として描画する plt.barh(データ列x, データ列y, color='coral') plt.barh(データ列x, データ列y, color='coral') 文字列の中の大文字・小文字を無視してパターンによるすべてのマッチを使う re.findall(pattern, s, flags=re.IGNORECASE) re.findall(pattern, s, flags=re.IGNORECASE) 整数nの八進数表記 oct(n) oct(n) ミディアムターコイズ色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='mediumturquoise') plt.plot(データ列x, データ列y, color='mediumturquoise') option: グラフの色を黄緑に指定する color = 'chartreuse' color = 'chartreuse' データフレームを各列と列の組み合わせ毎に集約して、最大値を求める df.groupby([column, column2], as_index=False).max() df.groupby([column, column2], as_index=False).max() バリーウッド色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='burlywood') plt.bar(データ列x, データ列y, color='burlywood') オレンジレッド色を使って棒グラフを描画する plt.bar(データ列x, データ列y, color='orangered') plt.bar(データ列x, データ列y, color='orangered') 配列とリストについての散布図に赤い丸マーカーを描画する plt.plot(データ列x, データ列y, marker='o', c='r') plt.plot(データ列x, データ列y, marker='o', c='r') データフレームの重複する行を数える df.duplicated().sum() df.duplicated().sum() ブースティングでクラス分類をする model = sklearn.ensemble.AdaBoostClassifier(random_state=0, n_estimators=100) model = sklearn.ensemble.AdaBoostClassifier(random_state=0, n_estimators=100) 日付データにn分を加算する aDate + datetime.timedelta(minutes=n) aDate + datetime.timedelta(minutes=n) 文字列の開始位置から先に部分文字列が含まれないか調べる s.find(sub, start) == -1 s.find(sub, start) == -1 nが偶数 n % 2 == 1 n % 2 == 0 折れ線グラフの色をレモンシフォンに変更する plt.plot(データ列x, データ列y, color='lemonchiffon') plt.plot(データ列x, データ列y, color='lemonchiffon') 縦棒グラフを小麦色色で描画する plt.bar(データ列x, データ列y, color='wheat') plt.bar(データ列x, データ列y, color='wheat') フローラルホワイト色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='floralwhite') plt.barh(データ列x, データ列y, color='floralwhite') option: フォントの色をバイオレットに変更する color = 'violet' color = 'violet' JSONファイルのファイル入力を辞書にする json.load(fin) json.load(fin) プロットにy=0の破線を設定する plt.axhline(y=0, linestyle='dashed') plt.axhline(y=0, linestyle='dashed') 要素を両端キューの先頭に追加する deq.appendleft(element) deq.appendleft(element) 辞書をインデント付きで文字列に変換する json.dumps(aDict, ensure_ascii=False, indent=n) json.dumps(aDict, ensure_ascii=False, indent=n) ロバストな線形分類器を作る model = sklearn.linear_model.HuberClassifier() model = sklearn.linear_model.HuberClassifier() JSONLファイルにデータフレームをCSVファイルで保存する df.to_csv(filename) df.to_csv(filename) ヒストグラムの色をブラックに指定する plt.hist(データ列, color='black') plt.hist(データ列, color='black') nの2進表現 bin(n) bin(n) 2つのタプルをネスト化する collections.ChainMap(aArray, aArray2) collections.ChainMap(aDict, aDict2) アンティークホワイト色として散布図を描画する plt.scatter(データ列x, データ列y, color='antiquewhite') plt.scatter(データ列x, データ列y, color='antiquewhite') タプルをnから番号付けする enumerate(aTuple, start=n) enumerate(aTuple, start=n) オブジェクトは浮動小数点数クラスかテストする isinstance(obj, float) isinstance(obj, float) 折れ線グラフの印を▼にする plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') オブジェクトをデバッグ向けの文字列にする repr(obj) repr(obj) グリーン色を用いて棒グラフを描画する plt.bar(データ列x, データ列y, color='green') plt.bar(データ列x, データ列y, color='green') 横方向に二つのデータフレームをマージする pd.merge(df, df2) pd.merge(df, df2) あらかじめASCII限定として正規表現をコンパイルする re.compile(pattern, flag=re.ASCI) re.compile(pattern, flag=re.ASCI) option: ダークゴールデンロッドに色を指定する color = 'darkgoldenrod' color = 'darkgoldenrod' 折れ線グラフをスレートブルー色として描画する plt.plot(データ列x, データ列y, color='slateblue') plt.plot(データ列x, データ列y, color='slateblue') ミディアムスプリンググリーン色で散布図を描画する plt.scatter(データ列x, データ列y, color='mediumspringgreen') plt.scatter(データ列x, データ列y, color='mediumspringgreen') stringモジュールをインポートする import string import string 散布図の▼マーカーの線幅を変更する plt.scatter(データ列x, データ列y, marker='v', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='v', markeredgewidth=2.5) 一点鎖線にヒストグラムのスタイルを設定する plt.hist(データ列, linestyle='dashbot') plt.hist(データ列, linestyle='dashbot') リストと数列についての散布図を大きさnで描画する plt.scatter(データ列x, データ列y, s=n) plt.scatter(データ列x, データ列y, s=n) 文字列が空白文字か s.isspace() s.isspace() 配列とリストについての散布図にrgbのポイントマーカーを描画する plt.plot(データ列x, データ列y, marker='.', c=rgb) plt.plot(データ列x, データ列y, marker='.', c=rgb) ミディアムスプリンググリーン色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='mediumspringgreen') plt.plot(データ列x, データ列y, color='mediumspringgreen') リストと数列についての散布図に黒い大バツマーカーを描画する plt.plot(データ列x, データ列y, marker='X', c='k') plt.plot(データ列x, データ列y, marker='X', c='k') 二つ並べてデータ列を箱ひげ図にする plt.boxplot([データ列, データ列]) plt.boxplot([データ列, データ列]) 折れ線グラフをライトスチールブルー色として描画する plt.plot(データ列x, データ列y, color='lightsteelblue') plt.plot(データ列x, データ列y, color='lightsteelblue') 散布図に大バツマーカーを加える plt.scatter(データ列x, データ列y, marker='X') plt.scatter(データ列x, データ列y, marker='X') ライトグレー色で散布図を描画する plt.scatter(データ列x, データ列y, color='lightgray') plt.scatter(データ列x, データ列y, color='lightgray') 折れ線グラフをオリーブ色として描画する plt.plot(データ列x, データ列y, color='olive') plt.plot(データ列x, データ列y, color='olive') データフレームのリストカラムの空文字をNaNに変換しドロップする df[aList].replace('', np.nan).dropna() df[aList].replace('', np.nan).dropna() 散布図の色を黄緑にする plt.scatter(データ列x, データ列y, color='chartreuse') plt.scatter(データ列x, データ列y, color='chartreuse') タプルの文字列が最初に見つかるインデックスを探す aTuple.index(element) aTuple.index(element) データフレームからランダムに一行抽出する df.sample() df.sample() データフレームから列を三つだけ選択する df[[column, column2, column3]] df[[column, column2, column3]] カウンタを少ない方からリストとして得る aCounter.most_common()[::-1] aCounter.most_common()[::-1] 折れ線グラフのバツ印の太さを変更する plt.plot(データ列x, データ列y, marker='x', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='x', markeredgewidth=2.5) 配列を列方向に連結する np.concatenate([aArray, aArray2], axis=1) np.concatenate([aArray, aArray2], axis=0) 青紫色で線グラフを描画する plt.plot(データ列x, データ列y, color='violet') plt.plot(データ列x, データ列y, color='violet') 折れ線グラフの△マーカーを赤色にする plt.plot(データ列x, データ列y, marker='^', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='^', markerfacecolor='r') カウンタをシーケンスをカウントして、更新する aCounter.update(iterable) aCounter.update(iterable) option: 書き込み用に指定する color = 'w' mode = 'w' option: データ型としてブール型を用いる dtype = np.int32 dtype = np.int32 オールドレース色として散布図を描画する plt.scatter(データ列x, データ列y, color='oldlace') plt.scatter(データ列x, データ列y, color='oldlace') 黒色で実行結果をプリントする print(f'\033[30m{value}\033[0m') print(f'\033[30m{value}\033[0m') ひとつでも大文字が文字列内にあるか調べる any(c.isupper() for c in s) any(c.isupper() for c in s) リストとイテラブルをzipする itertools.zip_longest(iterable, iterable2) itertools.zip_longest(iterable, iterable2) リストを昇順にソートする sorted(aList, reverse=True) sorted(aList, reverse=False) データ列が正規分布に従うかどうか仮説検定する scipy.stats.shapiro(データ列) scipy.stats.shapiro(データ列) データフレームを2つの列の値でグループ化して、列挙する [(name, group) for name, group in df.groupby(['A', 'B'])] [(name, group) for name, group in df.groupby(['A', 'B'])] 青い点線を用いてデータ列の推移を描く plt.plot(データ列x, データ列y, linestyle='dotted', color='b') plt.plot(データ列x, データ列y, linestyle='dotted', color='b') 棒グラフをオレンジレッド色を用いて描画する plt.bar(データ列x, データ列y, color='orangered') plt.bar(データ列x, データ列y, color='orangered') ヒストグラムでカラーマップを用いる "plt.hist(データ列x, color=plt.get_cmap(""Spectral""))" "plt.hist(データ列x, color=plt.get_cmap(""Spectral""))" 混同行列を求める 混同行列 = sklearn.混同行列 = sklearn.metrics.confusion_matrix(混同行列, データ列2) 混同行列 = sklearn.metrics.confusion_matrix(正解データ列, 予測データ列) option: ゲインズボロを用いる color = 'gainsboro' color = 'gainsboro' オリベドラブ色でヒストグラムを描画する plt.hist(データ列, color='olivedrab') plt.hist(データ列, color='olivedrab') option: フォントの色をダークカーキに設定する color = 'darkkhaki' color = 'darkkhaki' こんにちは世界をプリントする print() print('Hello World') 日付データが日付データより前 aDate < aDate2 aDate < aDate2 ベクトルの平均値 np.mean(aArray) np.mean(aArray) 縦棒グラフの色をピーチパフにする plt.bar(データ列x, データ列y, color='peachpuff') plt.bar(データ列x, データ列y, color='peachpuff') 追加できるように文字列の示すエンコーディングで既存のファイルを開く] open(filepath, mode='a', encoding=s) open(filepath, mode='a', encoding=s) 列の重複組み合せ df.set_index(iterable) itertools.combinations_with_replacement(iterable, n) ライトブルー色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='lightblue') plt.plot(データ列x, データ列y, color='lightblue') option: 最初の行をヘッダに設定する header = None header = 0 nで乱数生成系列を初期化する random.seed(n) random.seed(n) 入力から二つの整数を取り出す A, B = map(int, input().split()) A, B = map(int, input().split()) タプルの項目名の値 aDict[key] aDict[key] 空のマップ {} {} 折れ線グラフをパウダーブルー色として描画する plt.plot(データ列x, データ列y, color='powderblue') plt.plot(データ列x, データ列y, color='powderblue') サーモン色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='salmon') plt.barh(データ列x, データ列y, color='salmon') タプルの中の一番小さい値 min(aTuple) min(aTuple) 線グラフの色をグリーンイエローに設定する plt.plot(データ列x, データ列y, color='greenyellow') plt.plot(データ列x, データ列y, color='greenyellow')