diff --git "a/result_test.tsv" "b/result_test.tsv" new file mode 100644--- /dev/null +++ "b/result_test.tsv" @@ -0,0 +1,1001 @@ +データフレームのカラムが正規分布からどの程度、歪んでいるか調べる df[col].skew() df[col].kurt() +xでデータフレームのリストカラムのNaNを埋める df[aList].fillna(x) df[aList].fillna(x) +折れ線グラフを描画して色をカデットブルーに設定する plt.plot(データ列, データ列2, color='cadetblue') plt.plot(データ列, データ列2, color='cadetblue') +データフレームのカラムの歪度を算出する df[col].kurt() df[col].kurt() +ヒストグラムの色をライムグリーンに指定する plt.hist(データ列, color='limegreen') plt.hist(データ列, color='limegreen') +線グラフの色をオレンジにする plt.plot(データ列, データ列2, color='orange') plt.plot(データ列, データ列2, color='orange') +<オプション>グラフの色をカデットブルーに指定する color = 'cadetblue' color = 'cadetblue' +画面にプロットを設定する sns.set(context='notebook') sns.set(context='notebook') +<オプション>読み込み用にセットする mode = 'r' mode = 'r' +ヒストグラムを描画してその色をコーラルにセットする plt.hist(データ列, color='coral') plt.hist(データ列, color='coral') +データフレームのリストカラムの中の欠損値の数を数える df[aList].isna().sum() df[aList].isna().sum() +リストとリストの黒い濃いグラフをプロットする plt.plot(xdata, ydata, linestyle='deep', color='k') plt.plot(xdata, ydata, linestyle='deep', color='k') +ヒストグラムの色をオーキッドに変更する plt.hist(データ列, color='orchid') plt.hist(データ列, color='orchid') +リストとリストの散布図にポイントマーカーを描画する plt.plot(xdata, ydata, marker='.') plt.plot(xdata, ydata, marker='.') +線グラフを描画してその色をライトグリーンにする plt.plot(データ列, データ列2, color='lightseagreen') plt.plot(データ列, データ列2, color='lightseagreen') +線グラフの色をラベンダーブラッシュにセットする plt.plot(データ列, データ列2, color='lavenderblush') plt.plot(データ列, データ列2, color='lavenderblush') +線グラフの色をディムグレーに設定する plt.plot(データ列, データ列2, color='dimgray') plt.plot(データ列, データ列2, color='dimgrey') +データ列は正規分布からどれだけ、歪んでいるか見る ds.kurt() ds.kurt() +折れ線グラフを描画して、色を青緑にする plt.plot(データ列, データ列2, color='teal') plt.plot(データ列, データ列2, color='teal') +データフレームの列が文字列で始まらない行を取り出す df[not df[column].str.endswith(s)] df[not df[column].str.startswith(s)] +配列とリストについての散布図にカラーコードのポイントマーカーをプロットする plt.plot(xdata, ydata, marker='.', c=rgb) plt.plot(xdata, ydata, marker='.', c=rgb) +日付時刻データがタイムスタンプデータより後ろ aDatetime < aDatetime2 aDatetime > aDatetime2 +<オプション>グリーンイエローにグラフの色を設定する color = 'yellowgreen' color = 'greenyellow' +右三角マーカーを散布図に用いる plt.plot(xdata, ydata, marker='>') plt.plot(xdata, ydata, marker='>') +列名リストによってデータフレームをまとめた表を求める df.groupby(columns) df.groupby(columns) +折れ線グラフの色をライトゴールドロディイエローに変更する plt.plot(データ列, データ列2, color='lightgoldenrodyellow') plt.plot(データ列, データ列2, color='lightgoldenrodyellow') +データフレームの最初n行 df.head(n) df.head(n) +リストの末尾に文字列を加える aList.index(element) aList.append(element) +英字の大文字を全部使う string.ascii_uppercase string.ascii_uppercase +空のマッピング collections.ChainMap() {} +データフレームのカラムを丸めて整数型にする df[col].round().astype(int) df[col].round().astype(int) +文字列を空白によって分割する s.split() s.split() +データフレームのリスト列の平均値を求める df[aList].mean() df[aList].mean() +nがn2の倍数でないか n % n2!= 0 n % n2 != 0 +文字列がリストの要素かどうか調べる element in aList element in aList +xが真かテストする bool(x) bool(x) +リストについてのヒストグラムを色差別ない色を用いて描画する plt.hist(xdata, color='colorblind') plt.hist(xdata, color='colorblind') +パステル調のの折れ線グラフの線幅をnに設定する plt.plot(xdata, ydata, linestyle='pastel', linewidth=n) plt.plot(xdata, ydata, linestyle='pastel', linewidth=n) +データフレームを各列毎にグループ化して、列の標準偏差を算出する df.groupby(column)[column2].std() df.groupby(column)[column2].std() +黒色の大バツマーカーで散布図を描く plt.plot(xdata, ydata, marker='X', c='k') plt.plot(xdata, ydata, marker='X', c='k') +<オプション>色を��マトにセットする color = 'tomato' color = 'tomato' +<オプション>グラフの色をダークオーキッドにセットする color = 'darkorchid' color = 'darkorchid' +ヒストグラムの色をダークスレートブルーにセットする plt.hist(データ列, color='darkslateblue') plt.hist(データ列, color='darkslateblue') +線グラフを描画して、その色を貝殻にセットする plt.plot(データ列, データ列2, color='seashell') plt.plot(データ列, データ列2, color='seashell') +ヒストグラムを描画して、色をホワイトスモークに指定する plt.hist(データ列, color='whitesmoke') plt.hist(データ列, color='whitesmoke') +<オプション>色をアリスブルーに設定する color = 'aliceblue' color = 'aliceblue' +データフレームをCSVファイルとしてJSONLファイルに書き込む df.to_csv(filename) df.to_csv(filename) +タイムスタンプデータと日付時刻データの時間差 aDatetime == aDatetime2 aDatetime - aDatetime2 +ヒストグラムの色をライトスレイグレーに指定する plt.hist(データ列, color='lightslategray') plt.hist(データ列, color='lightslategrey') +ヒストグラムの色をオリーブに指定する plt.hist(データ列, color='olive') plt.hist(データ列, color='olive') +<オプション>パレットトルコイズを使用する color = 'paleturquoise' color = 'paleturquoise' +文字列から部分文字列を全て消す s.strip(sub) s.replace(sub, '') +小数点数とyのノルム math.hypot(x, y) math.hypot(x, y) +列をビン数nで分割する pd.cut(ds, n) pd.cut(ds, n) +カウンタを用いる aCounter.total() import collections +ヒストグラムを描画して、その色をミディアムアクアマリンに変更する plt.hist(データ列, color='mediumaquamarine') plt.hist(データ列, color='mediumaquamarine') +JSON文字列を辞書に変換する json.loads(jsonString) json.loads(jsonString) +<オプション>区切り記号を使わない sep = '' sep = '' +横方向に複数のデータフレームを一つにする pd.concat([df, df2, df3], axis=1) pd.concat([df, df2, df3], axis=1) +等しい量になるようにデータ列をビン数nでビン分割する pd.qcut(ds, n) pd.qcut(ds, n) +折れ線グラフを描画して、その色をダークターコイズに指定する plt.plot(データ列, データ列2, color='darkturquoise') plt.plot(データ列, データ列2, color='darkturquoise') +配列と数列についての散布図に黒い▽マーカーを描画する plt.plot(xdata, ydata, marker='v', c='k') plt.plot(xdata, ydata, marker='v', c='k') +散布図に黒いダイアモンドマーカーを用いる plt.plot(xdata, ydata, marker='D', c='k') plt.plot(xdata, ydata, marker='D', c='k') +線グラフを描画してその色をペールグリーンにセットする plt.plot(データ列, データ列2, color='palegreen') plt.plot(データ列, データ列2, color='palegreen') +データ列のNaNを最小値で埋める ds.fillna(ds.min()) ds.fillna(ds.min()) +ライムにヒストグラムの色を変更する plt.hist(データ列, color='lime') plt.hist(データ列, color='lime') +濃い色の折れ線グラフを描き、その線幅をnに設定する plt.plot(xdata, ydata, linewidth=n, color='deep') plt.plot(xdata, ydata, linewidth=n, color='deep') +オレンジにヒストグラムの色を設定する plt.hist(データ列, color='orange') plt.hist(データ列, color='orange') +まとめてデータフレームの列の名前を文字列を文字列に置換する df.rename(columns={column2].columns={column: name}) df.columns = [str(x).replace(s, s2) for x in df.columns] +二つの列によってで降順にデータフレームをソートする df.sort_values(by=['A', 'B'], ascending=False) df.sort_values(by=['A', 'B'], ascending=False) +リストの値を並べる sorted(aList) sorted(aList) +折れ線グラフに描画して印を丸印にする plt.plot(データ列, データ列2, marker='o') plt.plot(データ列, データ列2, marker='o') +ヒストグラムの色をサーモンに指定する plt.hist(データ列, color='salmon') plt.hist(データ列, color='salmon') +データフレームの指定した列を配列として抽出する df[column].values df[column].values +ヒストグラムの色をインディアンレッドに指定する plt.hist(データ列, color='indianred') plt.hist(データ列, color='indianred') +ファイルをUTF8を使ってオープンする] open(filepath, encoding='utf-8') open(filepath, encoding='utf-8') +イテラブルを多重集合に変換する set(iterable) collections.Counter(iterable) +折れ線グラフを描画して、色をライトグレーに設定する plt.plot(データ列, データ列2, color='lightgray') plt.plot(データ列, データ列2, color='lightgrey') +集合から任意の要素を取り除く aSet.difference_update(iterable) aSet.pop() +<オプション>改行をセパレータで用いる sep = '\n' sep = '\n' +マップのキーとその��をペアとして取り出す aDict.items() aDict.items() +nの2進リテラルを使う bin(n) bin(n) +折れ線グラフのダイアモンドマーカーの線幅をnにする plt.plot(データ列, データ列2, marker='D', markeredgewidth=n) plt.plot(データ列, データ列2, marker='D', markeredgewidth=n) +浮動小数点数を実数に加える x * y x + y +文字列が数字か調べる s.isdigit() s.isdigit() +折れ線グラフを描画して、色をパールバイオレットレッドに設定する plt.plot(データ列, データ列2, color='palevioletred') plt.plot(データ列, データ列2, color='palevioletred') +データフレームを関数によってグループ分けする df.groupby(関数).describe() df.groupby(関数) +リストとリストについて明るいグラフを描画して、その色を黒にする plt.plot(xdata, ydata, linestyle='bright', color='k') plt.plot(xdata, ydata, linestyle='bright', color='k') +線グラフの色をダークオーキッドに設定する plt.plot(データ列, データ列2, color='darkorchid') plt.plot(データ列, データ列2, color='darkorchid') +浮動小数点数を複素数に変換する float(e) complex(x) +<オプション>ラベンダーブラッシュにグラフの色をセットする color = 'lavenderblush' color = 'lavenderblush' +折れ線グラフの色をサドルブラウンに変更する plt.plot(データ列, データ列2, color='saddlebrown') plt.plot(データ列, データ列2, color='saddlebrown') +<オプション>ミディアムシアグリーンにグラフの色を設定する color ='mediumseagreen' color = 'mediumseagreen' +データフレームのカラムの中に文字列と文字列が含まれるか df[col].isin([value, value2]) df[col].isin([value, value2]) +文字列を変数にする z = sympy.Symbol(s) sympy.Symbol(s) +二つの集合が集合と互いに素か調べる aSet.isdisjoint(aSet2) aSet.isdisjoint(aSet2) +線グラフを描画して、色をダークグリーンに設定する plt.plot(データ列, データ列2, color='darkgreen') plt.plot(データ列, データ列2, color='darkgreen') +実数の3乗 x ** 3 x ** 3 +データフレームから重複する行を消し、、入れ替える df.drop_duplicates(inplace=True) df.drop_duplicates(inplace=True) +データフレームの内の列と列に重複があれば、削除する df.drop_duplicates(subset=[column, column2]) df.drop_duplicates(subset=[column, column2]) +グラフに水平方向の破線を付ける plt.axhline(y=0, linestyle='dashed') plt.axhline(y=0, linestyle='dashed') +データ列を箱ひげ図で可視化する plt.boxplot(データ列) plt.boxplot(データ列) +ヒストグラムを描画して色をフォレストグリーンに変更する plt.hist(データ列, color='forestgreen') plt.hist(データ列, color='forestgreen') +リストが全て真か all(aList) all(aList) +ヒストグラムの色を耐火レンガに変更する plt.hist(データ列, color='firebrick') plt.hist(データ列, color='firebrick') +ベクトルの列ごとの合計 np.sum(aArray, axis=0) np.sum(aArray, axis=0) +折れ線グラフを描画して、その色をブルーバイオレットにする plt.plot(データ列, データ列2, color='blueviolet') plt.plot(データ列, データ列2, color='blueviolet') +ミディアムブルーにヒストグラムの色を設定する plt.hist(データ列, color='mediumblue') plt.hist(データ列, color='mediumblue') +線グラフの色をイエローグリーンに指定する plt.plot(データ列, データ列2, color='yellowgreen') plt.plot(データ列, データ列2, color='yellowgreen') +データフレームのリストカラムが正規分布からどの程度、尖っているか確認する df[aList].skew() df[aList].skew() +日付データの曜日を使う aDate.weekday() aDate.weekday() +文字列リストを結合して一つの文字列にする ''.join(map(str, iterable)) ''.join(aStringList) +折れ線グラフを描画して色を小麦色に設定する plt.plot(データ列, データ列2, color='wheat') plt.plot(データ列, データ列2, color='wheat') +書式としてデータ列を日付データに変換する pd.to_datetime(ds, format=fmt) pd.to_datetime(ds, format='%Y-%m-%d') +折れ線グラフの大バツマーカーのサイズをnに変更する plt.plot(データ列, データ列2, marker='X', markersize=n) plt.plot(データ列, データ列2, marker='X', markersize=n) +実線にヒストグラムの線のスタイルを変更する plt.hist(データ列, linestyle='solid') plt.hist(データ列, linestyle='solid') +<オプション>ライトスカイブルーにグラフの色を指定する color = 'lightskyblue' color = 'lightskyblue' +タプルのn番目以降の要素を得る aTuple[:-n] aTuple[n:] +両端キューのstart番目からendの部分要素 collections.deque(itertools.islice(deq, start, end)) collections.deque(itertools.islice(deq, start, end)) +データフレームを2つの列によって昇順に並べ直して、更新す�� df.sort_values(by=['A', 'B'], ascending=True, inplace=True) df.sort_values(by=['A', 'B'], ascending=True, inplace=True) +リストとリストの散布図を描画し、マーカーを星に変更する plt.plot(xdata, ydata, marker='*') plt.plot(xdata, ydata, marker='*') +ヒストグラムを描画して、その色を青緑に設定する plt.hist(データ列, color='teal') plt.hist(データ列, color='turquoise') +折れ線グラフの色をパールバイオレットレッドに指定する plt.plot(データ列, データ列2, color='palevioletred') plt.plot(データ列, データ列2, color='palevioletred') +両端キューに数値をエンキューする deq.append(element) deq.appendleft(element) +グラフの色テーマを色差別なくする sns.set(pallete='colorblind') sns.set(pallete='colorblind') +折れ線グラフを描画して、色をシエナに設定する plt.plot(データ列, データ列2, color='sienna') plt.plot(データ列, データ列2, color='sienna') +色差別ない色で重なりを見やすくデータ列とリストについての散布図を描画する plt.plot(xdata, ydata, c='colorblind', alpha=0.5) plt.plot(xdata, ydata, c='colorblind', alpha=0.5) +<オプション>n番目のカラムをインデックスに変更する index_col = n index_col = n +データフレームの列がxより大きいデータを取り出す df[df[column] > x] df[df[column] > x] +データフレームからカテゴリデータのカラム名の一覧 df.select_dtypes('object').columns df.select_dtypes('object').columns +折れ線グラフを描画してその色をライトスレイグレーに設定する plt.plot(データ列, データ列2, color='lightslategray') plt.plot(データ列, データ列2, color='lightslategray') +配列と数列の散布図に赤色のバツマーカーを描画する plt.plot(xdata, ydata, marker='x', c='r') plt.plot(xdata, ydata, marker='x', c='r') +折れ線グラフの大バツマーカーを赤色にする plt.plot(データ列, データ列2, marker='X', markerfacecolor='r') plt.plot(データ列, データ列2, marker='X', markerfacecolor='r') +データ列をビン数nとしてビン分割し、namesのラベルをつける pd.cut(ds, n, labels=names) pd.cut(ds, n, labels=names) +値を黄色でプリントできる文字列に変換する f'\033[33m{value}\033[0m' f'\033[33m{value}\033[0m' +折れ線グラフを描画して、色をスノーに設定する plt.plot(データ列, データ列2, color='snow') plt.plot(データ列, データ列2, color='snow') +文字列の右側は部分文字列か s.rstrip(sub) s.endswith(sub) +文字列の右側から部分文字列を消す s.rfind(sub) s.rstrip(sub) +色差別ないパレットをグラフの描画で用いる sns.set(pallete='colorblind') sns.set(pallete='colorblind') +Pandasでデータ列を書式fmtで日付データに変換する pd.to_datetime(ds, format='%Y-%m-%d') pd.to_datetime(ds, format=fmt) +箱ヒゲ図を2つ並べる plt.boxplot([データ列, データ列2]) plt.boxplot([データ列, データ列2]) +<オプション>ミディアムスプリンググリーンにグラフの色を設定する color ='mediumspringgreen' color = 'mediumspringgreen' +カラーコードの▼マーカーで散布図を描画する plt.plot(xdata, ydata, marker='v', c=rgb) plt.plot(xdata, ydata, marker='v', c=rgb) +整数nを八進表記にする oct(n) oct(n) +データフレームの50パーセンタイル df.median() df.median() +データフレームから指定された4列を取り出す df[df.columns[1:]] df[[column, column2, column3, column4]] +ベクトルの累積積 aArray - aArray2 np.cumprod(aArray) +<オプション>耐火レンガ色を使用する color = 'firebrick' color = 'firebrick' +黒い△マーカーを散布図に使用する plt.plot(xdata, ydata, marker='^', c='k') plt.plot(xdata, ydata, marker='^', c='k') +折れ線グラフを描画して、色をミディアムブルーに設定する plt.plot(データ列, データ列2, color='mediumblue') plt.plot(データ列, データ列2, color='mediumblue') +パステル調のの色をカラーコードに設定する plt.plot(xdata, ydata, linestyle='pastel', color=rgb) plt.plot(xdata, ydata, linestyle='pastel', color=rgb) +<オプション>ダークグレー色を用いる color = 'darkgray' color = 'darkgrey' +リスト内の要素が少なくともひとつ真かどうか調べる any(aList) any(aList) +パステル調のグラフを配列とリストで描画して、線幅をnに設定する plt.plot(xdata, ydata, linestyle='pastel', color='r') plt.plot(xdata, ydata, linestyle='pastel', color='r') +CSVからデータフレームを読み込む pd.concat([df, df2, df3], axis=1) pd.read_csv(filename, sep=',') +リストと数列についての散布図に右三角マーカーを描画する plt.plot(xdata, ydata, marker='>') plt.plot(xdata, ydata, marker='>') +折れ線グラフの色をスプリンググリーンに指定する plt.plot(データ列, データ列2, color='springgreen') plt.plot(データ列, デ���タ列2, color='springgreen') +データフレームを列の値によってグループ化し、記述統計量を求める df.groupby(columns).describe() df.groupby(column).describe() +データフレームのインデックスの名前を一度にnameからname2に付け直す df.rename(index={name: name2}) df.rename(index={name: name2}) +両端キューのn番目の値を見る deq[n] deq[n] +リストとリストについての散布図にカラーコードの丸マーカーをプロットする plt.plot(xdata, ydata, marker='o', c=rgb) plt.plot(xdata, ydata, marker='o', c=rgb) +year年month月day日のタイムスタンプをオブジェクト化する datetime.datetime(year=year, month=month, day=day) datetime.datetime(year=year, month=month, day=day) +スクリプトファイルのフォルダパス os.path.abspath(filepath) os.path.dirname(os.path.abspath(__file__)) +部分文字列が文字列中にあるか調べる sub in s sub in s +n2がn以上かつ、n3以下か n <= n2 or n >= n3 n <= n2 and n2 <= n3 +線グラフを描画して、色をドジャーブルーに設定する plt.plot(データ列, データ列2, color='dodgerblue') plt.plot(データ列, データ列2, color='dodgerblue') +集合にイテラブルを追加する aSet.update(iterable) aSet.update(iterable) +文字列は全て印字できるかどうか調べる s.isprintable() s.isprintable() +線グラフを描画して、その色をコーンズシルクに設定する plt.plot(データ列, データ列2, color='cornsilk') plt.plot(データ列, データ列2, color='cornsilk') +<オプション>青紫を使う color = 'violet' color = 'violet' +赤い四角マーカーで散布図をプロットする plt.plot(xdata, ydata, marker='s', c='r') plt.plot(xdata, ydata, marker='s', c='r') +<オプション>色をダークスレートブルーに設定する color = 'darkslateblue' color = 'darkslateblue' +リストとリストの破線グラフを描いて、その色を明るいに設定する plt.plot(xdata, ydata, linestyle='dash', color='bright') plt.plot(xdata, ydata, linestyle='dash', color='bright') +aListn番目から要素を取り出す aList.pop(n) aList.pop(n) +データフレームを'A'列によって小さい順に破壊的にソートする df.sort_values(by='A', ascending=True, inplace=True) df.sort_values(by='A', ascending=True, inplace=True) +分子と分母から有理数を新規生成する fractions.Fraction(分子, 分母) fractions.Fraction(分子, 分母) +文字列のプレフィックスは部分文字列 s.endswith(sub) s.startswith(sub) +n2行n列の二次元リストを作る [[0] * n for _ in range(n2)] [[0] * n for _ in range(n2)] +イテラブルのイミュータブルなセット frozenset(iterable) frozenset(iterable) +暗いの色を黒くする plt.plot(xdata, ydata, linestyle='dark', color='k') plt.plot(xdata, ydata, linestyle='dark', color='k') +マルーンにヒストグラムの色を設定する plt.hist(データ列, color='maroon') plt.hist(データ列, color='maroon') +折れ線グラフに線幅nの菱形マーカーを描画する plt.plot(データ列, データ列2, marker='D', markeredgewidth=n) plt.plot(データ列, データ列2, marker='D', markeredgewidth=n) +最大行数をnに設定する pd.set_option('display.max_rows', n) pd.set_option('display.max_rows', n) +値をマゼンタで表示する print(f'\033[35m{value}\033[0m') print(f'\033[35m{value}\033[0m') +折れ線グラフにポイント印を使う plt.plot(データ列, データ列2, marker='.') plt.plot(データ列, データ列2, marker='.') +折れ線グラフの色をディムグレーに変更する plt.plot(データ列, データ列2, color='dimgrey') plt.plot(データ列, データ列2, color='dimgray') +データフレームのカラムの欠損値をメディアンに設定する df[col].fillna(df[col].median()) df[col].fillna(df[col].median()) +ヒストグラムを描画して色をダークスレートブルーに設定する plt.hist(データ列, color='darkslateblue') plt.hist(データ列, color='darkslateblue') +<オプション>グラフの色を真紅に設定する color = 'crimson' color = 'crimson' +線グラフの色をローングリーンに設定する plt.plot(データ列, データ列2, color='lawngreen') plt.plot(データ列, データ列2, color='lawngreen') +データフレームのリストカラムの25パーセンタイルを計算する df[aList].quantile(percent/100) df[aList].quantile(0.25) +'A'列でデータフレームをまとめたグループ df.groupby('A') df.groupby('A') +<オプション>ミディアムターコイズにグラフの色を指定する color ='mediumturquoise' color = 'mediumturquoise' +文字列内に空白が含まれる any(c.isspace() for c in s) any(c.isspace() for c in s) +日付データにn日分加算する aDate + datetime.timedelta(days=n) aDate + datetime.timedelta(days=n) +リストが空でないかどうか len(aList) == 0 len(aList) != 0 +データフレームの中で、列と列の重複を取り除く df.drop_duplicates(subset=[column, column2]) df.drop_duplicates(subset=column) +線グラフを描画してその色をパパイヤウィップに指定する plt.plot(データ列, データ列2, color='papayawhip') plt.plot(データ列, データ列2, color='papayawhip') +行列のユニークな要素とその個数を求める np.unique(aArray) u, counts = np.unique(aArray, return_counts=True) +<オプション>グラフの色を黄色にセットする color = 'yellow' color = 'yellow' +文字列を区切りで区切って、文字列リストに変換する s.split(sep) s.split(sep) +シーケンスから最大長nの双方向キューを生成する collections.deque(iterable, maxlen=n) collections.deque(iterable, maxlen=n) +リストについての柱状図を暗い色でプロットする plt.hist(xdata, color='dark') plt.hist(xdata, color='dark') +小数点数の小数部を計算する math.log10(x) math.modf(x)[0] +predicateFuncが真となるリストの部分 df[aList].duplicated() itertools.takewhile(predicateFunc, iterable) +2つのデータ列を並べてヒストグラムにする plt.hist([データ列, データ列2], color=['b', 'r']) plt.hist([データ列, データ列2], color=['b', 'r']) +nが奇数 n % 2 == 0 n % 2 == 1 +文字列が文字列リストのいづれかテストする s in aStringList s in aStringList +改行せずにリストをプリントする print(*aList) print(value, end='') +折れ線グラフを描画して、その色をミントクリームに変更する plt.plot(データ列, データ列2, color='mintcream') plt.plot(データ列, データ列2, color='mintcream') +Pandasでdatetime64型のデータフレームのカラムをインデックスにする df.index = pd.DatetimeIndex(df[col]) df.index = pd.DatetimeIndex(df[col]) +データフレームの数値をまとめて四捨五入する df.round() df.round() +nが一桁の数 len(str(n)) 0 <= n <= 9 +ヒストグラムを描画してその色をダークシアグリーンに指定する plt.hist(データ列, color='darkseagreen') plt.hist(データ列, color='darkseagreen') +'A'列の値によってデータフレームをグループ化し、基本統計量を求める df.groupby(column).sum() df.groupby('A').describe() +ヒストグラムの色をリネンに変更する plt.hist(データ列, color='linen') plt.hist(データ列, color='linen') +真部分集合 aSet.issubset(aSet2) aSet < aSet2 +折れ線グラフを描画して、色をカーキに変更する plt.plot(データ列, データ列2, color='khaki') plt.plot(データ列, データ列2, color='khaki') +値をキューのn番目に挿入する deq.insert(n, element) deq.insert(n, element) +文字列内にアルファベットが含まれる string.ascii_uppercase any(c.isalpha() for c in s) +二つの整数最小公倍数 math.lcm(n, n2) math.lcm(n, n2) +列の各データが何回出現するか見る ds.value_counts() ds.value_counts() +データフレームが正規分布からどれだけ、尖っているか見る df.kurt() df.skew() +データフレームが正規分布からどの程度、歪んでいるか調べる df.kurt() df.kurt() +色差別ないの線幅をnに指定する plt.plot(xdata, ydata, linestyle='colorblind', linewidth=n) plt.plot(xdata, ydata, linestyle='colorblind', linewidth=n) +複数のシートをファイルから読む pd.read_excel(filename, sheet_name=[n, n2]) pd.read_excel(filename, sheet_name=[n, n2]) +数を十の位で丸める round(x, -4) round(x, -1) +データフレームの列の値がリストに含まれる行を抽出する df[df[column].isin(aList)] df[df[column].isin(aList)] +文字列中から正規表現にASCII限定としてマッチする位置を探す re.search(pattern, s, flags=re.ASCI) re.search(pattern, s, flags=re.ASCI) +ヒストグラムを描画して、nにビン数を指定する plt.hist(データ列, bins=n) plt.hist(データ列, bins=n) +空白で文字列を区切って数列に変換する map(int, s.split()) map(int, s.split()) +データ列をリストを境界値としてビニングする pd.cut(ds, aList) pd.cut(ds, aList) +<オプション>色をゴールデンロッドに設定する color = 'goldenrod' color = 'goldenrod' +ヒストグラムを描画してその色をダークサーモンに設定する plt.hist(データ列, color='darksalmon') plt.hist(データ列, color='darksalmon') +ヒストグラムを描画して、色を小麦色に設定する plt.hist(データ列, color='wheat') plt.hist(データ列, color='wheat') +データフレームから重複した行を残さず消す df.drop_duplicates() df.drop_duplicates(keep=False) +データフレームの欠損値を直前の値に増やす df.fillna(df.mode().iloc[0]) df.fillna(method='ffill') +リストの末尾から値をポップする aList.pop() aList.pop() +<オプション>グラフの色をディムグレーに変更する color = 'dimgray' color = 'dimgrey' +折れ線グラフを実線に設定する plt.plot(データ列, データ列2, linestyle='solid') plt.plot(データ列, データ列2, linestyle='solid') +データフレームの列をヒストグラムとして可視化する plt.hist(df[column]) plt.hist(df[column]) +線グラフを描画して、色をライムグリーンに設定する plt.plot(データ列, データ列2, color='limegreen') plt.plot(データ列, データ列2, color='limegreen') +現在の再帰の上限 sys.getrecursionlimit() sys.getrecursionlimit() +濃いの折れ線の線幅を指定する plt.plot(xdata, ydata, linestyle='deep', linewidth=n) plt.plot(xdata, ydata, linestyle='deep', linewidth=n) +グラフの目的を論文に指定する sns.set(context='paper') sns.set(context='paper') +赤色の丸マーカーをリストと配列についての散布図に描画する plt.plot(xdata, ydata, marker='o', c='r') plt.plot(xdata, ydata, marker='o', c='r') +ヒストグラムを描画して、その色をカーキに変更する plt.hist(データ列, color='khaki') plt.hist(データ列, color='khaki') +整数nがリストのどれかかどうか n in aList n in aList +ヒストグラムを描画して、色をロイヤルブルーに変更する plt.hist(データ列, color='royalblue') plt.hist(データ列, color='royalblue') +折れ線グラフの四角印の線幅をnにする plt.plot(データ列, データ列2, marker='s', markeredgewidth=n) plt.plot(データ列, データ列2, marker='s', markeredgewidth=n) +線グラフを描画して、その色をミディアムパープルに設定する plt.plot(データ列, データ列2, color='mediumpurple') plt.plot(データ列, データ列2, color='mediumpurple') +折れ線グラフの星印を青色にする plt.plot(データ列, データ列2, marker='*', markerfacecolor='b') plt.plot(データ列, データ列2, marker='*', markerfacecolor='b') +ヒストグラムを描画して、色をライトゴールドロディイエローに指定する plt.hist(データ列, color='lightgoldenrodyellow') plt.hist(データ列, color='lightgoldenrodyellow') +列にシーケンスを続ける itertools.accumulate(iterable) itertools.chain(iterable, iterable2) +バイオレットにヒストグラムの色を設定する plt.hist(データ列, color='violet') plt.hist(データ列, color='violet') +二つの変数をコロンで区切ってプリントする print(value, value2, sep=':') print(value, value2, sep=':') +<オプション>アンティークホワイトにグラフの色を指定する color = 'antiquewhite' color = 'antiquewhite' +ヒストグラムを描画して、その色をバリーウッドに変更する plt.hist(データ列, color='burlywood') plt.hist(データ列, color='burlywood') +<オプション>グラフの色をスチールブルーにセットする color ='steelblue' color = 'steelblue' +散布図を黒いクロスマーカーで描く plt.plot(xdata, ydata, marker='x', c='k') plt.plot(xdata, ydata, marker='x', c='k') +リストと数列について散布図をプロットする plt.scatter(xdata, ydata) plt.scatter(xdata, ydata) +<オプション>グラフの色を青紫にする color = 'violet' color = 'violet' +ヒストグラムを描画して、色をライトシアンに指定する plt.hist(データ列, color='lightcyan') plt.hist(データ列, color='lightcyan') +両端キューの要素をインプレースに逆に並べ直す deq.sort_index(iterable) deq.reverse() +セットの補集合 aSet.difference(aSet2) aSet.difference(aSet2) +文字列の右側から範囲を指定して部分文字列を探す s.find(sub, start, end) s.find(sub, start, end) +ヒストグラムを描画して、その色をダークゴールデンロッドに変更する plt.hist(データ列, color='darkgoldenrod') plt.hist(データ列, color='darkgoldenrod') +プロットの題名をuntitledに設定する plt.title(untitled) plt.title(untitled) +折れ線グラフの色をラベンダーにセットする plt.plot(データ列, データ列2, color='lavender') plt.plot(データ列, データ列2, color='lavender') +0から始まる無限な数列を求める itertools.count() itertools.count() +カラムのNaNを最小値に設定する ds.fillna(ds.min()) ds.fillna(ds.min()) +<オプション>エンコーディングをUTF8に変更する encoding = 'utf-8' encoding = 'utf-8' +リストの要素数 len(aList) len(aList) +線幅nのクロスマーカーを折れ線グラフに描画する plt.plot(データ列, データ列2, marker='x', markeredgewidth=n) plt.plot(データ列, データ列2, marker='x', markeredgewidth=n) +折れ線グラフの色をアリスブルーに変更する plt.plot(データ列, データ列2, color='aliceblue') plt.plot(データ列, データ列2, color='aliceblue') +ヒストグラムを描画して、色をネイビーに設定する plt.hist(データ列, color='navy') plt.hist(データ列, color='navy') +<オプション>ミディアムブルー色を用いる color ='mediumblue' color = 'mediumblue' +xの小数点以下'3'桁までを出力する print(':.3f'.format(x)) print(':.3f'.format(x)) +xが1、もしくは2かどうか調べる x == 1 or x == 2 x == 1 or x == 2 +<オプション>ラベンダー色を使用する color = 'lavender' color = 'lavender' +配列の度数分布図をプロットする plt.hist(データ列, bins=n) plt.hist(aArray) +折れ線グラフの印を三角印にする plt.plot(データ列, データ列2, marker='^') plt.plot(データ列, データ列2, marker='^') +ヒストグラムの色をゲインズボロにセットする plt.hist(データ列, color='gainsboro') plt.hist(データ列, color='gainsboro') +<オプション>ピーチパフを使う color = 'peachpuff' color = 'peachpuff' +<オプション>ダークカーキ色を用いる color = 'darkkhaki' color = 'darkkhaki' +<オプション>ミントクリームを使う color ='mintcream' color = 'mintcream' +プロットをポスター用に設定する sns.set(context='poster') sns.set(context='poster') +赤色の暗いをプロットする plt.plot(xdata, ydata, linestyle='dark', color='r') plt.plot(xdata, ydata, linestyle='dark', color='r') +ファイルを開き]、バイナリ書き込みストリームを求める open(filepath, mode='wb') open(filepath, mode='wb') +赤色の下三角マーカーを数列とリストについての散布図に描画する plt.plot(xdata, ydata, marker='v', c='r') plt.plot(xdata, ydata, marker='v', c='r') +データフレームの中で、列と列の重複を消す df.drop_duplicates(subset=[column, column2]) df.drop_duplicates(subset=[column, column2]) +列の75パーセンタイル ds.quantile(0.25) ds.quantile(0.75) +イテラブルとリストについて散布図を描画して、丸マーカーの色をカラーコードに設定する plt.plot(xdata, ydata, marker='o', c=rgb) plt.plot(xdata, ydata, marker='o', c=rgb) +折れ線グラフを一点鎖線として描画する plt.plot(データ列, データ列2, linestyle='dashbot') plt.plot(データ列, データ列2, linestyle='dashbot') +ヒストグラムのビンをセットする plt.hist(データ列, bins=n) plt.hist(データ列, bins=n) +列のコンビネーション itertools.combinations(iterable, n) itertools.combinations(iterable, n) +折れ線グラフに描画して、印を四角印にする plt.plot(データ列, データ列2, marker='s') plt.plot(データ列, データ列2, marker='s') +リストを等量でn個に分割する pd.qcut(aList, n) pd.qcut(aList, n) +<オプション>色をパウダーブルーに設定する color = 'powderblue' color = 'powderblue' +実数の双曲線正弦の逆数を求める math.sinh(x) math.asinh(x) +ダークターコイズにヒストグラムの色を指定する plt.hist(データ列, color='darkturquoise') plt.hist(データ列, color='darkturquoise') +散布図を色差別ない色のマーカーで重なりを見やすく描画する plt.plot(xdata, ydata, c='colorblind', alpha=0.5) plt.plot(xdata, ydata, c='colorblind', alpha=0.5) +xを浮動小数点数にする float(x) float(x) +リストとデータ列の散布図を濃い色を使って重なりを見やすく描く plt.plot(xdata, ydata, c='deep', alpha=0.5) plt.plot(xdata, ydata, c='deep', alpha=0.5) +部分文字列かテストする sub in s sub in s +リストのオブジェクトの位置をエラーなく使う aList.extend(aList2) aList.index(element) if element in aList else -1 +アルファベットから1文字ランダムに選ぶ random.choice(string.ascii_uppercase) random.choice(string.ascii_uppercase) +ヒストグラムの色をシーグリーンに変更する plt.hist(データ列, color='seagreen') plt.hist(データ列, color='seagreen') +淡い色として柱状図を描画する plt.hist(xdata, color='muted') plt.hist(xdata, color='muted') +配列と配列についてリストの値に応じて、散布図の色を変える plt.scatter(xdata, ydata, c=aList, cmap='Blues') plt.scatter(xdata, ydata, c=aList, cmap='Blues') +ヒストグラムの色をダークオリーブグリーンに変更する plt.hist(データ列, color='darkolivegreen') plt.hist(データ列, color='darkolivegreen') +データフレームの中の列と列に重複があれば取り除く df.drop_duplicates(subset=[column, column2]) df.drop_duplicates(subset=column) +線グラフの色をシーグリーンに設定する plt.plot(データ列, データ列2, color='seagreen') plt.plot(データ列, データ列2, color='seagreen') +<オプション>色をライトゴールドロディイエローに設定する color = 'lightgoldenrodyellow' color = 'lightgoldenrodyellow' +<オプション>サーモン色を用いる color ='salmon' color = 'salmon' +列と列をチェインする itertools.chain(iterable, iterable2) itertools.chain(iterable, iterable2) +欠損値を含めてデータフレームを列でグループ化する df.groupby(column, dropna=False) df.groupby(column, dropna=False) +黒色の左三角マーカーで散布図を描く plt.plot(xdata, ydata, marker='<', c='k') plt.plot(xdata, ydata, marker='<', c='k') +nわるn2を計算する n / n2 n / n2 +ピアソン積率相関係数でデータフレームの列と列の相関行列を計算する df[[column, column2]].corr(method='kendall') df[[column, column2]].corr(method='pearson') +両端キューをdequeue deq.count(element) deq.popleft() +カウンタを高頻出方からリストとして得る aCounter.most_common(k) aCounter.most_common() +カウンタを多い順番に列挙する aCounter.most_common() aCounter.most_common() +折れ線グラフを描画してその色をダークグレーに設定する plt.plot(データ列, データ列2, color='darkgray') plt.plot(データ列, データ列2, color='darkgray') +折れ線グラフを描画して、色をアクアに設定する plt.plot(データ列, データ列2, color='aqua') plt.plot(データ列, データ列2, color='aqua') +<オプション>線種を実線に変更する linestyle ='solid' linestyle = 'solid' +文字列がタプルに含まれないかどうか調べる element not in aTuple element not in aTuple +変数を黄色化する f'\033[33m{value}\033[0m' f'\033[33m{value}\033[0m' +データ列とリストについてカラーコードの暗いグラフをプロットする plt.plot(xdata, ydata, linestyle='dark', color=rgb) plt.plot(xdata, ydata, linestyle='dark', color=rgb) +リストとリストについての散布図に赤色の星マーカーを描画する plt.plot(xdata, ydata, marker='*', c='r') plt.plot(xdata, ydata, marker='*', c='r') +データフレームのリストカラムを100の位で丸めて整数型にする df[aList].round(-2).astype(int) df[aList].round(-2).astype(int) +<オプション>グレーに色を設定する color = 'grey' color = 'gray' +日付時刻データとタイムスタンプデータの時間差を秒数で計算する (aDatetime - aDatetime2).total_seconds()//60 (aDatetime - aDatetime2).total_seconds()//60 +リストを色差別ない色の柱状図で描画する plt.hist(xdata, color='colorblind') plt.hist(xdata, color='colorblind') +ヒストグラムを描画して色をサーモンに設定する plt.hist(データ列, color='salmon') plt.hist(データ列, color='salmon') +リストを緑色化する f'\033[32m{value}\033[0m' f'\033[32m{value}\033[0m' +データフレームを'A'列と'B'列の値によってグループ化し、基本統計量を求める df.groupby(['A', 'B']).describe() df.groupby(['A', 'B']).describe() +データフレームの中に含まれる文字列と日付データの合計を数える df.isin([value, value2]).sum() df.isin([value, value2]).sum() +コロンで文字列を分割して、文字列リストにする s.split(sep) s.split(':') +データ列と配列について散布図を描画し、、マーカーの色をパステル調のに設定する plt.plot(xdata, ydata, c='pastel') plt.plot(xdata, ydata, c='pastel') +文字列はタイトル大文字小文字かどうか調べる s.istitle() s.istitle() +整数nを符号付きで長さn2のバイナリにする n //= n2 n.to_bytes(length=bytesize, byteorder='big', signed=True) +リストをn個にビニングしてnamesのラベルをつける pd.cut(aList, n, labels=names) pd.cut(aList, n, labels=names) +<オプション>ゴールデンロッドを使用する color = 'goldenrod' color = 'goldenrod' +<オプション>色を青緑に設定する color = 'turquoise' color = 'teal' +明るい色でイテラブルについてのヒストグラムを描画する plt.hist(xdata, color='bright') plt.hist(xdata, color='bright') +n個に等間隔でデータ列をビン分割する pd.cut(ds, n) pd.cut(ds, n) +ヒストグラムを描画して、色をレベッカパープルに設定する plt.hist(データ列, color='rebeccapurple') plt.hist(データ列, color='rebeccapurple') +変数がマイナス無限大に近づくとき数式の極限値を求める sympy.limit(e, z, -oooo) sympy.limit(e, z, -oo) +直前の値でデータ列の欠損値を置換する ds.fillna(method='bfill') ds.fillna(method='ffill') +ファイルパスの拡張子付きのファイル名を使う os.path.abspath(filepath) os.path.basename(filepath) +折り返しを無効に設定する sns.set(context='poster') pd.set_option('expand_frame_repr', False) +データ列のNaNを中央値で補う ds.fillna(ds.median()) ds.fillna(ds.median()) +データフレームの列と列の各列間の相関係数 df[[column, column2]].corr() df[[column, column2]].corr() +リストから行列を作成する np.array(aList) np.array(aList) +レベッカパープルにヒストグラムの色を設定する plt.hist(データ列, color='rebeccapurple') plt.hist(データ列, color='rebeccapurple') +表データの指定された列を抽出する df.columns = columns df[column] +線グラフを描画して、色をデピンクに設定する plt.plot(データ列, データ列2, color='deeppink') plt.plot(データ列, データ列2, color='deeppink') +折れ線グラフを描画してその色をゴールデンロッドに指定する plt.plot(データ列, データ列2, color='goldenrod') plt.plot(データ列, データ列2, color='goldenrod') +文字列を最後の部分文字列で二分し後半の文字列を使う s.rpartition(sub)[-1] s.rpartition(sub)[-1] +データフレームの列がxである行を取り出す df[df[column] == x] df[df[column] == x] +タプルのキーに対応した値を参照する aDict[key] aDict.get(key) +データフレームのstart行目からend行目までを取り出す df[start:end] df[start:end] +データフレームのリストカラムのNaNを最小値にセットする df[aList].fillna(df[aList].min()) df[aList].fillna(df[aList].min()) +折れ線グラフの菱形印のサイズをnに設定する plt.plot(データ列, データ列2, marker='D', markersize=n) plt.plot(データ列, データ列2, marker='D', markersize=n) +データフレームの列のヒストグラムをプロットする plt.hist(df[column]) plt.hist(df[column]) +行列の要素ごとのアダマール積 np.multiply(aArray, aArray2) np.multiply(aArray, aArray2) +ヒストグラムをプロットして、透明度をxに指定する plt.hist(データ列, alpha=x) plt.hist(データ列, alpha=x) +濃いで柱状図を描画する plt.hist(xdata, color='deep') plt.hist(xdata, color='deep') +ヒストグラムを描画してその色を紺碧に設定する plt.hist(データ列, color='azure') plt.hist(データ列, color='azure') +オブジェクトのバイトサイズを知る sys.getsizeof(obj) sys.getsizeof(obj) +折れ線グラフにサイズnの上三角印を描画する plt.plot(データ列, データ列2, marker='^', markersize=n) plt.plot(データ列, データ列2, marker='^', markersize=n) +<オプション>タブを区切りで用いる sep = '\t' sep = '\t' +左三角マーカーとして散布図を描画する plt.plot(xdata, ydata, marker='<') plt.plot(xdata, ydata, marker='<') +線グラフの色をダークオリーブグリーンに設定する plt.plot(データ列, データ列2, color='darkolivegreen') plt.plot(データ列, データ列2, color='darkolivegreen') +データフレームの列の中にある日付データと文字列の合計を数える df.isin([value, value2]).sum() df[col].isin([value, value2]).sum() +イテラブルとリストについての散布図に赤いダイアモンドマーカーをプロットする plt.plot(xdata, ydata, marker='D', c='r') plt.plot(xdata, ydata, marker='D', c='r') +ヒストグラムを描画して、その色をダークグレーに指定する plt.hist(データ列, color='darkgray') plt.hist(データ列, color='darkgrey') +ベクトルを行方向に連結する np.concatenate([aArray, aArray2], axis=1) np.concatenate([aArray, aArray2], axis=1) +折れ線グラフに描画して、印を▽にする plt.plot(データ列, データ列2, marker='v') plt.plot(データ列, データ列2, marker='v') +xにヒストグラムのアルファ値を設定する plt.hist(データ列, alpha=x) plt.hist(データ列, alpha=x) +ヒストグラムの色をディムグレーに指定する plt.hist(データ列, color='dimgray') plt.hist(データ列, color='dimgray') +データフレームのグループごとの最小値 df.groupby(column).min() df.groupby(column).min() +ヒストグラムを描画してその色を青に指定する plt.hist(データ列, color='blue') plt.hist(データ列, color='blue') +Pandasでフォーマットで文字列を日付データに変換する pd.to_datetime(s, format=fmt) pd.to_datetime(s, format='%Y-%m-%d') +データフレームをJSONLファイルにカラムの名前を付けずに保存する df.to_csv(filename, encoding='utf-8') df.to_csv(filename, header=None) +カウンタから最頻出な項目の件数を求める aCounter.most_common()[1] aCounter.most_common()[1] +折れ線グラフの下三角マーカーを黄色にする plt.plot(データ列, データ列2, marker='v', markerfacecolor='y') plt.plot(データ列, データ列2, marker='v', markerfacecolor='y') +赤色の淡いグラフを描く plt.plot(xdata, ydata, linestyle='muted', color='r') plt.plot(xdata, ydata, linestyle='muted', color='r') +で使える色名の一覧 matplotlib.colors.cnames matplotlib.colors.cnames +ヒストグラムの色を濃いシアンに変更する plt.hist(データ列, color='darkcyan') plt.hist(データ列, color='darkcyan') +<オプション>タンに色をする color = 'tan' color = 'tan' +折れ線グラフを描画してその色をロージーブラウンに設定する plt.plot(データ列, データ列2, color='rosybrown') plt.plot(データ列, データ列2, color='rosybrown') +文字列を最初の部分文字列で二分し、後半の文字列を使う s.partition(sub)[-1] s.partition(sub)[-1] +nとn2のビット和を求める n | n2 n | n2 +タプルと組を接続する aTuple + aTuple2 aTuple + aTuple2 +標準出力の出力先がターミナルか調べる os.isatty(sys.stdin.fileno()) sys.stdout.isatty() +<オプション>カンマを区切りで使う sep = ',' sep = ',' +配列と配列の散布図を描画し、、マーカーの色を明るいに変更する plt.plot(xdata, ydata, c='bright') plt.plot(xdata, ydata, c='bright') +実数が負の数か math.isfinite(x) x < 0 +データフレー��のカラムの75パーセンタイル df[col].quantile(percent/100) df[col].quantile(0.75) +浮動小数点数を実数で除する x // y x / y +空のチェーンマップを作る collections.ChainMap() collections.ChainMap() +データフレームを列名リストによって昇順に破壊的にソートする df.sort_values(by=column, ascending=False, inplace=True) df.sort_values(by=column, ascending=True, inplace=True) +データフレームを表示するときカラムの最大幅をnに設定する pd.set_option('max_colwidth', n) pd.set_option('max_colwidth', n) +データフレームの列のpercent分位数 df[col].quantile(0.75) df[col].quantile(percent/100) +明るいの折れ線グラフの色を赤にする plt.plot(xdata, ydata, linestyle='bright', color='r') plt.plot(xdata, ydata, linestyle='bright', color='r') +文字列中にひとつでも非空白が含まれるか確認する any(not c.isspace() for c in s) any(not c.isspace() for c in s) +カウンタのキーと出現回数を列挙する aCounter.items() aCounter.items() +各列毎にデータフレームをグループ化して、列の個数を求める df.groupby(column)[column2].count() df.groupby(column)[column2].count() +データフレームが重複している df.duplicated() df.duplicated() +データフレームの中に日付データと文字列がある df.isin([value, value2]) df.isin([value, value2]) +カラーバーを横向きで描く s.split(sep) plt.colorbar(orientation='horizontal') +<オプション>コーラルにグラフの色を設定する color = 'coral' color = 'coral' +折れ線グラフを描画して、色をスラグレーに設定する plt.plot(データ列, データ列2, color='slategrey') plt.plot(データ列, データ列2, color='slategrey') +データフレームの重複した行だけ df.duplicated() df[df.duplicated(keep=False)] +パステル調の色を使って数列と配列の散布図をプロットする plt.plot(xdata, ydata, c='pastel') plt.plot(xdata, ydata, c='pastel') +黒いパステル調のをプロットする plt.plot(xdata, ydata, linestyle='pastel', color='k') plt.plot(xdata, ydata, linestyle='pastel', color='k') +コーンズシルクにヒストグラムの色を指定する plt.hist(データ列, color='cornsilk') plt.hist(データ列, color='cornsilk') +ヒストグラムを描画して、その色を赤にする plt.hist(データ列, color='red') plt.hist(データ列, color='red') +リストの末尾の要素を求める aList[i], aList[-1] aList[-1] +ヒストグラムを描画して、その色をオールドレースに指定する plt.hist(データ列, color='oldlace') plt.hist(データ列, color='oldlace') +表のn行目を削除し、、更新する n.set_length= n, byteorder='big', signed=True) df.drop(n, axis=0, inplace=True) +折れ線グラフの星マーカーの大きさをnに指定する plt.plot(データ列, データ列2, marker='*', markersize=n) plt.plot(データ列, データ列2, marker='*', markersize=n) +データフレームの列がx以下の行を取り出す df[df[column] == x] df[df[column] <= x] +<オプション>色を茶色に設定する color = 'brown' color = 'brown' +リストとリストで淡いを描き、、その線幅をnに設定する plt.plot(xdata, ydata, linestyle='muted', color=rgb) plt.plot(xdata, ydata, linestyle='muted', linewidth=n) +小数点以下の表示精度をn桁にする pd.set_option('precision', n) pd.set_option('precision', n) +上限nの両端キューを作る collections.deque(maxlen=n) collections.deque(maxlen=n) +本日の日付を使う datetime.date.today() datetime.date.today() +イテラブルから集合を使う set(iterable) set(iterable) +コードポイントの最大値 sys.maxunicode sys.maxunicode +線グラフを描画して、その色をコーンフラワーブルーに指定する plt.plot(データ列, データ列2, color='cornflowerblue') plt.plot(データ列, データ列2, color='cornflowerblue') +見やすいプロットを描画する import seaborn as sns import seaborn as sns +<オプション>ダークシアンに色を設定する color = 'darkcyan' color = 'darkcyan' +nがn2よりも大きいか判定する n < n2 n > n2 +中央値でリストをビン分割する pd.qcut(aList, 2) pd.qcut(aList, 2) +カウンタの要素数 len(aCounter) len(aCounter) +行列の内積 np.dot(aArray) np.dot(aArray, aArray2) +プラットホームのバイトオーダを知る sys.getrecursionlimit() sys.byteorder +TSVをデータフレームとして読み込む pd.read_csv(filename, sep='\t', encoding='utf-8') pd.read_csv(filename, sep='\t') +<オプション>色をイエローグリーンに設定する color = 'greenyellow' color = 'yellowgreen' +文字列の先頭から空白やタブを取り除く s.lstrip('\t') s.lstrip() +タプルを引数として展開してプリントする formatText.format(*args) print(*aTuple, sep=',') +ヒストグラムを描画して色をペルーに設定する plt.hist(データ列, color='peru') plt.hist(データ列, color='peru') +<��プション>ライトグレーを使用する color = 'lightgray' color = 'lightgray' +ふたつの集合の対称差を使う aSet.symmetric_difference(aSet2) aSet.symmetric_difference(aSet2) +折れ線グラフを描画して、色をダークオレンジに設定する plt.plot(データ列, データ列2, color='darkorange') plt.plot(データ列, データ列2, color='darkorange') +ヒストグラムの色をティールに設定する plt.hist(データ列, color='teal') plt.hist(データ列, color='teal') +イテラブルとリストで色差別ないの折れ線グラフを描画して、その線幅をnに変更する plt.plot(xdata, ydata, linestyle='colorblind', linewidth=n) plt.plot(xdata, ydata, linestyle='colorblind', color=rgb) +文字列の開始位置以降に部分文字列が含まれない s.find(sub, start)!= -1 s.find(sub, start) == -1 +オブジェクトがフィールドを持つ hasattr(obj, プロパティ名) hasattr(obj, プロパティ名) +データ列とラベルを指定して、棒グラフをプロットする plt.barh(ラベル列, データ列) plt.bar(ラベル列, データ列) +本日が土曜日かどうか datetime.datetime.today().weekday() == 6 datetime.datetime.today().weekday() == 5 +データフレームの欠損値をモードで埋める df.fillna(df.mode().iloc[0]) df.fillna(df.mode().iloc[0]) +<オプション>サドルブラウンを用いる color ='saddlebrown' color = 'saddlebrown' +ファイルを文字列の示すエンコーディングとして開く] open(filepath, encoding=s) open(filepath, encoding=s) +配列のスカラー倍を算出する aArray * n aArray * n +等差数列から整数乱数を得る random.randrange(start, end, step) random.randrange(start, end, step) +スピアマン順位相関係数でデータフレームのリスト列の相関行列 df[aList].corr(method='spearman') df[aList].corr(method='spearman') +黒い色差別ないグラフをプロットする plt.plot(xdata, ydata, linestyle='colorblind', color='k') plt.plot(xdata, ydata, linestyle='colorblind', color='k') +マッピングの項目名一覧を得る aDict.values() list(aDict) +ヒストグラムを描画して、色を貝殻に設定する plt.hist(データ列, color='seashell') plt.hist(データ列, color='seashell') +文字列の中で複数行対応としてパターンにマッチした文字列をリストに変換する re.findall(pattern, s, flags=re.MULTILINE) re.findall(pattern, s, flags=re.MULTILINE) +本日の年 datetime.datetime.today().year datetime.datetime.today().year +線グラフの色をインディアンレッドに設定する plt.plot(データ列, データ列2, color='indianred') plt.plot(データ列, データ列2, color='indianred') +散布図にダイアモンドマーカーを用いる plt.plot(xdata, ydata, marker='D') plt.plot(xdata, ydata, marker='D') +黒い星マーカーを散布図に使う plt.plot(xdata, ydata, marker='*', c='k') plt.plot(xdata, ydata, marker='*', c='k') +折れ線グラフの色をミスティローズにセットする plt.plot(データ列, データ列2, color='mistyrose') plt.plot(データ列, データ列2, color='mistyrose') +<オプション>ターコイズを使う color = 'turquoise' color = 'turquoise' +組をソートする sorted(aTuple) sorted(aTuple) +文字列を最初の部分文字列で分割したときの前半の文字列を使う s.partition(sub)[0] s.partition(sub)[0] +線グラフの色をライトシアンに変更する plt.plot(データ列, データ列2, color='lightcyan') plt.plot(データ列, データ列2, color='lightcyan') +データフレームのカラムの欠損値を後の値に設定する df[col].fillna(method='bfill') df[col].fillna(method='bfill') +10を底とする対数を求める math.log(x, k) math.log10(x) +折れ線グラフを描画してその色をプラムに設定する plt.plot(データ列, データ列2, color='plum') plt.plot(データ列, データ列2, color='plum') +ライトコーラルにヒストグラムの色を設定する plt.hist(データ列, color='lightcoral') plt.hist(データ列, color='lightcoral') +行列から重複を除いたベクトルを作る np.unique(aArray) np.unique(aArray) +ヒストグラムを描画してその色をスプリンググリーンに変更する plt.hist(データ列, color='springgreen') plt.hist(データ列, color='springgreen') +ビン数nでデータフレームの中の列を分割する pd.cut(df[col], n) pd.cut(df[col], n) +ヒストグラムを描画して、その色をダークオレンジにする plt.hist(データ列, color='darkorange') plt.hist(データ列, color='darkorange') +列を分割する pd.cut(ds, aList) pd.cut(ds, aList) +文字列を走査し正規表現にASCII限定としてマッチするか調べる re.search(pattern, s, flags=re.ASCI) re.search(pattern, s, flags=re.ASCI) +データフレームのデータ型一覧 df.dtypes df.dtypes +3変数の最小値を求める min(x, y, z) min(x, y, z) +<オプション>ポイントマーカーを加える marker = '.' marker = '.' +浮動小数点数のn乗の実数剰余 pow(x, n, y) pow(x, n, y) +データフレームをグループ化し、各列に対し標準偏差を求める df.groupby(column)[column2].std() df.groupby(column)[column2].std() +データフレームを二つの列でソートする df.sort_values(by=['A', 'B']) df.sort_values(by=['A', 'B']) +折れ線グラフの色をライトサーモンに指定する plt.plot(データ列, データ列2, color='lightsalmon') plt.plot(データ列, データ列2, color='lightsalmon') +<オプション>色をスラグレーに変更する color ='slategray' color = 'slategrey' +'A'列と'B'列でデータフレームを昇順に並べ直す df.sort_values(by=['A', 'B'], ascending=False) df.sort_values(by=['A', 'B'], ascending=True) +ヒストグラムを描画して、その色をダークグリーンに変更する plt.hist(データ列, color='darkgreen') plt.hist(データ列, color='darkgreen') +横軸にuntitledというラベルを付ける plt.xlabel(untitled) plt.xlabel(untitled) +書き込みできるようにファイルを文字列の示すエンコーディングを用いてオープンする] open(filepath, mode='w', encoding=s) open(filepath, mode='w', encoding=s) +TSVファイルからCSVファイルをSJISで読む pd.read_csv(filename, encoding='shift_jis') pd.read_csv(filename, encoding='shift_jis') +折れ線グラフを破線として描画する plt.plot(データ列, データ列2, linestyle='dashed') plt.plot(データ列, データ列2, linestyle='dashed') +データフレームの指定された列をリストとして取り出す df[column].values df[column].values.tolist() +アルファベットの小文字を使う string.ascii_uppercase string.ascii_lowercase +散布図に黒色のバツマーカーを使う plt.plot(xdata, ydata, marker='x', c='k') plt.plot(xdata, ydata, marker='x', c='k') +リストと配列について破線グラフを描画し、、その色を淡いに設定する plt.plot(xdata, ydata, linestyle='dash', color='muted') plt.plot(xdata, ydata, linestyle='dash', color='muted') +ヒストグラムの色をスレートブルーにする plt.hist(データ列, color='slateblue') plt.hist(データ列, color='slateblue') +値をデックの先頭に追加する deq.index(element) deq.appendleft(element) +ベクトルの分散 np.var(aArray) np.var(aArray) +二つのデータフレームを列'A'と列'B'をキーとして右結合する pd.merge(df, df2, left_on='A', right_on='B') pd.merge(df, df2, left_on=column, right_on=column2, how='right') +データ列を1000の位で四捨五入する ds.round(-2) ds.round(-3) +文字化けしないようにTSVを読み込む pd.read_csv(filename, encoding='shift_jis') pd.read_csv(filename, encoding='shift_jis') +データフレームの列の要約統計量を求める df[col].describe() df[col].describe() +データフレームからn番目の列を消す pd.concat([df[df.columns[n:]]], axis=0) pd.concat([df[df.columns[:n]], df[df.columns[n+1:]]], axis=1) +数値の簡略化を行う sympy.sympify(e) sympy.sympify(e) +配列とイテラブルの散布図に黒い三角マーカーを描画する plt.plot(xdata, ydata, marker='^', c='k') plt.plot(xdata, ydata, marker='^', c='k') +ヒストグラムを描画してその色をライトグレーにセットする plt.hist(データ列, color='lightgray') plt.hist(データ列, color='lightgray') +<オプション>マーカーを▲に変更する marker = '^' marker = '^' +データ列を等量でn個にビニングする pd.qcut(ds, n) pd.qcut(ds, n) +両端キューをクリアする deq.clear() deq.clear() +ファイルを絶対パスにする os.path.abspath(filepath) os.path.abspath(filepath) +折れ線グラフを描画して、色をクリムゾンに設定する plt.plot(データ列, データ列2, color='crimson') plt.plot(データ列, データ列2, color='crimson') +折れ線グラフに描画してマーカーを星にする plt.plot(データ列, データ列2, marker='*') plt.plot(データ列, データ列2, marker='*') +リストとデータ列について散布図を描画してマーカーを菱形にセットする plt.plot(xdata, ydata, marker='D') plt.plot(xdata, ydata, marker='D') +カウンタの最頻出な項目を求める aCounter.most_common()[0] aCounter.most_common()[0] +まとめてValueMapでデータ列の値を置き換える ds.replace(ValueMap) ds.replace(ValueMap) +赤いバツマーカーで散布図を描く plt.plot(xdata, ydata, marker='x', c='r') plt.plot(xdata, ydata, marker='x', c='r') +データフレームを列でによって降順にソートする df.sort_values(by=column, ascending=False) df.sort_values(by=column, ascending=False) +暗いの折れ線グラフをデータ列とリストを用いて描き、その線幅をnに設定する plt.plot(xdata, ydata, linestyle='dark', linewidth=n) plt.plot(xdata, ydata, linestyle='dark', color=rgb) +折れ線グラフの色をベージュに変更する plt.plot(データ列, データ列2, color='beige') plt.plot(データ列, データ列2, color='beige') +小数点数が無限大か調べる math.isfinite(x) math.isinf(x) +グラフの描画でパステル調の色を使う sns.set(pallete='pastel') sns.set(pallete='pastel') +<オプション>エンコーディングをBOM付きに指定する encoding = 'utf_8_sig' encoding = 'utf_8_sig' +Pandasでデータフレームのcollのエポック秒から日付データに変換する pd.to_datetime(df[col], unit='s', utc=True) pd.to_datetime(df[col], unit='s', utc=True) +シーケンスの各要素に対して、predicateFuncが真であれば、その要素を出力する itertools.takewhile(predicateFunc, iterable) itertools.takewhile(predicateFunc, iterable) +文字列の最初からタブを取り除く s.rstrip('\t') s.lstrip('\t') +データ列を四分位数ごとに分割する pd.qcut(ds, 4) pd.qcut(ds, 4) +データ列を100の位で四捨五入する ds.round(-2) ds.round(-2) +散布図に左三角マーカーを用いる plt.plot(xdata, ydata, marker='<') plt.plot(xdata, ydata, marker='<') +現在の時間数を使う datetime.date.today().hour datetime.date.today().hour +ベクトルのユニークな要素ごとの出現回数 np.unique(aArray, return_counts=True) np.unique(aArray, return_counts=True) +イテラブルから配列を作成する np.array(iterable) np.array(iterable) +<オプション>フォレストグリーン色を用いる color = 'forestgreen' color = 'forestgreen' +ファイルパスをUTF8で書き込み用に開く] open(filepath, mode='w', encoding='utf-8') open(filepath, mode='w', encoding='utf-8') +カウンタをセットに変換する set(aCounter) set(aCounter) +グラフの描画を綺麗にする import seaborn as sns import seaborn as sns +オプションで、ファイルを出力先にする file = sys.open(filename, 'w') file = sys.open(filename, 'w') +<オプション>スラッシュを分割記号で使う sep = '/' sep = '/' +最小値でデータフレームのリスト列のNaNを埋める df[aList].fillna(df[aList].min()) df[aList].fillna(df[aList].min()) +オブジェクトのプロパティを値に設定する setattr(obj, プロパティ名, 値) setattr(obj, プロパティ名, 値) +<オプション>グラフの色をパールゴールデンロッドに指定する color = 'palegoldenrod' color = 'palegoldenrod' +ミディアムアクアマリンにヒストグラムの色を設定する plt.hist(データ列, color='mediumaquamarine') plt.hist(データ列, color='mediumaquamarine') +データフレームのインデックスの名前の一覧 df.index df.index +表データからカテゴリデータの列を抽出する df.select_dtypes('object') df.select_dtypes('object') +<オプション>ダークグリーンを使用する color = 'darkgreen' color = 'darkgreen' +文字列が小文字かどうか調べる s.islower() s.islower() +データフレームのリスト列の文字列を欠損値に変換する df[aList].replace(s, np.nan) df[aList].replace(s, np.nan) +散布図に赤い右三角マーカーを用いる plt.plot(xdata, ydata, marker='>', c='r') plt.plot(xdata, ydata, marker='>', c='r') +折れ線グラフのポイント印を赤色にする plt.plot(データ列, データ列2, marker='.', markerfacecolor='r') plt.plot(データ列, データ列2, marker='.', markerfacecolor='r') +<オプション>▼マーカーを描画する marker = 'v' marker = 'v' +文字列の先頭でASCII限定としてパターンにマッチさせる re.match(pattern, s, flags=re.ASCI) re.match(pattern, s, flags=re.ASCI) +エクセルファイルファイルからn番目のシートを読み込む pd.read_excel(filename, sheet_name=n) pd.read_excel(filename, sheet_name=n) +散布図に赤色の三角マーカーを使う plt.plot(xdata, ydata, marker='^', c='r') plt.plot(xdata, ydata, marker='^', c='r') +データ列は何時か見る ds.dt.hour ds.dt.hour +組のn番目からn2番目までの部分 aTuple[n:n2] aTuple[n:n2] +CSVTSVファイルをn番目のカラムを行として読み込む pd.read_csv(filename, index_col=n) pd.read_csv(filename, index_col=n) +数値を青色にする f'\033[34m{value}\033[0m' f'\033[34m{value}\033[0m' +<オプション>白にグラフの色をセットする color = 'white' color = 'white' +<オプション>左三角印を加える marker = '<' marker = '<' +タプルの最初の値を見る aTuple) aTuple[0] +16進文字列をバイト列に変換する int(s, 8).to_bytes(length=bytesize, byteorder='big') int(s, 16).to_bytes(length=bytesize, byteorder='big') +リストとリストについての散布図を淡い色で重なりを見やすくプロットする plt.plot(xdata, ydata, c='muted', alpha=0.5) plt.plot(xdata, ydata, c='muted', alpha=0.5) +<オプション>色をオーキッドに設定する color = 'orchid' color = 'orchid' +データフレームの列を10の位で丸めて、整数型にする df[col].round(-2).astype(int) df[col].round(-1).astype(int) +今日が何月か知る datetime.datetime.today().month datetime.datetime.today().month +一方に含まれ、他方に含まれな��集合を計算する aSet.difference(aSet2) aSet.difference(aSet2) +ヒストグラムを描画してその色をピンクに指定する plt.hist(データ列, color='pink') plt.hist(データ列, color='pink') +nが一桁の整数か -9 <= n <= 9 -9 <= n <= 9 +<オプション>無視するフッタをnに設定する skipfooter = n skipfooter = n +青いパステル調のを描画する plt.plot(xdata, ydata, linestyle='pastel', color='b') plt.plot(xdata, ydata, linestyle='pastel', color='b') +リストと数列について散布図を描画して、文字列というデータラベル用のラベルを設定する plt.scatter(xdata, xdata, label=s) plt.scatter(xdata, xdata, label=s) +データフレームを各列毎にグループ化し、列の平均値を計算する df.groupby(column)[column2].mean() df.groupby(column)[column2].mean() +カラーコードの左三角マーカーをリストと配列の散布図に描画する plt.plot(xdata, ydata, marker='<', c=rgb) plt.plot(xdata, ydata, marker='<', c=rgb) +文字列内にひとつでも大文字が含まれる any(c.isupper() for c in s) any(c.isupper() for c in s) +散布図をパステル調の色のマーカーとしてプロットする plt.plot(xdata, ydata, c='pastel') plt.plot(xdata, ydata, c='pastel') +配列の要素ごとの最大公約数 np.gcd(aArray, aArray2) np.gcd(aArray, aArray2) +nから無限に数え上げるする itertools.count(start=n) itertools.count(start=n) +散布図を赤い菱形マーカーで描画する plt.plot(xdata, ydata, marker='D', c='r') plt.plot(xdata, ydata, marker='D', c='r') +データフレームの列がx、かつカラムがx2である行を抽出する df[(df[column] == x] df[(df[column] == x) & (df[column2] == x2)] +データフレームのn行より後ろ抽出する df.drop(n, axis=0) df[n:] +<オプション>シルバー色を使用する color ='silver' color = 'silver' +正弦の逆数 math.asin(x) math.asin(x) +文字列中に非アスキー文字が含まれる any(not c.isupper() for c in s) any(not c.isascii() for c in s) +シーケンスとシーケンスのデカルト積を求める itertools.product(iterable, iterable2) itertools.product(iterable, iterable2) +オブジェクトが整数クラスのインスタンスかどうか確認する isinstance(obj, int) isinstance(obj, int) +TSV形式のファイルからデータフレームを読む pd.read_csv(filename, sep='\t', encoding='utf-8') pd.read_csv(filename, sep='\t', encoding='utf-8') +リストとデータ列についての散布図に四角マーカーを描く plt.plot(xdata, ydata, marker='s') plt.plot(xdata, ydata, marker='s') +<オプション>プラムを使う color = 'plum' color = 'plum' +データフレームを列名リストによってグループ化して、列挙する [(name, group) for name, group in df.groupby(columns)] [(name, group) for name, group in df.groupby(columns)] +印字できる文字を全部使う string.printable string.printable +シーケンスを文字列として連結する ','.join(map(str, iterable)) ''.join(map(str, iterable)) +データフレームをn列まで表示可能なようにする pd.set_option('display.max_columns', n) pd.set_option('display.max_columns', n) +変数名を項目名としてマップを作る dict(name=element) dict(name=element) +<オプション>グラフの色をミディアムブルーに指定する color ='mediumblue' color = 'mediumblue' +オブジェクトがタプルに含まれるか調べる isinstance(obj, tuple) element in aTuple +イテラブルとリストの折れ線グラフをカラーコードで描画する plt.plot(xdata, ydata, color=rgb) plt.plot(xdata, ydata, color=rgb) +折れ線グラフの右三角印のサイズをnに設定する plt.plot(データ列, データ列2, marker='>', markersize=n) plt.plot(データ列, データ列2, marker='>', markersize=n) +折れ線グラフの▼マーカーを黒色にする plt.plot(データ列, データ列2, marker='v', markerfacecolor='k') plt.plot(データ列, データ列2, marker='v', markerfacecolor='k') +データフレームの最初 df.tail() df.head() +ファイルパスからのストリームを使う open(filepath) open(filepath) +2つの文字列を順にプリントする print(value, value2, value3) print(value, value2) +配列の行ごとの標準偏差 np.std(aArray, axis=1) np.std(aArray, axis=1) +折れ線グラフの丸マーカーのサイズをnにする plt.plot(データ列, データ列2, marker='o', markersize=n) plt.plot(データ列, データ列2, marker='o', markersize=n) +線グラフを描画して、その色をオリベドラブに指定する plt.plot(データ列, データ列2, color='olivedrab') plt.plot(データ列, データ列2, color='olivedrab') +折れ線グラフを描画して、その色をレモンシフォンに変更する plt.plot(データ列, データ列2, color='lemonchiffon') plt.plot(データ列, データ列2, color='lemonchiffon') +データフレームのカラムのNaNを直後の値で埋める df[col].fillna(method='bfill') df[col].fillna(method='bfill') +ヒストグラムを描画して、その色を紺に変更する plt.hist(データ列, color='darkblue') plt.hist(データ列, color='darkblue') +日付時刻データが木曜日 aDatetime.weekday() == 1 aDatetime.weekday() == 3 +黒色の丸マーカーで散布図を描画する plt.plot(xdata, ydata, marker='o', c='k') plt.plot(xdata, ydata, marker='o', c='k') +nとn2が等しいかどうか調べる n == n2 n == n2 +淡いグラフをプロットして、その線幅をnに設定する plt.plot(xdata, ydata, linestyle='muted', linewidth=n) plt.plot(xdata, ydata, linestyle='muted', color='r') +<オプション>グラフの色をパパイヤウィップにする color = 'papayawhip' color = 'papayawhip' +クラスが名前付きタプルか確認する hasattr(obj, '_asdict') issubclass(C, tuple) +折れ線グラフを描画してその色をミディアムアクアマリンにセットする plt.plot(データ列, データ列2, color='mediumaquamarine') plt.plot(データ列, データ列2, color='mediumaquamarine') +集合から全ての要素を消す aSet.clear() aSet.clear() +ヒストグラムを描画して、その色をダークカーキにする plt.hist(データ列, color='darkkhaki') plt.hist(データ列, color='darkkhaki') +データフレームから重複する行をドロップする df.drop_duplicates(keep=False) df.drop_duplicates() +ヒストグラムを描画して、色をホットピンクにセットする plt.hist(データ列, color='hotpink') plt.hist(データ列, color='hotpink') +データフレームから破壊的に重複を消す df.drop_duplicates(inplace=True) df.drop_duplicates(inplace=True) +線グラフの色をグリーンイエローに変更する plt.plot(データ列, データ列2, color='yellowgreen') plt.plot(データ列, データ列2, color='greenyellow') +イテラブルにイテラブルを続けたイテラブルを得る itertools.chain(iterable, iterable2) itertools.chain(iterable, iterable2) +xでデータ列の欠損値を補う ds.fillna(x) ds.fillna(x) +キーが辞書上で定義されていないか調べる key in aDict key not in aDict +n番目のシートをエクセルファイルファイルのデータフレームとして読む pd.read_excel(filename, sheet_name=n) pd.read_excel(filename, sheet_name=n) +データ列とラベル列を指定して、積み上げ棒を描く plt.bar(ラベル列, データ列, bottom=データ列2, color="red") plt.bar(ラベル列, データ列, bottom=データ列2, color="red") +リストとリストを加える aList + aList2 aList + aList2 +折れ線グラフを描画して、色をローングリーンにセットする plt.plot(データ列, データ列2, color='lawngreen') plt.plot(データ列, データ列2, color='lawngreen') +実数の整数部を求める math.modf(x)[1] math.modf(x)[1] +ヒストグラムを描画して色をアクアマリンに指定する plt.hist(データ列, color='aquamarine') plt.hist(データ列, color='aquamarine') +データフレームの末尾を確認する df.tail() df.tail() +文字列全体が正規表現にケースを無視してマッチするか見る re.fullmatch(pattern, s, flags=re.IGNORECASE) re.fullmatch(pattern, s, flags=re.IGNORECASE) +<オプション>ダークゴールデンロッドにグラフの色を変更する color = 'darkgoldenrod' color = 'darkgoldenrod' +小数点数の平方根 math.fabs(x) math.sqrt(x) +黒いバツマーカーを折れ線グラフに描画する plt.plot(データ列, データ列2, marker='X', markerfacecolor='k') plt.plot(データ列, データ列2, marker='x', markerfacecolor='k') +分子n分母mの有理数を作る fractions.Fraction(numerator=n, denominator=m) fractions.Fraction(numerator=n, denominator=m) +リストとリストについて散布図を描画してポイントマーカーの色をカラーコードに設定する plt.plot(xdata, ydata, marker='.', c=rgb) plt.plot(xdata, ydata, marker='.', c=rgb) +線グラフを描画して、色をアリスブルーに設定する plt.plot(データ列, データ列2, color='aliceblue') plt.plot(データ列, データ列2, color='aliceblue') +配列とデータ列の散布図をプロットして、バツマーカーの色をカラーコードに設定する plt.plot(xdata, ydata, marker='x', c=rgb) plt.plot(xdata, ydata, marker='x', c=rgb) +データフレームを各列と列の組み合わせ毎にグループ化して、標準偏差を計算する df.groupby([column, column2], as_index=False).std() df.groupby([column, column2], as_index=False).std() +棒グラフを描画し、、中央寄せする plt.bar(ラベル列, データ列, align='center') plt.bar(ラベル列, データ列, align='center') +折れ線グラフの右三角マーカーの線幅をnに変更する plt.plot(データ列, データ列2, marker='>', markeredgewidth=n) plt.plot(データ列, データ列2, marker='>', markeredgewidth=n) +エラーなく集合から値を除去する aSet.isdiscard(element) aSet.discard(element) +データフレームのリストカラムの中にいくつ文字列があるか求める df[aList].isin([value]).sum() df[aList].isin([value]).sum() +をエクセルファイルファイルから読み込む pd.read_excel(filename, sheet_name=[n, n2]) pd.read_excel(filename) +ヒストグラムの色をブランチドアーモンドに変更する plt.hist(データ列, color='blanchedalmond') plt.hist(データ列, color='blanchedalmond') +データフレームを列で並べて更新する df.sort_values(by=column, inplace=True) df.sort_values(by=column, inplace=True) +数列とデータ列について明るい色の折れ線グラフを描き、、その線幅をnに変更する plt.plot(xdata, ydata, linewidth=n, color='bright') plt.plot(xdata, ydata, linewidth=n, color='bright') +ベクトルの行ごとの合計を求める np.sum(aArray, axis=1) np.sum(aArray, axis=1) +データ列をy軸、リストを横軸と指定して、折れ線を描画する plt.plot(xdata, ydata) plt.plot(xdata, ydata) +<オプション>紺碧にグラフの色を設定する color = 'azure' color = 'azure' +文字列をタイムスタンプに変換する datetime.datetime.fromisoformat(日付の書かれた文字列) datetime.datetime.fromisoformat(日付の書かれた文字列) +異なるカラムをキーとして二つのデータフレームを左結合する pd.merge(df, df2, left_on=column, right_on=column2, how='left') pd.merge(df, df2, left_on=column, right_on=column2, how='left') +リストとリストについて色差別ないグラフを描画し、、その色を青にする plt.plot(xdata, ydata, linestyle='colorblind', color='b') plt.plot(xdata, ydata, linestyle='colorblind', color='b') +折れ線グラフの色をオレンジレッドに変更する plt.plot(データ列, データ列2, color='orangered') plt.plot(データ列, データ列2, color='orangered') +日付時刻データが金曜日 aDatetime.weekday() == 4 aDatetime.weekday() == 4 +グラフのパレットを濃くする sns.set(pallete='deep') sns.set(pallete='deep') +折れ線グラフを描画して、色を暗い赤に設定する plt.plot(データ列, データ列2, color='darkred') plt.plot(データ列, データ列2, color='darkred') +データフレームのリストカラムの欠損値を後の値に変更する df[aList].fillna(method='ffill') df[aList].fillna(method='bfill') +<オプション>グラフの線種を点線に変更する linestyle = 'dotted' linestyle = 'dotted' +Pandasで書式でデータフレームのcollを日付データに変換する pd.to_datetime(df[col], format='%Y-%m-%d') pd.to_datetime(df[col], format='%Y-%m-%d') +折れ線グラフを描画して、その色をピーチパフに指定する plt.plot(データ列, データ列2, color='peachpuff') plt.plot(データ列, データ列2, color='peachpuff') +黒い左三角マーカーを配列とリストについての散布図に描画する plt.plot(xdata, ydata, marker='<', c='k') plt.plot(xdata, ydata, marker='<', c='k') +散布図を明るい色で描く plt.plot(xdata, ydata, c='bright') plt.plot(xdata, ydata, c='bright') +ヒストグラムの色を珊瑚に指定する plt.hist(データ列, color='coral') plt.hist(データ列, color='coral') +ランダムにデータフレームから重複ありでn行をサンプリングする df.sample(n, replace=True) df.sample(n, replace=True) +二つの列を並べて箱ひげ図にする plt.boxplot([データ列, データ列2], color=['b', 'r']) plt.boxplot([df[column], df[column2]]) +赤いポイントマーカーをリストと数列についての散布図に描く plt.plot(xdata, ydata, marker='.', c='r') plt.plot(xdata, ydata, marker='.', c='r') +文字列を水色でプリントできる文字列に変換する f'\033[32m{value}\033[0m' f'\033[36m{value}\033[0m' +パープルにヒストグラムの色を変更する plt.hist(データ列, color='purple') plt.hist(データ列, color='purple') +データフレームのカラムの標本標準偏差を算出する df[col].std() df[col].std() +明るい色の折れ線グラフをプロットして、その線幅をnに指定する plt.plot(xdata, ydata, linewidth=n, color='bright') plt.plot(xdata, ydata, linewidth=n, color='bright') +リストと配列について破線グラフを描いて、その色を色差別ないに設定する plt.plot(xdata, ydata, linestyle='dash', color='colorblind') plt.plot(xdata, ydata, linestyle='dash', color='colorblind') +データフレームを表示するとき、最大列数を減らす pd.set_option('display.max_columns', n) pd.set_option('display.max_columns', n) +アリスブルーにヒストグラムの色を設定する plt.hist(データ列, color='mediumblue') plt.hist(データ列, color='aliceblue') +ヒストグラムを描画してその色をハニーデューに設定する plt.hist(データ列, color='honeydew') plt.hist(データ列, color='honeydew') +日付データと日付データの時間差を秒で求める (aDate - aDate2).total_seconds()//60 (aDate - aDate2).total_seconds()//60 +ヒストグラムを描画してその色を��ールバイオレットレッドに設定する plt.hist(データ列, color='palevioletred') plt.hist(データ列, color='palevioletred') +<オプション>ダークターコイズ色を用いる color = 'darkturquoise' color = 'darkturquoise' +データ列とラベルを指定して縦棒グラフを描画する plt.bar(ラベル列, データ列) plt.bar(ラベル列, データ列) +文字の文字コードを求める ord(ch) ord(ch) +n個分双方向キューの順序を左にローテンションする deq.rotate(-n) deq.rotate(-n) +ファイルをSJISで開く] open(filepath, encoding='shift_jis') open(filepath, encoding='shift_jis') +折れ線グラフの星マーカーの線幅をnにセットする plt.plot(データ列, データ列2, marker='*', markeredgewidth=n) plt.plot(データ列, データ列2, marker='*', markeredgewidth=n) +オプションで標準出力を出力先にする file = sys.stdout file = sys.stdout +破線グラフの色を色差別ないにセットする plt.plot(xdata, ydata, linestyle='dash', color='colorblind') plt.plot(xdata, ydata, linestyle='dash', color='colorblind') +データフレームのn行目を破壊的に消す df.drop(n, axis=0, inplace=True) df.drop(n, axis=0, inplace=True) +<オプション>小麦色を使う color = 'wheat' color = 'wheat' +白色で文字列を出力する print(f'\033[37m{value}\033[0m') print(f'\033[37m{value}\033[0m') +データフレームを列によってソートして、上の方n件を取り出す df.sort_values(columns).head(n) df.sort_values(columns).head(n) +デフォルトでグラフの見た目をイイ感じに設定する sns.set(context='talk') sns.set() +ファイルから拡張子なしのファイル名を取り出す os.path.basename(filepath) os.path.splitext(os.path.basename(filepath))[0] +nが1、もしくは2 n < n2 n == 1 or n == 2 +文字列の開始位置からと終了位置の間に部分文字列があるか調べる s.find(sub, start, end)!= -1 s.find(sub, start, end) != -1 +線グラフを描画して、その色をパープルに設定する plt.plot(データ列, データ列2, color='purple') plt.plot(データ列, データ列2, color='purple') +リストとデータ列についての散布図に文字列という凡例用のラベルを付ける plt.scatter(xdata, xdata, label=s) plt.scatter(xdata, xdata, label=s) +黒色のポイントマーカーで散布図を描画する plt.plot(xdata, ydata, marker='.', c='k') plt.plot(xdata, ydata, marker='.', c='k') +本日が火曜日か判定する datetime.datetime.today().weekday() == 1 datetime.datetime.today().weekday() == 1 +折れ線グラフを描画してその色をシアンに設定する plt.plot(データ列, データ列2, color='cyan') plt.plot(データ列, データ列2, color='cyan') +配列と配列について散布図を描画して、マーカーを▽に設定する plt.plot(xdata, ydata, marker='v') plt.plot(xdata, ydata, marker='v') +文字列中の部分文字列の出現回数をカウントする s.count(sub) s.count(sub) +折れ線グラフに下三角印を使用する plt.plot(データ列, データ列2, marker='v') plt.plot(データ列, データ列2, marker='v') +折れ線グラフの色をシエナに指定する plt.plot(データ列, データ列2, color='sienna') plt.plot(データ列, データ列2, color='sienna') +実数の値が整数か調べる math.isnan(x) x.is_integer() +データフレームのリストカラムの中にある文字列の数を数える df[aList].isin([value]).sum() df[aList].isin([value]).sum() +色を暗くする sns.set(style='dark') sns.set(pallete='dark') +最後の部分文字列によって文字列を二分割する s.rpartition(sub) s.rpartition(sub) +折れ線グラフを描画してその色をシスルに設定する plt.plot(データ列, データ列2, color='thistle') plt.plot(データ列, データ列2, color='thistle') +データフレームをインデックスを用いて整列する df.sort_index() df.sort_index() +データフレームを各列と列の組み合わせ毎にグループ化し、、最大値を求める df.groupby([column, column2], as_index=False).max() df.groupby([column, column2], as_index=False).max() +折れ線グラフの色をダークカーキに指定する plt.plot(データ列, データ列2, color='darkkhaki') plt.plot(データ列, データ列2, color='darkkhaki') +ヒストグラムの色をデピンクに変更する plt.hist(データ列, color='deeppink') plt.hist(データ列, color='deeppink') +実数の小数点を四捨五入する math.floor(x) round(x) +二つのデータ列を並べて箱髭図にする plt.boxplot([データ列, データ列2]) plt.boxplot([データ列, データ列2]) +データフレームのカラムは何分か見る df[col].dt.minute df[col].dt.minute +マッピングに要素を項目名として加える aDict[key] = element aDict[key] = element +Pandasでエポック秒のデータ列からPandasの日付型に変換する pd.to_datetime(ds, unit='s', utc=True) pd.to_datetime(ds, unit='s', utc=True) +ヒストグラムを描画して、色をミントクリームに設定する plt.hist(データ列, color='mintcream') plt.hist(データ列, color='mintcream') +カンマで文字列を分割して、列挙する s.split(',') s.split(',') +データフレームのリストカラムを四捨五入して、整数型にする df[aList].round().astype(int) df[aList].round().astype(int) +ヒストグラムを描画して色をディムグレーに変更する plt.hist(データ列, color='dimgray') plt.hist(データ列, color='dimgrey') +ポイントマーカーを用いて散布図を描画する plt.plot(xdata, ydata, marker='.') plt.plot(xdata, ydata, marker='.') +ヒストグラムを描画して、その色をパパイヤウィップにする plt.hist(データ列, color='papayawhip') plt.hist(データ列, color='papayawhip') +リストとリストについて暗い色の折れ線グラフを描いて、その線幅をnに設定する plt.plot(xdata, ydata, linewidth=n, color='dark') plt.plot(xdata, ydata, linewidth=n, color='dark') +<オプション>色をスラグレーに指定する color ='slategray' color = 'slategray' +タイムスタンプデータからn日分、減算する aDatetime - datetime.timedelta(days=n) aDatetime - datetime.timedelta(days=n) +データフレームのリスト列のヒートマップをグラフ化する sns.heatmap(df[aList].corr()) sns.heatmap(df[aList].corr()) +青色の暗いグラフを描画する plt.plot(xdata, ydata, linestyle='dark', color='b') plt.plot(xdata, ydata, linestyle='dark', color='b') +追加できるようにUTF8で既存のファイルパスをオープンする] open(filepath, mode='a') open(filepath, mode='a', encoding='utf-8') +ゼロ埋めした配列 aArray.ndim np.zeros(要素数) +データフレームのリスト列の中央値 df[aList].median() df[aList].median() +<オプション>ミディアムスレートブルーに色を設定する color ='mediumslateblue' color = 'mediumslateblue' +昇順にデータフレームを列を用いて並べ直す df.sort_values(by=column, ascending=True) df.sort_values(by=column, ascending=True) +xの小数点以下'2'桁までを出力する print(':.2f'.format(x)) print(':.2f'.format(x)) +データフレームのリストカラムの未入力値を中央値に指定する df[aList].fillna(df[aList].median()) df[aList].fillna(df[aList].median()) +文字列を赤色で表示する print(f'\033[31m{value}\033[0m') print(f'\033[31m{value}\033[0m') +シャルトリューズにヒストグラムの色を指定する plt.hist(データ列, color='chartreuse') plt.hist(データ列, color='chartreuse') +折れ線グラフを描画して、色をミディアムバイオレットレッドに設定する plt.plot(データ列, データ列2, color='mediumvioletred') plt.plot(データ列, データ列2, color='mediumvioletred') +ファイルを書き込み用にオープンする] open(filepath, mode='w') open(filepath, mode='w') +<オプション>フクシア色を使用する color = 'fuchsia' color = 'fuchsia' +データ列を折れ線グラフに描画して、印をポイント印にする plt.plot(データ列, データ列2, marker='.') plt.plot(データ列, データ列2, marker='.') +<オプション>ロージーブラウンにグラフの色を変更する color = 'brown' color = 'rosybrown' +データ列を千の位で丸めて、整数型にする ds.round(-1).astype(int) ds.round(-3).astype(int) +線グラフの色をアンティークホワイトに変更する plt.plot(データ列, データ列2, color='antiquewhite') plt.plot(データ列, データ列2, color='antiquewhite') +ファイルパスをオープンして]、バイナリストリームを求める f = open(filepath, mode='rb') open(filepath, mode='rb') +折れ線グラフに描画してマーカーをダイアモンドにする plt.plot(データ列, データ列2, marker='D') plt.plot(データ列, データ列2, marker='D') +リストにリストを加える aList.extend(aList2) aList.extend(aList2) +辞書順で文字列は文字列より後か s < s2 s > s2 +折れ線グラフの下三角印の線幅をnにセットする plt.plot(データ列, データ列2, marker='v', markeredgewidth=n) plt.plot(データ列, データ列2, marker='v', markeredgewidth=n) +全要素を0で初期化された8ビット整数型の行列を作る np.zeros(行数, 列数, dtype=np.int16) np.zeros(行数, 列数, dtype=np.int8) +データフレームの中にいくつNaNが存在するかカウントする df.isna().sum() df.isna().sum() +棒グラフの色を設定する plt.barh(ラベル列, データ列, color=rgb) plt.bar(ラベル列, データ列, color=rgb) +日付時刻データが日付時刻データと同時かどうかテストする aDatetime == aDatetime2 aDatetime == aDatetime2 +1行だけ標準入力から読む sys.stdin.readline().rstrip() sys.stdin.readline() +暗い色の折れ線を描いて、その線幅をnに指定する plt.plot(xdata, ydata, linewidth=n, color='dark') plt.plot(xdata, ydata, linewidth=n, color='dark') +点線���ヒストグラムを設定する plt.hist(データ列, linestyle='dotted') plt.hist(データ列, linestyle='dotted') +▲マーカーを散布図に使う plt.plot(xdata, ydata, marker='^') plt.plot(xdata, ydata, marker='^') +<オプション>ミディアムターコイズを使用する color ='mediumturquoise' color = 'mediumturquoise' +タプル内の要素は少なくとも一つ真 any(aTuple) any(aTuple) +実数を実数に掛ける x + y x * y +折れ線グラフを描画してその色をダークカーキに設定する plt.plot(データ列, データ列2, color='darkkhaki') plt.plot(データ列, データ列2, color='darkkhaki') +逆行列を計算する np.linalg.inv(aArray) np.linalg.inv(aArray) +ヒストグラムを描画して、色をブラックに変更する plt.hist(データ列, color='black') plt.hist(データ列, color='black') +データフレームを破壊的に列によってによって並べ直す df.sort_values(by=column, inplace=True) df.sort_values(by=column, inplace=True) +折れ線グラフを描画して、色をアンティークホワイトに設定する plt.plot(データ列, データ列2, color='antiquewhite') plt.plot(データ列, データ列2, color='antiquewhite') +色差別ないグラフを描画して、その線幅をnに設定する plt.plot(xdata, ydata, linestyle='colorblind', color='r') plt.plot(xdata, ydata, linestyle='colorblind', color='r') +ファイルパスから読み込みストリームを開いて]、fとする f = open(filepath, mode='r') f = open(filepath, mode='r') +ヒストグラムの色をスノーに変更する plt.hist(データ列, color='snow') plt.hist(データ列, color='snow') +<オプション>シアンを使う color = 'cyan' color = 'cyan' +イテラブルと数列について散布図を描画して、マーカーを左三角に設定する plt.plot(xdata, ydata, marker='<') plt.plot(xdata, ydata, marker='<') +数値をパラメータについて微分する sympy.integrate(e, z) sympy.diff(e, z) +本日が月曜日かどうか調べる datetime.datetime.today().weekday() == 0 datetime.datetime.today().weekday() == 0 +データフレームを関数の値でまとめたグループ df.groupby(関数) df.groupby(関数) +データフレームのn行目まで抽出する df[n:] df[:n] +オブジェクトの型を調べる type(obj) type(obj) +マッピングをJSON形式の文字列に変換する json.loads(jsonString) json.dumps(aDict, ensure_ascii=False) +列によってデータフレームをソートして、インデックスを振り直す df.sort_values(columns).reset_index() df.sort_values(columns).reset_index(drop=True) +カラーコードの大バツマーカーとして散布図を描く plt.plot(xdata, ydata, marker='x', c=rgb) plt.plot(xdata, ydata, marker='X', c=rgb) +リストとリストについて色差別ない色の折れ線グラフを描画して、その線幅をnに変更する plt.plot(xdata, ydata, linewidth=n, color='colorblind') plt.plot(xdata, ydata, linewidth=n, color='colorblind') +折れ線グラフの色をトマトに変更する plt.plot(データ列, データ列2, color='tomato') plt.plot(データ列, データ列2, color='tomato') +データフレームの列の分散 df[col].var() df[col].var() +リストと配列の散布図をプロットして、マーカーの色を色差別ないにセットする plt.plot(xdata, ydata, c='colorblind') plt.plot(xdata, ydata, c='colorblind') +リストを境界値としてリストを分割する pd.cut(aList, aList) pd.cut(aList, aList) +ヒストグラムとして配列を可視化する plt.hist(aArray) plt.hist(aArray) +0からNまでの配列を作成する np.arange(N) np.arange(N) +データフレームを'A'列で小さい順にソートする df.sort_values(by='A', ascending=False) df.sort_values(by='A', ascending=True) +黒い淡いグラフを描く plt.plot(xdata, ydata, linestyle='muted', color='k') plt.plot(xdata, ydata, linestyle='muted', color='k') +赤色の下三角マーカーを散布図に使う plt.plot(xdata, ydata, marker='v', c='r') plt.plot(xdata, ydata, marker='v', c='r') +<オプション>ペールグリーンを用いる color = 'palegreen' color = 'palegreen' +ヒストグラムを描画して、その色をパールゴールデンロッドに変更する plt.hist(データ列, color='palegoldenrod') plt.hist(データ列, color='palegoldenrod') +2を底とする対数 math.log10(x) math.log2(x) +<オプション>ブランチドアーモンドにグラフの色を設定する color = 'blanchedalmond' color = 'blanchedalmond' +'A'列の値によってデータフレームをグループ化して、列挙する [(name, group) for name, group in df.groupby('A')] [(name, group) for name, group in df.groupby('A')] +<オプション>リネンを使う color = 'linen' color = 'linen' +データフレームの中にが存在する df.isin([value]).sum() df.isin([value]) +ファイルを開いて]、読み込みストリームを使う open(filepath, mode='r') open(filepath, mode='r') +ファイルに文字列を書く f.write(s) f.write(s) +データ列が何年か調べる ds.dt.year ds.dt.year +データ列の曜日を使う ds.dt.weekday_name ds.dt.weekday_name +グラフに鉛直方向の実線を付ける plt.grid(True) plt.axvline(x=0, linestyle='solid') +折れ線グラフの色をタンに変更する plt.plot(データ列, データ列2, color='tan') plt.plot(データ列, データ列2, color='tan') +明るい色のヒストグラムで配列を描画する plt.hist(xdata, color='bright') plt.hist(xdata, color='bright') +データフレームを各列毎にグループ化して列の最小値を求める df.groupby(column)[column2].min() df.groupby(column)[column2].min() +線グラフの色をミディアムターコイズに指定する plt.plot(データ列, データ列2, color='mediumturquoise') plt.plot(データ列, データ列2, color='mediumturquoise') +浮動小数点数の仮数 math.frexp(x)[0] math.frexp(x)[0] +日付時刻データをタプルにする aDatetime.timetuple() aDatetime.timetuple() +折れ線グラフの色をダークシアンにする plt.plot(データ列, データ列2, color='darkcyan') plt.plot(データ列, データ列2, color='darkcyan') +データフレームのリストカラムの欠損値を前の行の値で置換する df[aList].fillna(method='bfill') df[aList].fillna(method='ffill') +データ列を折れ線グラフに描画して、マーカーを△印にする plt.plot(データ列, データ列2, marker='^') plt.plot(データ列, データ列2, marker='^') +濃いグラフの色をカラーコードに指定する plt.plot(xdata, ydata, linestyle='deep', color=rgb) plt.plot(xdata, ydata, linestyle='deep', color=rgb) +データフレームのカラムとカラムを折れ線グラフでプロットする plt.plot(df[col], df[col2]) plt.plot(df[col], df[col2]) +リストとリストのカラーコードの濃いグラフを描く plt.plot(xdata, ydata, linestyle='deep', color=rgb) plt.plot(xdata, ydata, linestyle='deep', color=rgb) +折れ線グラフのポイントマーカーの線幅をnに変更する plt.plot(データ列, データ列2, marker='.', markeredgewidth=n) plt.plot(データ列, データ列2, marker='.', markeredgewidth=n) +<オプション>ダークブルー色を使用する color = 'darkblue' color = 'darkblue' +ヒストグラムの色をホットピンクに変更する plt.hist(データ列, color='hotpink') plt.hist(データ列, color='hotpink') +列によってデータフレームをソートして、新しいインデックスを振り直す df.sort_values(columns).reset_index(drop=True) df.sort_values(columns).reset_index() +<オプション>プラムにグラフの色を変更する color = 'plum' color = 'plum' +データ列の中にある文字列との合計を求める ds.isin([value, value2]).sum() ds.isin([value, value2]).sum() +データフレームのそれぞれのグループ毎の個数 df.groupby(column).count() df.groupby(column).count() +改行によって文字列を区切る s.splitlines() s.splitlines() +配列を分割数nでビン分割する pd.cut(aArray, n) pd.cut(aArray, n) +<オプション>色を暗い赤に設定する color = 'darkred' color = 'darkred' +データフレームのカラムはどの程度、分散しているか確認する df[col].var() df[col].var() +線グラフを描画して、色をゴールドに設定する plt.plot(データ列, データ列2, color='gold') plt.plot(データ列, データ列2, color='gold') +データフレームを'A'列によって並べ、、更新する df.sort_values(by='A', inplace=True) df.sort_values(by='A', inplace=True) +ヒストグラムを描画して、その色をライトスチールブルーに指定する plt.hist(データ列, color='lightsteelblue') plt.hist(データ列, color='lightsteelblue') +リストとリストを使って明るいの折れ線を描いて、その線幅をnに指定する plt.plot(xdata, ydata, linestyle='bright', color='r') plt.plot(xdata, ydata, linestyle='bright', color='r') +グラフを全般的にパステル調にする sns.set(pallete='pastel') sns.set(pallete='pastel') +<オプション>ブランチドアーモンド色を使用する color = 'blanchedalmond' color = 'blanchedalmond' +タプルを逆順にする aTuple[::-1] reversed(aTuple) +モカシンにヒストグラムの色をする plt.hist(データ列, color='moccasin') plt.hist(データ列, color='moccasin') +実数を実数で除算した余り x % y x % y +<オプション>色をライトコーラルに指定する color = 'lightcoral' color = 'lightcoral' +selectorsでマスクしたリストの要素を取り出す aList.clear() itertools.compress(iterable, selectors=iterable2) +折れ線グラフを描画して色をダーク・スラテグレーに設定する plt.plot(データ列, データ列2, color='darkslategrey') plt.plot(データ列, データ列2, color='darkslategrey') +文字列のn番目を使う s[n] s[n] +折れ線グラフを描画してその色を赤に設定する plt.plot(データ列, データ列2, color='red') plt.plot(���ータ列, データ列2, color='red') +データ列とデータ列の折れ線をuntitledとラベル付けして描画する plt.plot(xdata, ydata, label=untitled) plt.plot(xdata, ydata, label=untitled) +<オプション>グラフの色をピーチパフに変更する color = 'peachpuff' color = 'peachpuff' +文字列の中の大文字・小文字を無視してパターンによる全てのマッチを見る re.findall(pattern, s, flags=re.IGNORECASE) re.findall(pattern, s, flags=re.IGNORECASE) +四分位数ごとに配列をビン分割する pd.qcut(aArray, 4) pd.qcut(aArray, 4) +ファイルから1バイト、読み込む f.read() f.read(1) +ヒストグラムの色をオリベドラブに変更する plt.hist(データ列, color='olivedrab') plt.hist(データ列, color='olivedrab') +データフレームのグループの平均値 df.groupby(column).mean() df.groupby(column).mean() +<オプション>色をベージュに指定する color = 'beige' color = 'beige' +文字列が組の要素か element in aTuple element in aTuple +リストとデータ列について色差別ないグラフを描いて、色を黒にする plt.plot(xdata, ydata, linestyle='colorblind', color='k') plt.plot(xdata, ydata, linestyle='colorblind', color='k') +リストのn番目のを求める aList[n] aList[n] +イテラブルとリストについてパステル調の色の折れ線グラフを描画して、線幅をnに設定する plt.plot(xdata, ydata, linewidth=n, color='pastel') plt.plot(xdata, ydata, linewidth=n, color='pastel') +折れ線グラフを描画してその色をライトスチールブルーに指定する plt.plot(データ列, データ列2, color='lightsteelblue') plt.plot(データ列, データ列2, color='lightsteelblue') +実行結果をマゼンタでプリントできる文字列に変換する f'\033[35m{value}\033[0m' f'\033[35m{value}\033[0m' +ヒストグラムの色をネイビーにする plt.hist(データ列, color='navy') plt.hist(データ列, color='navy') +最初のカテゴリーを除外して表データの列をベクトルに変換する np.array(iterable) pd.get_dummies(df[column], drop_first=True) +データフレームをJSONLファイルに小数点以下3桁まで書き込む df.to_csv(filename, float_format='%.3f') df.to_csv(filename, float_format='%.3f') +ファイルパスをバイナリモードとして開いて]fとする f = open(filepath, mode='rb') f = open(filepath, mode='rb') +文字列を最後の部分文字列で分けたときの前半の文字列を求める s.rpartition(sub)[-1] s.rpartition(sub)[0] +ヒストグラムの色をクリムゾンに指定する plt.hist(データ列, color='crimson') plt.hist(データ列, color='crimson') +データフレームのリスト列の値を正規表現patternでまとめてreplに置き換える df[aList].replace(pattern, repl, regex=True) df[aList].replace(pattern, repl, regex=True) +黒い▼マーカーで散布図を描画する plt.plot(xdata, ydata, marker='v', c='k') plt.plot(xdata, ydata, marker='v', c='k') +文字列からISO書式で日付時刻に変換する datetime.datetime.strptime(日付の書かれた文字列, format) datetime.datetime.fromisoformat(日付の書かれた文字列) +文字列全体が正規表現にASCII限定としてマッチするか調べる re.fullmatch(pattern, s, flags=re.ASCI) re.fullmatch(pattern, s, flags=re.ASCI) +折れ線グラフを描画して、色をリネンに設定する plt.plot(データ列, データ列2, color='linen') plt.plot(データ列, データ列2, color='linen') +線グラフの色をオールドレースに設定する plt.plot(データ列, データ列2, color='oldlace') plt.plot(データ列, データ列2, color='oldlace') +データフレームの中にいくつ日付データがあるか数える df.isin([value]).sum() df.isin([value]).sum() +文字列を部分文字列で区切り、文字列リストに変換する s.split(sub) s.split(sub) +ヒストグラムを描画して、その色をインディアンレッドに指定する plt.hist(データ列, color='indianred') plt.hist(データ列, color='indianred') +カウンタを少ない方からリストとして得る aCounter.most_common()[:-1] aCounter.most_common()[::-1] +右三角マーカーで散布図を描く plt.plot(xdata, ydata, marker='>') plt.plot(xdata, ydata, marker='>') +nとn2のビット積を計算する n / n2 n & n2 +値を水色にする f'\033[33m{value}\033[0m' f'\033[36m{value}\033[0m' +イテラブルをキューに変換する collections.deque(iterable) collections.deque(iterable) +<オプション>ミッドナイトブルーにグラフの色を設定する color ='midnightblue' color = 'midnightblue' +列を使ってデータフレームをグループ化して、各グループごとの件数を知る df.groupby(column).size() df.groupby(column).size() +<オプション>ミディアムバイオレットレッドにグラフの色を変更する color ='mediumvioletred' color = 'mediumvioletred' +現在の月数 datetime.datetime.today().year datetime.datetime.today().month +バイナリ書き込みモードでファイルを開いて]fとする f = open(filepath, mode='wb') f = open(filepath, mode='wb') +数を整数にする int(x) int(x) +データフレームの列の各データが何回出現するか確認する df[col].value_counts() df[col].value_counts() +配列とリストについて散布図を描画し、、マーカーを四角に設定する plt.plot(xdata, ydata, marker='s') plt.plot(xdata, ydata, marker='s') +<オプション>色をターコイズに指定する color = 'turquoise' color = 'turquoise' +UNIX時刻を使う import pandas as pd import time +線グラフの色を赤に設定する plt.plot(データ列, データ列2, color='red') plt.plot(データ列, データ列2, color='red') +線グラフを描画してその色をパウダーブルーに変更する plt.plot(データ列, データ列2, color='powderblue') plt.plot(データ列, データ列2, color='powderblue') +<オプション>ホットピンクを使う color = 'hotpink' color = 'hotpink' +xが一桁の整数かどうか調べる -9 <= x <= 9 -9 <= x <= 9 +列の値によってデータフレームをグループ化する df.groupby(columns) df.groupby(column) +<オプション>グラフの種類を一点鎖線にする linestyle = 'dashbot' linestyle = 'dashbot' +リストの先頭を捨てる aList[0] aList[1:] +カラーコードの左三角マーカーで散布図を描く plt.plot(xdata, ydata, marker='<', c=rgb) plt.plot(xdata, ydata, marker='<', c=rgb) +パラメータについて数値を積分する sympy.integrate(e, z) sympy.integrate(e, z) +散布図を星マーカーで描画する plt.plot(xdata, ydata, marker='*') plt.plot(xdata, ydata, marker='*') +折れ線グラフを描画してその色を青に設定する plt.plot(データ列, データ列2, color='blue') plt.plot(データ列, データ列2, color='blue') +列をキーにして二つのデータフレームを外部ジョインする pd.merge(df, df2, left_on=column, right_on=column2, how='outer') pd.merge(df, df2, on=column, how='outer') +ヒストグラムを描画して、その色をオレンジレッドに指定する plt.hist(データ列, color='orangered') plt.hist(データ列, color='orangered') +線グラフの色をゲインズボロに変更する plt.plot(データ列, データ列2, color='gainsboro') plt.plot(データ列, データ列2, color='gainsboro') +データフレームの列の値がxより大きくx2より少ない行を取り出す df[(x < df[column]) & (df[column] < x2)] df[(x < df[column]) & (df[column] < x2)] +nがn2の倍数かどうか調べる n % n2 == 0 n % n2 == 0 +二つのカウンタの共通するデータを計算する aCounter & aCounter2 aCounter & aCounter2 +やわらかい青にヒストグラムの色を設定する plt.hist(データ列, color='cornflowerblue') plt.hist(データ列, color='cornflowerblue') +保存するCSVの小数点以下の桁数を設定する df.to_csv(filename, float_format='%.3f') df.to_csv(filename, float_format='%.3f') +'A'列によってでデータフレームを降順にソートする df.sort_values(by='A', ascending=False) df.sort_values(by='A', ascending=False) +折れ線グラフを描画して、その色をオレンジレッドにする plt.plot(データ列, データ列2, color='orangered') plt.plot(データ列, データ列2, color='orangered') +折れ線グラフの左三角マーカーの線幅をnにセットする plt.plot(データ列, データ列2, marker='<', markeredgewidth=n) plt.plot(データ列, データ列2, marker='<', markeredgewidth=n) +<オプション>アイボリーにグラフの色を指定する color = 'ivory' color = 'ivory' +二進数文字列を整数に変換する int(s, 8) int(s, 2) +nの各桁の総和を算出する sum(map(int, str(n))) sum(map(int, str(n))) +タプルの文字列が最初に見つかる場所 aTuple.index(element) aTuple.index(element) +データフレームのカラムの中に日付データがあるかどうか調べる df[col].isin([value]) df[col].isin([value]) +折れ線グラフに菱形マーカーを加える plt.plot(データ列, データ列2, marker='D') plt.plot(データ列, データ列2, marker='D') +折れ線グラフを描画して色をアクアマリンに設定する plt.plot(データ列, データ列2, color='aquamarine') plt.plot(データ列, データ列2, color='aquamarine') +<オプション>グラフの色をダークターコイズに変更する color = 'darkturquoise' color = 'darkturquoise' +上限を指定して、両端キューを作る collections.deque(maxlen=n) collections.deque(maxlen=n) +折れ線グラフに線幅nの▲マーカーを描画する plt.plot(データ列, データ列2, marker='^', markeredgewidth=n) plt.plot(データ列, データ列2, marker='^', markeredgewidth=n) +ヒストグラムを描画してその色をアイボリーに指定する plt.hist(データ列, color='ivory') plt.hist(データ列, color='ivory') +データフレームの欠損値を最小値で補う df.fillna(df.min()) df.fillna(df.min()) +リストとリストの折れ線グラフを描画して、色を文字列に変更する plt.plot(xdata, ydata, color=s) plt.plot(xdata, ydata, color=s) +nの八進数表記 oct(n) oct(n) +日付時刻データを浮動小数点数にする aDatetime.timestamp() aDatetime.timestamp() +降順にデータフレームを破壊的に列を用いてソートする df.sort_values(by=column, ascending=True, inplace=True) df.sort_values(by=column, ascending=False, inplace=True) +二つのデータフレームを列をキーにしてジョインする pd.merge(df, df2, on=column, how='outer') pd.merge(df, df2, on=column) +データ列の未入力値を直前の値に変更する ds.fillna(method='ffill') ds.fillna(method='ffill') +データ列とデータ列についての散布図にダイアモンドマーカーを描く plt.plot(xdata, ydata, marker='D') plt.plot(xdata, ydata, marker='D') +ファイルをオープンして]、書き込みストリームを求める open(filepath, mode='w') open(filepath, mode='w') +セットが空でないか調べる len(aSet)!= 0 len(aSet) != 0 +数列とリストの黒色の暗いグラフを描画する plt.plot(xdata, ydata, linestyle='dark', color='k') plt.plot(xdata, ydata, linestyle='dark', color='k') +n2がnより大きくかつ、n3未満か調べる n < n2 and n3 n < n2 and n2 < n3 +ヒストグラムを描画して色をビスクに設定する plt.hist(データ列, color='bisque') plt.hist(データ列, color='bisque') +赤い大バツマーカーとして散布図を描く plt.plot(xdata, ydata, marker='X', c='r') plt.plot(xdata, ydata, marker='X', c='r') +データフレームをreplにまとめて正規表現で置き換える df.replace(pattern, repl, regex=True) df.replace(pattern, repl, regex=True) +データフレームの列を行にセットする df[column].isin(aSet)] df.set_index(column) +データフレームの列の文字列が文字列が含まれない行を選択する df[not df[column].str.contains(s)] df[not df[column].str.contains(s)] +実行結果をアンダーライン付きでプリントできる文字列に変換する f'\033[37m{value}\033[0m' f'\033[4m{value}\033[0m' +列をダミー変数にする pd.get_dummies(iterable) pd.get_dummies(iterable) +赤色の右三角マーカーで散布図を描画する plt.plot(xdata, ydata, marker='>', c='r') plt.plot(xdata, ydata, marker='>', c='r') +日付データからn日を減算する aDate - datetime.timedelta(days=n) aDate - datetime.timedelta(days=n) +リストを境界値として配列をビン分割する pd.cut(aArray, aList) pd.cut(aArray, aList) +イテラブルの要素を両端キューの末尾に追加する collections.deque(iterable) deq.extend(iterable) +<オプション>色をスノーに指定する color ='snow' color = 'snow' +ファイルからn文字読み込む f.read(n) f.read(n) +リストをn回、加える aList * n aList * n +文字列内にひとつでも小文字が含まれる any(c.isupper() for c in s) any(c.islower() for c in s) +カウンタの要素を一つ増やす aCounter.keys() aCounter[element] += 1 +線グラフを描画して、その色をネイビーに設定する plt.plot(データ列, データ列2, color='navy') plt.plot(データ列, データ列2, color='navy') +データフレームの列と列を取り除く df[[column, column2]] df.drop([column, column2], axis=1) +数列とデータ列の散布図を描いて、色を濃いに変更する plt.plot(xdata, ydata, c='deep') plt.plot(xdata, ydata, c='deep') +文字列中にひとつでも非英字が含まれるかテストする any(not c.isalpha() for c in s) any(not c.isalpha() for c in s) +コマンドの第2引数を知る sys.argv[1] sys.argv[1] +辞書から多重集合を作る collections.Counter(aDict) collections.Counter(aDict) +ファイル名がTSVファイルかどうか調べる filename.endswith('.tsv') filename.endswith('.tsv') +セットをタプルに変換する tuple(aSet) tuple(aSet) +実行を異常終了する sys.exit() sys.exit(1) +黄色い▼マーカーを折れ線グラフに描画する plt.plot(データ列, データ列2, marker='v', markerfacecolor='y') plt.plot(データ列, データ列2, marker='v', markerfacecolor='y') +データ列の正規分布に対する左右対称性 ds.skew() ds.kurt() +nがn2未満またはn3以上か n <= n2 n < n2 or n >= n3 +濃いグラフの色を黒色に指定する plt.plot(xdata, ydata, linestyle='deep', color='k') plt.plot(xdata, ydata, linestyle='deep', color='k') +行列のユニークな要素とその位置 u, indices = unique(aArray, return_index=True) u, indices = np.unique(aArray, return_index=True) +タイムスタンプデータをn時間前に戻す aDatetime - datetime.timedelta(days=n) aDatetime - datetime.timedelta(hours=n) +ヒストグラムの色をダークシアグリーンにする plt.hist(データ列, color='darkseagreen') plt.hist(データ列, color='darkseagreen') +多重集合を作る aSet.difference(aSet2) collections.Counter() +線グラフの色をパールゴールデンロッド��設定する plt.plot(データ列, データ列2, color='palegoldenrod') plt.plot(データ列, データ列2, color='palegoldenrod') +データフレームを表示するとき表示可能な列数の最大値をnに増やす pd.set_option('display.max_columns', n) pd.set_option('display.max_columns', n) +ヒストグラムを描画して、色をラベンダーに設定する plt.hist(データ列, color='lavender') plt.hist(データ列, color='lavender') +<オプション>ロージーブラウンを用いる color = 'rosybrown' color = 'rosybrown' +データフレームのリスト列の相関行列を計算する df[aList].corr(method='spearman') df[aList].corr() +<オプション>グラフの色をロイヤルブルーに変更する color = 'royalblue' color = 'royalblue' +ヒストグラムの色をゴールドに変更する plt.hist(データ列, color='gold') plt.hist(データ列, color='gold') +数値の積分を行う sympy.diff(e, z) sympy.integrate(e) +データフレームの中の列を等間隔でn個に分割する pd.cut(df[col], n) pd.cut(df[col], n) +2つの実行結果をカンマで区切って表示する print(value, value2, sep='/') print(value, value2, sep=',') +ヒストグラムを描画して、色をダークバイオレットにセットする plt.hist(データ列, color='darkviolet') plt.hist(データ列, color='darkviolet') +<オプション>シーグリーンにグラフの色を設定する color ='seagreen' color = 'seagreen' +折れ線グラフの色をナバホホワイトに変更する plt.plot(データ列, データ列2, color='navajowhite') plt.plot(データ列, データ列2, color='navajowhite') +Pandasでデータ列を日付データに変換し、データフレームのインデックスにする df.index = pd.DatetimeIndex(pd.to_datetime(df[col]) df.index = pd.DatetimeIndex(pd.to_datetime(ds)) +日付時刻データは日付時刻データより前か調べる aDatetime < aDatetime2 aDatetime < aDatetime2 +データフレームから数値データのカラムを抽出する df[[column, column2, column3, column4]] df.select_dtypes('number') +折れ線グラフの色をディープスカイブルーにセットする plt.plot(データ列, データ列2, color='deepskyblue') plt.plot(データ列, データ列2, color='deepskyblue') +暗いパレットをグラフの描画で使う sns.set(pallete='dark') sns.set(pallete='dark') +ダークグレーにヒストグラムの色を指定する plt.hist(データ列, color='darkgrey') plt.hist(データ列, color='darkgray') +折れ線グラフの星印を赤色にする plt.plot(データ列, データ列2, marker='*', markerfacecolor='r') plt.plot(データ列, データ列2, marker='*', markerfacecolor='r') +nが3で割り切れるか n % 3 == 0 n % 3 == 0 +浮動小数点数のn乗して整数による余り pow(x, n, y) pow(x, n, y) +データフレームを'A'列の値によってグループ分けする df.groupby('A') df.groupby('A') +折れ線グラフの大バツマーカーの線幅をnに指定する plt.plot(データ列, データ列2, marker='x', markeredgewidth=n) plt.plot(データ列, データ列2, marker='X', markeredgewidth=n) +<オプション>グラフの色をリネンに指定する color = 'linen' color = 'linen' +組の各要素を関数に適用した結果でソートする sorted(aTuple, key=func) sorted(aTuple, key=func) +データ列と配列の淡いグラフを描画して、その色を青くする plt.plot(xdata, ydata, linestyle='muted', color='b') plt.plot(xdata, ydata, linestyle='muted', color='b') +カンマで文字列を分割して文字列リストにする s.split(',') s.split(',') +数字を全て使う string.digits string.digits +データフレームのカラムを100の位で丸めて、整数にする df[col].round(-3).astype(int) df[col].round(-2).astype(int) +二数の一番小さい値 math.lcm(n, np.counts max(x, y) +配列のユニークな要素を計算する np.unique(aArray) np.unique(aArray) +ふたつの関係が⊆か確認する os.path.weekday() == 0 aSet.issubset(aSet2) +ヒストグラムの色をダークスラテグレーに変更する plt.hist(データ列, color='darkslategray') plt.hist(データ列, color='darkslategray') +ヒストグラムを描画して、その色をティールに設定する plt.hist(データ列, color='coral') plt.hist(データ列, color='teal') +折れ線グラフを描画して、その色をマゼンタにする plt.plot(データ列, データ列2, color='magenta') plt.plot(データ列, データ列2, color='magenta') +EUCでファイルをオープンする] open(filepath, encoding='euc_jp') open(filepath, encoding='euc_jp') +数を万の位で四捨五入する round(x, -2) round(x, -4)