diff --git "a/result_test.tsv" "b/result_test.tsv" --- "a/result_test.tsv" +++ "b/result_test.tsv" @@ -1,1001 +1,1001 @@ -リストをy軸、リストをx軸として、大きさnの散布図を描画する plt.scatter(データ列x, データ列y, s=n) plt.scatter(データ列x, データ列y, s=n) -option: グラフの色をグリーンイエローに指定する color = 'greenyellow' color = 'greenyellow' -数式を簡単化する sympy.sympify(e) sympy.sympify(e) -外れ値にロバストな標準化を行う frozenset(aTuple) sklearn.preprocessing.RobustScaler().fit_transform(データ) -列毎にデータフレームを分類して、標準偏差を計算する df.groupby(column).std() df.groupby(column).std() -option: 行列のデータ型を指定する dtype = np.int dtype = bool -折れ線グラフの色をアイボリーに変更する plt.plot(データ列x, データ列y, color='ivory') plt.plot(データ列x, データ列y, color='ivory') -データフレームから破壊的に重複した行をドロップする df.drop_duplicates(inplace=True) df.drop_duplicates(inplace=True) -折れ線グラフの印を左三角印にする plt.plot(データ列x, データ列y, marker='<') plt.plot(データ列x, データ列y, marker='<') -nを十六進リテラルにする hex(n) hex(n) -縦棒グラフの色を青緑にする plt.bar(データ列x, データ列y, color='teal') plt.bar(データ列x, データ列y, color='teal') -文字列を最後から空白で区切る s.rsplit() s.rsplit() -ホワイト色の線グラフを描画する plt.plot(データ列x, データ列y, color='white') plt.plot(データ列x, データ列y, color='white') -option: 改行をセパレータで使用する sep = '\n' sep = '\n' -折れ線グラフの星印を黒色にする plt.plot(データ列x, データ列y, marker='*', markerfacecolor='k') plt.plot(データ列x, データ列y, marker='*', markerfacecolor='k') -多次元尺度構成法で多次元データをパステル調に次元に次元削減する sklearn.manifold.MSD(n_components=N).fit_transform(多次元データ) sklearn.manifold.MSD(n_components=N).fit_transform(多次元データ) -ブラウン色の線グラフを描画する plt.plot(データ列x, データ列y, color='brown') plt.plot(データ列x, データ列y, color='brown') -文字列中に部分文字列が存在しない sub not in s sub not in s -'A'列の値によってデータフレームを集約して、列挙する [(name, group) for name, group in df.groupby('A')] [(name, group) for name, group in df.groupby('A')] -option: 印を大バツに変える marker = 'X' marker = 'X' -赤い下三角マーカーで散布図を描く plt.plot(データ列x, データ列y, marker='v', c='r') plt.plot(データ列x, データ列y, marker='v', c='r') -ヒストグラムの色をホワイトに変更する plt.hist(データ列, color='white') plt.hist(データ列, color='white') -整数nを二進数リテラルに変換する bin(n) bin(n) -ホワイト色の棒グラフを描画する plt.bar(データ列x, データ列y, color='white') plt.bar(データ列x, データ列y, color='white') -散布図をバツマーカーで描画する plt.scatter(データ列x, データ列y, marker='x') plt.plot(データ列x, データ列y, marker='x') -変数をマゼンタでプリントできる文字列に変換する f'\033[35m{value}\033[0m' f'\033[35m{value}\033[0m' -option: タブを区切りで用いる sep = '\t' sep = '\t' -赤色としてヒストグラムを描画する plt.hist(データ列, color='red') plt.hist(データ列, color='red') -クラス分類の適合率と再現率の調和平均を算出する sklearn.metrics.f1_score(正解データ列, 予測データ列) sklearn.metrics.f1_score(正解データ列, 予測データ列) -棒グラフを珊瑚色で描画する plt.bar(データ列x, データ列y, color='coral') plt.bar(データ列x, データ列y, color='coral') -数字を全て使う string.digits string.digits -表データから列を三つ選択する df[[column, column2, column3]] df[[column, column2, column3]] -縦棒グラフの色をダークオレンジにする plt.bar(データ列x, データ列y, color='darkorange') plt.bar(データ列x, データ列y, color='darkorange') -データフレームの正規分布に対する上下広がり df.skew() df.skew() -ダークサーモン色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='darksalmon') plt.bar(データ列x, データ列y, color='darksalmon') -ファイルを開いて]、バイナリ書き込みストリームを求める open(filepath, mode='wb') open(filepath, mode='wb') -タプルから計数器を作る collections.Counter(aDict) collections.Counter(aDict) -カラーバーを描く plt.colorbar() plt.colorbar() -データフレームの列と列の相関行列をヒートマップでグラフ化する sns.heatmap(df[[column, column2]].corr()) sns.heatmap(df[[column, column2]].corr()) -散布図のポイントマーカーの太さを変更する plt.scatter(データ列x, データ列y, marker='.', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='.', markeredgewidth=2.5) -日付時刻データの曜日を使う aDatetime.weekday() aDatetime.weekday() -ブラックにヒストグラムの色を指定する plt.hist(データ列, color='black') plt.hist(データ列, color='black') -グリーンイエロー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='greenyellow') plt.bar(データ列x, データ列y, color='greenyellow') -双方向キューをタプルにする tuple(deq) tuple(deq) -数値を因数分解する sympy.factor(e) sympy.factor(e) -option: ラベンダーブラッシュ色を用いる color = 'lavenderblush' color = 'lavenderblush' -option: ダークスラテグレーに色を設定する color = 'darkslategray' color = 'darkslategray' -キーが辞書上でまだ定義されていない key not in aDict key not in aDict -文字列のUNIX時間から日付データにする pd.to_datetime(s, unit='s', utc=True) pd.to_datetime(s, unit='s', utc=True) -t分布型確率的近傍埋め込み法を行う model = sklearn.manifold.TSNE(n_components=n) model = sklearn.manifold.TSNE(n_components=n) -文字列の中のASCII限定として正規表現によるマッチを使う re.findall(pattern, s, flags=re.ASCI) re.findall(pattern, s, flags=re.ASCI) -散布図の左三角印の色を指定する plt.scatter(データ列x, データ列y, marker='<', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='<', markerfacecolor='#800080') -縦棒グラフの色をアンティークホワイトにする plt.bar(データ列x, データ列y, color='antiquewhite') plt.bar(データ列x, データ列y, color='antiquewhite') -タプル内の要素が少なくとも一つ真か any(aTuple) any(aTuple) -スラグレー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='slategray') plt.bar(データ列x, データ列y, color='slategrey') -ネイビーにヒストグラムの色を設定する plt.hist(データ列, color='navy') plt.hist(データ列, color='navy') -TSV形式のファイルからデータフレームを読む pd.read_csv(filename, sep='\t', encoding='shift_jis') pd.read_csv(filename, sep='\t', encoding='utf-8') -無限にnから数え上げるする itertools.count(start=n) itertools.count(start=n) -線グラフの色をブランチドアーモンドにセットする plt.plot(データ列x, データ列y, color='blanchedalmond') plt.plot(データ列x, データ列y, color='blanchedalmond') -グラフのx軸を対数に変更する plt.xscale('log') plt.xscale('log') -パラメータについて数値をn階微分する sympy.diff(e, z, n) sympy.diff(e, z, n) -ファイルパスをUTF8としてオープンする] open(filepath, encoding='utf-8') open(filepath, encoding='utf-8') -グラフを全般的に明るくする sns.set(pallete='bright') sns.set(pallete='bright') -データ列を丸めて整数にする ds.round().astype(int) ds.round().astype(int) -option: フォントの色をライトブルーに設定する color = 'lightblue' color = 'lightblue' -非小文字が文字列中にあるか調べる s.islower() any(not c.islower() for c in s) -折れ線グラフをミディアムブルー色として描画する plt.plot(データ列x, データ列y, color='mediumblue') plt.plot(データ列x, データ列y, color='mediumblue') -データフレームがどの程度分散しているか見る df.var() df.var() -散布図に丸印を使う plt.scatter(データ列x, データ列y, marker='o') plt.scatter(データ列x, データ列y, marker='o') -データ列をリストを境界値としてビンニングする pd.cut(ds, aList) pd.cut(ds, aList) -データフレームを各列と列の組み合わせ毎にグループ分けして、平均値を計算する df.groupby([column, column2], as_index=False).mean() df.groupby([column, column2], as_index=False).mean() -線グラフの色をペールグリーンに指定する plt.plot(データ列x, データ列y, color='palegreen') plt.plot(データ列x, データ列y, color='palegreen') -数列とリストについての散布図に上三角マーカーをプロットする plt.plot(データ列x, データ列y, marker='^') plt.plot(データ列x, データ列y, marker='^') -リストの末尾のn要素を捨てる aList[:-n] aList[:-n] -線グラフを実線を用いて描く plt.plot(データ列x, データ列y, linestyle='solid') plt.plot(データ列x, データ列y, linestyle='solid') -リストをひとつ置きに得る aList[::2] aList[::2] -option: 色をダークグレーに設定する color = 'darkgrey' color = 'darkgrey' -option: ミディアムパープルを使う color ='mediumpurple' color = 'mediumpurple' -option: グラフの線のスタイルを一点鎖線にする linestyle = 'dashbot' linestyle = 'dashbot' -赤い左三角マーカーとして散布図を描画する plt.plot(データ列x, データ列y, marker='<', c='r') plt.plot(データ列x, データ列y, marker='<', c='r') -ヒストグラムをパールゴールデンロッド色���して描画する plt.hist(データ列, color='palegoldenrod') plt.hist(データ列, color='palegoldenrod') -要素が全て1の配列を初期化する np.ones(要素数, dtype=np.int) np.ones(要素数, dtype=np.int) -データフレームのリストカラムのNaNを最小値で埋める df[aList].fillna(df[aList].min()) df[aList].fillna(df[aList].min()) -小数点数のk進対数 math.log(x, k) math.log(x, k) -散布図をダークバイオレット色として描画する plt.scatter(データ列x, データ列y, color='darkviolet') plt.scatter(データ列x, データ列y, color='darkviolet') -文字列を変数に変換する sympy.Symbol(s) sympy.Symbol(s) -双方向キューをリストに変換する list(deq) list(deq) -散布図の左三角マーカーの大きさを設定する plt.scatter(データ列x, データ列y, marker='<', markersize=2.0) plt.scatter(データ列x, データ列y, marker='<', markersize=2.0) -JSON文字列を辞書に変換する dict(jsonString) json.loads(jsonString) -線グラフをペルー色で描画する plt.plot(データ列x, データ列y, color='peru') plt.plot(データ列x, データ列y, color='peru') -散布図をインディゴ色を使って描画する plt.scatter(データ列x, データ列y, color='indigo') plt.scatter(データ列x, データ列y, color='indigo') -文字列の最初から不要な空白やタブを取り除く s.lstrip() s.lstrip() -入力から二つの文字列値を読む A, B = map(str, input().split()) A, B = map(str, input().split()) -タプルの浅いコピーを作成する aDict.copy() aDict.copy() -文字列中に部分文字列が含まれるかどうか調べる sub in s sub in s -グラフの全般的にパレットを淡くする sns.set(pallete='muted') sns.set(pallete='muted') -双方向キューのstart番目からend番目までの部分要素 collections.deque(itertools.islice(deq, start, end)) collections.deque(itertools.islice(deq, start, end)) -データを最大値を用いて正規化を行う sklearn.preprocessing.MaxAbsScaler().fit_transform(データ) sklearn.preprocessing.MaxAbsScaler().fit_transform(データ) -半透明の一点鎖線でリストの推移を描画する plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) -散布図のバツマーカーを青色にする plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='b') plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='b') -折れ線グラフの色をコーラルに変更する plt.plot(データ列x, データ列y, color='coral') plt.plot(データ列x, データ列y, color='coral') -option: 上三角マーカーを使う marker = '^' marker = '^' -辞書の項目名を要素に設定する aDict[key] = element aDict[key] = element -データ列の各値の出現回数を求める ds.value_counts() ds.value_counts() -浮動小数点数の分数近似 sys.limit_denominator q.limit_denominator(max_denominator=1000000) -Pandasでフォーマットfmtを用いて文字列を日付データにする pd.to_datetime(s, format=fmt) pd.to_datetime(s, format=fmt) -データフレームのリストカラムの欠損値を平均で補う df[aList].fillna(df[aList].mean()) df[aList].fillna(df[aList].mean()) -全要素を0で初期化した行列を作る np.zeros(行数, 列数) np.zeros(行数, 列数) -縦棒グラフを描画し、、中央寄せする plt.bar(ラベル列, データ列, align='center') plt.bar(ラベル列, データ列, align='center') -ヘッダを指定せずTSVを読み込む pd.read_csv(filename, header=None) pd.read_csv(filename, header=None) -option: フォントの色をカデットブルーに設定する color = 'cadetblue' color = 'cadetblue' -線グラフを青い実線で描画する plt.plot(データ列x, データ列y, linestyle='solid', color='b') plt.plot(データ列x, データ列y, linestyle='solid', color='b') -ホワイトスモーク色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='whitesmoke') plt.plot(データ列x, データ列y, color='whitesmoke') -勾配ブースティングとして回帰分析を行う model = sklearn.ensemble.GradientBoostingRegressor() model = sklearn.ensemble.GradientBoostingRegressor() -中央値でデータ列をビニングする pd.qcut(ds, 2) pd.qcut(ds, 2) -線グラフをシエナ色を使って描画する plt.plot(データ列x, データ列y, color='sienna') plt.plot(データ列x, データ列y, color='sienna') -オーキッドにヒストグラムの色を変更する plt.hist(データ列, color='orchid') plt.hist(データ列, color='orchid') -シルバー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='silver') plt.bar(データ列x, データ列y, color='silver') -キューの中に数値はある element in deq element in deq -option: デピンクにグラフの色を設定する color = 'deeppink' color = 'deeppink' -タイムスタンプデー���をn分前にする aDatetime - datetime.timedelta(minutes=n) aDatetime - datetime.timedelta(minutes=n) -線形回帰モデルの係数 model.coe model.coef_ -'A'列ででデータフレームを降順にソートする df.sort_values(by='A', ascending=False) df.sort_values(by='A', ascending=False) -エポック秒のデータ列からタイムスタンプに変換する pd.to_datetime(ds, unit='s', utc=True) pd.to_datetime(ds, unit='s', utc=True) -シルバー色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='silver') plt.bar(データ列x, データ列y, color='silver') -データ列の推移を一点鎖線で描画する plt.plot(データ列x, データ列y, linestyle='dashbot') plt.plot(データ列x, データ列y, linestyle='dashbot') -散布図をタン色を使って描画する plt.scatter(データ列x, データ列y, color='tan') plt.scatter(データ列x, データ列y, color='tan') -散布図をコーラル色を用いて描画する plt.scatter(データ列x, データ列y, color='coral') plt.scatter(データ列x, データ列y, color='coral') -集合をイミュータブルにする frozenset(aSet) frozenset(aSet) -データフレームを四捨五入する df.round() df.round() -文字列を部分文字列で分けた場合の残りの文字列 s.partition(sub)[-1] s.partition(sub)[-1] -option: 色をカーキに指定する color = 'khaki' color = 'khaki' -行列の行を選択する aArray[行番号] aArray[行番号] -データフレームを列名リストの値によってグループ分けする df.groupby(columns) df.groupby(columns) -ファイルを開いて]、書き込みストリームを使う open(filepath, mode='w') open(filepath, mode='w') -option: グラフの色をダークバイオレットに変更する color = 'darkviolet' color = 'darkviolet' -浮動小数点数とyの斜辺 math.hypot(x, y) math.hypot(x, y) -線グラフの色を茶色に設定する plt.plot(データ列x, データ列y, color='brown') plt.plot(データ列x, データ列y, color='brown') -y軸の表示範囲を変更する plt.ylim(目盛りの値 plt.ylim(最小値, 最大値) -データフレームの内で何行、重複するか見る df.duplicated().sum() df.duplicated().sum() -日付データのデータフレームのカラムをデータフレームのインデックスにする df.index = pd.DatetimeIndex(df.columns) df.index = pd.DatetimeIndex(df[col]) -データフレームのカラムの正規分布に対する上下広がり df[col].skew() df[col].skew() -option: グラフの色をライトグレーに変更する color = 'lightgray' color = 'lightgrey' -逆双曲線正弦を求める math.asinh(x) math.asinh(x) -サンディーブラウン色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='sandybrown') plt.bar(データ列x, データ列y, color='sandybrown') -option: グラフの色をゲインズボロに変更する color = 'gainsboro' color = 'gainsboro' -データフレームから型リストのデータ型の列を除外する df.select_dtypes(exclude=typeList) df.select_dtypes(exclude=typeList) -棒グラフをパールバイオレットレッド色として描画する plt.bar(データ列x, データ列y, color='palevioletred') plt.bar(データ列x, データ列y, color='palevioletred') -option: グラフの色をシーグリーンに変更する color ='seagreen' color = 'seagreen' -option: グラフの種類を点線に変更する linestyle = 'dotted' linestyle = 'dotted' -リストのn番目にオブジェクトを挿入する aList.insert(n, element) aList.insert(n, element) -文字列の左側 s[0] s[0] -option: ミスティローズを使う color ='mistyrose' color = 'mistyrose' -データフレームの列の値が欠損値 df[col].isna() df[col].isna() -ヒストグラムの色をブラウンに設定する plt.hist(データ列, color='brown') plt.hist(データ列, color='brown') -option: グラフの色をピンクに指定する color = 'pink' color = 'pink' -ハニーデュー色で散布図を描画する plt.scatter(データ列x, データ列y, color='honeydew') plt.scatter(データ列x, データ列y, color='honeydew') -option: 箱ひげ図を横向きにする vert = False vert = False -ダークゴールデンロッド色で線グラフを描画する plt.plot(データ列x, データ列y, color='darkgoldenrod') plt.plot(データ列x, データ列y, color='darkgoldenrod') -文字列の開始位置から終了位置の範囲で部分文字列の出現をカウントする s.count(sub, start, end) s.count(sub, start, end) -ベクトルのユニークな値を要素とする配列 np.unique(aArray) np.unique(aArray) -ダークスレートブルー色を用いて線グラフを描画する plt.plot(データ列x, データ列y, color='darkslateblue') plt.plot(データ列x, データ列y, color='darkslateblue') -データフレームの中のカラムをビン分割する pd.cut(df[col], aList) pd.cut(df[col], aList) -リストとリストについての散布図に右三角マーカーを描く plt.plot(データ列x, データ列y, marker='>') plt.plot(データ列x, データ列y, marker='>') -データフレームをグループ化し、それぞれの列に対し個数を算出する df.groupby(column)[column2].count() df.groupby(column)[column2].count() -縦棒プロットを描画して、バーの幅を調整する plt.bar(ラベル列, データ列, width=0.5) plt.bar(ラベル列, データ列, width=0.5) -集合の浅いコピーを作る aSet.copy() aSet.copy() -青い星印を折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='*', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='*', markerfacecolor='b') -縦棒グラフをドジャーブルー色で描画する plt.bar(データ列x, データ列y, color='dodgerblue') plt.bar(データ列x, データ列y, color='dodgerblue') -データフレームのリスト列の分散 df[aList].var() df[aList].var() -ファイル名がテキストファイルかどうか調べる filename.endswith('.txt') filename.endswith('.txt') -t分布型確率的近傍埋め込み法で淡く次元に次元削減する sklearn.manifold.TSNE(n_components=三).fit_transform(多次元データ) sklearn.manifold.TSNE(n_components=三).fit_transform(多次元データ) -紺碧色を用いて散布図を描画する plt.scatter(データ列x, データ列y, color='azure') plt.scatter(データ列x, データ列y, color='azure') -横棒グラフをカデットブルー色として描画する plt.barh(データ列x, データ列y, color='cadetblue') plt.barh(データ列x, データ列y, color='cadetblue') -データフレームを列ごとに分類して、グループの平均値を求める df.groupby(column).mean() df.groupby(column).mean() -空白文字 ' ' ' ' -スプリンググリーンにヒストグラムの色を設定する plt.hist(データ列, color='springgreen') plt.hist(データ列, color='springgreen') -nが正の数かどうか調べる n > 0 n > 0 -要素が全て1のベクトルを作る np.ones(要素数, dtype=np.int) np.ones(要素数, dtype=np.int) -Pandasでタイムスタンプのデータフレームのカラムをインデックスにする df.set_index(col, inplace=True) df.index = pd.DatetimeIndex(df[col]) -nをn2だけ小さくする n -= n2 n -= n2 -縦棒グラフをダークグレー色を用いて描画する plt.bar(データ列x, データ列y, color='darkgray') plt.bar(データ列x, データ列y, color='darkgrey') -散布図の上三角マーカーを青くする plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='b') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='b') -option: 三角マーカーを加える marker = '^' marker = '^' -option: デピンクを使う color = 'deeppink' color = 'deeppink' -書き込みモードとしてファイルを開いて]、fとする f = open(filepath, mode='w') f = open(filepath, mode='w') -二つのデータ列の散布図として残差を描画する sns.residplot(x=データ列, y=データ列) sns.residplot(x=データ列, y=データ列) -横方向に3つのデータフレームを連結する pd.concat([df, df2, df3], axis=1) pd.concat([df, df2, df3], axis=1) -縦棒グラフをカデットブルー色として描画する plt.bar(データ列x, データ列y, color='cadetblue') plt.bar(データ列x, データ列y, color='cadetblue') -option: コーンズシルクを用いる color = 'cornsilk' color = 'cornsilk' -option: 色をスノーに設定する color ='snow' color = 'snow' -カラムの欠損値を最頻値にする ds.fillna(ds.mode().iloc[0]) ds.fillna(ds.mode().iloc[0]) -データを四分位点でスケール変換する sklearn.preprocessing.RobustScaler().fit_transform(データ) sklearn.preprocessing.RobustScaler().fit_transform(データ) -クラス分類をバギングを使って行う model = sklearn.ensemble.BaggingClassifier(n_estimators=10) model = sklearn.ensemble.BaggingClassifier(n_estimators=10) -文字列の末尾から部分文字列を取り除く s.rstrip(sub) s.removesuffix(sub) -オレンジレッド色としてヒストグラムを描画する plt.hist(データ列, color='orangered') plt.hist(データ列, color='orangered') -リストと数列について散布図を描画して、右三角マーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='>', c=rgb) plt.plot(データ列x, データ列y, marker='>', c=rgb) -データフレームのメディアンを算出する df.median() df.median() -ベージュ色で散布図を描画する plt.scatter(データ列x, データ列y, color='beige') plt.scatter(データ列x, データ列y, color='beige') -データフレームの各グループごとの個数を計算する df.groupby(column).count() df.groupby(column).count() -option: グラフの色をダークターコイズに変更する color = 'darkturquoise' color = 'darkturquoise' -option: 改行しないように設定する end = '' end = '' -実行結果を黒色でプリン��する print(f'\033[30m{value}\033[0m') print(f'\033[30m{value}\033[0m') -ケンドールの順位相関係数を求める scipy.stats.kendalltau(データ列, データ列2) scipy.stats.kendalltau(データ列, データ列2) -リストの最後を除く aList[-1] aList[:-1] -option: 線の幅を3.0ポイントに指定する linewidth = 3.0 linewidth = 3.0 -データフレームの最初n行 df.head(n) df.head(n) -列のイミュータブルなセット frozenset(iterable) frozenset(iterable) -新しいロバスト分類モデルを新規作成する model = sklearn.linear_model.RANSACClassifier(random_state=0) model = sklearn.linear_model.RANSACClassifier(random_state=0) -文字列を文字コードでバイト列にする s.encode(encoding='sjis', errors='%.2f%%') s.encode(encoding=encoding) -縦棒グラフの色をダークカーキにする plt.bar(データ列x, データ列y, color='darkkhaki') plt.bar(データ列x, データ列y, color='darkkhaki') -ヒストグラムの色をダークサーモンにセットする plt.hist(データ列, color='darksalmon') plt.hist(データ列, color='darksalmon') -スチールブルー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='steelblue') plt.bar(データ列x, データ列y, color='steelblue') -線グラフの色を黄色に設定する plt.plot(データ列x, データ列y, color='yellow') plt.plot(データ列x, データ列y, color='yellow') -データフレームのカラムの中に含まれる文字列の合計を数える df[col].isin([value]).sum() df[col].isin([value]).sum() -データフレームの中のカラムをn個にビン分割して、namesのラベルをつける pd.cut(df[col], n, labels=names) pd.cut(df[col], n, labels=names) -折れ線グラフをハニーデュー色として描画する plt.plot(データ列x, データ列y, color='honeydew') plt.plot(データ列x, データ列y, color='honeydew') -第2引数で指定したファイルの名前 sys.argv[1] sys.argv[1] -サンディーブラウンにヒストグラムの色を設定する plt.hist(データ列, color='sandybrown') plt.hist(データ列, color='sandybrown') -文字列中のカタカナをひらがなに変換する ('\u4E00' <= ch <= ch <= 'u9FD0') ''.join([chr(ord(ch) - 96) if ('ァ' <= ch <= 'ン') else ch for ch in s]) -文字列中にひとつでも非英字が含まれるか any(not c.isalpha() for c in s) any(not c.isalpha() for c in s) -昇順にタプルの要素を並べる sorted(aTuple, reverse=True) sorted(aTuple, reverse=True) -配列とリストの散布図をプロットして、その大きさをnにする plt.scatter(データ列x, データ列y, s=n) plt.scatter(データ列x, データ列y, s=n) -データフレームの欠損値がある箇所に df.dropna() df.style.highlight_null() -切片なしの回帰モデルを作る model = sklearn.linear_model.LinearRegression(fit_intercept=False) model = sklearn.linear_model.LinearRegression(fit_intercept=False) -線グラフの色をライトスレイグレーに指定する plt.plot(データ列x, データ列y, color='lightslategrey') plt.plot(データ列x, データ列y, color='lightslategrey') -線グラフの色をダークオーキッドに設定する plt.plot(データ列x, データ列y, color='darkorchid') plt.plot(データ列x, データ列y, color='darkorchid') -データフレームの列を折れ線グラフとして作図する plt.plot(df[column], df[column]) plt.plot(df[column], df[column]) -主成分分析で多次元データをパステル調に次元に次元削減する sklearn.decomposition.PCA(n_components=N).fit_transform(多次元データ) sklearn.decomposition.PCA(n_components=N).fit_transform(多次元データ) -ミッドナイトブルー色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='midnightblue') plt.barh(データ列x, データ列y, color='midnightblue') -文字列で区切って二つの値をプリントする print(value, value2, sep=s) print(value, value2, sep=s) -データ列の第一四分位数を求める ds.quantile(0.25) ds.quantile(0.25) -プログラムの実行を強制的に終える sys.exit() sys.exit() -option: グラフの色をベージュに指定する color = 'beige' color = 'beige' -折れ線グラフをパレットトルコイズ色として描画する plt.plot(データ列x, データ列y, color='paleturquoise') plt.plot(データ列x, データ列y, color='paleturquoise') -ブルーバイオレット色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='blueviolet') plt.plot(データ列x, データ列y, color='blueviolet') -赤い大バツマーカーをデータ列とリストについての散布図に描画する plt.plot(データ列x, データ列y, marker='X', c='r') plt.plot(データ列x, データ列y, marker='X', c='r') -ホールドアウト法を用いる X_train, X_test, y_train, y_train, y_test = train_test_size=0.3, y_test_train, y_train, y_test_split(説明変数, 目的変数, test_size=0.3) X_train, X_test, y_train, y_test = train_test_split(説明変数, 目的変数, test_size=0.3) -プラットホームはWindows sys.platform.startswith('darwin') sys.platform.startswith('win32') -文字列の末尾から部分文字列を除く s.rfind(sub) s.rstrip(sub) -辞書をJSON形式の文字列にする json.dumps(aDict, ensure_ascii=False) json.dumps(aDict, ensure_ascii=False) -option: グラフの色をイエローグリーンに変更する color = 'yellowgreen' color = 'yellowgreen' -散布図をグレー色を使って描画する plt.scatter(データ列x, データ列y, color='grey') plt.scatter(データ列x, データ列y, color='grey') -散布図にrgbの大バツマーカーを用いる plt.plot(データ列x, データ列y, marker='X', c=rgb) plt.plot(データ列x, データ列y, marker='X', c=rgb) -散布図の左三角印を黒くする plt.scatter(データ列x, データ列y, marker='<', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='<', markerfacecolor='k') -nの二乗を求める n ** 2 n ** 2 -option: ラインを細くする linestyle = 'dotted' linewidth = 3.0 -横棒グラフをオレンジ色として描画する plt.barh(データ列x, データ列y, color='orange') plt.barh(データ列x, データ列y, color='orange') -option: グラフの色をダークオリーブグリーンに変更する color = 'darkolivegreen' color = 'darkolivegreen' -よりランダムなランダムフォレストでクラス分類を行う model = sklearn.ensemble.RandomForestClassifier() model = sklearn.ensemble.ExtraTreeClassifier(n_estimators=10) -Pythonのバージョンを知る sys.version sys.version -タプルの中の一番大きい値 maxlen(aTuple) max(aTuple) -折れ線グラフに菱形マーカーを加える plt.plot(データ列x, データ列y, marker='D') plt.plot(データ列x, データ列y, marker='D') -nとn2のシートをエクセルファイルファイルから読み込む pd.read_excel(filename, sheet_name=[n, n2]) pd.read_excel(filename, sheet_name=[n, n2]) -横棒グラフをピンク色として描画する plt.barh(データ列x, データ列y, color='pink') plt.barh(データ列x, データ列y, color='pink') -列の文字列長を列として使う ds.str.len() ds.str.len() -折れ線グラフを淡いピンク色色を用いて描画する plt.plot(データ列x, データ列y, color='lightpink') plt.plot(データ列x, データ列y, color='lightpink') -option: 色をダークマゼンタに設定する color = 'darkmagenta' color = 'darkmagenta' -ヒストグラムの色をピーチパフにする plt.hist(データ列, color='peachpuff') plt.hist(データ列, color='peachpuff') -option: 色をアクアに設定する color = 'aqua' color = 'aqua' -グレー色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='gray') plt.plot(データ列x, データ列y, color='gray') -ライトグリーンにヒストグラムの色を設定する plt.hist(データ列, color='lightgreen') plt.hist(データ列, color='lightseagreen') -回帰分析をブースティングで行う model = sklearn.ensemble.AdaBoostRegressor(n_estimators=10) model = sklearn.ensemble.AdaBoostRegressor(random_state=0, n_estimators=100) -表をグループ化し、各列に対し平均値を求める df.groupby(column)[column2].mean() df.groupby(column)[column2].mean() -データフレームの最初の列以外を説明変数にする 説明変数 = df[df.columns[1:]] 説明変数 = df[df.columns[1:]] -複素数型の全要素を0で初期化した行列 np.zeros(行数, 列数, dtype=bool) np.zeros(行数, 列数, dtype=bool) -データフレームを列で並べる df.sort_values(by=column) df.sort_values(by=column) -データフレームのカラムの文字列をNaNに変換する df[col].replace(s, np.nan) df[col].replace(s, np.nan) -複数の列の値によってデータフレームをグループ分けして、列挙する [(name, group) for name, group in df.groupby(columns)] [(name, group) for name, group in df.groupby(columns)] -ミントクリーム色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='mintcream') plt.plot(データ列x, データ列y, color='mintcream') -縦棒グラフの色をディムグレーにする plt.bar(データ列x, データ列y, color='dimgrey') plt.bar(データ列x, データ列y, color='dimgray') -データ列の値が正規分布にしたがって発生する確率を算出する scipy.stats.norm.pdf(データ列, loc=平均値, scale=標準偏差) scipy.stats.norm.pdf(データ列, loc=平均値, scale=標準偏差) -3変数の最小値 min(x, y, z, min) min(x, y, z) -データ列の折れ線グラフを右三角印で描画する plt.plot(データ列x, データ列y, marker='>') plt.plot(データ列x, データ列y, marker='>') -列からひとつランダムに選ぶ random.choice(iterable) random.choice(iterable) -オブジェクトを文字列にする str(obj) str(obj) -option: グラフの種類を破線にセットする linestyle = 'dashed' linestyle = 'dashed' -折れ線グラフのポイントマーカーを赤色にする plt.plot(データ列x, データ列y, marker='.', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='.', markerfacecolor='r') -データ列とデータ列について散布図を描画し、その大きさをnに設定する plt.scatter(データ列x, データ列y, s=n) plt.scatter(データ列x, データ列y, s=n) -リストとリストについての散布図に黒いクロスマーカーをプロットする plt.plot(データ列x, データ列y, marker='x', c='k') plt.plot(データ列x, データ列y, marker='x', c='k') -赤い▽マーカーを用いて散布図を描画する plt.plot(データ列x, データ列y, marker='v', c='r') plt.plot(データ列x, データ列y, marker='v', c='r') -クロスマーカーで散布図を描画する plt.plot(データ列x, データ列y, marker='x') plt.plot(データ列x, データ列y, marker='x') -横棒グラフをディムグレー色として描画する plt.barh(データ列x, データ列y, color='dimgrey') plt.barh(データ列x, データ列y, color='dimgray') -option: ビスク色を使用する color = 'bisque' color = 'bisque' -イテラブルを累積したイテラブルを求める itertools.accumulate(iterable, operator.mul) itertools.accumulate(iterable, operator.mul) -横棒グラフの色をやわらかい青にする plt.barh(データ列x, データ列y, color='cornflowerblue') plt.barh(データ列x, データ列y, color='cornflowerblue') -要素は集合のメンバーに含まれないか調べる element not in aSet element not in aSet -ふたつの関係が真上位集合か調べる aSet > aSet2 aSet > aSet2 -ユニコードに対応する文字 chr(unicode) chr(unicode) -複素数型のゼロ埋めされた配列 np.zeros(要素数, dtype=np.int32) np.zeros(要素数, dtype=bool) -option: 平均を追記する showmeans = False showmeans = False -option: グラフの色を珊瑚に設定する color = 'coral' color = 'coral' -両端キューを要素を出す deq.append(element) deq.popleft() -線グラフの色をライトスレイグレーに設定する plt.plot(データ列x, データ列y, color='lightslategray') plt.plot(データ列x, データ列y, color='lightslategray') -データフレームを列で集約して、列の要約統計量を求める df.groupby(column).describe() df.groupby(column).describe()[column2] -option: フォントの色をパウダーブルーに変更する color = 'powderblue' color = 'powderblue' -カテゴリデータ列をベクトル化する sklearn.preprocessing.OneHotEncoder(sparse=False).fit_transform(データ列) sklearn.preprocessing.OneHotEncoder(sparse=False).fit_transform(データ列) -データフレームのpercent分位数を計算する df.quantile(percent/100) df.quantile(percent/100) -縦棒グラフをライトコーラル色を用いて描画する plt.bar(データ列x, データ列y, color='lightcoral') plt.bar(データ列x, データ列y, color='lightcoral') -データフレームのカラムの値が欠損値 df[col].isna() df[col].isna() -折れ線グラフの左三角印の色を変える plt.plot(データ列x, データ列y, marker='<', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='<', markerfacecolor='#800080') -文字列内にひとつでも空白が含まれるか確認する any(c.isspace() for c in s) any(c.isspace() for c in s) -'A'列によって表をまとめたグループを使う df.groupby('A') df.groupby('A') -下三角マーカーとして散布図を描画する plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') -ブラック色でヒストグラムを描画する plt.hist(データ列, color='black') plt.hist(データ列, color='black') -リストを箱髭図として可視化する plt.boxplot(データ列) plt.boxplot(データ列) -ダークカーキ色で棒グラフを描画する plt.bar(データ列x, データ列y, color='darkkhaki') plt.bar(データ列x, データ列y, color='darkkhaki') -三整数の最大公約数 math.gcd(n, n2, n3) math.gcd(n, n2, n3) -文字列の先頭から空白を除去する s.lstrip() s.lstrip() -散布図の右三角マーカーを赤色にする plt.scatter(データ列x, データ列y, marker='>', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='>', markerfacecolor='r') -ヒストグラムの色をナバホホワイトに変更する plt.hist(データ列, color='navajowhite') plt.hist(データ列, color='navajowhite') -リストを分割数nで分割する pd.cut(aList, n) pd.cut(aList, n) -option: 箱髭図を水平方向にする vert = False vert = False -モードで列の欠損値を埋める ds.fillna(ds.mode().iloc[0]) ds.fillna(ds.mode().iloc[0]) -グリーンにヒストグラムの色を設定する plt.hist(データ列, color='green') plt.hist(データ列, color='green') -データフレームを'A'列の値でグループ化し要約統計量を計算���る df.groupby('A').describe() df.groupby('A').describe() -データフレームを列の値で集約して、個数を求める df.groupby(column).count() df.groupby(column).count() -重複した行のみを抽出する df[df.duplicated(keep=False)] df[df.duplicated(keep=False)] -散布図の四角印の大きさを変更する plt.scatter(データ列x, データ列y, marker='s', markersize=2.0) plt.scatter(データ列x, データ列y, marker='s', markersize=2.0) -option: パレットトルコイズに色を設定する color = 'paleturquoise' color = 'paleturquoise' -option: ダークシアグリーン色を用いる color = 'darkseagreen' color = 'darkseagreen' -数値を赤色でプリントできる文字列に変換する f'\033[31m{value}\033[0m' f'\033[31m{value}\033[0m' -正規分布にしたがってデータ列の値が発生する確率を求める "sklearn.preprocessing.Normalizer(norm=""r_val_score)" scipy.stats.norm.pdf(データ列, loc=平均値, scale=標準偏差) -散布図のダイアモンド印の色を設定する plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='#800080') -ヒストグラムをピーチパフ色として描画する plt.hist(データ列, color='peachpuff') plt.hist(データ列, color='peachpuff') -スラグレー色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='slategray') plt.barh(データ列x, データ列y, color='slategray') -option: コーラル色を使用する color = 'coral' color = 'coral' -折れ線グラフをペルー色を用いて描画する plt.plot(データ列x, データ列y, color='peru') plt.plot(データ列x, データ列y, color='peru') -明るく色使いをグラフの描画で使う sns.set(pallete='bright') sns.set(pallete='bright') -列によってデータフレームをグループ化して、最小値を求める df.groupby(column).min() df.groupby(column).min() -実数のk進対数を算出する math.log(x, k) math.log(x, k) -ダークグリーンにヒストグラムの色を設定する plt.hist(データ列, color='darkgreen') plt.hist(データ列, color='darkgreen') -Pandasで、日付データのデータフレームのカラムをインデックスにする df.index = pd.DatetimeIndex(df[col]) df.index = pd.DatetimeIndex(df[col]) -option: グリーンイエローを使う color = 'greenyellow' color = 'greenyellow' -データフレームの中にある日付データと文字列の数を数える df.isin([value, value2]).sum() df.isin([value, value2]).sum() -折れ線グラフをやわらかい青色で描画する plt.plot(データ列x, データ列y, color='cornflowerblue') plt.plot(データ列x, データ列y, color='cornflowerblue') -option: どのカラムもインデックスにしない index_col = None index_col = None -実数のバイナリ対数を求める math.log2(x) math.log2(x) -全ての印字 string.printable string.printable -線グラフを色付きの実線を用いてプロットする plt.plot(データ列x, データ列y, linestyle='solid', color='#800080') plt.plot(データ列x, データ列y, linestyle='solid', color='#800080') -サーモン色としてヒストグラムを描画する plt.hist(データ列, color='salmon') plt.hist(データ列, color='salmon') -横棒グラフを紺色を用いて描画する plt.barh(データ列x, データ列y, color='darkblue') plt.barh(データ列x, データ列y, color='darkblue') -データフレームのカラムのメディアン df.median() df[col].median() -シルバー色を使って横棒グラフを描画する plt.barh(データ列x, データ列y, color='silver') plt.barh(データ列x, データ列y, color='silver') -カテゴリでグループ化して、データフレームの全カラムの相関を可視化する sns.pairplot(df, hue='カテゴリ列') sns.pairplot(df, hue='カテゴリ列') -散布図のクロス印を赤くする plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='r') -ヒストグラムの色をオリベドラブにする plt.hist(データ列, color='olivedrab') plt.hist(データ列, color='olivedrab') -データフレームの列の歪度を求める df[col].kurt() df[col].kurt() -縦棒グラフをディープスカイブルー色として描画する plt.bar(データ列x, データ列y, color='deepskyblue') plt.bar(データ列x, データ列y, color='deepskyblue') -スラグレー色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='slategray') plt.plot(データ列x, データ列y, color='slategrey') -双方向キューのn番目に数値を途中追加する deq.insert(n, element) deq.insert(n, element) -ファイルパスを読み込み用にオープンして]、fとする f = open(filepath, mode='r') f = open(filepath, mode='r') -ヒストグラムを横に並べてプロットする plt.hist([データ列, データ列, データ列], color=['b', 'r', 'g']) plt.hist([データ列, データ列], color=['b', 'r']) -データフレームの上n行 df.tail(n) df.head(n) -数値をパラメータについて微分する sympy.diff(e, z) sympy.diff(e, z) -データフレームを表示するとき折り返しをしない pd.set_option('expand_frame_repr', False) pd.set_option('expand_frame_repr', False) -配列のムーア・ペンローズの擬似逆行列を求める np.linalg.pinv(aArray) np.linalg.pinv(aArray) -データフレームのカラムをヒストグラムにする plt.hist(df[column]) plt.hist(df[column]) -データフレームの未入力値を平均値にセットする df.fillna(df.mean()) df.fillna(df.mean()) -ゴールデンロッド色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='goldenrod') plt.plot(データ列x, データ列y, color='goldenrod') -ライトスレイグレー色で棒グラフを描画する plt.bar(データ列x, データ列y, color='lightslategray') plt.bar(データ列x, データ列y, color='lightslategray') -文字列に漢字が使われているか調べる re.search('[あ-んア-ン', 'ン') re.search('[\u4E00-\u9FD0]', s) -option: 改行コードをUNIXに指定する newline = '\n' newline = '\n' -配列の変遷を折れ線グラフにする plt.plot(range(len(データ列)), データ列2) plt.plot(range(len(データ列)), データ列) -データフレームから重複するデータを消す df.drop_duplicates() df.drop_duplicates() -線グラフの色をグリーンイエローに指定する plt.plot(データ列x, データ列y, color='greenyellow') plt.plot(データ列x, データ列y, color='greenyellow') -折れ線グラフの色をグリーンイエローにセットする plt.plot(データ列x, データ列y, color='greenyellow') plt.plot(データ列x, データ列y, color='greenyellow') -データフレームを列の値でグループ化してそれぞれのグループごとの最小値を求める df.groupby(column).min() df.groupby(column).min() -タプルを文字列として一つにする aTuple[::2] ''.join(map(str, iterable)) -カウンタからイテラブルを回数して引く aCounter.subtract(iterable) aCounter.subtract(iterable) -nはタプルのいづれかか確認する n in aTuple n in aTuple -縦棒グラフをグリーンイエロー色で描画する plt.bar(データ列x, データ列y, color='greenyellow') plt.bar(データ列x, データ列y, color='greenyellow') -円プロットでデータ列の割合を可視化する plt.pie(データ列, startangle=90) plt.pie(データ列, startangle=90) -数列と配列の散布図をプロットし、、大バツマーカーの色をrgbに指定する plt.plot(データ列x, データ列y, marker='X', c=rgb) plt.plot(データ列x, データ列y, marker='X', c=rgb) -ヒストグラムの線種を点線に設定する plt.hist(データ列, linestyle='dotted') plt.hist(データ列, linestyle='dotted') -符号付き整数の最大値を知る math.floor(x) sys.maxsize -縦棒グラフを貝殻色で描画する plt.bar(データ列x, データ列y, color='seashell') plt.bar(データ列x, データ列y, color='seashell') -2つのデータフレームをジョインする pd.merge(df, df2) pd.merge(df, df2) -浮動小数点数が正か x > 0 x > 0 -option: どの列もインデックスに設定しない index_col = None index_col = None -ヒストグラムの色を濃いシアンに設定する plt.hist(データ列, color='darkcyan') plt.hist(データ列, color='darkcyan') -option: 書き込みモードに変更する mode = 'w' mode = 'w' -黒い星マーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='*', markerfacecolor='k') plt.plot(データ列x, データ列y, marker='*', markerfacecolor='k') -折れ線グラフに青い四角印を描画する plt.plot(データ列x, データ列y, marker='s', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='s', markerfacecolor='b') -全ての印字できる文字 string.printable string.printable -ハニーデュー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='honeydew') plt.bar(データ列x, データ列y, color='honeydew') -赤い一点鎖線としてリストの推移をプロットする plt.plot(データ列x, データ列y, linestyle='dashbot', color='r') plt.plot(データ列x, データ列y, linestyle='dashbot', color='r') -横棒グラフをライトゴールドロディイエロー色を用いて描画する plt.barh(データ列x, データ列y, color='lightgoldenrodyellow') plt.barh(データ列x, データ列y, color='lightgoldenrodyellow') -サンディーブラウン色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='sandybrown') plt.plot(データ列x, データ列y, color='sandybrown') -リストと配列について散布図をプロットして、マーカーを下三角に設定する plt.plot(データ列x, データ列y, marker='v') plt.plot(��ータ列x, データ列y, marker='v') -カラムの空文字を欠損値に変換し、ドロップする ds.replace('', np.nan).dropna() ds.replace('', np.nan).dropna() -ダークカーキにヒストグラムの色を設定する plt.hist(データ列, color='darkkhaki') plt.hist(データ列, color='darkkhaki') -データフレームのカラムが何年か確認する df[col].dt.year df[col].dt.year -バリーウッド色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='burlywood') plt.plot(データ列x, データ列y, color='burlywood') -データ列の折れ線グラフを三角印で描画する plt.plot(データ列x, データ列y, marker='^') plt.plot(データ列x, データ列y, marker='^') -データフレームを散布図でグラフ化してカテゴリ別にマーカーを変える sns.scatterplot(data=df, x='列名', y='列名', style='カテゴリ列') sns.scatterplot(data=df, x='列名', y='列名', style='カテゴリ列') -データフレームから重複するデータをドロップする df.drop_duplicates() df.drop_duplicates() -線グラフを点線でプロットする plt.plot(データ列x, データ列y, linestyle='dotted') plt.plot(データ列x, データ列y, linestyle='dotted') -全8進数字 string.octdigits string.octdigits -データフレームで、列の重複を見る df.duplicated(subset=column) df.duplicated(subset=column) -列は正規分布からどれだけ歪んでいるか見る ds.kurt() ds.kurt() -2つのオブジェクトは等しいか調べる obj == obj2 obj == obj2 -一番右側の列をデータフレームから除く df[df.columns[1:]] df[df.columns[:-1]] -UTF8でファイルをオープンする] open(filepath, encoding='utf-8') open(filepath, encoding='utf-8') +小数点数の指数部を求める math.frexp(x)[1] math.frexp(x)[1] +集合から要素を除く aSet.discard(element) aSet.remove(element) +実数を整数で割った余り x // y x % y +データフレームのあるカラムを百の位で丸めて整数型にする df['列A'].round(-2).astype(int) df['列A'].round(-2).astype(int) +文字列を両端キューの先頭につけ加える deq.appendleft(element) deq.appendleft(element) +option: グラフの色をダークレッドに設定する color = 'darkred' color = 'darkred' +カラムの欠損値をxに指定する df['列A'].fillna(x) df['列A'].fillna(x) +配列の列ごとの最大値 np.max(aArray, axis=0) np.max(aArray, axis=0) +後ろから空白で文字列を区切る s.rsplit() s.rsplit() +横棒グラフをブルーバイオレット色として描画する plt.barh(データ列x, データ列y, color='blueviolet') plt.barh(データ列x, データ列y, color='blueviolet') +整数nを符号付きでバイナリに変換する n.to_bytes((n.bit_length() + 7) // 8, byteorder='big', signed=True) n.to_bytes((n.bit_length() + 7) // 8, byteorder='big', signed=True) +マッピングのキーとその項目をペアとして取り出す aDict.items() aDict.items() +option: 淡いピンク色色を使用する color = 'lightpink' color = 'lightpink' +二つの列によってデータフレームをグループ分けしてグループ名を列挙する [name for name, _ in df.groupby(['列A', '列B'])] [name for name, _ in df.groupby(['列A', '列B'])] +ゴールデンロッドにヒストグラムの色を設定する plt.hist(データ列, color='goldenrod') plt.hist(データ列, color='goldenrod') +データシリーズの秒を使う ds.dt.second ds.dt.second +折れ線グラフの右三角マーカーを赤色にする plt.plot(データ列x, データ列y, marker='>', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='>', markerfacecolor='r') +パールゴールデンロッドにヒストグラムの色を設定する plt.hist(データ列, color='palegoldenrod') plt.hist(データ列, color='palegoldenrod') +縦棒グラフをクリムゾン色で描画する plt.bar(データ列x, データ列y, color='crimson') plt.bar(データ列x, データ列y, color='crimson') +シアン色として線グラフを描画する plt.plot(データ列x, データ列y, color='cyan') plt.plot(データ列x, データ列y, color='cyan') +実行結果をマゼンタにする int(context='muted') f'\033[35m{value}\033[0m' +折れ線グラフを青い実線を用いて描画する plt.plot(データ列x, データ列y, linestyle='solid', color='b') plt.plot(データ列x, データ列y, linestyle='solid', color='b') +ロバスト推定としてクラス分類をする model = sklearn.linear_model.RANSACClassifier(random_state=0) model = sklearn.linear_model.RANSACClassifier(random_state=0) +ベクトルの要素ごとの最大公約数 np.gcd(aArray, aArray2) np.gcd(aArray, aArray2) +option: オレンジレッドにフォントの色を設定する color = 'orangered' color = 'orangered' +青い大バツマーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='X', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='X', markerfacecolor='b') +カーネル密度分布を描画する sns.kdeplot(x='列名', hue='カテゴリ列', data=df) sns.kdeplot(x='列名', hue='カテゴリ列', data=df) +option: 黄緑を使う color = 'chartreuse' color = 'chartreuse' +オレンジレッド色として棒グラフを描画する plt.bar(データ列x, データ列y, color='orangered') plt.bar(データ列x, データ列y, color='orangered') +行列の要素ごとの最小公倍数 np.quantile(aArray, aArray2) np.lcm(aArray, aArray2) +線グラフの色を紺碧にセットする plt.plot(データ列x, データ列y, color='azure') plt.plot(データ列x, データ列y, color='azure') +データフレームのあるカラムを千の位で丸める df['列A'].round(-3) df['列A'].round(-3) +折れ線グラフのポイントマーカーの色を設定する plt.plot(データ列x, データ列y, marker='.', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='.', markerfacecolor='#800080') +赤いマーカーを散布図に描画する plt.scatter(データ列x, データ列y, markerfacecolor='r') plt.scatter(データ列x, データ列y, markerfacecolor='r') +入力から二つの実数を読む A, B = map(float, input().split()) A, B = map(float, input().split()) +データシリーズの未入力値を平均に設定する ds.fillna(ds.mean()) ds.fillna(ds.mean()) +列のコンビネーション itertools.combinations(iterable, n) itertools.combinations(iterable, n) +2つの変数をそれぞれ定義する x, y = y, x x, y = i, j +文字列はリストに含まれないかどうか調べる element not in aList element not in aList +両端キューに値をenqueueする deq.pop() deq.appendleft(element) +ファイルからストリームをオープンして]fileとする file = open(filepath, mode='w') file = open(filepath) +データ列の変化を実線で描画する plt.plot(データ列x, データ列y, linestyle='solid') plt.plot(データ列x, データ列y, linestyle='solid') +縦棒グラフをライトイエロー色で描画する plt.bar(データ列x, データ列y, color='lightyellow') plt.bar(データ列x, データ列y, color='lightyellow') +タイタニックのデータセットからデータフレームを読み込む df = sns.load_dataset('titanic') df = sns.load_dataset('titanic') +積み上げ棒グラフを描く plt.bar(ラベル列, データ列, bottom=データ列y, color='#800080') plt.bar(ラベル列, データ列, bottom=データ列y, color='#800080') +青いバツマーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='x', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='x', markerfacecolor='b') +文字列の終了位置以前に部分文字列が含まれないかどうか s.find(sub, 0, end) == -1 s.find(sub, 0, end) == -1 +実数の双曲線正弦の逆数を求める math.asinh(x) math.asinh(x) +データフレームの最初5行 df.head(5) df.head(5) +縦棒グラフをスラグレー色として描画する plt.bar(データ列x, データ列y, color='slategrey') plt.bar(データ列x, データ列y, color='slategray') +SJISでファイルをオープンする] open(filepath, encoding='shift_jis') open(filepath, encoding='shift_jis') +データフレームをある列によって整列してNaNを先頭にする df.sort_values(by='列A', na_position='first') df.sort_values(by='列A', na_position='first') +今日の曜日を整数で使う datetime.datetime.today().weekday() datetime.datetime.today().weekday() +赤い左三角マーカーを用いて散布図を描画する plt.plot(データ列x, データ列y, marker='<', c='r') plt.plot(データ列x, データ列y, marker='<', c='r') +option: 色をロージーブラウンに変更する color = 'rosybrown' color = 'rosybrown' +データフレームをTSVファイルで出力する df.to_csv('file.tsv', sep='\t') df.to_csv('file.tsv', sep='\t') +シャルトリューズ色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='chartreuse') plt.plot(データ列x, データ列y, color='chartreuse') +文字列の左側から空白を除く s.lstrip('\ ') s.lstrip() +横方向に2つのデータフレームを合体させる pd.concat([df, df2, df3], axis=1) pd.concat([df, df2], axis=1) +改行を取り除いて1行だけ標準入力から読み込む sys.stdin.readline().rstrip() sys.stdin.readline().rstrip() +シーケンスを文字列リストに変換して、'改行で連結する '\n'.join(map(str, iterable)) '\n'.join(map(str, iterable)) +行列の列ごとの標準偏差を求める np.std(aArray, axis=0) np.std(aArray, axis=0) +option: 線のスタイルを点線に指定する linestyle = 'dotted' linestyle = 'dotted' +リスト中の要素は全て真かどうか all(aList) all(aList) +データフレームを小数点以下3桁まで保存する df.to_csv('file.csv', float_format='%.3f') df.to_csv('file.csv', float_format='%.3f') +データフレームの中の列をn個にビニングして、namesのラベルをつける pd.cut(df[col], n, labels=names) pd.cut(df[col], n, labels=names) +配列を行方向に連結する np.concatenate([aArray, aArray2], axis=1) np.concatenate([aArray, aArray2], axis=1) +赤い大バツマーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='X', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='X', markerfacecolor='r') +JSON文字列を読み込む json.loads(jsonString) json.loads(jsonString) +青い破線としてデータ列の移り変わりを描画する plt.plot(データ列x, データ列y, linestyle='dashed', color='b') plt.plot(データ列x, データ列y, linestyle='dashed', color='b') +点線にヒストグラムの線の種類を設定する plt.hist(データ列, linestyle='dotted') plt.hist(データ列, linestyle='dotted') +三自然数の最大公約数を算出する math.gcd(n, n2, n3) math.gcd(n, n2, n3) +option: 文字コードを文字列の示す文字コードに指定する encoding = s encoding = s +淡いピンク色色でヒストグラムを描画する plt.hist(データ列, color='lightpink') plt.hist(データ列, color='lightpink') +折れ線グラフをダークグレー色として描画する plt.plot(データ列x, データ列y, color='darkgrey') plt.plot(データ列x, データ列y, color='darkgrey') +線グラフの色をアリスブルーに指定する plt.plot(データ列x, データ列y, color='aliceblue') plt.plot(データ列x, データ列y, color='aliceblue') +option: リネンにグラフの色を指定する color = 'linen' color = 'linen' +書き込みモードでファイルをオープンして]fとする f = open(filepath, mode='w') f = open(filepath, mode='w') +ダイアモンドマーカーとして散布図を描画する plt.plot(データ列x, データ列y, marker='D') plt.plot(データ列x, データ列y, marker='D') +ファイルパスを追加できるようにオープンする] open(filepath, mode='a') open(filepath, mode='a') +列名を指定してデータフレームを内部結合する pd.merge(df, df2, on='列A', how='inner') pd.merge(df, df2, on='列A', how='inner') +カウンタのそれぞれの項目をそのカウントだけ列挙する aCounter.elements() aCounter.elements() +ミディアムバイオレットレッド色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='mediumvioletred') plt.bar(データ列x, データ列y, color='mediumvioletred') +文字列に列を変換して、カンマで連結する ','.join(map(str, iterable)) ','.join(map(str, iterable)) +赤い丸マーカーで散布図をプロットする plt.plot(データ列x, データ列y, marker='o', c='r') plt.plot(データ列x, データ列y, marker='o', c='r') +ヒートマップでクラス分類の予測精度を見る sns.heatmap(confusion_matrix_正解データ列, 予測データ列) sns.heatmap(confusion_matrix(正解データ列, 予測データ列), annot=True, cmap='Reds') +両端キューを要素を出す deq.popleft() deq.popleft() +ヒストグラムをライトスレイグレー色を用いて描画する plt.hist(データ列, color='lightslategray') plt.hist(データ列, color='lightslategray') +グレー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='gray') plt.bar(データ列x, データ列y, color='grey') +option: フォントの色をスラグレーに指定する color ='slategrey' color = 'slategray' +横棒グラフをダーク・スラテグレー色を使って描画する plt.barh(データ列x, データ列y, color='darkslategrey') plt.barh(データ列x, データ列y, color='darkslategrey') +折れ線グラフの色をライトグレーに変更する plt.plot(データ列x, データ列y, color='lightgray') plt.plot(データ列x, データ列y, color='lightgray') +ファイルパスとfilenameを結合する os.path.join(filepath, filepath) os.path.join(filepath, filename) +配列を三つ並べてヒストグラムにする plt.hist([データ列, データ列, データ列], color=['b', 'r', 'g']) plt.hist([データ列, データ列, データ列], color=['b', 'r', 'g']) +句読点文字を全て見る string.punctuation string.punctuation +回帰分析をバギングとして行う model = sklearn.ensemble.BaggingRegressor(n_estimators=10) model = sklearn.ensemble.BaggingRegressor(n_estimators=10) +黄色で文字列を表示する print(f'\033[33m{value}\033[0m') print(f'\033[33m{value}\033[0m') +赤いバツ印を散布図に描画する plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='r') +折れ線グラフの下三角印を青くする plt.plot(データ列x, データ列y, marker='v', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='v', markerfacecolor='b') +行列の合計を求める aArray.sum() np.sum(aArray) +カテゴリ別に並べて、データフレームを箱ひげ図にする sns.boxplot(x='カ���ゴリ列', y='列', data=df) sns.boxplot(x='カテゴリ列', y='列', data=df) +現在実行中の例外を情報を知る sys.info() sys.exc_info() +ヒストグラムをディムグレー色を使って描画する plt.hist(データ列, color='dimgray') plt.hist(データ列, color='dimgray') 日付データが火曜日 aDate.weekday() == 1 aDate.weekday() == 1 -大文字を小文字に変換する s.casefold() s.lower() -パレットトルコイズ色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='paleturquoise') plt.bar(データ列x, データ列y, color='paleturquoise') -option: フォントの色をグリーンに指定する color = 'green' color = 'green' -データフレームのリストカラムを丸めて、整数にする df[aList].round().astype(int) df[aList].round().astype(int) -ベージュ色として棒グラフを描画する plt.bar(データ列x, データ列y, color='beige') plt.bar(データ列x, データ列y, color='beige') -辞書から計数器を作る collections.Counter(aDict) collections.Counter(aDict) -データフレームの列を破壊的に消す df.drop(column, axis=1, inplace=True) df.drop(column, axis=1, inplace=True) -データを外れ値にロバストな標準化を行う sklearn.preprocessing.RANSACClassifier(n_components=N).fit_transform(データ) sklearn.preprocessing.RobustScaler().fit_transform(データ) -文字列の右側から部分文字列を除く s.rfind(sub) s.rstrip(sub) -year年の日付をオブジェクト化する datetime.date(year=year, month=1, day=1) datetime.date(year=year, month=1, day=1) -レモンシフォン色で棒グラフを描画する plt.bar(データ列x, データ列y, color='lemonchiffon') plt.bar(データ列x, データ列y, color='lemonchiffon') -データフレームの未入力値を直後の値に指定する df.fillna(method='bfill') df.fillna(method='bfill') -2つのカウンタのいずれかに含まれる値を求める aCounter | aCounter2 aCounter | aCounter2 -リストを文字列に変換してタブで結合する '\t'\t'.join(map(str, iterable)) '\t'.join(map(str, iterable)) -正弦の逆数 math.asin(x) math.asin(x) -ふたつの集合のいずれか一方だけの集合を見る aSet.difference(aSet2) aSet.symmetric_difference(aSet2) -線グラフの色を深紅にセットする plt.plot(データ列x, データ列y, color='crimson') plt.plot(データ列x, データ列y, color='crimson') -実数の2乗 x ** 2 x ** 2 -折れ線グラフの右三角印の線幅を変更する plt.plot(データ列x, データ列y, marker='>', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='>', markeredgewidth=2.5) -nの各桁の総和を計算する itertools.combinations(iterable, n) sum(map(int, str(n))) -線グラフをターコイズ色で描画する plt.plot(データ列x, データ列y, color='turquoise') plt.plot(データ列x, データ列y, color='turquoise') -折れ線グラフの色をライトゴールドロディイエローにする plt.plot(データ列x, データ列y, color='lightgoldenrodyellow') plt.plot(データ列x, データ列y, color='lightgoldenrodyellow') -文字列内にひとつでも英数字があるか any(c.isalnum() for c in s) any(c.isalnum() for c in s) -x座標の目盛を対数に変更する plt.xscale('log') plt.xscale('log') -リストの全順列 itertools.permutations(iterable) itertools.permutations(iterable) -リストの末尾にリストを追加して広げる aList.extend(aList2) aList.extend(aList2) -データフレームの列がxである行を取り出す df[df[column] == x] df[df[column] == x] -option: ミディアムバイオレットレッド色を使用する color ='mediumvioletred' color = 'mediumvioletred' -現在は何時か知る datetime.date.today().hour datetime.date.today().hour -データフレームのカラムを小数点以下n桁で四捨五入する df[col].round(n) df[col].round(n) -読み込みモードを用いてファイルをオープンする] open(filepath, mode='r') open(filepath, mode='r') -option: 耐火レンガにフォントの色を設定する color = 'firebrick' color = 'firebrick' -円プロットを完全な円にする plt.axis('equals') plt.axis('equals') -option: レベッカパープル色を使用する color ='rebeccapurple' color = 'rebeccapurple' -折れ線グラフに丸マーカーを用いる plt.plot(データ列x, データ列y, marker='o') plt.plot(データ列x, データ列y, marker='o') -グラフの描画で暗くパレットを使う sns.set(pallete='dark') sns.set(pallete='dark') -0で全要素を初期化した複素数型の行列 np.zeros(行数, 列数, dtype=bool) np.zeros(行数, 列数, dtype=bool) -データフレームのカラムが文字列が含まれる行を抽出する df[df[column].str.contains(s)] df[df[column].str.contains(s)] -データフレームを表示するとき、最大行数をnに設定する pd.set_option('display.max_rows', n) pd.set_option('display.max_rows', n) -シエナ色の折れ線グラ���を描画する plt.plot(データ列x, データ列y, color='sienna') plt.plot(データ列x, データ列y, color='sienna') -プロットの色を全般的に色差別なくする sns.set(pallete='colorblind') sns.set(pallete='colorblind') -空のロジスティック回帰モデルを用意する model = sklearn.linear_model.LogisticRegression() model = sklearn.linear_model.LogisticRegression() -データフレームの列の値がxより大きくx2より少ないデータを抽出する df[(x < df[column]) & (df[column] < x2)] df[(x < df[column]) & (df[column] < x2)] -散布図を黒いポイントマーカーで描画する plt.plot(データ列x, データ列y, marker='.', c='k') plt.plot(データ列x, データ列y, marker='.', c='k') -記号計算を使う import fractions import sympy -折れ線グラフのポイント印の線幅を設定する plt.plot(データ列x, データ列y, marker='.', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='.', markeredgewidth=2.5) -散布図に黒い三角印を描画する plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='k') -サドルブラウンにヒストグラムの色を設定する plt.hist(データ列, color='saddlebrown') plt.hist(データ列, color='saddlebrown') -ダークバイオレット色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='darkviolet') plt.plot(データ列x, データ列y, color='darkviolet') -タイムスタンプデータとタイムスタンプデータの時間差 aDatetime - aDatetime2 aDatetime - aDatetime2 -文字列をコロンによって分割し、列挙する s.split(':') s.split(':') -横棒グラフを青緑色で描画する plt.barh(データ列x, データ列y, color='teal') plt.barh(データ列x, データ列y, color='turquoise') -リストと配列について散布図を描いて、ダイアモンドマーカーの色をrgbに指定する plt.plot(データ列x, データ列y, marker='D', c=rgb) plt.plot(データ列x, データ列y, marker='D', c=rgb) -ヒストグラムをリネン色を使って描画する plt.hist(データ列, color='linen') plt.hist(データ列, color='linen') -行列にはいくつ要素があるか調べる aArray.size aArray.size -ヒストグラムをシルバー色を用いて描画する plt.hist(データ列, color='silver') plt.hist(データ列, color='silver') -日付時刻データが木曜日かどうか調べる aDatetime.weekday() == 3 aDatetime.weekday() == 3 -データフレームのヒートマップをグラフ化する sns.heatmap(df.corr()) sns.heatmap(df.corr()) -オールドレース色として棒グラフを描画する plt.bar(データ列x, データ列y, color='oldlace') plt.bar(データ列x, データ列y, color='oldlace') -リストとリストの散布図を描いて、三角マーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='^', c=rgb) plt.plot(データ列x, データ列y, marker='^', c=rgb) -混同行列を算出する 混同行列 = sklearn.metrics.confusion_matrix(正解データ列, 予測データ列) 混同行列 = sklearn.metrics.confusion_matrix(正解データ列, 予測データ列) +データフレームの指定したカラムのNaNを最大値に変更する df['列A'].fillna(df['列A'].max()) df['列A'].fillna(df['列A'].max()) +ふたつの集合が互いに素かどうか調べる aSet.isdisjoint(aSet2) aSet.isdisjoint(aSet2) +オブジェクトのフィールドの値 setattr(obj, プロパティ名) getattr(obj, プロパティ名) +線グラフの色をサンディーブラウンに設定する plt.plot(データ列x, データ列y, color='sandybrown') plt.plot(データ列x, データ列y, color='sandybrown') +ファイルからベースファイル名を見る os.path.splitext(filepath)[1].abspath(__file__) os.path.splitext(os.path.basename(filepath))[0] +データシリーズの中に文字列と文字列がいくつあるか調べる ds.isin([value, value2]).sum() ds.isin([value, value2]).sum() +正規表現で文字列を分ける re.split(pattern, s) re.split(pattern, s) +option: パープルにグラフの色を設定する color = 'purple' color = 'purple' +平均値でデータフレームの指定したカラムの欠損値を埋める df['列A'].fillna(df['列A'].mean()) df['列A'].fillna(df['列A'].mean()) +データフレームの複数の列を並べて箱ひげ図として作図する plt.boxplot([df['カラム'], df['カラム']]) plt.boxplot([df['カラム'], df['カラム']]) +option: ナバホホワイトを用いる color = 'navajowhite' color = 'navajowhite' +イテラブルにタプルを続ける itertools.chain(iterable, iterable2) itertools.chain(iterable, iterable2) +データフレームの一部のカラムの欠損値を平均値で補完する df[['列A', '列B']].fillna(df[['列A', '列B']].mean()) df[['列A', '列B']].fillna(df[['列A', '列B']].mean()) +事前にパターンをコンパイルする re.compile(pattern) re.compile(pattern) +option: グラフの色をライムに指定する color = 'lime' color = 'lime' +データフレームのNaNを直後の値に設定する df.fillna(method='bfill') df.fillna(method='bfill') +両端キューのサイズ len(deq) len(deq) +整数nを8進表記に変換する oct(n) oct(n) +タン色として散布図を描画する plt.scatter(データ列x, データ列y, color='tan') plt.scatter(データ列x, データ列y, color='tan') +データシリーズの歪み ds.kurt() ds.kurt() +日付データからn分減算する aDate - datetime.timedelta(minutes=n) aDate - datetime.timedelta(minutes=n) +グラフの横軸にキャプションを設定する plt.xlabel('x軸ラベル') plt.xlabel('x軸ラベル') +ヒストグラムをスラグレー色を用いて描画する plt.hist(データ列, color='slategray') plt.hist(データ列, color='slategrey') +ヒストグラムの色をミディアムブルーにする plt.hist(データ列, color='mediumblue') plt.hist(データ列, color='mediumblue') +2つのデータ列の残差を散布図として描く sns.residplot(x=データ列, y=データ列) sns.residplot(x=データ列, y=データ列) +データフレームから同じ内容の行を破壊的にドロップする df.drop_duplicates(inplace=True) df.drop_duplicates(inplace=True) +フォレストグリーンにヒストグラムの色を設定する plt.hist(データ列, color='forestgreen') plt.hist(データ列, color='forestgreen') +データフレームのカラムをグループ化して、ヒストグラムで見る sns.histplot(df, x='列名', hue='カテゴリ名') sns.histplot(df, x='列名', hue='カテゴリ名') +折れ線グラフの色をライトスレイグレーに指定する plt.plot(データ列x, データ列y, color='lightslategray') plt.plot(データ列x, データ列y, color='lightslategrey') +ベクトルのユニークな要素とその個数 u, indices = np.unique(aArray, return_index=True) u, counts = np.unique(aArray, return_counts=True) +イテラブルを2回あわせた直積を求める itertools.product(iterable, repeat=2) itertools.product(iterable, repeat=2) +文字列をタイムスタンプ型にする pd.to_datetime(日付を表現した文字列) pd.to_datetime(日付を表現した文字列) +濃いシアン色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='darkcyan') plt.bar(データ列x, データ列y, color='darkcyan') +アリスブルー色で棒グラフを描画する plt.bar(データ列x, データ列y, color='aliceblue') plt.bar(データ列x, データ列y, color='aliceblue') +1からNまでの配列を作成する np.arange(1, N+1) np.arange(1, N+1) +option: バリーウッドを用いる color = 'burlywood' color = 'burlywood' +線グラフの色をパウダーブルーに設定する plt.plot(データ列x, データ列y, color='powderblue') plt.plot(データ列x, データ列y, color='powderblue') +ヒストグラムをアリスブルー色として描画する plt.hist(データ列, color='aliceblue') plt.hist(データ列, color='aliceblue') +正則化付き単回帰分析の準備をする model = sklearn.linear_model.ElasticNet() model = sklearn.linear_model.ElasticNet() +オブジェクトは辞書型か調べる isinstance(obj, dict) isinstance(obj, dict) +ミッドナイトブルー色を用いて縦棒グラフを描画する plt.bar(データ列x, データ列y, color='midnightblue') plt.bar(データ列x, データ列y, color='midnightblue') +option: ライトスカイブルーにグラフの色を設定する color = 'lightskyblue' color = 'lightskyblue' +x座標の目盛りの表示を変更する plt.xticks(目盛りの値リスト) plt.xticks(目盛りの値リスト) +折れ線グラフのクロスマーカーの色を設定する plt.plot(データ列x, データ列y, marker='x', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='x', markerfacecolor='#800080') +ヒストグラムの色をパールバイオレットレッドに変更する plt.hist(データ列, color='palevioletred') plt.hist(データ列, color='palevioletred') +上限から下限までの範囲でヒストグラムを描く plt.hist(データ列, range=(start, end)) plt.hist(データ列, range=(start, end)) +散布図にrgbの左三角マーカーを使用する plt.plot(データ列x, データ列y, marker='<', c=rgb) plt.plot(データ列x, データ列y, marker='<', c=rgb) +下線付きで文字列を表示する print(f'\033[4m{value}\033[0m') print(f'\033[4m{value}\033[0m') +符号なし8ビット整数型のゼロ埋めされた配列 np.zeros(要素数, dtype=np.uint8) np.zeros(要素数, dtype=np.uint8) +赤い点線を使って数列の推移を描画する plt.plot(データ列x, データ列y, linestyle='dotted', color='r') plt.plot(データ列x, データ列y, linestyle='dotted', color='r') +オールドレース色を用いてヒストグラムを描画する plt.hist(データ列, color='oldlace') plt.hist(データ列, color='oldlace') +文字列内にひとつでも空白が含まれるかどうか調べる any(c.isspace() for c in s) any(c.isspace() for c in s) +数値を両端キューの末尾に追加する deq.append(element) deq.append(element) +最大値・最小値として整数乱数を生成する random.randint(最小値, 最大値) random.randint(最小値, 最大値) +データフレームの一部の列の中に文字列と文字列が存在するか判定する df[['列A', '列B']].isin([value, value2]).sum() df[['列A', '列B']].isin([value, value2]) +箱髭図を二つ並べて描画する plt.boxplot([データ列, データ列]) plt.boxplot([データ列, データ列]) +n個に等間隔でデータフレームの中の列をビン分割して、namesのラベルをつける pd.cut(df[col], n, labels=names) pd.cut(df[col], n, labels=names) +縦棒グラフをブランチドアーモンド色を用いて描画する plt.bar(データ列x, データ列y, color='blanchedalmond') plt.bar(データ列x, データ列y, color='blanchedalmond') +散布図の菱形マーカーの線幅を変える plt.scatter(データ列x, データ列y, marker='D', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='D', markeredgewidth=2.5) +数に実数を加算する x + y x + y +オブジェクトにプロパティが存在するかどうかテストする hasattr(obj, プロパティ名) hasattr(obj, プロパティ名) +散布図に赤いダイアモンドマーカーを用いる plt.plot(データ列x, データ列y, marker='D', c='r') plt.plot(データ列x, データ列y, marker='D', c='r') +データフレームのインデックスのリスト df.index df.index +データフレームをグループ化し、それぞれの最小値を算出する df.groupby('列A').min() df.groupby('列A').min() +行列は何次元か調べる aArray.ndim aArray.ndim +ヒストグラムを描画して、ビン数を指定する plt.hist(データ列, bins=区関数) plt.hist(データ列, bins=区関数) +データフレームを指定した列によってソートして、NaNを先頭にする df.sort_values(by='列A', na_position='first') df.sort_values(by='列A', na_position='first') +データを最大最小値でスケール変換する sklearn.preprocessing.MinMaxScaler().fit_transform(データ) sklearn.preprocessing.MinMaxScaler().fit_transform(データ) +線グラフを青い実線で描画する plt.plot(データ列x, データ列y, linestyle='solid', color='b') plt.plot(データ列x, データ列y, linestyle='solid', color='b') イテラブルを配列にする np.array(iterable) np.array(iterable) -数列と配列の散布図に右三角マーカーを描画する plt.plot(データ列x, データ列y, marker='>') plt.plot(データ列x, データ列y, marker='>') -データフレームの中の列を四分位数ごとに分割する pd.qcut(df[col], 4) pd.qcut(df[col], 4) -nのビット長 n.bit_length(n) n.bit_length() -大文字を全部使う string.ascii_uppercase string.ascii_uppercase -折れ線グラフをコーンズシルク色を用いて描画する plt.plot(データ列x, データ列y, color='cornsilk') plt.plot(データ列x, データ列y, color='cornsilk') -データ列と配列の散布図に▲マーカーをプロットする plt.plot(データ列x, データ列y, marker='^') plt.plot(データ列x, データ列y, marker='^') -散布図のバツマーカーの大きさを変える plt.scatter(データ列x, データ列y, marker='x', markersize=2.0) plt.scatter(データ列x, データ列y, marker='x', markersize=2.0) -option: バイナリモードを用いる mode = 'rb' mode = 'rb' -整数nをバイト列にする n.to_bytes((n.bit=length() + 7) // 8, byteorder='big') n.to_bytes((n.bit_length() + 7) // 8, byteorder='big') -データフレームの列の第一四分位数 df[col].quantile(0.25) df[col].quantile(0.25) -サブ型 dtype(int) issubclass(サブクラス, クラス) -重複する行のみを取り出す df.duplicated() df[df.duplicated(keep=False)] -棒グラフをライトシアン色として描画する plt.bar(データ列x, データ列y, color='lightcyan') plt.bar(データ列x, データ列y, color='lightcyan') -nがn2より大きいか確認する n > n2 n > n2 -2つの文字列は等しくないかテストする s.isdisjoint(s) s != s2 -データフレームをグループ化しそれぞれの列に対し最小値を求める df.groupby(column)[column2].min() df.groupby(column)[column2].min() -option: エンコーディングをBOM付きに指定する encoding = 'utf_8_sig' encoding = 'utf_8_sig' -クラスが名前付きタプル issubclass(C, tuple) issubclass(C, tuple) -アークコサインを求める math.acos(x) math.acos(x) -option: 右三角印を加える marker = '>' marker = '>' -青い上三角マーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='^', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='^', markerfacecolor='b') -カテゴリで色分けして、カーネル密度分布をプロットする sns.kdeplot(x='列名', hue='カテゴリ列', data=df) sns.kdeplot(x='列名', hue='カテゴリ列', data=df) -タプルをソートしてJSONフォーマットの文字列にする json.dumps(aDict, ensure_ascii=False) json.dumps(aDict, ensure_ascii=False, sort_keys=True) -n個に列をビン分割する pd.cut(ds, n) pd.cut(ds, n) -折れ線グラフのダイアモンド印を黒くする plt.plot(データ列x, データ列y, marker='D', markerfacecolor='k') plt.plot(データ列x, データ列y, marker='D', markerfacecolor='k') -星マーカーを散布図に使う plt.plot(データ列x, データ列y, marker='*') plt.plot(データ列x, データ列y, marker='*') -折れ線グラフの左三角マーカーの色を指定する plt.plot(データ列x, データ列y, marker='<', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='<', markerfacecolor='#800080') -今日が月曜日 datetime.datetime.today().weekday() == 0 datetime.datetime.today().weekday() == 0 -プロットの色をパステル調にする sns.set(pallete='pastel') sns.set(pallete='pastel') -データフレームからカラムを4つ選択する df[[column, column2, column3, column3]] df[[column, column2, column3, column4]] -折れ線グラフをマゼンタ色として描画する plt.plot(データ列x, データ列y, color='magenta') plt.plot(データ列x, データ列y, color='magenta') -文字列中にひとつでも非空白が含まれる any(not c.isspace() for c in s) any(not c.isspace() for c in s) -データフレームのリストカラムを10の位で四捨五入して、整数型にする df[aList].round(-1).astype(int) df[aList].round(-1).astype(int) -8ビット整数型の全要素を0で初期化した行列 np.zeros(行数, 列数, dtype=np.int8) np.zeros(行数, 列数, dtype=np.int8) -棒グラフをライトグリーン色を用いて描画する plt.bar(データ列x, データ列y, color='lightseagreen') plt.bar(データ列x, データ列y, color='lightseagreen') -リストと数列について散布図を描いて、マーカーを菱形に設定する plt.plot(データ列x, データ列y, marker='D') plt.plot(データ列x, データ列y, marker='D') -option: ベージュを用いる color = 'beige' color = 'beige' -ライトスレイグレー色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='lightslategrey') plt.plot(データ列x, データ列y, color='lightslategray') -箱ヒゲ図を描画して、平均線を加える plt.boxplot(データ列, meanline=True) plt.boxplot(データ列, meanline=True) -文字列がリストに含まれるか element in aList element in aList -データフレームの列の名前を一度に文字列を文字列に置換する df.columns = [str(x).replace(s, s2) for x in df.columns] df.columns = [str(x).replace(s, s2) for x in df.columns] -オブジェクトが関数かどうか callable(obj) callable(obj) -データフレームを各列と列の組み合わせ毎にグループ化し、、最小値を計算する df.groupby([column, column2], as_index=False).min() df.groupby([column, column2], as_index=False).min() +縦棒グラフを黒くする plt.bar(データ列x, データ列y, color='k') plt.bar(データ列x, データ列y, color='k') +色名とカラーコードの対応表を求める matplotlib.colors.cnames matplotlib.colors.cnames +貝殻色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='seashell') plt.barh(データ列x, データ列y, color='seashell') +プラットホームはMacOSかどうか確認する sys.platform.startswith('darwin') sys.platform.startswith('darwin') +ディープスカイブルーにヒストグラムの色を設定する plt.hist(データ列, color='deepskyblue') plt.hist(データ列, color='deepskyblue') +ファイルを文字列の示すエンコーディングとしてオープンする] open(filepath, encoding=s) open(filepath, encoding=s) +year年month月day日のタイムスタンプをオブジェクト化する datetime.datetime(year=year, month=month, day=day) datetime.datetime(year=year, month=month, day=day) +空のマップを生成する {} {} +ドジャーブルー色として棒グラフを描画する plt.bar(データ列x, データ列y, color='dodgerblue') plt.bar(データ列x, データ列y, color='dodgerblue') +黄色で文字列をプリントする print(f'\033[33m{value}\033[0m') print(f'\033[33m{value}\033[0m') +オブジェクトに属性が存在するかどうか調べる hasattr(obj, プロパティ名) hasattr(obj, プロパティ名) +ヒストグラムをイエローグリーン色として描画する plt.hist(データ列, color='yellowgreen') plt.hist(データ列, color='yellowgreen') +option: リネン色を使用する color = 'linen' color = 'linen' +データフレームの指定した列を万の位で丸める df['列A'].round(-4) df['列A'].round(-4) +2つのデータフレームを横向きにマージする pd.merge(df, df2) pd.merge(df, df2) +環境の名前を知る sys.getcwd[0] sys.platform +二つの集合に共通する要素からなる集合 aSet.intersection(aSet2) aSet.intersection(aSet2) +グレー色を用いて散布図を描画する plt.scatter(データ列x, データ列y, color='gray') plt.scatter(データ列x, データ列y, color='gray') +変数が無限大に近づくときの数値の極限値を算出する sympy.limit(e, z, -oo) sympy.limit(e, z, oo) +データフレームの指定したカラムのNaNを最小値で置換する df['列A'].fillna(df['列A'].min()) df['列A'].fillna(df['列A'].min()) +option: 事前に説明変数を正規化する normalize = True normalize = True +イテラブルにリストを続けた列 itertools.chain(iterable, iterable2) itertools.chain(iterable, iterable2) +ライトグリーン色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='lightseagreen') plt.plot(データ列x, データ列y, color='lightgreen') +散布図の印を赤くする plt.scatter(データ列x, データ列y, markerfacecolor='r') plt.scatter(データ列x, データ列y, markerfacecolor='r') +year年month月day日hour時minute分を日付時刻にする datetime.datetime(year=year, month=month, day=day, hour=hour, minute=hour, minute=minute) datetime.datetime(year=year, month=month, day=day, hour=hour, minute=minute) +データシリーズの上位25パーセント ds.quantile(0.25) ds.quantile(0.25) +ヒストグラムをアクアマリン色として描画する plt.hist(データ列, color='aquamarine') plt.hist(データ列, color='aquamarine') +シスル色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='thistle') plt.bar(データ列x, データ列y, color='thistle') +横棒グラフをハニーデュー色として描画する plt.barh(データ列x, データ列y, color='honeydew') plt.barh(データ列x, データ列y, color='honeydew') +option: フォントの色をサンディーブラウンに変更する color ='sandybrown' color = 'sandybrown' +データシリーズが何分か調べる ds.dt.minute ds.dt.minute +option: 濃いシアンを使う color = 'darkcyan' color = 'darkcyan' +option: エラーがあるとき例外を発生させるように設定する errors ='strict' errors = 'strict' +線を半透明の破線で描画する plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) +折れ線グラフの色を淡い茶色に変更する plt.plot(データ列x, データ列y, color='tan') plt.plot(データ列x, データ列y, color='tan') +nの8進数表現 oct(n) oct(n) +散布図のマーカーを青色にする plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='b') plt.scatter(データ列x, データ列y, markerfacecolor='b') +リストが全て真かどうか調べる all(aList) all(aList) +暗い赤色を用いて横棒グラフを描画する plt.barh(データ列x, データ列y, color='darkred') plt.barh(データ列x, データ列y, color='darkred') +棒グラフの色をやわらかい青にする plt.bar(データ列x, データ列y, color='cornflowerblue') plt.bar(データ列x, データ列y, color='cornflowerblue') +ダークグレー色を使って散布図を描画する plt.scatter(データ列x, データ列y, color='darkgray') plt.scatter(データ列x, データ列y, color='darkgray') +option: ゴールド色を用いる color = 'gold' color = 'gold' +option: ディープスカイブルーを使う color = 'deepskyblue' color = 'deepskyblue' +ファイルパスをベース名と拡張子に分割する os.path.splitext(filepath) os.path.splitext(filepath) +散布図の四角マーカーを青色にする plt.scatter(データ列x, データ列y, marker='s', markerfacecolor='b') plt.scatter(データ列x, データ列y, marker='s', markerfacecolor='b') +ヒストグラムの色をミディアムオーキッドにセットする plt.hist(データ列, color='mediumorchid') plt.hist(データ列, color='mediumorchid') +option: シルバーにグラフの色を設定する color ='silver' color = 'silver' +縦棒グラフの色をタンにする plt.bar(データ列x, データ列y, color='tan') plt.bar(データ列x, データ列y, color='tan') +偽陰性を避けたい指標を使用する sklearn.metrics.recall_score(正解データ列, 予測データ列) sklearn.metrics.recall_score(正解データ列, 予測データ列) +Pandasのバージョンを調べる print(pd.__version__) print(pd.__version__) +線グラフの色をパープルに変更する plt.plot(データ列x, データ列y, color='purple') plt.plot(データ列x, データ列y, color='purple') +カウンタのキーの出現回数 aCounter[0] aCounter[element] +option: ミントクリーム色を使用する color ='mintcream' color = 'mintcream' +文字列の中で大文字・小文字を無視して正規表現にマッチした全文字列をリストに変換する re.findall(pattern, s, flags=re.IGNORECASE) re.findall(pattern, s, flags=re.IGNORECASE) +データフレームを表示するとき表示可能な最大行数を変更する pd.set_option('display.max_rows', n) pd.set_option('display.max_rows', n) +散布図の△マーカーの色を変更する plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='#800080') +乱数で要素を埋めた行列 np.random.random((行数, 列数)) np.random.random((行数, 列数)) +option: コロンを区切り記号で用いる sep = ':' sep = ':' +棒グラフをマゼンタ色を使って描画する plt.bar(データ列x, データ列y, color='magenta') plt.bar(データ列x, データ列y, color='magenta') +セパレータで文字列を区切って、列挙する s.split(sub) s.split(sep) +オーキッド色でヒストグラムを描画する plt.hist(データ列, color='orchid') plt.hist(データ列, color='orchid') +option: マーカーを星に変える marker = '*' marker = '*' +データシリーズの中にいくつ文字列が存在するか数える ds.isin([value]).sum() ds.isin([value]).sum() +2つのデータフレームを横方向に結合する pd.concat([df, df2], axis=1) pd.concat([df, df2], axis=1) +線グラフをダークマゼンタ色で描画する plt.plot(データ列x, データ列y, color='darkmagenta') plt.plot(データ列x, データ列y, color='darkmagenta') +n掛けるn2を求める n / n2 n * n2 +折れ線グラフの上三角マーカーの色を変える plt.plot(データ列x, データ列y, marker='^', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='^', markerfacecolor='#800080') +データシリーズを十の位で丸めて整数にする ds.round(-1).astype(int) ds.round(-1).astype(int) +カラムの正規分布を判定する scipy.stats.shapiro(df['列A']) scipy.stats.shapiro(df['列A']) +横棒グラフをミディアムシアグリーン色を用いて描画する plt.barh(データ列x, データ列y, color='mediumseagreen') plt.barh(データ列x, データ列y, color='mediumseagreen') +データフレームのn行目を消してみる df.drop(n, axis=0) df.drop(n, axis=0) +option: ミディアムパープルにグラフの色を設定する color ='mediumpurple' color = 'mediumpurple' +散布図に黒い菱形印を描画する plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='k') +平均値でデータフレームの欠損値を補う df.fillna(df.mean()) df.fillna(df.mean()) +横棒グラフを淡い茶色色を用いて描画する plt.barh(データ列x, データ列y, color='tan') plt.barh(データ列x, データ列y, color='tan') +散布図に星マーカーを使用する plt.plot(データ列x, データ列y, marker='*') plt.scatter(データ列x, データ列y, marker='*') +タプルを階層化マップにする collections.ChainMap(aDict) collections.ChainMap(aDict) +グラフをスライドに変更する sns.set(context='talk') sns.set(context='talk') +フローラルホワイト色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='floralwhite') plt.plot(データ列x, データ列y, color='floralwhite') +散布図の菱形印の色を設定する plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='#800080') +二つの列を組み合わせてグループ化し、合計を計算する s.groupby(['列A', '列B'], as_index=False).sum() df.groupby(['列A', '列B'], as_index=False).sum() +正規分布として疑似乱数を生成する random.normalvariate(mu=0.5, sigma=0.2) random.normalvariate(mu=0.5, sigma=0.2) +option: グラフの種類を実線に変更する linestyle ='solid' linestyle = 'solid' +option: 分割記号をタブにする sep = '\t' sep = '\t' +グラフで使える色名の一覧を使う matplotlib.colors.cnames matplotlib.colors.cnames +0から始まるn個の整数列を作る list(range(n,) list(range(n)) +日付データからn時間を引く aDate - datetime.timedelta(hours=n) aDate - datetime.timedelta(hours=n) +部分文字列が文字列中にあるか s.issub(sub) sub in s +組の末尾 aTuple[-1] aTuple[-1] +折れ線グラフをライトグリーン色を用いて描画する plt.plot(データ列x, データ列y, color='lightgreen') plt.plot(データ列x, データ列y, color='lightseagreen') +棒グラフをゴールド色を用いて描画する plt.bar(データ列x, データ列y, color='gold') plt.bar(データ列x, データ列y, color='gold') +複数の列からグループ化し、平均値を求める df.groupby(['列A', '列B'], as_index=False).mean() df.groupby(['列A', '列B'], as_index=False).mean() +ホットピンクにヒストグラムの色を変更する plt.hist(データ列, color='hotpink') plt.hist(データ列, color='hotpink') +x軸だけ目盛り線 plt.grid(axis='x') plt.grid(axis='x') +option: ライトグレーに色を設定する color = 'lightgrey' color = 'lightgrey' +データ列の各データが何回出現するか調べる ds.value_counts() ds.value_counts() +全ての句点文字 string.punctuation string.punctuation +リストを黒色で表示できる文字列にする f'\033[30m{value}\033[0m' f'\033[30m{value}\033[0m' +文字コードを文字にする ord(ch) chr(unicode) +散布図に黒い▲マーカーを描画する plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='k') +点線でヒストグラムを描画する plt.hist(データ列, linestyle='dotted') plt.hist(データ列, linestyle='dotted') +option: ライトグレー色を使用する color = 'lightgray' color = 'lightgrey' +散布図を黒い星マーカーで描く plt.plot(データ列x, データ列y, marker='*', c='k') plt.plot(データ列x, データ列y, marker='*', c='k') +箱髭図を描いて平均を加える plt.boxplot(データ列, showmeans=True) plt.boxplot(データ列, showmeans=True) +貝殻色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='seashell') plt.barh(データ列x, データ列y, color='seashell') +リストにリストを展開する aList.extend(aList2) aList.extend(aList2) +散布図をピーチパフ色として描画する plt.scatter(データ列x, データ列y, color='peachpuff') plt.scatter(データ列x, データ列y, color='peachpuff') +マッピングをJSON形式の文字列に変換する json.dumps(aDict, ensure_ascii=False) json.dumps(aDict, ensure_ascii=False) +データフレームの文字列を未入力値に変換する df.replace(値, np.nan) df.replace(値, np.nan) +小数点数以下の最大の整数 math.floor(x) math.floor(x) +配列と数列についてリストの値に応じて、散布図の色を変える plt.scatter(データ列x, データ列y, c=aList, cmap='Blues') plt.scatter(データ列x, データ列y, c=aList, cmap='Blues') +リストとリストの散布図を描き、、バツマーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='x', c=rgb) plt.plot(データ列x, データ列y, marker='x', c=rgb) +option: 青緑にグラフの色を設定する color = 'teal' color = 'teal' +rgbの星マーカーで散布図を描く plt.plot(データ列x, データ列y, marker='*', c=rgb) plt.plot(データ列x, データ列y, marker='*', c=rgb) +データフレームのカラム間の相関行列を求める df.corr() df.corr() +2つの変数をスラッシュで区切ってプリントする print(value, value2, sep='/') print(value, value2, sep='/') +数値をアンダーライン付きにする f'\033[4m{value}\033[0m' f'\033[4m{value}\033[0m' +option: フォレストグリーンにフォントの色を設定する color = 'forestgreen' color = 'forestgreen' +浮動小数点数に変換する float(x) float(x) +n個に等間隔で配列をビニングする pd.cut(aArray, n) pd.cut(aArray, n) +文字列の中でASCII限定としてパターンにマッチした全ての文字列をリストに変換する re.findall(pattern, s, flags=re.ASCI) re.findall(pattern, s, flags=re.ASCI) +リストを引数として展開して出力する print(*aList, sep=',') print(*aList) +ヒストグラムの色をアイボリーに変更する plt.hist(データ列, color='ivory') plt.hist(データ列, color='ivory') +折れ線グラフをグレー色を用いて描画する plt.plot(データ列x, データ列y, color='grey') plt.plot(データ列x, データ列y, color='gray') +多次元データをt分布型確率的近傍埋め込み法を使ってパステル調に次元に次元削減する sklearn.manifold.TSNE(n_components=N).fit_transform(多次元データ) sklearn.manifold.TSNE(n_components=N).fit_transform(多次元データ) +折れ線グラフの色をフォレストグリーンに指定する plt.plot(データ列x, データ列y, color='forestgreen') plt.plot(データ列x, データ列y, color='forestgreen') +整数nを十六進数表現に変換する hex(n) hex(n) +折れ線グラフを実線で描く plt.plot(データ列x, データ列y, linestyle='solid') plt.plot(データ列x, データ列y, linestyle='solid') +データ列とリストの散布図に黒い四角マーカーを描画する plt.plot(データ列x, データ列y, marker='s', c='k') plt.plot(データ列x, データ列y, marker='s', c='k') +option: グラフの色をダークオーキッドにセットする color = 'darkorchid' color = 'darkorchid' +スレートブルー色を用いて折れ線グラフを描画する plt.plot(データ列x, データ列y, color='slateblue') plt.plot(データ列x, データ列y, color='slateblue') +プロットの中の縦軸にラベルを付ける plt.ylabel('y軸ラベル') plt.ylabel('y軸ラベル') +日付を表現した文字列をdatetime64型に変換する pd.to_datetime(日付を表現した文字列) pd.to_datetime(日付を表現���た文字列) +タプルの要素を並べ変える sorted(aTuple) sorted(aTuple) +option: フォントの色をカーキに変更する color = 'khaki' color = 'khaki' +真紅色の棒グラフを描画する plt.bar(データ列x, データ列y, color='crimson') plt.bar(データ列x, データ列y, color='crimson') +データフレームのある列の値がxより小さいデータを抽出する df[df['列A'] < x] df[df['列A'] < x] +データ列の推移を折れ線プロットにする plt.plot(range(len(データ列)), データ列) plt.plot(range(len(データ列)), データ列) +ヒストグラムの色をダークブルーにセットする plt.hist(データ列, color='darkblue') plt.hist(データ列, color='darkblue') +アリスブルー色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='aliceblue') plt.plot(データ列x, データ列y, color='aliceblue') +option: グラフの色を青に変更する color = 'blue' color = 'blue' +データフレームから重複を残さず重複を取り除く df.drop_duplicates(keep=False) df.drop_duplicates(keep=False) +データフレームを表示するとき、表示可能な最大行数をnに指定する pd.set_option('display.max_rows', n) pd.set_option('display.max_rows', n) +折れ線グラフをプラム色として描画する plt.plot(データ列x, データ列y, color='plum') plt.plot(データ列x, データ列y, color='plum') +リストを円プロットにする plt.pie(データ列, startangle=90) plt.pie(データ列, startangle=90) +文字列全体を大文字・小文字を無視してパターンにマッチさせる re.fullmatch(pattern, s, flags=re.IGNORECASE) re.fullmatch(pattern, s, flags=re.IGNORECASE) +横棒グラフをシーグリーン色を用いて描画する plt.barh(データ列x, データ列y, color='seagreen') plt.barh(データ列x, データ列y, color='seagreen') +青い左三角マーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='<', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='<', markerfacecolor='b') +散布図の▽マーカーを赤くする plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='r') +文字列全体がパターンにマッチするか見る re.fullmatch(pattern, s) re.fullmatch(pattern, s) +2つの文字列を出力する print(value, value2) print(value, value2) +文字コードに対応する文字を求める chr(unicode) chr(unicode) +辞書の浅いコピーを新規生成する aDict.copy() aDict.copy() +データフレームを2つの列でグループ化し、記述統計量を求める df.groupby(['列A', '列B']).describe() df.groupby(['列A', '列B']).describe() +折れ線グラフの左三角マーカーの色を変える plt.plot(データ列x, データ列y, marker='<', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='<', markerfacecolor='#800080') +ケンドール相関係数を用いてデータフレームの選択した列の相関行列を求める df[['列A', '列B']].corr(df[['列A', '列B']].corr()) df[['列A', '列B']].corr(method='kendall') +ヘッダを指定せずカンマ区切りのファイルを読む pd.merge(df, intercept='s', intercept=True) pd.read_csv('file.csv', header=None) +散布図に四角マーカーを使用する plt.scatter(データ列x, データ列y, marker='s') plt.scatter(データ列x, データ列y, marker='s') +nがタプルのどれか n in aTuple n in aTuple +オブジェクトはリストか調べる isinstance(obj, (list) isinstance(obj, list) +二つのオブジェクトが同一参照かどうか調べる obj is obj2 obj is obj2 +ミッドナイトブルー色を使って線グラフを描画する plt.plot(データ列x, データ列y, color='midnightblue') plt.plot(データ列x, データ列y, color='midnightblue') +浮動小数点数のk進対数を求める math.log(x, k) math.log(x, k) +option: フォントの色をゴーストホワイトに指定する color = 'ghostwhite' color = 'ghostwhite' +整数nの8進数リテラル oct(n) oct(n) +折れ線グラフの印をポイントにする plt.plot(データ列x, データ列y, marker='.') plt.plot(データ列x, データ列y, marker='.') +データフレームを表示するときヘッダー行を左寄せにセットする pd.set_option('colheader_justify', 'left') pd.set_option('colheader_justify', 'left') +カウンタからゼロカウントを削除する aCounter.clear() +aCounter +ピンク色を用いて折れ線グラフを描画する plt.plot(データ列x, データ列y, color='pink') plt.plot(データ列x, データ列y, color='pink') +ふたつのマップを合体する collections.intersection(aDict, aDict2) aDict | aDict2 +横棒グラフをホワイトスモーク色を用いて描画する plt.barh(データ列x, データ列y, color='whitesmoke') plt.barh(データ列x, データ列y, color='whitesmoke') +データ���レームの最初の列以外を全て説明変数にする 説明変数 = df[df.columns[1:]] 説明変数 = df[df.columns[1:]] +TSVからデータフレームを読み込む pd.read_csv('file.tsv', sep='\t') pd.read_csv('file.tsv', sep='\t') +指定したカラムの要約統計量 df['列A'].describe() df['列A'].describe() +option: 青紫に色を変更する color = 'violet' color = 'violet' +option: ライトゴールドロディイエローを使う color = 'lightgoldenrodyellow' color = 'lightgoldenrodyellow' +散布図に赤いクロスマーカーを使う plt.plot(データ列x, データ列y, marker='x', c='r') plt.plot(データ列x, データ列y, marker='x', c='r') +最大値・最小値を用いて乱数を生成する random.uniform(最小値, 最大値) random.randint(最小値, 最大値) +散布図の色をティールにする plt.scatter(データ列x, データ列y, color='teal') plt.scatter(データ列x, データ列y, color='teal') +青にヒストグラムの色を設定する plt.hist(データ列, color='blue') plt.hist(データ列, color='blue') +線グラフの色をナバホホワイトに指定する plt.plot(データ列x, データ列y, color='navajowhite') plt.plot(データ列x, データ列y, color='navajowhite') +半透明の点線で折れ線グラフを描く plt.plot(データ列x, データ列y, linestyle='dotted', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dotted', alpha=0.5) +散布図の色をバイオレットにする plt.scatter(データ列x, データ列y, color='violet') plt.scatter(データ列x, データ列y, color='violet') +パラメータがマイナス無限大に近づくときの数値の極限値を計算する sympy.limit(e, z, -oo) sympy.limit(e, z, -oo) 最大値・最小値で乱数を生成する random.randint(最小値, 最大値) random.randint(最小値, 最大値) -横棒プロットを描いて、ラベルを中央寄せする plt.barh(ラベル列, データ列, align='center') plt.barh(ラベル列, データ列, align='center') -文字列をカンマを用いて区切り、、列挙する s.split(',') s.split(',') -第2引数のファイルの名前 sys.argv[1] sys.argv[1] -パレットを全般的に暗くする sns.set(pallete='dark') sns.set(pallete='dark') -データフレームから指定された4つの列のみ抽出する df[[column, column2, column3, column4]] df[[column, column2, column3, column4]] -数列を二つ並べて箱ひげ図にする plt.boxplot([データ列, データ列]) plt.boxplot([データ列, データ列]) -散布図をホワイトスモーク色を用いて描画する plt.scatter(データ列x, データ列y, color='whitesmoke') plt.scatter(データ列x, データ列y, color='whitesmoke') -option: バッファリングのサイズを小さくする buffering = 4096 buffering = 4096 -文字列の右端から部分文字列を除く s.rstrip(sub) s.rstrip(sub) -データフレームの列が正規表現文字列にマッチする行を取り出す df[df[column].str.match(s)] df[df[column].str.match(s)] -線グラフの色を耐火レンガに設定する plt.plot(データ列x, データ列y, color='firebrick') plt.plot(データ列x, データ列y, color='firebrick') -ブルーバイオレット色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='blueviolet') plt.barh(データ列x, データ列y, color='blueviolet') -レベッカパープルにヒストグラムの色を設定する plt.hist(データ列, color='rebeccapurple') plt.hist(データ列, color='rebeccapurple') -データフレームを'A'列によって並べ、、更新する df.sort_values(by='A', inplace=True) df.sort_values(by='A', inplace=True) -配列を等量でn個にビニングする pd.qcut(aArray, n) pd.qcut(aArray, n) -散布図を三角マーカーを用いる描画する plt.plot(データ列x, データ列y, marker='^') plt.scatter(データ列x, データ列y, marker='^') -option: 文字列を改行の代わりに用いる end = s end = s -散布図のマーカーをクロス印にする plt.scatter(データ列x, データ列y, marker='x') plt.scatter(データ列x, データ列y, marker='x') -option: グラフの色をネイビーに指定する color = 'navy' color = 'navy' -デックの末尾から値を取り除く deq.pop() deq.pop() -折れ線グラフの色をオリベドラブに変更する plt.plot(データ列x, データ列y, color='olivedrab') plt.plot(データ列x, データ列y, color='olivedrab') -ダークゴールデンロッド色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='darkgoldenrod') plt.bar(データ列x, データ列y, color='darkgoldenrod') -日付と時刻から日付時刻を作る datetime.datetime(年, 月, 日, 時, 分, 秒) datetime.datetime(年, 月, 日, 時, 分, 秒) -ユニコードエスケープで文字列をバイト列に変換する s.encode(encoding='unicode_escape') s.encode(encoding='unicode_escape') -ブラックにヒストグラムの色を設定する plt.hist(データ列, color='black') plt.hist(データ列, color='black') -イテラブルを文字列リストに変換して、部分文字列で結合する sub.join(map(str, iterable)) sub.join(map(str, iterable)) -縦棒グラフをサドルブラウン色として描画する plt.bar(データ列x, データ列y, color='saddlebrown') plt.bar(データ列x, データ列y, color='saddlebrown') -option: フォントの色をライトシアンに設定する color = 'lightcyan' color = 'lightcyan' -n個の要素があるリストを作る [element] * n [element] * n -文字列をユニコード列に変換する [ord(ch) for ch, s] [ord(ch) for ch in s] -データフレームのリストカラムのモード df[aList].mode() df[aList].mode() -文字列を走査し正規表現に大文字・小文字を無視してマッチするか調べる re.search(pattern, s, flags=re.IGNORECASE) re.search(pattern, s, flags=re.IGNORECASE) -実数が整数かどうか確認する x.is_integer() x.is_integer() -option: オールドレースにフォントの色を指定する color = 'oldlace' color = 'oldlace' -ハニーデュー色としてヒストグラムを描画する plt.hist(データ列, color='honeydew') plt.hist(データ列, color='honeydew') -散布図をスレートブルー色として描画する plt.scatter(データ列x, データ列y, color='slateblue') plt.scatter(データ列x, データ列y, color='slateblue') -列の中に文字列と文字列がいくつ存在するか数える ds.isin([value, value2]).sum() ds.isin([value, value2]).sum() -赤い四角マーカーで散布図を描く plt.plot(データ列x, データ列y, marker='s', c='r') plt.plot(データ列x, データ列y, marker='s', c='r') -ミディアムブルー色で棒グラフを描画する plt.bar(データ列x, データ列y, color='mediumblue') plt.bar(データ列x, データ列y, color='mediumblue') -折れ線グラフのダイアモンドマーカーの色を変える plt.plot(データ列x, データ列y, marker='D', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='D', markerfacecolor='#800080') -散布図をピンク色として描画する plt.scatter(データ列x, データ列y, color='pink') plt.scatter(データ列x, データ列y, color='pink') -ヒストグラムをミディアムシアグリーン色を用いて描画する plt.hist(データ列, color='mediumseagreen') plt.hist(データ列, color='mediumseagreen') -データフレームを十の位で丸める df.round(-1) df.round(-1) -大きさnで数列と配列の散布図を描画する plt.scatter(データ列x, データ列y, s=n) plt.scatter(データ列x, データ列y, s=n) -option: グラフの色をライトスカイブルーに指定する color = 'lightskyblue' color = 'lightskyblue' -option: データ型を指定する dtype = np.int16 dtype = np.int8 -二つのデータ列の散布図として残差を描く sns.pairplot(df, x='列名', y='列名', y='列名', data=df) sns.residplot(x=データ列, y=データ列) -文字列のプレフィックスから部分文字列を除く s.find(sub) s.removeprefix(sub) -データフレームのリスト列の値をValueMapでまとめて変更する df[aList].replace(ValueMap) df[aList].replace(ValueMap) -環境はウィンドウズ sys.platform.startswith('win32') sys.platform.startswith('win32') -散布図をロージーブラウン色を使って描画する plt.scatter(データ列x, データ列y, color='rosybrown') plt.scatter(データ列x, データ列y, color='rosybrown') -グレー色でヒストグラムを描画する plt.hist(データ列, color='grey') plt.hist(データ列, color='grey') -半透明の一点鎖線としてデータ列の推移をプロットする plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) -ファイルから書き込みストリームを開いて]、fとする f = open(filepath, mode='w') f = open(filepath, mode='w') -棒グラフをライトイエロー色を用いて描画する plt.bar(データ列x, データ列y, color='lightyellow') plt.bar(データ列x, データ列y, color='lightyellow') -散布図をライトグレー色として描画する plt.scatter(データ列x, データ列y, color='lightgray') plt.scatter(データ列x, データ列y, color='lightgrey') -整数の最大値 max(x, y) sys.maxsize -スノー色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='snow') plt.barh(データ列x, データ列y, color='snow') -深紅色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='crimson') plt.barh(データ列x, データ列y, color='crimson') -分数を分母の最大値を指定して近似する q.limit_denominator(max_denominator=1000000) q.limit_denominator(max_denominator=1000000) -青いポイントマーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='.', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='.', markerfacecolor='b') -nまでのスライス slice(n) slice(n) -データフレームの列をヒストグラムを使って描画する plt.hist(データ列) plt.hist(df[column]) -ヒストグラムをサドルブラウン色として描画する plt.hist(データ列, color='saddlebrown') plt.hist(データ列, color='saddlebrown') -ベクトルの各要素に加算する aArray.keys() aArray + aArray2 -option: 行列のデータ型を指定する dtype = np.uint8 dtype = np.int -棒グラフをリネン色を用いて描画する plt.bar(データ列x, データ列y, color='linen') plt.bar(データ列x, データ列y, color='linen') -ヒストグラムの色をダークスレートブルーに変更する plt.hist(データ列, color='darkslateblue') plt.hist(データ列, color='darkslateblue') -Pandasでフォーマットでデータ列を日付データにする pd.to_datetime(ds, format='%Y-%m-%d') pd.to_datetime(ds, format='%Y-%m-%d') -データフレームのカラムの時を見る df[col].dt.hour df[col].dt.hour -折れ線グラフの菱形マーカーの色を変更する plt.plot(データ列x, データ列y, marker='D', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='D', markerfacecolor='#800080') -option: フォントの色をダークターコイズに設定する color = 'darkturquoise' color = 'darkturquoise' -回帰分析をアンサンブル学習で行う sklearn.ensemble.VotingRegressor() sklearn.ensemble.VotingRegressor() -線グラフの色をライトシアンに設定する plt.plot(データ列x, データ列y, color='lightcyan') plt.plot(データ列x, データ列y, color='lightcyan') -option: フォントの色を赤に設定する color ='red' color = 'red' -文字列内に空白が含まれる any(c.isspace() for c in s) any(c.isspace() for c in s) -ファイルをバイナリ書き込みモードで開く] open(filepath, mode='wb') open(filepath, mode='wb') -SVDで濃く次元に次元削減する sklearn.decomposition.TruncatedSVDORE(n_components=二).fit_transform(多次元データ) sklearn.decomposition.TruncatedSVD(n_components=二).fit_transform(多次元データ) -折れ線グラフの大バツマーカーの色を設定する plt.plot(データ列x, データ列y, marker='X', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='X', markerfacecolor='#800080') -データフレームから一番左側の列を消す df.drop(axis='first') df[df.columns[1:]] -データフレームからランダムに一行を抽出する df.sample() df.sample() -xの小数点以下'4'桁までプリントする print(':.4f'.format(x)) print(':.4f'.format(x)) -深紅色の線グラフを描画する plt.plot(データ列x, データ列y, color='crimson') plt.plot(データ列x, データ列y, color='crimson') -第二引数で指定したファイル名 sys.argv[1] sys.argv[1] -バイナリ書き込み用にファイルをオープンして]、fとする f = open(filepath, mode='wb') f = open(filepath, mode='wb') -グリーンイエロー色として棒グラフを描画する plt.bar(データ列x, データ列y, color='greenyellow') plt.bar(データ列x, データ列y, color='greenyellow') -列の値を正規表現patternで一度に置き換える ds.replace(pattern, repl, regex=True) ds.replace(pattern, repl, regex=True) -データフレームのカラムのNaNを50パーセンタイルで埋める df[col].fillna(df[col].median()) df[col].fillna(df[col].median()) -最後の部分文字列で文字列を二つに区切って、前半の文字列を使う s.rpartition(sub)[0] s.rpartition(sub)[0] -データ列の欠損値を平均で埋める ds.fillna(ds.mean()) ds.fillna(ds.mean()) -ヒストグラムをライトグリーン色として描画する plt.hist(データ列, color='lightseagreen') plt.hist(データ列, color='lightgreen') -option: モカシンを使用する color ='moccasin' color = 'moccasin' -日付データは日付データよりあと aDate > aDate2 aDate > aDate2 -グラフを画面用に変更する sns.set(context='notebook') sns.set(context='notebook') -散布図のマーカーの色を変える plt.scatter(データ列x, データ列y, markerfacecolor='#800080') plt.scatter(データ列x, データ列y, markerfacecolor='#800080') -散布図をスラグレー色を使って描画する plt.scatter(データ列x, データ列y, color='slategray') plt.scatter(データ列x, データ列y, color='slategray') -16進文字列を整数に変換する int(s, 16) int(s, 16) -縦棒グラフを青緑色で描画する plt.bar(データ列x, データ列y, color='teal') plt.bar(データ列x, データ列y, color='teal') -最後の部分文字列で文字列を二分する s.rpartition(sub)[0] s.rpartition(sub) -横棒グラフを描画して、棒の幅を調整する plt.barh(ラベル列, データ列, width=0.5) plt.barh(ラベル列, データ列, width=0.5) -nがn2より大きいか n > n2 n > n2 -リストの個数 len(aList) len(aList) -ミディアムブルー色でヒストグ���ムを描画する plt.hist(データ列, color='mediumblue') plt.hist(データ列, color='mediumblue') -配列の値を変更する aArray[行番号, 列番号] = 指定の値 aArray[行番号, 列番号] = 指定の値 -リストとリストについて散布図を描画し、▼マーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='v', c=rgb) plt.plot(データ列x, データ列y, marker='v', c=rgb) -リスト内の要素は全て真か調べる all(aList) all(aList) -イテラブルとリストについて散布図を描いてマーカーを四角に指定する plt.plot(データ列x, データ列y, marker='s') plt.plot(データ列x, データ列y, marker='s') +浮動小数点数に実数を掛ける x * y x * y +オプションで出力先を標準出力に設定する file = sys.stdout file = sys.stdout +option: 色を小麦色に設定する color = 'wheat' color = 'wheat' +リストとイテラブルの散布図に▼マーカーを描画する plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') +グレーにヒストグラムの色を設定する plt.hist(データ列, color='gray') plt.hist(データ列, color='gray') +オプションで、標準出力を使用する file = sys.stdout file = sys.stdout +モデルの予測値と目的変数を比較する pd.DataFrame({'実測': 目的変数, 目的変数)}) pd.DataFrame({'実測': 目的変数, '予測': model.predict(説明変数)}) +文字列をバイト列にする int(s, s2) bytes(s) +カウンタのKトップを列挙する aCounter.most_common(k) aCounter.most_common(k) +データフレームの指定したカラムの母標準偏差を求める df['列A'].std(ddof=0) df['列A'].std(ddof=0) +option: 淡い茶色色を使う color = 'tan' color = 'tan' +横棒グラフをスノー色として描画する plt.barh(データ列x, データ列y, color='snow') plt.barh(データ列x, データ列y, color='snow') +散布図の色を黄緑にする plt.scatter(データ列x, データ列y, color='chartreuse') plt.scatter(データ列x, データ列y, color='chartreuse') +多次元データを特異値分解としてパステル調に次元に次元削減する sklearn.decomposition.TruncatedSVD(n_components=N).fit_transform(多次元データ) sklearn.decomposition.TruncatedSVD(n_components=N).fit_transform(多次元データ) +3つの文字列を順に出力する print(value, value2, value3) print(value, value2, value3) +折れ線グラフの色をダークレッドに設定する plt.plot(データ列x, データ列y, color='darkred') plt.plot(データ列x, データ列y, color='darkred') +データフレームの中に日付データがあるか調べる df.isin([value]) df.isin([value]) +データフレームの中に含まれると日付データの合計を数える df.isin([value, value2]).sum() df.isin([value, value2]).sum() +ミディアムアクアマリン色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='mediumaquamarine') plt.bar(データ列x, データ列y, color='mediumaquamarine') +実数とyのノルム math.ceil(x, y) math.hypot(x, y) +データフレームの選択した列の欠損値をその最頻値で埋める df[['列A', '列B']].fillna(df[['列A', '列B']].mode().iloc[0]) df[['列A', '列B']].fillna(df[['列A', '列B']].mode().iloc[0]) +option: n番目の列をインデックスに増やす index_col(element) index_col = n +ホワイト色で線グラフを描画する plt.plot(データ列x, データ列y, color='white') plt.plot(データ列x, データ列y, color='white') +データフレームが重複しているかどうか調べる df.duplicated() df.duplicated() +option: スレートブルー色を使用する color ='slateblue' color = 'slateblue' +ランダムにデータフレームから抽出する df.sample() df.sample() +フローラルホワイト色として散布図を描画する plt.scatter(データ列x, データ列y, color='floralwhite') plt.scatter(データ列x, データ列y, color='floralwhite') +パラメータについて数式の積分を求める sympy.integrate(e, z) sympy.integrate(e, z) +散布図を貝殻色として描画する plt.scatter(データ列x, データ列y, color='seashell') plt.scatter(データ列x, データ列y, color='seashell') +度数分布図を描画し合計を1にする plt.hist(データ列, density=True) plt.hist(データ列, density=True) +赤い実線としてデータ列の変遷を描画する plt.plot(データ列x, データ列y, linestyle='solid', color='r') plt.plot(データ列x, データ列y, linestyle='solid', color='r') +ハローワールドをプリントする print('Hello World') print('Hello World') +配列のSkewnessを算出する scipy.stats.shapiro(配列, fisher=True) scipy.stats.skew(配列, bias=False) +要素が集合に含まれないかどうか調べる element not in aSet element not in aSet +等量でn個に配列をビン分割する pd.qcut(aArray, n) pd.qcut(aArray, n) +プロット中で日本語を使えるようにする sns.set(font='IPAexGothic') sns.set(font='IPAexGothic') +散布図の右三角印の線幅を変える plt.scatter(データ列x, データ列y, marker='>', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='>', markeredgewidth=2.5) +両端キューの左側 deq[0] deq[0] +ファイルパスから拡張子なしのファイル名を取り出す os.path.splitext(filepath))[0] os.path.splitext(os.path.basename(filepath))[0] +文字列のの開始位置から終了位置までの間に部分文字列がいくつか存在するか調べる s.count(sub, start, end) s.count(sub, start, end) +option: 四角印を加える marker ='s' marker = 's' +ベクトルのユニークな要素 u, counts = np.unique(aArray) np.unique(aArray) +配列と配列の散布図にrgbの右三角マーカーを描画する plt.plot(データ列x, データ列y, marker='>', c=rgb) plt.plot(データ列x, データ列y, marker='>', c=rgb) +ヒストグラムをライトグリーン色を用いて描画する plt.hist(データ列, color='lightseagreen') plt.hist(データ列, color='lightseagreen') +オブジェクトが関数 callable(obj) callable(obj) +線グラフをライトスレイグレー色で描画する plt.plot(データ列x, データ列y, color='lightslategray') plt.plot(データ列x, データ列y, color='lightslategray') +折れ線グラフのバツ印を赤くする plt.plot(データ列x, データ列y, marker='x', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='x', markerfacecolor='r') +表をグループ化し、ある列の記述統計量を算出する df.groupby('列A').describe()['列B'] df.groupby('列A').describe()['列B'] +データ列のUNIX秒を日付データに変換する pd.to_datetime(ds, unit='s', utc=True) pd.to_datetime(ds, unit='s', utc=True) +文字列は全て識別子名かどうか調べる s.isidentifier() s.isidentifier() +option: 小麦色を使う color = 'wheat' color = 'wheat' +標準化する sklearn.preprocessing.StandardScaler().fit_transform(データ) sklearn.preprocessing.StandardScaler().fit_transform(データ) +表示可能な最大列数を変更する pd.set_option('display.max_columns', n) pd.set_option('display.max_columns', n) +2つのカウンタのいずれかに含まれる要素 aCounter | aCounter2 aCounter | aCounter2 +ヒストグラムの色をイエローグリーンに指定する plt.hist(データ列, color='yellowgreen') plt.hist(データ列, color='yellowgreen') +2つの文字列は同じでないか調べる s!= s2 s != s2 +ヒストグラムを真紅色で描画する plt.hist(データ列, color='crimson') plt.hist(データ列, color='crimson') +データフレームのカラムを各グループごとに散布図にする sns.scatterplot(data=df, x='列名', y='列名', hue='カテゴリ列') sns.scatterplot(data=df, x='列名', y='列名', hue='カテゴリ列') +ランダム性を強化したランダムフォレストでクラス分類をする model = sklearn.ensemble.ExtraTreeClassifier(n_estimators=10) model = sklearn.ensemble.ExtraTreeClassifier(n_estimators=10) +option: 黄色にグラフの色を変更する color = 'yellow' color = 'yellow' +折れ線グラフの色をダークグレーに指定する plt.plot(データ列x, データ列y, color='darkgray') plt.plot(データ列x, データ列y, color='darkgray') +ヒストグラムをホットピンク色を用いて描画する plt.hist(データ列, color='hotpink') plt.hist(データ列, color='hotpink') +データシリーズを丸めて整数にする ds.round().astype(int) ds.round().astype(int) +option: ペルーにフォントの色を設定する color = 'peru' color = 'peru' +折れ線グラフの色をタンに指定する plt.plot(データ列x, データ列y, color='tan') plt.plot(データ列x, データ列y, color='tan') +最小値でデータフレームの選択したカラムの欠損値を埋める df[['列A', '列B']].fillna(df[['列A', '列B']].min()) df[['列A', '列B']].fillna(df[['列A', '列B']].min()) +整数nがセットのどれかかどうか調べる n in aSet n in aSet +データフレームを表示するとき、表示可能な列数の最大値をnに指定する pd.set_option('display.max_columns', n) pd.set_option('display.max_columns', n) +ミントクリームにヒストグラムの色を設定する plt.hist(データ列, color='mintcream') plt.hist(データ列, color='mintcream') +ダークオリーブグリーン色で線グラフを描画する plt.plot(データ列x, データ列y, color='darkolivegreen') plt.plot(データ列x, データ列y, color='darkolivegreen') +データフレームとデータフレームの列を合体させる df.T pd.concat([df, ds], axis=1) +グラフの色使いを暗くする sns.set(pallete='dark') sns.set(pallete='dark') +配列とリストの散布図にrgbのバツマーカーを描画する plt.plot(データ列x, データ列y, marker='x', c=rgb) plt.plot(データ列x, データ列y, marker='x', c=rgb) +単回帰モデルの残差をヒストグラムにする plt.hist(目的変数 - model.predict(説明変数)) plt.hist(目的変数 - model.predict(説明変数)) +変数を赤色化する f'\033[31m{value}\033[0m' f'\033[31m{value}\033[0m' +ベクトルの次元数を計算する aArray.shape aArray.ndim +タプルの値を列挙する aTuple.index() aDict.values() +option: 色をモカシンに指定する color ='moccasin' color = 'moccasin' +データフレームの指定した列の欠損値を直前の値で置き換える df['列A'].fillna(method='ffill') df['列A'].fillna(method='ffill') +データフレームの指定した列の名前一覧の列だけ選択する df[columns] df[columns] +折れ線グラフの色をグレーに指定する plt.plot(データ列x, データ列y, color='gray') plt.plot(データ列x, データ列y, color='gray') +ティール色を用いて棒グラフを描画する plt.bar(データ列x, データ列y, color='teal') plt.bar(データ列x, データ列y, color='teal') +オリベドラブ色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='olivedrab') plt.plot(データ列x, データ列y, color='olivedrab') +線グラフをスレートブルー色として描画する plt.plot(データ列x, データ列y, color='slateblue') plt.plot(データ列x, データ列y, color='slateblue') +プロットを使う準備をする import matplotlib.pyplot as plt import matplotlib.pyplot as plt +散布図の丸マーカーの色を設定する plt.scatter(データ列x, データ列y, marker='o', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='o', markerfacecolor='#800080') +ミディアムパープル色を用いてヒストグラムを描画する plt.hist(データ列, color='mediumpurple') plt.hist(データ列, color='mediumpurple') +指定した列によってデータフレームを並べ直す df.sort_values(by='列A') df.sort_values(by='列A') +データフレームから指定した列名一覧の列のみ選ぶ df.select_dtypes('object').columns df[columns] +データフレームを二つのカラムによって小さい順に破壊的に並べる df.sort_values(by=['列A', '列B'], ascending=True, inplace=True) df.sort_values(by=['列A', '列B'], ascending=True, inplace=True) +option: 青緑色を用いる color = 'teal' color = 'teal' +ふたつの集合の∪ aSet.intersection(aSet2) aSet.union(aSet2) +横棒グラフをダークオレンジ色として描画する plt.barh(データ列x, データ列y, color='darkorange') plt.barh(データ列x, データ列y, color='darkorange') +2つのデータフレームを連結する pd.concat([df, df2], axis=0) pd.concat([df, df2]) +等間隔の行列 np.arange(開始値, 終了値, 等差) np.arange(開始値, 終了値, 等差) +線グラフをミディアムシアグリーン色として描画する plt.plot(データ列x, データ列y, color='mediumseagreen') plt.plot(データ列x, データ列y, color='mediumseagreen') +インデックスにしてCSVファイルのn行目を読み込む pd.read_csv('file.csv', index_col=n) pd.read_csv('file.csv', index_col=n) +文字列の中で大文字・小文字を無視してパターンにマッチした全ての文字列をリストにする re.findall(pattern, s, flags=re.IGNORECASE) re.findall(pattern, s, flags=re.IGNORECASE) +ヒストグラムの色をミディアムブルーに変更する plt.hist(データ列, color='mediumblue') plt.hist(データ列, color='mediumblue') +オブジェクトはタプルに含まれないか調べる element not in aTuple element not in aTuple +ブルーバイオレット色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='blueviolet') plt.bar(データ列x, データ列y, color='blueviolet') +双方向キューから最初の要素を取り出す deq.index(element) deq.remove(element) +ティール色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='teal') plt.plot(データ列x, データ列y, color='teal') +リストとリストの散布図を描画し、、マーカーを星に変更する plt.plot(データ列x, データ列y, marker='*') plt.plot(データ列x, データ列y, marker='*') +縦棒グラフをレベッカパープル色として描画する plt.bar(データ列x, データ列y, color='rebeccapurple') plt.bar(データ列x, データ列y, color='rebeccapurple') +option: グラフの色をディムグレーに指定する color = 'dimgrey' color = 'dimgrey' +変数を紫色で表示する print(f'\033[35m{value}\033[0m') print(f'\033[35m{value}\033[0m') +日付データからn秒を減算する aDate - datetime.timedelta(seconds=n) aDate - datetime.timedelta(seconds=n) +デックのn番目 deq[n] deq[n] +横軸の目盛りに文字列を設定する plt.xticks([0, 60, 90], ['不可', '秀']) plt.xticks([0, 60, 90], ['不可', '可', '秀']) +折れ線グラフに青い左三角印を描画する plt.plot(データ列x, データ列y, marker='<', markerfacecolor='b') plt.plot(デー��列x, データ列y, marker='<', markerfacecolor='b') +ヒストグラムを実線として描画する plt.hist(データ列, linestyle='solid') plt.hist(データ列, linestyle='solid') +散布図をアンティークホワイト色を使って描画する plt.scatter(データ列x, データ列y, color='antiquewhite') plt.scatter(データ列x, データ列y, color='antiquewhite') +データシリーズの文字列を未入力値にする ds.replace(値, np.nan) ds.replace(値, np.nan) +左三角マーカーで散布図を描く plt.plot(データ列x, データ列y, marker='<') plt.plot(データ列x, データ列y, marker='<') +データフレームの指定した列を百の位で丸める df['列A'].round(-2) df['列A'].round(-2) +データフレームの選択したカラムの中に日付データがあるか調べる df[['列A', '列B']].isin([value]) df[['列A', '列B']].isin([value]) +ヒストグラムをライトシアン色として描画する plt.hist(データ列, color='lightcyan') plt.hist(データ列, color='lightcyan') +データフレームを表示するとき、表示できる最大行数をnに設定する pd.set_option('display.max_rows', n) pd.set_option('display.max_rows', n) +縦棒グラフの色をダークシアグリーンにする plt.bar(データ列x, データ列y, color='darkseagreen') plt.bar(データ列x, データ列y, color='darkseagreen') +コーラル色で棒グラフを描画する plt.bar(データ列x, データ列y, color='coral') plt.bar(データ列x, データ列y, color='coral') +シーケンスから行列を作る np.array(iterable) np.array(iterable) +ミスティローズにヒストグラムの色を変更する plt.hist(データ列, color='mistyrose') plt.hist(データ列, color='mistyrose') +空のガウス過程分類モデルを用意する model = sklearn.gaussian_process.GaussianProcessClassifier() model = sklearn.gaussian_process.GaussianProcessClassifier() +散布図に黒い丸マーカーを用いる plt.plot(データ列x, データ列y, marker='o', c='k') plt.plot(データ列x, データ列y, marker='o', c='k') +未初期化の行列 np.empty(要素数, dtype=np.int) np.empty(要素数, dtype=np.int) +折れ線グラフの左三角印を青くする plt.plot(データ列x, データ列y, marker='<', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='<', markerfacecolor='b') +データフレームの欠損値を数値で埋める df.fillna(x) df.fillna(x) +オブジェクトがリストの要素でないか element not in aList element not in aList +データフレームを行を付けず出力する df.to_csv('file.csv', header=None) df.to_csv('file.csv', index=None) +実数を万の位で四捨五入する round(x, -4) round(x, -4) +データシリーズのSkewness ds.skew() ds.skew() +配列とリストの散布図に黒い右三角マーカーを描画する plt.plot(データ列x, データ列y, marker='>', c='k') plt.plot(データ列x, データ列y, marker='>', c='k') +option: 色をディムグレーに設定する color = 'dimgrey' color = 'dimgrey' +縦棒グラフを描画し、、バーの横幅を調整する plt.bar(ラベル列, データ列, width=0.5) plt.bar(ラベル列, データ列, width=0.5) +今日が何曜日か知る datetime.datetime.today().weekday() datetime.datetime.today().weekday() +リストとリストについて散布図を描画して、マーカーを丸に変更する plt.plot(データ列x, データ列y, marker='o') plt.plot(データ列x, データ列y, marker='o') +カウンタを低頻出な方から列挙する aCounter.most_common()[::-1] aCounter.most_common()[::-1] +データ列の推移を半透明の一点鎖線でプロットする plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) +リストとリストについて散布図をプロットし、、マーカーを大バツに設定する plt.plot(データ列x, データ列y, marker='X') plt.plot(データ列x, データ列y, marker='X') +データフレームのある列の文字列を欠損値に変換する df['列A'].replace(値, np.nan) df['列A'].replace(値, np.nan) +赤いポイントマーカーを散布図に描画する plt.scatter(データ列x, データ列y, marker='.', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='.', markerfacecolor='r') +ひとつでも非アスキー文字が文字列中に含まれる any(not c.isascii() for c in s) any(not c.isascii() for c in s) +マップのキーに対応した値 aDict.keys() aDict.get(key) +ヒストグラムをリネン色を使って描画する plt.hist(データ列, color='linen') plt.hist(データ列, color='linen') +オリーブ色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='olive') plt.plot(データ列x, データ列y, color='olive') +ライトグレー色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='lightgrey') plt.plot(データ列x, デー��列y, color='lightgrey') +option: タブを分割記号で用いる sep = '\t' sep = '\t' +散布図の四角印の大きさを変更する plt.scatter(データ列x, データ列y, marker='s', markersize=2.0) plt.scatter(データ列x, データ列y, marker='s', markersize=2.0) +n足すn2を求める n + n2 n + n2 +ホワイト色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='white') plt.bar(データ列x, データ列y, color='white') +スクリプトファイルと同じフォルダのファイルパスのパスを使う os.path.join(os.path.dirname(os.path.abspath(__file__)), filepath) os.path.join(os.path.dirname(os.path.abspath(__file__)), filepath) +データフレームの指定した列がどの程度、分散しているか見る df['列A'].var() df['列A'].var() +データフレームをソートし、、新しいインデックスを加える df.sort_values('キーとなる列').reset_index() df.sort_values('キーとなる列').reset_index() +本日は何月か知る datetime.datetime.today().month datetime.datetime.today().month +データフレームのカラムを目的変数にする 目的変数 = df['列名'] 目的変数 = df['列名'] +2つのデータフレームを合体させる pd.concat([df, df2]) pd.concat([df, df2]) +散布図をゲインズボロ色を用いて描画する plt.scatter(データ列x, データ列y, color='gainsboro') plt.scatter(データ列x, データ列y, color='gainsboro') +実数のハイパボリック・サイン math.acosh(x) math.sinh(x) +バイナリできるようにファイルをオープンする] open(filepath, mode='rb') open(filepath, mode='rb') +線グラフの色をカデットブルーに指定する plt.plot(データ列x, データ列y, color='cadetblue') plt.plot(データ列x, データ列y, color='cadetblue') +カウンタから最も頻出な文字列の件数 aCounter.most_common()[1] aCounter.most_common()[1] +5行をランダムに表から抽出する df.sample(5) df.sample(5) +2つのカウンタの共通する要素 aCounter & aCounter2 aCounter & aCounter2 +線グラフの色をラベンダーに指定する plt.plot(データ列x, データ列y, color='lavender') plt.plot(データ列x, データ列y, color='lavender') +マッピングを並べ直してJSON形式の文字列に変換する json.dumps(aDict, ensure_ascii=False, sort_keys=True) json.dumps(aDict, ensure_ascii=False, sort_keys=True) +ダークスラテグレー色として縦棒グラフを描画する plt.bar(データ列x, データ列y, color='darkslategray') plt.bar(データ列x, データ列y, color='darkslategray') +スーパーセットもしくは等しいかどうか aSet or aSet2 aSet > aSet2 +データフレームの一部のカラムの空文字を欠損値に変換し、ドロップする df[['列A', '列B']].replace('', np.nan).dropna() df[['列A', '列B']].replace('', np.nan).dropna() +カウンタの文字列のカウント aCounter[element] aCounter[element] +option: シーグリーンにグラフの色を変更する color ='seagreen' color = 'seagreen' +ラベル付きの円プロットを描画する plt.pie(データ列, startangle=90, labels=ラベル列) plt.pie(データ列, startangle=90, labels=ラベル列) +sepを区切りとして文字列リストを結合する sep.join(aStringList) sep.join(aStringList) +文字列がカタカナ ('ァ' <= ch <= 'ン') ('ァ' <= ch <= 'ン') +ヒストグラムを深紅色で描画する plt.hist(データ列, color='crimson') plt.hist(データ列, color='crimson') +文字コードtextで追加できるようにファイルをオープンする] open(filepath, mode='a', encoding=text) open(filepath, mode='a', encoding=text) +オブジェクトは集合型 isinstance(obj, set) isinstance(obj, set) +RANSACでクラス分類を行う model = sklearn.linear_model.RANSACClassifier(random_state=0) model = sklearn.linear_model.RANSACClassifier(random_state=0) +option: ピーチパフ色を用いる color = 'peachpuff' color = 'peachpuff' +線グラフの色をフクシアに設定する plt.plot(データ列x, データ列y, color='fuchsia') plt.plot(データ列x, データ列y, color='fuchsia') +データ列を分割数nで分割してnamesのラベルをつける pd.cut(ds, n, labels=names) pd.cut(ds, n, labels=names) +パパイヤウィップ色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='papayawhip') plt.plot(データ列x, データ列y, color='papayawhip') +データフレームを複数の列で降順にソートする df.sort_values(by=['列A', '列B'], ascending=False) df.sort_values(by=['列A', '列B'], ascending=False) +正規分布による累積分布関数の逆関数を使う scipy.stats.norm.cdf(x, loc=平均値, scale=標準偏差) scipy.stats.norm.cdf(x, loc=平均値, scale=標準偏差) +ヒストグラムの色をダークオリーブグリーンに変更する plt.hist(データ列, color='darkolivegreen') plt.hist(データ列, color='darkolivegreen') +行列の行ごとの最大を求める np.max(aArray, axis=1) np.max(aArray, axis=1) +空白文字を全部見る string.whitespace string.whitespace +線グラフをバイオレット色として描画する plt.plot(データ列x, データ列y, color='violet') plt.plot(データ列x, データ列y, color='violet') +双方向キューを全て取り除く deq.clear() deq.clear() +横棒グラフをマルーン色として描画する plt.barh(データ列x, データ列y, color='maroon') plt.barh(データ列x, データ列y, color='maroon') +データフレームの中に文字列がある df.isin([value]) df.isin([value]) +CSVのn行目をインデックスとして読み込む pd.read_csv('file.csv', index_col=n) pd.read_csv('file.csv', index_col=n) +option: フォントの色を白に設定する color = 'white' color = 'white' +データフレームの列概要 df.info() df.info() +nがn2より大きいかどうか確認する n > n2 n > n2 +現在を文字列でフォーマットする "datetime.datetime.today().strftime(""%d/%m/%y"")" "datetime.datetime.today().strftime(""%d/%m/%y"")" +折れ線グラフの色をブランチドアーモンドに変更する plt.plot(データ列x, データ列y, color='blanchedalmond') plt.plot(データ列x, データ列y, color='blanchedalmond') +グラフの色を暗くする sns.set(pallete='dark') sns.set(pallete='dark') +分子n分母mの有理数を作る fractions.Fraction(numerator=n, denominator=m) fractions.Fraction(numerator=n, denominator=m) +データシリーズのNaNを直前の値に指定する ds.fillna(method='ffill') ds.fillna(method='ffill') +日付と時間から日付時刻 aDate - datetime.timedelta(hours=n) datetime.datetime(年, 月, 日, 時, 分, 秒) +option: シルバーを使う color ='silver' color = 'silver' +破線に折れ線グラフを設定する plt.plot(データ列x, データ列y, linestyle='dashed') plt.plot(データ列x, データ列y, linestyle='dashed') +ロイヤルブルーにヒストグラムの色を設定する plt.hist(データ列, color='royalblue') plt.hist(データ列, color='royalblue') +青紫色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='violet') plt.barh(データ列x, データ列y, color='violet') +縦棒グラフをブランチドアーモンド色で描画する plt.bar(データ列x, データ列y, color='blanchedalmond') plt.bar(データ列x, データ列y, color='blanchedalmond') +option: グリーンにフォントの色を設定する color = 'green' color = 'green' +データフレームをインデックスによって降順で並べ直す df.sort_index(ascending=False) df.sort_index(ascending=False) +カラム名を指定して2つのデータフレームを内部結合する pd.merge(df, df2, on='列A', how='inner') pd.merge(df, df2, on='列A', how='inner') +配列を等間隔でn個に分割する pd.cut(aArray, n) pd.cut(aArray, n) +データフレームの指定した列のNaNをxに設定する df['列A'].fillna(x) df['列A'].fillna(x) +非大文字が文字列中にあるかどうか確認する any(not c.isupper() for c in s) any(not c.isupper() for c in s) +option: ライトサーモンにグラフの色を変更する color = 'lightsalmon' color = 'lightsalmon' +行列の行ごとの標準偏差を求める np.std(aArray, axis=1) np.std(aArray, axis=1) +プラットホーム名 sys.platform sys.platform +データフレームの選択したカラムの中にいくつNaNがあるか数える df[['列A', '列B']].isna().sum() df[['列A', '列B']].isna().sum() +折れ線グラフをライトイエロー色として描画する plt.plot(データ列x, データ列y, color='lightyellow') plt.plot(データ列x, データ列y, color='lightyellow') +折れ線グラフの色をターコイズに指定する plt.plot(データ列x, データ列y, color='turquoise') plt.plot(データ列x, データ列y, color='turquoise') +ブルーバイオレット色としてヒストグラムを描画する plt.hist(データ列, color='blueviolet') plt.hist(データ列, color='blueviolet') +JSON形式の文字列を辞書にする json.loads(jsonString) json.loads(jsonString) +ある列の値がx以上y以下の行を抽出する df[df['列A'] <= x] df[(x <= df['列A']) & (df['列A'] <= y)] +オブジェクトのプロパティの値をする getattr(obj, プロパティ名) setattr(obj, プロパティ名, 値) +データフレームを表示するとき、最大行数をnに設定する pd.set_option('display.max_rows', n) pd.set_option('display.max_rows', n) +多次元データをt分布型確率的近傍埋め込み法でパステル調に次元に次元削減する sklearn.manifold.TSNE(n_components=N).fit_transform(多次元データ) sklearn.manifold.TSNE(n_components=N).fit_transform(多次元データ) +データフレームの統計量を確認する df.describe() df.describe() +option: グラフの色をペールグリーンに指定する color = 'palegreen' color = 'palegreen' +データフレームの指定した列を千の位で丸めて、整数型にする df['列A'].round(-3).astype(int) df['列A'].round(-3).astype(int) +nが2で割り切れないか n % 2 == 1 n % 2 == 1 +データフレームを表示するとき、表示可能な列数の最大値をnにセットする pd.set_option('display.max_rows', n) pd.set_option('display.max_columns', n) +ライムグリーン色で線グラフを描画する plt.plot(データ列x, データ列y, color='limegreen') plt.plot(データ列x, データ列y, color='limegreen') +茶色色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='brown') plt.plot(データ列x, データ列y, color='brown') +折れ線グラフの色をパールゴールデンロッドにセットする plt.plot(データ列x, データ列y, color='palegoldenrod') plt.plot(データ列x, データ列y, color='palegoldenrod') +折れ線グラフの丸印の太さを設定する plt.plot(データ列x, データ列y, marker='o', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='o', markeredgewidth=2.5) +イテラブルの各要素を順に双方向キューの左側につけ加える deq.extendleft(iterable) deq.extendleft(iterable) +option: 色をミントクリームに設定する color ='mintcream' color = 'mintcream' +日付データをISO書式の文字列にする aDate.isoformat() aDate.isoformat() +データフレームから列を1つのみ選択する df[['列A']] df[['列A']] +箱ひげ図をプロットして、平均値を追加する plt.boxplot(データ列, showmeans=True) plt.boxplot(データ列, showmeans=True) +ダークシアン色で散布図を描画する plt.scatter(データ列x, データ列y, color='darkcyan') plt.scatter(データ列x, データ列y, color='darkcyan') +データフレームの欠損値を平均値で補う df.fillna(df.mean()) df.fillna(df.mean()) +データフレームのカラムを型に変換する df[col].astype(ty) df[col] = df[col].astype(ty) +スカイブルー色としてヒストグラムを描画する plt.hist(データ列, color='skyblue') plt.hist(データ列, color='skyblue') +折れ線グラフを赤い点線として描く plt.plot(データ列x, データ列y, linestyle='dotted', color='r') plt.plot(データ列x, データ列y, linestyle='dotted', color='r') +ロバストな線形回帰モデルを作成する model = sklearn.linear_model.HuberRegressor() model = sklearn.linear_model.HuberRegressor() +option: ミントクリームを使う color ='mintcream' color = 'mintcream' +データフレームをCSVファイルからロードする pd.read_csv('file.csv', sep=',') pd.read_csv('file.csv', sep=',') +横棒グラフをピンク色として描画する plt.barh(データ列x, データ列y, color='pink') plt.barh(データ列x, データ列y, color='pink') +色付きの破線を用いてリストの推移を描画する plt.plot(データ列x, データ列y, linestyle='dashed', color='#800080') plt.plot(データ列x, データ列y, linestyle='dashed', color='#800080') +十六進文字列をバイナリに変換する hex(s, hex) int(s, 16).to_bytes(length=bytesize, byteorder='big') +最初のカテゴリーを除いてデータフレームのある列をワンホット・ベクトルに変換する pd.get_dummies(df['列A'], drop_first=True) pd.get_dummies(df['列A'], drop_first=True) +データシリーズのNaNを最頻値で置換する ds.fillna(ds.mode().iloc[0]) ds.fillna(ds.mode().iloc[0]) +ファイルから1文字読む f.read(1) f.read(1) +線形回帰モデルのR2を求める model = sklearn.linear_model.R2 sklearn.metrics.r2_score(目的変数, model.predict(説明変数)) +ベクトル間のユークリッド距離 aArray.pointsize(point, point2) math.dist(point, point2) +データ列を2つ並べて箱ひげ図にする plt.boxplot([データ列, データ列]) plt.boxplot([データ列, データ列]) +横棒グラフをデピンク色として描画する plt.barh(データ列x, データ列y, color='deeppink') plt.barh(データ列x, データ列y, color='deeppink') +ヒストグラムで配列を作図する plt.hist(データ列) plt.hist(データ列) +ヒストグラムをライトコーラル色を用いて描画する plt.hist(データ列, color='lightcoral') plt.hist(データ列, color='lightcoral') +モカシン色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='moccasin') plt.bar(データ列x, データ列y, color='moccasin') +縦棒グラフをパウダーブルー色として描画する plt.bar(データ列x, データ列y, color='powderblue') plt.bar(データ列x, データ列y, color='powderblue') +散布図のマーカーを▽印にする plt.scatter(データ列x, データ列y, marker='v') plt.scatter(データ列x, データ列y, marker='v') +赤い大バツマーカーとして散布図を描画する plt.plot(データ列x, データ列y, marker='X', c='r') plt.plot(データ列x, データ列y, marker='X', c='r') +option: ライトスレイグレー色を用いる color = 'lightslategrey' color = 'lightslategray' +option: 星マーカーを加える marker = '*' marker = '*' +列とシーケンスをペアのリストにする itertools.zip_longest(iterable, iterable2) itertools.zip_longest(iterable, iterable2) +散布図を丸印で描画する plt.scatter(データ列x, データ列y, marker='o') plt.scatter(データ列x, データ列y, marker='o') +色を全般的に色差別なくする sns.set(pallete='colorblind') sns.set(pallete='colorblind') +最後の部分文字列で文字列を分けた場合の最初の文字列を取り出す s.rpartition(sub) s.rpartition(sub)[0] +最後の部分文字列によって文字列を二分する s.rpartition(sub) s.rpartition(sub) +平均値付き箱ヒゲ図をプロットする plt.boxplot(データ列, showmeans=True) plt.boxplot(データ列, showmeans=True) +データシリーズの不偏標準偏差を計算する ds.std() ds.std() +2進数文字列を整数にする int(s, 2) int(s, 2) +ディープスカイブルー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='deepskyblue') plt.bar(データ列x, データ列y, color='deepskyblue') +多次元データをMSDで淡く次元に次元削減する sklearn.manifold.MSD(n_components=三).fit_transform(多次元データ) sklearn.manifold.MSD(n_components=三).fit_transform(多次元データ) +配列の平均 np.mean(aArray) np.mean(aArray) +文字列の中で大文字・小文字を無視して正規表現にマッチしたすべての文字列をリストに変換する re.findall(pattern, s, flags=re.IGNORECASE) re.findall(pattern, s, flags=re.IGNORECASE) +八進文字列をbytesizeバイトのバイト列に変換する int(s, 8).to_bytes(length=bytesize, byteorder='big') int(s, 8).to_bytes(length=bytesize, byteorder='big') +リストとリストについての散布図に文字列という凡例用のラベルをつける plt.scatter(データ列x, データ列y, label=s) plt.scatter(データ列x, データ列y, label=s) +シエナにヒストグラムの色を変更する plt.hist(データ列, color='sienna') plt.hist(データ列, color='sienna') +データフレームの指定した三つの列を取り出す df[['列A', '列B', '列C']] df[['列A', '列B', '列C']] +option: グラフの色をローングリーンにセットする color = 'lawngreen' color = 'lawngreen' +散布図に青い印を描画する plt.scatter(データ列x, データ列y, markerfacecolor='b') plt.scatter(データ列x, データ列y, markerfacecolor='b') +データフレームのあるカラムの不偏分散 df['列A'].var(ddof=1) df['列A'].var(ddof=1) +特異値分解として淡く次元に次元削減する sklearn.decomposition.TruncatedSVD(n_components=三).fit_transform(多次元データ) sklearn.decomposition.TruncatedSVD(n_components=三).fit_transform(多次元データ) +ヒストグラムの色をライトスチールブルーに指定する plt.hist(データ列, color='lightsteelblue') plt.hist(データ列, color='lightsteelblue') +オブジェクトが集合 isinstance(obj, set) isinstance(obj, set) +実線に折れ線グラフの線の種類を設定する plt.plot(データ列x, データ列y, linestyle='solid') plt.plot(データ列x, データ列y, linestyle='solid') +option: アクアを使用する color = 'aqua' color = 'aqua' +ファイルパスをSJISで書き込み用にオープンする] open(filepath, encoding='shift_jis') open(filepath, mode='w', encoding='shift_jis') +オプションで標準エラーを出力先にする file = sys.stderr file = sys.stderr +縦棒グラフをモカシン色で描画する plt.bar(データ列x, データ列y, color='moccasin') plt.bar(データ列x, データ列y, color='moccasin') +オブジェクトがタプルの要素かどうか element in aTuple element in aTuple +ヒストグラムをインディアンレッド色を使って描画する plt.hist(データ列, color='indianred') plt.hist(データ列, color='indianred') +文字列を特殊文字も含め小文字にする s.casefold() s.casefold() +イエローグリーン色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='yellowgreen') plt.plot(データ列x, データ列y, color='yellowgreen') +今日の日付を使う datetime.date.today() datetime.date.today() +異なる列をキーとしてデータフレームを右結合する df.merge(df, df2, left_on='列A', right_on='列B', = map(df.columns, how='right') pd.merge(df, df2, left_on='列A', right_on='列B', how='right') +オブジェクトは浮動小数点数型 isinstance(obj, float) isinstance(obj, float) +やわらかい青色の棒グラフを描画する plt.bar(データ列x, データ列y, color='cornflowerblue') plt.bar(データ列x, データ列y, color='cornflowerblue') +文字列全体が正規表現に大文字・小文字を無視してマッチするか調べる re.fullmatch(pattern, s, flags=re.IGNORECASE) re.fullmatch(pattern, s, flags=re.IGNORECASE) +本日は何年か知る datetime.datetime.today().year datetime.datetime.today().year +散布図に右三角印を加える plt.scatter(データ列x, データ列y, marker='>') plt.scatter(データ列x, データ列y, marker='>') +グリッドの線種を破線に変更する plt.grid(linestyle='dashed') plt.grid(linestyle='dashed') +ヒストグラムをグリーン色として描画する plt.hist(データ列, color='green') plt.hist(データ列, color='green') +データフレームのインデックスがnの行を取り出す df.loc[n] df.loc[n] +データフレームから列を一つのみ選択する df[['列A']] df[['列A']] +折れ線グラフに簡単な説明を付ける plt.plot(データ列x, データ列y, label='s') plt.plot(データ列x, データ列y, label='ラベル') +散布図を黒いクロスマーカーとして描く plt.plot(データ列x, データ列y, marker='x', c='k') plt.plot(データ列x, データ列y, marker='x', c='k') +イテラブルを折れ線グラフとして可視化する plt.plot(データ列x, データ列y) plt.plot(データ列x, データ列y) +ゼロ埋めされたブール型のベクトルを作成する np.zeros(要素数, dtype=np.int32) np.zeros(要素数, dtype=np.int32) +ロバストな単回帰モデルを新規作成する model = sklearn.linear_model.HuberRegressor() model = sklearn.linear_model.HuberRegressor() +データシリーズの中に文字列と日付データがあるか調べる ds.isin([value, value2]) ds.isin([value, value2]) +自然数個のものからk個取り出した場合の並べ方の総数を求める math.perm(n, k) math.perm(n, k) +option: グラフの色をスラグレーに指定する color ='slategrey' color = 'slategray' +折れ線グラフの四角マーカーを青色にする plt.plot(データ列x, データ列y, marker='s', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='s', markerfacecolor='b') +コーンフラワーブルー色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='cornflowerblue') plt.plot(データ列x, データ列y, color='cornflowerblue') +セットの補集合 aSet.difference(aSet2) aSet.difference(aSet2) +ダークシアグリーン色を用いて横棒グラフを描画する plt.barh(データ列x, データ列y, color='darkseagreen') plt.barh(データ列x, データ列y, color='darkseagreen') +横棒グラフをローングリーン色を使って描画する plt.barh(データ列x, データ列y, color='lawngreen') plt.barh(データ列x, データ列y, color='lawngreen') +タイムスタンプ型の表データのあるカラムをデータフレームのインデックスにする df.index = pd.DatetimeIndex(df['列A']) df.index = pd.DatetimeIndex(df['列A']) +イエローグリーンにヒストグラムの色を変更する plt.hist(データ列, color='yellowgreen') plt.hist(データ列, color='yellowgreen') +横棒グラフをオリーブ色として描画する plt.barh(データ列x, データ列y, color='olive') plt.barh(データ列x, データ列y, color='olive') +リストと配列の散布図に大バツマーカーを描画する plt.plot(データ列x, データ列y, marker='X') plt.plot(データ列x, データ列y, marker='X') +折れ線グラフをラベンダーブラッシュ色を使って描画する plt.plot(データ列x, データ列y, color='lavenderblush') plt.plot(データ列x, データ列y, color='lavenderblush') +線形のクラス分類を行う model = sklearn.linear_model.LinearRegression() model = sklearn.linear_model.LogisticRegression() +折れ線グラフをアクアマリン色として描画する plt.plot(データ列x, データ列y, color='aquamarine') plt.plot(データ列x, データ列y, color='aquamarine') +実測値を回帰モデルの予測値と対比させる pd.DataFrame({'実測': 目的変数, '予測': model.predict(説明変数)}) pd.DataFrame({'実測': 目的変数, '予測': model.predict(説明変数)}) +ビスク色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='bisque') plt.barh(データ列x, データ列y, color='bisque') +分割数nとしてリストを等量でビン分割する pd.qcut(aList, n) pd.qcut(aList, n) +文字列全体がパターンにASCII限定としてマッチするか調べる re.fullmatch(pattern, s, flags=re.ASCI) re.fullmatch(pattern, s, flags=re.ASCI) +折れ線グラフをクリムゾン色を使って描画する plt.plot(データ列x, データ列y, color='crimson') plt.plot(データ列x, データ列y, color='crimson') +rgbの四角マーカーをリストと数列についての散布図に描画する plt.plot(データ列x, データ列y, marker='s', c=rgb) plt.plot(データ列x, データ列y, marker='s', c=rgb) +ヒストグラムを黄緑色を用いて描画する plt.hist(データ列, color='chartreuse') plt.hist(データ列, color='chartreuse') +グラフで利用可能な色名の一覧 matplotlib.colors.cnames matplotlib.colors.cnames +二つの列からグループ化し個数を求める df.groupby(['列A', '列B'], as_index=False).count() df.groupby(['列A', '列B'], as_index=False).count() +データフレームの列のユニークな値の個数を調べる df[col].nunique() df[col].nunique() +セットから任意の要素を取り除く aSet.pop() aSet.pop() +日付データにn日分、加える aDate + datetime.timedelta(days=n) aDate + datetime.timedelta(days=n) +線グラフの色をレベッカパープルに設定する plt.plot(データ列x, データ列y, color='rebeccapurple') plt.plot(データ列x, データ列y, color='rebeccapurple') +ダークサーモンにヒストグラムの色を指定する plt.hist(データ列, color='darksalmon') plt.hist(データ列, color='darksalmon') +データシリーズの分散を求める ds.var() ds.var() +平均値でデータフレームの一部のカラムの欠損値を埋める df[['列A', '列B']].fillna(df[['列A', '列B']].mean()) df[['列A', '列B']].fillna(df[['列A', '列B']].mean()) +等量でn個に配列を分割する pd.qcut(aArray, n) pd.qcut(aArray, n) +三整数のLCMを求める math.lcm(n, n2, n3) math.lcm(n, n2, n3) +2つのデータフレームを縦方向に一つにする pd.concat([df, df2], axis=0) pd.concat([df, df2], axis=0) +データフレームのカラムをに箱ひげ図で可視化する plt.boxplot(df[column]) sns.boxplot(x='カテゴリ列', y='列', data=df) +ふたつのカラムからグループ化し、標準偏差を求める df.groupby(['列A', '列B'], as_index=False).std() df.groupby(['列A', '列B'], as_index=False).std() +横棒グラフを描画して、中央寄せする plt.barh(ラベル列, データ列, align='center') plt.barh(ラベル列, データ列, align='center') +ヒストグラムの色をミディアムスプリンググリーンに変更する plt.hist(データ列, color='mediumspringgreen') plt.hist(データ列, color='mediumspringgreen') +ヒストグラムをアンティークホワイト色として描画する plt.hist(データ列, color='antiquewhite') plt.hist(データ列, color='antiquewhite') +スクリプトファイルのフォルダ名 os.path.path.dirname(os.path.abspath(__file__)) os.path.dirname(os.path.abspath(__file__)) +データフレームの選択したカラムのパーセンタイルを求める df[['列A', '列B']].quantile(パーセント/100) df[['列A', '列B']].quantile(パーセント/100) +データフレームの一部のカラムの母標準偏差 df[['列A', '列B']].std(ddof=0) df[['列A', '列B']].std(ddof=0) +シーケンスをカウンタに変換する collections.Counter(iterable) collections.Counter(iterable) +y軸だけ目盛り線 plt.grid(axis='y') plt.grid(axis='y') +ヒストグラムをホワイト色で描画する plt.hist(データ列, color='white') plt.hist(データ列, color='white') +スレートブルー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='slateblue') plt.bar(データ列x, データ列y, color='slateblue') +ヒストグラムの色をペールグリーンに変更する plt.hist(データ列, color='palegreen') plt.hist(データ列, color='palegreen') +option: 区切りをスラッシュにする sep = ':' sep = '/' +option: カデットブルーにフォントの色を設定する color = 'cadetblue' color = 'cadetblue' +カテゴリでグループ化して、データフレームを棒プロットにする sns.barplot(x='カテゴリ列', y='列', hue='カテゴリ', data=df) sns.barplot(x='カテゴリ列', y='列名', hue='カテゴリ', data=df) +マップの項目名の値 aDict[key] aDict[key] +見やすいグラフを用いる準備をする import seaborn as sns import seaborn as sns +リストを昇順にソートする sorted(aList, reverse=False) sorted(aList, reverse=False) +線グラフの色をライトグリーンに指定する plt.plot(データ列x, データ列y, color='lightgreen') plt.plot(データ列x, データ列y, color='lightseagreen') +列をビン数nで分割して、namesのラベルをつける pd.cut(ds, n, labels=names) pd.cut(ds, n, labels=names) +オーキッド色を使って棒グラフを描画する plt.bar(データ列x, データ列y, color='orchid') plt.bar(データ列x, データ列y, color='orchid') +天井を求める math.ceil(x) math.ceil(x) +折れ線グラフをピンク色として描画する plt.plot(データ列x, データ列y, color='pink') plt.plot(データ列x, データ列y, color='pink') +リストと配列についての散布図に星マーカーを描画する plt.plot(データ列x, データ列y, marker='*') plt.plot(データ列x, データ列y, marker='*') +データ列と数列についての散布図に赤い星マーカーを描画する plt.plot(データ列x, データ列y, marker='*', c='r') plt.plot(データ列x, データ列y, marker='*', c='r') +option: ライトイエロー色を使用する color = 'lightyellow' color = 'lightyellow' +オレンジレッド色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='orangered') plt.plot(データ列x, データ列y, color='orangered') +データフレームの指定した列の中に存在���る文字列と文字列の合計を数える df['列A'].isin([value, value2]).sum() df['列A'].isin([value, value2]).sum() +チョコレート色でヒストグラムを描画する plt.hist(データ列, color='chocolate') plt.hist(データ列, color='chocolate') +黒いバツマーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='x', markerfacecolor='k') plt.plot(データ列x, データ列y, marker='x', markerfacecolor='k') +データフレーム中の未入力値を除く df.dropna(inplace=True) df.dropna(inplace=True) +データフレームのあるカラムが正規分布からどの程度、尖っているか確認する df['列A'].skew() df['列A'].skew() +グラフのx軸を対数目盛に変更する plt.xscale('log') plt.xscale('log') +データフレームの指定したカラムの標準偏差などを確認する df['列A'].std() df['列A'].describe() +カウンタを多い順にリストとして得る aCounter.most_common() aCounter.most_common() +赤い▲マーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='^', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='^', markerfacecolor='r') +数式のn階微分を求める sympy.diff(e, z, n) sympy.diff(e, z, n) +非数値データ列を連番化する sklearn.preprocessing.LabelEncoder().fit_transform(データ列, labels=True) sklearn.preprocessing.LabelEncoder().fit_transform(データ列) +有理数モジュールをインポートする import fractions import fractions +option: グラフの色をダークスラテグレーに指定する color = 'darkslategray' color = 'darkslategray' +option: 整数型を使用する dtype = np.int dtype = np.int +キーがマッピング上で定義済み key in aDict key in aDict +縦棒グラフをアリスブルー色を用いて描画する plt.bar(データ列x, データ列y, color='aliceblue') plt.bar(データ列x, データ列y, color='aliceblue') +データフレームの中に日付データと文字列がいくつあるか数える df.isin([value, value2]).sum() df.isin([value, value2]).sum() +データフレームの選択した列の分位数 df[['列A', '列B']].quantile(パーセント/100) df[['列A', '列B']].quantile(パーセント/100) +散布図の左三角印を黒くする plt.scatter(データ列x, データ列y, marker='<', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='<', markerfacecolor='k') +データ列を書式としてタイムスタンプ型に変換する pd.to_datetime(ds) pd.to_datetime(ds, format='%Y-%m-%d') +データフレームをグループ化し、それぞれの分散を計算する df.groupby('列A').var() df.groupby('列A').var() +文字列を区切りで分割して文字列リストに変換する s.split(sep) s.split(sep) +option: 色をトマトに設定する color = 'tomato' color = 'tomato' +項目名が辞書上で定義されているか調べる key in aDict key in aDict 日付データをn日前にする aDate - datetime.timedelta(days=n) aDate - datetime.timedelta(days=n) -データフレームの列がxより多い行を取り出す df[df[column] > x] df[df[column] > x] -データフレームから指定された列のみ取り出す df[[column]] df[[column]] -二つのデータフレームを縦に連結する pd.concat([df, df2], axis=0) pd.concat([df, df2], axis=0) +線グラフの色をペールグリーンに変更する plt.plot(データ列x, データ列y, color='palegreen') plt.plot(データ列x, データ列y, color='palegreen') +日付データが日付データよりあと aDate < aDate2 aDate > aDate2 +option: ラベンダーブラッシュ色を用いる color = 'lavenderblush' color = 'lavenderblush' +表計算ファイルのシートをデータフレームとして読み込む pd.read_excel('file.xlsx') pd.read_excel('file.xlsx', sheet_name=シート名) +n×n2の二次元リストを得る [[0] * n for _ in range(n2)] [[0] * n for _ in range(n2)] +線グラフをオレンジ色を用いて描画する plt.plot(データ列x, データ列y, color='orange') plt.plot(データ列x, データ列y, color='orange') +散布図をrgbのバツマーカーで描く plt.plot(データ列x, データ列y, marker='x', c=rgb) plt.plot(データ列x, データ列y, marker='x', c=rgb) +リストを分割数nでビン分割する pd.cut(aList, n) pd.cut(aList, n) +データシリーズを整数に丸める ds.round() ds.round() +option: フォントの色をミディアムオーキッドに指定する color ='mediumorchid' color = 'mediumorchid' +縦棒グラフをダークオレンジ色で描画する plt.bar(データ列x, データ列y, color='darkorange') plt.bar(データ列x, データ列y, color='darkorange') +実数のコサインの逆数 math.acos(x) math.acos(x) +データフレームの一部の列を十の位で丸めて整数型にする df[['列A', '列B']].round(-1).astype(int) df[['列A', '列B']].round(-1).astype(int) +棒グラフをゴーストホワイト色を用いて��画する plt.bar(データ列x, データ列y, color='ghostwhite') plt.bar(データ列x, データ列y, color='ghostwhite') +データフレームのカラムの中にいくつ文字列があるか数える df['列A'].isin([value]).sum() df['列A'].isin([value]).sum() +データフレームのポイントプロットをプロットする sns.pointplot(x='カテゴリ列', y='列名', hue='カテゴリ列', data=df) sns.pointplot(x='カテゴリ列', y='列', hue='カテゴリ列', data=df) +レモンシフォン色を用いてヒストグラムを描画する plt.hist(データ列, color='lemonchiffon') plt.hist(データ列, color='lemonchiffon') +データフレームの行を条件で取り除く df[(df['列A'] == x) & (df['列B'] == y)] df[(df['列A'] == x) & (df['列B'] == y)] +折れ線グラフのポイント印の大きさを変更する plt.plot(データ列x, データ列y, marker='.', markersize=2.0) plt.plot(データ列x, データ列y, marker='.', markersize=2.0) +ディープスカイブルー色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='deepskyblue') plt.plot(データ列x, データ列y, color='deepskyblue') +イテラブル自身の長さnの順列 itertools.permutations(iterable, n) itertools.permutations(iterable, n) +プロットを濃くする sns.set(pallete='deep') sns.set(pallete='deep') +折れ線グラフの色を耐火レンガに変更する plt.plot(データ列x, データ列y, color='firebrick') plt.plot(データ列x, データ列y, color='firebrick') +ふたつの集合の交わり aSet.intersection(aSet2) aSet.intersection(aSet2) +日付データは何日か知る aDate.day aDate.day +ミッドナイトブルー色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='midnightblue') plt.bar(データ列x, データ列y, color='midnightblue') +カデットブルー色でヒストグラムを描画する plt.hist(データ列, color='cadetblue') plt.hist(データ列, color='cadetblue') +線グラフをライトスレイグレー色として描画する plt.plot(データ列x, データ列y, color='lightslategrey') plt.plot(データ列x, データ列y, color='lightslategray') +水色で文字列をプリントする print(f'\033[36m{value}\033[0m') print(f'\033[36m{value}\033[0m') +EUCでファイルをオープンする] open(filepath, encoding='euc_jp') open(filepath, encoding='euc_jp') +セットから値を取り除く aSet.remove(element) aSet.remove(element) +表計算ファイルを読み込む pd.read_excel('file.xlsx') pd.read_excel('file.xlsx') +散布図を丸マーカーでプロットする plt.plot(データ列x, データ列y, marker='o') plt.plot(データ列x, データ列y, marker='o') +データフレームのカーネル密度による分布図を描画する sns.kdeplot(x='列名', hue='カテゴリ列', data=df) sns.kdeplot(x='列名', hue='カテゴリ列', data=df) +印字可能な文字を使う string.printable string.printable +リストの折れ線グラフを描画し、、色をカラーコードで変更する plt.plot(データ列x, データ列y, color='#800080') plt.plot(データ列x, データ列y, color='#800080') +読み込みモードを用いてファイルをオープンして]、fとする f = open(filepath, mode='r') f = open(filepath, mode='r') +小数点以下の表示精度を設定する pd.set_option('precision', n) pd.set_option('precision', n) +option: フォントの色をアクアに設定する color = 'aqua' color = 'aqua' +データフレームの内容を調べる df.head() df.head() +マッピングからキーの値を得る aDict.get(key) aDict.get(key) +CSVをヘッダを指定せずロードする pd.read_csv('file.csv', header=None) pd.read_csv('file.csv', header=None) +グラフの描画を綺麗にする import seaborn as sns import seaborn as sns +データフレームの選択したカラムの中に文字列と文字列が存在する df[['列A', '列B']].isin([value, value2]) df[['列A', '列B']].isin([value, value2]) +縦棒プロットを描画して、ラベルを左寄せする plt.bar(ラベル列, データ列, align='edge') plt.bar(ラベル列, データ列, align='edge') +文字列中にひとつでも非アルファベットが含まれるか any(not c.isalpha() for c in s) any(not c.isalpha() for c in s) +列をカテゴリデータに変換する ds.asympify(iterable) ds.astype(object) +列を両端キューに変換する collections.deque(iterable) collections.deque(iterable) +列の名前を列挙する df.columns df.columns +ヒストグラムの色をグリーンに指定する plt.hist(データ列, color='green') plt.hist(データ列, color='green') +データフレームの中の未入力値の数を数える df.isna().sum() df.isna().sum() +多次元データを特異値分解で淡く次元に削減する sklearn.decomposition.TruncatedSVD(n_components=三).fit_transform(多次元データ) sklearn.decomposition.TruncatedSVD(n_components=三).fit_transform(多次元データ) +横棒グラフを耐火レンガ色を用いて描画する plt.barh(データ列x, データ列y, color='firebrick') plt.barh(データ列x, データ列y, color='firebrick') +ヒストグラムをマゼンタ色を使って描画する plt.hist(データ列, color='magenta') plt.hist(データ列, color='magenta') +貝殻色で散布図を描画する plt.scatter(データ列x, データ列y, color='seashell') plt.scatter(データ列x, データ列y, color='seashell') +option: ゴーストホワイト色を用いる color = 'ghostwhite' color = 'ghostwhite' +ライトブルー色で線グラフを描画する plt.plot(データ列x, データ列y, color='lightblue') plt.plot(データ列x, データ列y, color='lightblue') +データシリーズの中にと文字列がある ds.isin([value, value2]) ds.isin([value, value2]) +棒グラフをライトグリーン色を用いて描画する plt.bar(データ列x, データ列y, color='lightseagreen') plt.bar(データ列x, データ列y, color='lightseagreen') +三整数のLCM math.lcm(n, n2, n3) math.lcm(n, n2, n3) +行列間の要素ごとの最小公倍数 np.gcd(aArray, aArray2) np.lcm(aArray, aArray2) +option: 色を黄緑に設定する color = 'chartreuse' color = 'chartreuse' +ブルーバイオレット色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='blueviolet') plt.plot(データ列x, データ列y, color='blueviolet') +ヒストグラムを紺色として描画する plt.hist(データ列, color='darkblue') plt.hist(データ列, color='darkblue') +データフレームを関数の値に集約し、、列挙する [(name, group_df) for _ in df.groupby(関数)] [(name, group_df) for name, group_df in df.groupby(関数)] +データシリーズの分位数を求める ds.quantile(パーセント/100) ds.quantile(パーセント/100) +縦棒グラフをグレー色を用いて描画する plt.bar(データ列x, データ列y, color='gray') plt.bar(データ列x, データ列y, color='gray') +データフレームは正規分布からどの程度歪んでいるか見る df.kurt() df.kurt() +赤い大バツマーカーを用いて散布図を描画する plt.plot(データ列x, データ列y, marker='X', c='r') plt.plot(データ列x, データ列y, marker='X', c='r') +セットの全ての要素が別の集合に含まれる aSet.issubset(aSet2) aSet.issubset(aSet2) +双方向キューが空であるか調べる len(deq) == 0 len(deq) == 0 +多重集合を辞書から作成する collections.ChainMap(aDict) collections.Counter(aDict) +option: ミスティローズにフォントの色を設定する color ='mistyrose' color = 'mistyrose' +全要素を0で初期化した行列を作成する np.zeros(行数, 列数, dtype=np.int) np.zeros(行数, 列数) +nがn2 n >= n2 n == n2 +ファイルパスの拡張子なしのファイル名を使う os.path.splitext(filepath)[1]!= -1 os.path.splitext(os.path.basename(filepath))[0] +赤いポイントマーカーで散布図をプロットする plt.plot(データ列x, データ列y, marker='.', c='r') plt.plot(データ列x, データ列y, marker='.', c='r') +ヒストグラムの色をダークバイオレットにする plt.hist(データ列, color='darkviolet') plt.hist(データ列, color='darkviolet') +データフレームの最後のカラム以外を全て説明変数にする 説明変数 = df[df.columns[:-1]] 説明変数 = df[df.columns[:-1]] +ヒストグラムの描画して正規化する plt.hist(データ列, density=True) plt.hist(データ列, density=True) +散布図をゴールデンロッド色を用いて描画する plt.scatter(データ列x, データ列y, color='goldenrod') plt.scatter(データ列x, データ列y, color='goldenrod') +nがn2より小さいか判定する n < n2 n < n2 +数列のスピアマンの相関係数を計算する scipy.stats.spearmanr(数列, 数列2) scipy.stats.spearmanr(数列, 数列2) +タイムスタンプデータをn時間前に戻す aDatetime - datetime.timedelta(hours=n) aDatetime - datetime.timedelta(hours=n) +スラグレー色で棒グラフを描画する plt.bar(データ列x, データ列y, color='slategrey') plt.bar(データ列x, データ列y, color='slategrey') +リストとイテラブルについての散布図にrgbの▽マーカーをプロットする plt.plot(データ列x, データ列y, marker='v', c=rgb) plt.plot(データ列x, データ列y, marker='v', c=rgb) +折れ線グラフをレモンシフォン色として描画する plt.plot(データ列x, データ列y, color='lemonchiffon') plt.plot(データ列x, データ列y, color='lemonchiffon') +option: グラフの色をスラグレーにする color ='slategrey' color = 'slategray' +小麦色色で散布図を描画する plt.scatter(データ列x, データ列y, color='wheat') plt.scatter(データ列x, データ列y, color='wheat') +グリーンイエローにヒストグラムの色をセットする plt.hist(データ列, color='greenyellow') plt.hist(データ列, color='greenyellow') +numpyをインポートする import numpy as np import numpy as np +option: フローラルホワイトにグラフの色を設定する color = 'floralwhite' color = 'floralwhite' +オプションで標準出力を出力にする file = sys.stdout file = sys.stdout +横棒グラフをハニーデュー色を使って描画する plt.barh(データ列x, データ列y, color='honeydew') plt.barh(データ列x, データ列y, color='honeydew') +折れ線グラフの印を左三角にする plt.plot(データ列x, データ列y, marker='<') plt.plot(データ列x, データ列y, marker='<') +散布図をバツ印を用いる描画する plt.scatter(データ列x, データ列y, marker='x') plt.scatter(データ列x, データ列y, marker='x') +横棒プロットをプロットする plt.barh(ラベル列, データ列) plt.barh(ラベル列, データ列) +数値でデータフレームの選択したカラムの欠損値を埋める df[['列A', '列B']].fillna(x) df[['列A', '列B']].fillna(x) +ケースを無視して正規表現に文字列の先頭でマッチさせる re.match(pattern, s, flags=re.IGNORECASE) re.match(pattern, s, flags=re.IGNORECASE) +データフレームを列名を指定して全ジョインする pd.merge(df, df2, on='列A', how='outer') pd.merge(df, df2, on='列A', how='outer') +縦棒グラフの色をシーグリーンにする plt.bar(データ列x, データ列y, color='seagreen') plt.bar(データ列x, データ列y, color='seagreen') +線グラフの色をオリベドラブに指定する plt.plot(データ列x, データ列y, color='olivedrab') plt.plot(データ列x, データ列y, color='olivedrab') +リストと数列の散布図に菱形マーカーを描画する plt.plot(データ列x, データ列y, marker='D') plt.plot(データ列x, データ列y, marker='D') +散布図に大バツマーカーを用いる plt.plot(データ列x, データ列y, marker='X') plt.plot(データ列x, データ列y, marker='X') +xが1、もしくは2、もしくは3に等しいか確認する x == 1 or x == 2 or x == 3 x == 1 or x == 2 or x == 3 +文字列からformatのパターンで日付時刻にする datetime.datetime.strptime(日付の書かれた文字列, format) datetime.datetime.strptime(日付の書かれた文字列, format) +グラフから格子線を消す plt.grid(linewidth=3.0) plt.grid(False) +option: ライトイエローを使う color = 'lightyellow' color = 'lightyellow' +日付時刻データがタイムスタンプデータと同時か確認する aDatetime == aDatetime2 aDatetime == aDatetime2 +ヒストグラムをライトイエロー色を用いて描画する plt.hist(データ列, color='lightyellow') plt.hist(データ列, color='lightyellow') +散布図のバツ印の色を設定する plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='#800080') +折れ線グラフの色をネイビーに変更する plt.plot(データ列x, データ列y, color='navy') plt.plot(データ列x, データ列y, color='navy') +ヒストグラムの色をライトブルーに指定する plt.hist(データ列, color='lightblue') plt.hist(データ列, color='lightblue') +CSVファイルにデータフレームをインデックスを付けず保存する df.to_csv('file.csv', index=None) df.to_csv('file.csv', index=None) +文字列を下線付き化する f'\033[4m{value}\033[0m' f'\033[4m{value}\033[0m' +プロットにx=0の破線を設定する plt.axvline(x=0, linestyle='dashed') plt.axvline(x=0, linestyle='dashed') +線グラフの色をグリーンに設定する plt.plot(データ列x, データ列y, color='green') plt.plot(データ列x, データ列y, color='green') +表計算から全てのシートを読み込む pd.read_excel('file.xlsx', sheet_name=None) pd.read_excel('file.xlsx', sheet_name=None) +分類モデルの決定係数を求める sklearn.metrics.hmean_squared_error(データ列, データ列2) sklearn.metrics.r2_score(目的変数, model.predict(説明変数)) +option: グラフの色をオールドレースにセットする color = 'oldlace' color = 'oldlace' +数式のパラメータを数式で置き換える e.subs(z, e2) e.subs(z, e2) +コロンによって文字列を分割して、列挙する s.split(':') s.split(':') +データフレームの指定したカラムの中にいくつ文字列があるかカウントする df['列A'].isin([value]).sum() df['列A'].isin([value]).sum() +nからn2までの一つ置きの整数列を作る list(range(n, n2+1)) list(range(n, n2+1, 2)) +耐火レンガ色を使って棒グラフを描画する plt.bar(データ列x, データ列y, color='firebrick') plt.bar(データ列x, データ列y, color='firebrick') +option: BOM付きを使用する encoding = 'utf_8_sig' encoding = 'utf_8_sig' +データフレームの指定したカラムの中にいくつNaNが存在するか調べる df['列A'].isna().sum() df['列A'].isna().sum() +データフレームを並べ直して、下位n件を取り出す df.sort_values('キーとなる列').tail(n) df.sort_values('キーとなる列').tail(n) +option: リネンを用いる color = 'linen' color = 'linen' +rgbの左三角マーカーをリストとリストについての散布図に描画する plt.plot(データ列x, データ列y, marker='<', c=rgb) plt.plot(データ列x, データ列y, marker='<', c=rgb) +折れ線グラフの色を淡いピンク色にする plt.plot(データ列x, データ列y, color='lightpink') plt.plot(データ列x, データ列y, color='lightpink') +組の中の最大値を算出する max(aTuple) max(aTuple) +N未満までの配列 np.arange(N) np.arange(N) +100行をデータフレームからランダムに取り出す df.sample(100) df.sample(100) +折れ線グラフをアンティークホワイト色を用いて描画する plt.plot(データ列x, データ列y, color='antiquewhite') plt.plot(データ列x, データ列y, color='antiquewhite') +ファイルを開いて]、バイナリ書き込みストリームを使う open(filepath, mode='wb') open(filepath, mode='wb') +イエローグリーン色でヒストグラムを描画する plt.hist(データ列, color='yellowgreen') plt.hist(データ列, color='yellowgreen') +散布図の下三角印の線幅を変更する plt.scatter(データ列x, データ列y, marker='v', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='v', markeredgewidth=2.5) +データフレームのあるカラムの分を使う df['列A'].dt.minute df['列A'].dt.minute +データフレームの一部のカラムの尖度を求める df[['列A', '列B']].skew() df[['列A', '列B']].skew() +分類結果の適合率を求める sklearn.metrics.precision_score(正解データ列, 予測データ列) sklearn.metrics.precision_score(正解データ列, 予測データ列) +option: フローラルホワイトを使う color = 'floralwhite' color = 'floralwhite' +ケンドールの相関係数を求める scipy.stats.kendalltau(配列, 配列2) scipy.stats.kendalltau(df['列A'], df['列B']) +ダークマゼンタ色で散布図を描画する plt.scatter(データ列x, データ列y, color='darkmagenta') plt.scatter(データ列x, データ列y, color='darkmagenta') +ゼロ埋めされた複素数型のベクトル np.zeros(要素数, dtype=bool) np.zeros(要素数, dtype=bool) +リストとリストについて散布図を描いて、マーカーを星に変更する plt.plot(データ列x, データ列y, marker='*') plt.plot(データ列x, データ列y, marker='*') +データシリーズの未入力値を最大値で埋める ds.fillna(ds.max()) ds.fillna(ds.max()) +辞書をカウンタにする collections.Counter() collections.Counter(aDict) +グラフに水平方向の実線を設定する plt.axvline(y=0, linestyle='solid') plt.axhline(y=0, linestyle='solid') +データ列のユニークな要素 ds.unique() ds.unique() +ダークシアンにヒストグラムの色を設定する plt.hist(データ列, color='darkcyan') plt.hist(データ列, color='darkcyan') +綺麗なグラフを使う import seaborn as sns import seaborn as sns +文字列は漢字 s in s ('\u4E00' <= ch <= '\u9FD0') +オプションで、標準エラーを用いる file = sys.stderr file = sys.stderr +プラム色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='plum') plt.barh(データ列x, データ列y, color='plum') +2つのデータフレームを横向きに連結する pd.merge(df, df2, df3) pd.concat([df, df2], axis=1) +ブラック色で散布図を描画する plt.scatter(データ列x, データ列y, color='black') plt.scatter(データ列x, データ列y, color='black') +インディゴ色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='indigo') plt.plot(データ列x, データ列y, color='indigo') +option: 青緑を使用する color = 'turquoise' color = 'teal' +散布図をオリーブ色を用いて描画する plt.scatter(データ列x, データ列y, color='olive') plt.scatter(データ列x, データ列y, color='olive') +線グラフを青色で描画する plt.plot(データ列x, データ列y, color='blue') plt.plot(データ列x, データ列y, color='blue') +JSONファイルの入力を読み込んで、dataとする data = json.load(fin) data = json.load(fin) +データフレームの一部の列を10の位で丸める df[['列A', '列B']].round(-1) df[['列A', '列B']].round(-1) +列名を指定せずCSVファイルを読み込む pd.read_csv('file.csv', not_on='列A','strict') pd.read_csv('file.csv', header=None) +折れ線グラフを白色として描画する plt.plot(データ列x, データ列y, color='white') plt.plot(データ列x, データ列y, color='white') +型が名前付きタプルか調べる issubclass(C, tuple) issubclass(C, tuple) +棒グラフをダークゴールデンロッド色を用いて描画する plt.bar(データ列x, データ列y, color='darkgoldenrod') plt.bar(データ列x, データ列y, color='darkgoldenrod') +ヒストグラムをミッドナイトブルー色を用いて描画する plt.hist(デ��タ列, color='midnightblue') plt.hist(データ列, color='midnightblue') +マッピングのキーを要素にする aDict[key] = element aDict[key] = element +サンディーブラウン色を使って縦棒グラフを描画する plt.bar(データ列x, データ列y, color='sandybrown') plt.bar(データ列x, データ列y, color='sandybrown') +SJISでCSVファイルにデータフレームを保存する df.to_csv('file.csv', index=None) df.to_csv('file.csv', encoding='shift_jis') +データフレームの一部のカラムの欠損値を直前の値に設定する df[['列A', '列B']].fillna(method='ffill') df[['列A', '列B']].fillna(method='ffill') +線グラフの色をライトコーラルに設定する plt.plot(データ列x, データ列y, color='lightcoral') plt.plot(データ列x, データ列y, color='lightcoral') +文字列内にひとつでもアスキー文字が含まれる any(c.isascii() for c in s) any(c.isascii() for c in s) +year年month月day日hour時minute分をタイムスタンプに変換する datetime.datetime(year=year, month=month, day=day, hour=hour, minute=minute) datetime.datetime(year=year, month=month, day=day, hour=hour, minute=minute) +集合が空でない len(aSet) - aSet2) len(aSet) != 0 +ヒストグラムをミディアムオーキッド色を使って描画する plt.hist(データ列, color='mediumorchid') plt.hist(データ列, color='mediumorchid') +ある列の値によってデータフレームを集約する df.groupby('列A') df.groupby('列A') +折れ線グラフの色をゴールデンロッドに指定する plt.plot(データ列x, データ列y, color='goldenrod') plt.plot(データ列x, データ列y, color='goldenrod') +rgbの大バツマーカーを散布図に使う plt.plot(データ列x, データ列y, marker='X', c=rgb) plt.plot(データ列x, データ列y, marker='X', c=rgb) +データフレームの指定したカラムの欠損値をその最頻値で置き換える df['列A'].fillna(df['列A'].mode().iloc[0]) df['列A'].fillna(df['列A'].mode().iloc[0]) +日付データが日付データより後ろ aDate > aDate2 aDate > aDate2 +ポイントマーカーとしてデータ列の折れ線グラフを描画する plt.plot(データ列x, データ列y, marker='.') plt.plot(データ列x, データ列y, marker='.') +行列の全要素の値を変更する aArray[:, :] = 指定の値 aArray[:, :] = 指定の値 +インディアンレッド色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='indianred') plt.barh(データ列x, データ列y, color='indianred') +データフレームのカラムの母標準偏差を求める df['列A'].std(ddof=0) df['列A'].std(ddof=0) +イテラブルを文字列に変換して、'改行で連結する '\n'.join(map(str, iterable)) '\n'.join(map(str, iterable)) +データフレームの選択したカラムの平均 df[['列A', '列B']].mean() df[['列A', '列B']].mean() +ある列のカテゴリ毎の個数 df.groupby('列A').count() df.groupby('列A').count() +ゴールド色を用いてヒストグラムを描画する plt.hist(データ列, color='gold') plt.hist(データ列, color='gold') +要素を両端キューの最後から取り除く deq.pop() deq.pop() +option: マーカーを三角に変える marker = '^' marker = '^' +文字列のn番目の文字を使う s[n] s[n] +ヒストグラムを破線で描く plt.hist(データ列, linestyle='dashed') plt.hist(データ列, linestyle='dashed') +横棒グラフをペールグリーン色として描画する plt.barh(データ列x, データ列y, color='palegreen') plt.barh(データ列x, データ列y, color='palegreen') +ヒストグラムの色をトマトに変更する plt.hist(データ列, color='tomato') plt.hist(データ列, color='tomato') +キューの中に要素は含まれてる element in deq element in deq +ファイルパスを読み込みモードで開く] open(filepath, mode='r') open(filepath, mode='r') +option: パールゴールデンロッド色を用いる color = 'palegoldenrod' color = 'palegoldenrod' +文字列の開始位置番目と終了位置番目の間に部分文字列が存在しないか調べる s.find(sub, start, end) == -1 s.find(sub, start, end) == -1 +両端キュー中の値の数をカウントする deq.count(element) deq.count(element) +新しいガウス過程分類モデルを作る model = sklearn.gaussian_process.GaussianProcessClassifier() model = sklearn.gaussian_process.GaussianProcessClassifier() +散布図の△マーカーを赤くする plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='r') +オブジェクトをイテレータに変換する iter(obj) iter(obj) +横棒グラフをペルー色として描画する plt.barh(データ列x, データ列y, color='peru') plt.barh(データ列x, データ列y, color='peru') +データフレームの欠損値を平均で補う df.fillna(df.mean()) df.fillna(df.mean()) +小数点数の正接を求める math.tan(x) math.tan(x) +option: 三角マーカーを使用する marker = '^' marker = '^' +ある列の値がx以上y未満の行を抽出する df[(x <= y)] df[(x <= df['列A']) & (df['列A'] < y)] +箱ひげ図を描画し、、平均線を加える plt.boxplot(データ列, meanline=True) plt.boxplot(データ列, meanline=True) +ベージュにヒストグラムの色を指定する plt.hist(データ列, color='beige') plt.hist(データ列, color='beige') +option: 右三角印を用いる marker = '>' marker = '>' +折れ線グラフのアルファを設定する plt.plot(データ列x, データ列y, color='a') plt.plot(データ列x, データ列y, alpha=0.5) +データフレームの指定したカラムが正規分布からどの程度歪んでいるか見る df['列A'].kurt() df['列A'].kurt() +散布図を赤いダイアモンドマーカーで描画する plt.plot(データ列x, データ列y, marker='D', c='r') plt.plot(データ列x, データ列y, marker='D', c='r') +データフレームのカラムをグループ化してヒストグラムにする sns.histplot(df, x='列名', hue='カテゴリ名') sns.histplot(df, x='列名', hue='カテゴリ名') +マッピングをチェーンマップに変換する collections.ChainMap(aDict) collections.ChainMap(aDict) +データフレームの選択したカラムの分散を算出する df[['列A', '列B']].var() df[['列A', '列B']].var() +部分文字列が文字列の開始位置からと終了位置の間に含まれるか s.find(sub, start, end)!= -1 s.find(sub, start, end) != -1 棒グラフをライトイエロー色として描画する plt.bar(データ列x, データ列y, color='lightyellow') plt.bar(データ列x, データ列y, color='lightyellow') -option: 白を用いる color = 'white' color = 'white' -リストとリストの散布図を描画し、マーカーを下三角に指定する plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') -option: グラフの色をアンティークホワイトにする color = 'antiquewhite' color = 'antiquewhite' -option: アクア色を用いる color = 'aqua' color = 'aqua' -ヒストグラムの色を珊瑚に設定する plt.hist(データ列, color='coral') plt.hist(データ列, color='coral') -データフレームをTSVファイルから読む pd.read_csv(filename, sep='\t') pd.read_csv(filename, sep='\t', encoding='shift_jis') -リストと配列についての散布図に星マーカーを描く plt.plot(データ列x, データ列y, marker='*') plt.plot(データ列x, データ列y, marker='*') -リストの末尾からn番目以前の要素を取り出す aList[:-n] aList[:-n] -データ列の推移を折れ線グラフで描画する plt.plot(range(len(データ列)), データ列) plt.plot(range(len(データ列)), データ列) -データフレームの中のカラムをリストを境界値としてビン分割する pd.cut(df[col], aList) pd.cut(df[col], aList) -カテゴリで色分けしてデータフレームをカウントプロットにする sns.countplot(x='列名', hue='カテゴリ列', data=df) sns.countplot(x='列名', hue='カテゴリ列', data=df) -オブジェクトはリストかタプルか isinstance(obj, (list) isinstance(obj, (list) -データフレームのリストカラムを1000の位で丸めて、整数にする df[aList].round(-3).astype(int) df[aList].round(-3).astype(int) -黄緑にヒストグラムの色を設定する plt.hist(データ列, color='chartreuse') plt.hist(データ列, color='chartreuse') -タプルの要素数 len(aTuple) len(aTuple) -リストとシーケンスを連結する itertools.chain(iterable, iterable2) itertools.chain(iterable, iterable2) -文字列は識別子名か調べる s.isidentifier() s.isidentifier() -Pythonパスにを追加する sys.path.append(os.path.dirname(__file__), dir)) sys.path.append(dir) -横棒グラフをゲインズボロ色を用いて描画する plt.barh(データ列x, データ列y, color='gainsboro') plt.barh(データ列x, データ列y, color='gainsboro') -列を文字列に変換して'改行で連結する '\n'.join(map(str, iterable)) '\n'.join(map(str, iterable)) -option: フォレストグリーンにグラフの色を設定する color = 'forestgreen' color = 'forestgreen' -n個に配列をビン分割する pd.cut(aArray, n) pd.cut(aArray, n) -データフレームを各列毎にグループ化し、、列の標準偏差を求める df.groupby(column)[column2].std() df.groupby(column)[column2].std() -ASCII限定として正規表現で文字列を区切る re.split(pattern, s, flags=re.ASCI) re.split(pattern, s, flags=re.ASCI) -x座標の目盛を非表示にする plt.xticks([]) plt.xticks([]) -8進数文字列をバイト列に変換する int(s, 8).to_bytes(length=bytesize, byteorder='big') int(s, 8).to_bytes(length=bytesize, byteorder='big') -入力ストリームをクローズする f.close() f.close() -データフレームのリストカラムの欠損値を最大値にセットする df[aList].fillna(df[aList].max()) df[aList].fillna(df[aList].max()) -データフレームのカラムの中に文字列と日付データがいくつ含まれるか数える df[col].isin([value, value2]).sum() df[col].isin([value, value2]).sum() -空のキュー collections.deque() collections.deque() -TSVファイルからカンマ区切りのファイルを文字化けしないように読み込む pd.read_csv(filename, encoding='strict') pd.read_csv(filename, encoding='shift_jis') -ファイルに文字列を書く f.write(s) f.write(s) -option: アイボリーに色を設定する color = 'ivory' color = 'ivory' -行列のユニークな要素とそのインデックス aArray, return_index=True u, indices = np.unique(aArray, return_index=True) -データフレームのリストカラムの欠損値を最頻値に指定する df[aList].fillna(df[aList].mode().iloc[0]) df[aList].fillna(df[aList].mode().iloc[0]) -黒い丸マーカーをリストと配列についての散布図に描画する plt.plot(データ列x, データ列y, marker='o', c='k') plt.plot(データ列x, データ列y, marker='o', c='k') -option: マーカーの色をダークレッドにする markerfacecolor = 'darkred' markerfacecolor = 'darkred' -スプリンググリーン色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='springgreen') plt.plot(データ列x, データ列y, color='springgreen') -データフレームをランダムサンプリングする df.sample() df.sample() -option: グラフを実線に設定する linestyle ='solid' linestyle = 'solid' -散布図をシアン色を用いて描画する plt.scatter(データ列x, データ列y, color='cyan') plt.scatter(データ列x, データ列y, color='cyan') -整数個からk個取り出した時の順列の総数 math.perm(n, k) math.perm(n, k) -option: シルバー色を使用する color ='silver' color = 'silver' -全句読点文字 string.punctuation string.punctuation -折れ線グラフの色をディープスカイブルーに変更する plt.plot(データ列x, データ列y, color='deepskyblue') plt.plot(データ列x, データ列y, color='deepskyblue') -タプルを集合に変換する set(aTuple) set(iterable) -ダークマゼンタ色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='darkmagenta') plt.barh(データ列x, データ列y, color='darkmagenta') -ディムグレー色としてヒストグラムを描画する plt.hist(データ列, color='dimgray') plt.hist(データ列, color='dimgrey') -データフレームの列名一覧で指定された列を消す df.drop(columns, axis=1) df.drop(columns, axis=1) -青い一点鎖線でデータ列の推移をプロットする plt.plot(データ列x, データ列y, linestyle='dashbot', color='b') plt.plot(データ列x, データ列y, linestyle='dashbot', color='b') -ディムグレー色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='dimgray') plt.plot(データ列x, データ列y, color='dimgray') -散布図に丸マーカーを加える plt.scatter(データ列x, データ列y, marker='o') plt.scatter(データ列x, データ列y, marker='o') -1行だけ標準入力から読み込んで改行を取り除く sys.stdin.readline().rstrip() sys.stdin.readline().rstrip() -データフレームの列名を指定された列名一覧に置き換える df.columns = columns df.columns = columns -小数点数の余弦 math.cos(x) math.cos(x) -折れ線グラフの色をアリスブルーに指定する plt.plot(データ列x, データ列y, color='aliceblue') plt.plot(データ列x, データ列y, color='aliceblue') -配列と配列についての散布図に赤い左三角マーカーをプロットする plt.plot(データ列x, データ列y, marker='<', c='r') plt.plot(データ列x, データ列y, marker='<', c='r') -黒い星マーカーを散布図に描画する plt.scatter(データ列x, データ列y, marker='*', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='*', markerfacecolor='k') -線グラフの色を青紫に指定する plt.plot(データ列x, データ列y, color='violet') plt.plot(データ列x, データ列y, color='violet') -縦方向に二つのデータフレームを連結する pd.concat([df, df2]) pd.concat([df, df2]) -option: ミディアムパープル色を用いる color ='mediumpurple' color = 'mediumpurple' -エポック秒からタイムスタンプにする datetime.datetime.fromtimestamp(timestamp) datetime.datetime.fromtimestamp(timestamp) -バリーウッド色として棒グラフを描画する plt.bar(データ列x, データ列y, color='burlywood') plt.bar(データ列x, データ列y, color='burlywood') -縦棒グラフをプロットして、中央寄せする plt.bar(ラベル列, データ列, align='center') plt.bar(ラベル列, データ列, align='center') -predicateFuncがTrueとなるイテラブルの要素 itertools.takewhile(predicateFunc, iterable) itertools.dropwhile(predicateFunc, iterable) -ヒストグラムの描き、、正規化する plt.hist(データ列, density=True) plt.hist(データ列, density=True) -日付データをISO8601書式の文字列にする aDate.isoformat() aDate.isoformat() -実数の値が整数 math.floor(x) x.is_integer() -データ列の四分位を描画する plt.boxplot(データ列) plt.boxplot(データ列) -デピンク色として棒グラフを描画する plt.bar(データ列x, データ列y, color='deeppink') plt.bar(データ列x, データ列y, color='deeppink') -キューの要素をインプレースに反転する deq.reverse() deq.reverse() -データフレームを二つの列によってソートしてNaNを先頭にする df.sort_values(by=['A', 'B'], na_position='first') df.sort_values(by=['A', 'B'], na_position='first') -線グラフを紺色で描画する plt.plot(データ列x, データ列y, color='darkblue') plt.plot(データ列x, データ列y, color='darkblue') -option: ディムグレーにグラフの色を設定する color = 'dimgray' color = 'dimgrey' -グラフにx=0の破線をつける plt.axvline(x=0, linestyle='dashed') plt.axvline(x=0, linestyle='dashed') -スチールブルー色で線グラフを描画する plt.plot(データ列x, データ列y, color='steelblue') plt.plot(データ列x, データ列y, color='steelblue') -nが負の整数 n < 0 n < 0 -実数のコサインを算出する math.cos(x) math.cos(x) -ダークスレートブルー色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='darkslateblue') plt.barh(データ列x, データ列y, color='darkslateblue') -xの小数点以下'4'桁まで表示する print(':.4f'.format(x)) print(':.4f'.format(x)) -縦棒グラフをダークグレー色で描画する plt.bar(データ列x, データ列y, color='darkgrey') plt.bar(データ列x, データ列y, color='darkgray') -データフレームを列を用いてソートし、、上位n件を取り出す df.sort_values(columns).head(n) df.sort_values(columns).head(n) -余弦 math.cos(x) math.cos(x) -option: ライトグリーンにグラフの色を設定する color = 'lightgreen' color = 'lightgreen' -線グラフを貝殻色で描画する plt.plot(データ列x, データ列y, color='seashell') plt.plot(データ列x, データ列y, color='seashell') -ファイルパスを追加モードでオープンして]、fとする f = open(filepath, mode='a') f = open(filepath, mode='a') -列でデータフレームを並べ、、新しいインデックスを加える df.sort_values(columns).reset_index() df.sort_values(columns).reset_index() -データ列を横に並べて柱状グラフにする plt.hist([データ列, データ列], color=['b', 'r']) plt.hist([データ列, データ列], color=['b', 'r']) -青緑色の散布図を描画する plt.scatter(データ列x, データ列y, color='turquoise') plt.scatter(データ列x, データ列y, color='turquoise') -縦棒グラフを黄色くする plt.bar(データ列x, データ列y, color='y') plt.bar(データ列x, データ列y, color='y') -部分文字列によって文字列を区切る s.split(sub) s.split(sub) -データフレームを各列と列の組み合わせ毎に集約し、、最小値を計算する df.groupby([column, column2], as_index=False).min() df.groupby([column, column2], as_index=False).min() -タプルの要素数を見る len(aTuple) len(aTuple) -リストを等しい量になるように分割数nで分割する pd.qcut(aList, n) pd.qcut(aList, n) -option: ナバホホワイト色を用いる color = 'navajowhite' color = 'navajowhite' -データフレームを各列と列の組み合わせ毎にグループ分けして、最大値を算出する df.groupby([column, column2], as_index=False).max() df.groupby([column, column2], as_index=False).max() -データフレームのインデックスがnの行を取り出す df.index(n) df.loc[n] -散布図の星マーカーを赤色にする plt.scatter(データ列x, データ列y, marker='*', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='*', markerfacecolor='r') -データフレームを二つの列によってによって降順に並べ直す df.sort_values(by=['A', 'B'], ascending=False) df.sort_values(by=['A', 'B'], ascending=False) -カウンタを高頻出方からリストとして得る aCounter.most_common() aCounter.most_common() -縦棒グラフの色をミディアムターコイズにする plt.bar(データ列x, データ列y, color='mediumturquoise') plt.bar(データ列x, データ列y, color='mediumturquoise') -リストとリストについての散布図に下三角マーカーをプロットする plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') -プロットを表示する plt.pyicks() plt.show() -浮動小数点数の符号をコピーにする math.copysign(x, x2) math.copysign(x, x2) -折れ線グラフの星マーカーの太さを変える plt.plot(データ列x, データ列y, marker='*', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='*', markeredgewidth=2.5) -カテゴリ列で色分けして、データフレームを棒プロットにする sns.barplot(x='カテゴリ列', y='列', hue='カテゴリ', data=df) sns.barplot(x='カテゴリ列', y='列名', hue='カテゴリ', data=df) -線グラフの色をダークスラテグレーに設定する plt.plot(データ列x, データ列y, color='darkslategray') plt.plot(データ列x, データ列y, color='darkslategray') -縦棒グラフの色をアクアにする plt.bar(データ列x, データ列y, color='aqua') plt.bar(データ列x, データ列y, color='aqua') -ヒストグラムの色をディムグレーにする plt.hist(データ列, color='dimgrey') plt.hist(データ列, color='dimgrey') -ミディアムターコイズ色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='mediumturquoise') plt.plot(データ列x, データ列y, color='mediumturquoise') -データフレームのカラムの欠損値を後の行の値で埋める df[col].fillna(method='bfill') df[col].fillna(method='bfill') -折れ線グラフのクロスマーカーの色を変える plt.plot(データ列x, データ列y, marker='x', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='x', markerfacecolor='#800080') -データフレームのデータ型のリスト df.dtypes df.dtypes -二つの列によってデータフレームを昇順にソートして、更新する df.sort_values(by=['A', 'B'], ascending=True, inplace=True) df.sort_values(by=['A', 'B'], ascending=True, inplace=True) -日付時刻データがタイムスタンプデータより前 aDatetime < aDatetime2 aDatetime < aDatetime2 -散布図を貝殻色を用いて描画する plt.scatter(データ列x, データ列y, color='seashell') plt.scatter(データ列x, データ列y, color='seashell') -ロージーブラウン色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='rosybrown') plt.barh(データ列x, データ列y, color='rosybrown') -線グラフの色をダークグレーに変更する plt.plot(データ列x, データ列y, color='darkgray') plt.plot(データ列x, データ列y, color='darkgrey') -散布図を四角マーカーで描画する plt.plot(データ列x, データ列y, marker='s') plt.plot(データ列x, データ列y, marker='s') -偽陰性を抑えたい指標を使う sklearn.metrics.precision_score(正解データ列, 予測データ列) sklearn.metrics.recall_score(正解データ列, 予測データ列) -option: ラベンダーブラッシュを用いる color = 'lavenderblush' color = 'lavenderblush' -データ列は何時か調べる ds.dt.hour ds.dt.hour -日付データは日付データより前 aDate < aDate2 aDate < aDate2 -データフレームのカラムのNaNをxに変更する df[col].fillna(x) df[col].fillna(x) -箱ひげ図を描画し、、平均を加える plt.boxplot(データ列, showmeans=True) plt.boxplot(データ列, showmeans=True) -データフレームのn番目の行を取り出す df.loc[n] df.loc[n] -部分文字列かどうか調べる sub in s sub in s -名前からカラーマップを見る "plt.get_cmap(""カラーマップ名"")" "plt.get_cmap(""カラーマップ名"")" -散布図の下三角マーカーの線幅を指定する plt.scatter(データ列x, データ列y, marker='v', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='v', markeredgewidth=2.5) -線グラフの色をドジャーブルーに指定する plt.plot(データ列x, データ列y, color='dodgerblue') plt.plot(データ列x, データ列y, color='dodgerblue') -データフレームの列名を指定された名前リストに置き換える df.columns = columns df.columns = columns -回帰木分析を行う model = sklearn.tree.DecisionTreeRegressor() model = sklearn.tree.DecisionTreeRegressor() -option: フォントの色をミディアムシアグリーンに設定する color ='mediumseagreen' color = 'mediumseagreen' -パープル色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='purple') plt.barh(データ列x, データ列y, color='purple') -線グラフの色をピーチパフに設定する plt.plot(データ列x, データ列y, color='peachpuff') plt.plot(データ列x, データ列y, color='peachpuff') -データフレームのリストカラムの文字列を欠損値にする df[aList].replace(s, np.nan) df[aList].replace(s, np.nan) -オブジェクトは集合クラスのインスタンス isinstance(obj, set) isinstance(obj, set) -オブジェクトにフィールドがあるかテストする hasattr(obj, プロパティ名) hasattr(obj, プロパティ名) -ケンドールでデータフレームのリスト列の相関行列 df[aList].corr(method='kendall') df[aList].corr(method='kendall') -xが1、もしくは2かどうか x == 1 or x == 2 x == 1 or x == 2 -データ列の中央値を求める ds.median() ds.median() -棒グラフをディムグレー色として描画する plt.bar(データ列x, データ列y, color='dimgrey') plt.bar(データ列x, デ���タ列y, color='dimgrey') -データフレームの列の文字列が文字列で終わる行を選ぶ df[df[column].str.endswith(s)] df[df[column].str.endswith(s)] -option: フォントの色をベージュに設定する color = 'beige' color = 'beige' -横棒プロットを積み上げにする plt.barh(ラベル列, データ列, bottom=データ列y, color='#800080') plt.barh(ラベル列, データ列, bottom=データ列y, color='#800080') -タイムスタンプデータにn日を加える aDatetime + datetime.timedelta(days=n) aDatetime + datetime.timedelta(days=n) -データフレームから型リストで指定されたデータ型の列のみ除外する df.select_dtypes(exclude=typeList) df.select_dtypes(exclude=typeList) -破壊的にデータフレームを複数の列によってで並べる df.sort_values(by=column, inplace=True) df.sort_values(by=column, inplace=True) -横棒グラフをミディアムシアグリーン色として描画する plt.barh(データ列x, データ列y, color='mediumseagreen') plt.barh(データ列x, データ列y, color='mediumseagreen') -青緑色の横棒グラフを描画する plt.barh(データ列x, データ列y, color='teal') plt.barh(データ列x, データ列y, color='turquoise') -ネイビー色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='navy') plt.plot(データ列x, データ列y, color='navy') -リストから重複なく、n要素ランダムに選ぶ random.sample(iterable, k=n) random.sample(iterable, k=n) -縦棒グラフの色をパールバイオレットレッドにする plt.bar(データ列x, データ列y, color='palevioletred') plt.bar(データ列x, データ列y, color='palevioletred') -グラフのフォントを日本語表示に指定する sns.set(font='IPAexGothic') sns.set(font='IPAexGothic') -データフレームの欠損値をモードで埋める df.fillna(df.mode().iloc[0]) df.fillna(df.mode().iloc[0]) -折れ線グラフのクロス印の大きさを変える plt.plot(データ列x, データ列y, marker='x', markersize=2.0) plt.plot(データ列x, データ列y, marker='x', markersize=2.0) -予測結果の適合率を求める sklearn.metrics.precision_score(正解データ列, 予測データ列) sklearn.metrics.precision_score(正解データ列, 予測データ列) -nはn2か調べる n == n2 n == n2 -データフレームを'A'列によって小さい順にソートして、更新する df.sort_values(by='A', ascending=True, inplace=True) df.sort_values(by='A', ascending=True, inplace=True) -クラス分類をブースティングで行う model = sklearn.ensemble.HistGradientBoostingClassifier() model = sklearn.ensemble.AdaBoostClassifier(random_state=0, n_estimators=100) -グラフのパレットを指定する sns.set(pallete=パレット名) sns.set(pallete=パレット名) -横棒グラフをダークスレートブルー色として描画する plt.barh(データ列x, データ列y, color='darkslateblue') plt.barh(データ列x, データ列y, color='darkslateblue') -折れ線グラフの色をシルバーに変更する plt.plot(データ列x, データ列y, color='silver') plt.plot(データ列x, データ列y, color='silver') -リストの最初のオブジェクトを探す aList.index(element) aList.index(element) -要素がセットに含まれるか調べる element in aSet element in aSet -ピアソン相関係数としてデータフレームの相関行列 df.corr(method='pearson') df.corr(method='pearson') -散布図の印を赤くする plt.scatter(データ列x, データ列y, markerfacecolor='r') plt.scatter(データ列x, データ列y, markerfacecolor='r') -切り下げて整数に変換する math.ceil(x) math.floor(x) -データフレームのリスト列を丸めて、整数型にする df[aList].round().astype(int) df[aList].round().astype(int) -アンティークホワイト色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='antiquewhite') plt.bar(データ列x, データ列y, color='antiquewhite') -折れ線グラフの丸印の線幅を変更する plt.plot(データ列x, データ列y, marker='o', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='o', markeredgewidth=2.5) -ラインを一点鎖線に設定する plt.plot(データ列x, データ列y, linestyle='dashbot') plt.plot(データ列x, データ列y, linestyle='dashbot') -データフレームのカラムの値をValueMapでまとめて置換する df[col].replace(ValueMap) df[col].replace(ValueMap) -縦棒グラフの色をスチールブルーにする plt.bar(データ列x, データ列y, color='steelblue') plt.bar(データ列x, データ列y, color='steelblue') -実行時の標準出力の出力先がターミナルか os.isatty(sys.stdin.fileno()) sys.stdout.isatty() -option: グラフの色をミディアムスプリンググリーンに変更する color ='mediumspringgreen' color = 'mediumspringgreen' -空の回帰木モデルを用意する model = sklearn.tree.DecisionTreeRegressor() model = sklearn.tree.DecisionTreeRegressor() -ミディアムスレートブルー色としてヒストグラムを描画する plt.hist(データ列, color='mediumslateblue') plt.hist(データ列, color='mediumslateblue') -データフレームのリストカラムの未入力値を後の値に設定する df[aList].fillna(method='bfill') df[aList].fillna(method='bfill') -ダーク・スラテグレー色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='darkslategrey') plt.plot(データ列x, データ列y, color='darkslategrey') -デピンク色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='deeppink') plt.barh(データ列x, データ列y, color='deeppink') -文字列を評価する s.mean() eval(s) -マッピングを複製する dict(aDict) aDict.copy() -異なる列をキーとして二つのデータフレームを外部ジョインする pd.merge(df, df2, left_on=column, right_on=column2, how='outer') pd.merge(df, df2, left_on=column, right_on=column2, how='outer') -日付時刻データが木曜日か判定する aDatetime.weekday() == 3 aDatetime.weekday() == 3 -等差数列から整数乱数を得る random.randrange(start, end, step) random.randrange(start, end, step) -ファイルを開いて]、追加ストリームを使う open(filepath, mode='a') open(filepath, mode='a') -散布図をrgbの三角マーカーで描画する plt.plot(データ列x, データ列y, marker='^', c=rgb) plt.plot(データ列x, データ列y, marker='^', c=rgb) -オブジェクトがあるクラスのインスタンスか調べる isinstance(obj, クラス) isinstance(obj, クラス) -列のコンビネーションを得る itertools.combinationswith(iterable, n) itertools.combinations(iterable, n) -マルーン色を用いて棒グラフを描画する plt.bar(データ列x, データ列y, color='maroon') plt.bar(データ列x, データ列y, color='maroon') -小数点数の床数 math.floor(x) math.floor(x) -整数が正の数かどうか調べる x > 0 x > 0 -ファイルを文字コードtextで開く] open(filepath, encoding=text) open(filepath, encoding=text) -データフレームから型リストで指定されたデータ型のカラムを抽出する df.select_dtypes(include=typeList) df.select_dtypes(include=typeList) -横棒グラフをアクア色を用いて描画する plt.barh(データ列x, データ列y, color='aqua') plt.barh(データ列x, データ列y, color='aqua') -現在が月曜日 datetime.datetime.today().weekday() == 0 datetime.datetime.today().weekday() == 0 -ピーチパフ色で棒グラフを描画する plt.bar(データ列x, データ列y, color='peachpuff') plt.bar(データ列x, データ列y, color='peachpuff') -マッピングから項目名の値か、もしくは要素を得る aDict.get(key, element) aDict.get(key, element) -整数nを8進文字列に変換する oct(n)[2:] oct(n)[2:] -パパイヤウィップ色で散布図を描画する plt.scatter(データ列x, データ列y, color='papayawhip') plt.scatter(データ列x, データ列y, color='papayawhip') -option: 色をブラックに設定する color = 'black' color = 'black' -2進数文字列を整数に変換する int(s, 16) int(s, 2) -茶色色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='brown') plt.plot(データ列x, データ列y, color='brown') -sepを区切りにして文字列リストをひとつの文字列にする sep.join(aStringList) sep.join(aStringList) -線グラフを実線に設定する plt.plot(データ列x, データ列y, linestyle='solid') plt.plot(データ列x, データ列y, linestyle='solid') -1行から二つの文字列を読む A, B = map(str, input().split()) A, B = map(str, input().split()) -折れ線グラフの色をダークスレートブルーにセットする plt.plot(データ列x, データ列y, color='darkslateblue') plt.plot(データ列x, データ列y, color='darkslateblue') -データ列の値が未入力値か確認する ds.isna() ds.isna() -表データから列を3つ選択する df[[column, column2, column3]] df[[column, column2, column3]] -データ列を千の位で丸めて、整数型にする ds.round(-3).astype(int) ds.round(-3).astype(int) -ヒストグラムをミディアムターコイズ色を用いて描画する plt.hist(データ列, color='mediumturquoise') plt.hist(データ列, color='mediumturquoise') -双方向キューに値をエンキューする deq.appendleft(element) deq.appendleft(element) -赤いダイアモンドマーカーを使って散布図を描画する plt.plot(データ列x, データ列y, marker='D', c='r') plt.plot(データ列x, データ列y, marker='D', c='r') -折れ線グラフの色をダークサーモンに変更する plt.plot(データ列x, データ列y, color='darksalmon') plt.plot(データ列x, データ列y, color='darksalmon') -チョコレート色として縦棒グラフを描画する plt.bar(データ列x, データ列y, color='chocolate') plt.bar(データ列x, データ列y, color='chocolate') -nからstep間隔で無限に数え上げるする fractions.Fraction(start, end=step) itertools.count(start=n, step=step) -集合の更新不能版 aSet.update(iterable) frozenset(aSet) -文字列リストを一つにしてひとつの文字列にする ''.join([map(str, iterable)) ''.join(aStringList) -組の長さ len(aTuple) len(aTuple) -データフレームをグループ化し、各列に対し分散を求める df.groupby(column)[column2].var() df.groupby(column)[column2].var() -インデント幅nで辞書をJSONフォーマットの文字列に変換する json.dumps(aDict, ensure_ascii=False, indent=n) json.dumps(aDict, ensure_ascii=False, indent=n) -青い丸マーカーを散布図に描画する plt.scatter(データ列x, データ列y, marker='o', markerfacecolor='b') plt.scatter(データ列x, データ列y, marker='o', markerfacecolor='b') -赤い下三角マーカーを散布図に使う plt.plot(データ列x, データ列y, marker='v', c='r') plt.plot(データ列x, データ列y, marker='v', c='r') -双方向キューの先頭から要素を削除する deq.popleft() deq.popleft() -処理中の例外を情報 sys.exc_info() sys.exc_info() -ダークオーキッド色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='darkorchid') plt.bar(データ列x, データ列y, color='darkorchid') -データフレームから型の列のみ取り出す df.select_dtypes(ty) df.select_dtypes(ty) -グラフを淡くする sns.set(pallete='muted') sns.set(pallete='muted') -リストとリストについて散布図を描き、、ポイントマーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='.', c=rgb) plt.plot(データ列x, データ列y, marker='.', c=rgb) -配列と配列についての散布図に赤い四角マーカーを描画する plt.plot(データ列x, データ列y, marker='s', c='r') plt.plot(データ列x, データ列y, marker='s', c='r') -option: ミディアムスプリンググリーンにグラフの色を変更する color ='mediumspringgreen' color = 'mediumspringgreen' -ヒストグラムにカラーマップを使用する "plt.hist(データ列x, color=plt.get_cmap(""Spectral""))" "plt.hist(データ列x, color=plt.get_cmap(""Spectral""))" -回帰分析をヒストグラムと勾配ブースティングでする model = sklearn.ensemble.HistGradientBoostingRegressor() model = sklearn.ensemble.HistGradientBoostingRegressor() -タブ区切りのファイルをSJISで読み込む pd.read_csv(filename, encoding='shift_jis') pd.read_csv(filename, encoding='shift_jis') -2つの文字列を辞書順で比較する s < s2 s < s2 -パーセプトロンで回帰分析をする model = sklearn.neural_network.MLPRegressor(hidden_layer_sizes=(10, 10)) model = sklearn.neural_network.MLPRegressor(hidden_layer_sizes=(10, 10)) -ヒストグラムの色をシルバーにセットする plt.hist(データ列, color='silver') plt.hist(データ列, color='silver') -ヒストグラムをスラグレー色を使って描画する plt.hist(データ列, color='slategray') plt.hist(データ列, color='slategrey') -散布図に黒い△マーカーを描画する plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='k') -文字列から部分文字列を消す s.strip(sub) s.replace(sub, '') -配列として列を抽出する np.array(iterable) df[column].values -縦棒グラフをミディアムオーキッド色で描画する plt.bar(データ列x, データ列y, color='mediumorchid') plt.bar(データ列x, データ列y, color='mediumorchid') -データフレームのカラムの欠損値を50パーセンタイルで補う df[col].fillna(df[col].median()) df[col].fillna(df[col].median()) -線グラフの色をライトグレーに変更する plt.plot(データ列x, データ列y, color='lightgrey') plt.plot(データ列x, データ列y, color='lightgray') -nがn2以下、またはn3以上か判定する n <= n2 or n >= n3 n <= n2 or n >= n3 -nが3の倍数か n % 3 == 0 n % 3 == 0 -option: バリーウッド色を用いる color = 'burlywood' color = 'burlywood' -Pandasでデータフレームのcollをタイムスタンプに変換する pd.to_datetime(df[col]) pd.to_datetime(df[col]) -改行で文字列を分割する s.splitlines() s.splitlines() -ファイルがあるか調べる os.path.exists(filepath) os.path.exists(filepath) -実数の双曲線正接の逆数を求める math.atanh(x) math.atanh(x) -マゼンタ色で散布図を描画する plt.scatter(データ列x, データ列y, color='magenta') plt.scatter(データ列x, データ列y, color='magenta') -方程式として数式の変数の解を計算する sympy.solve(e, z) sympy.solve(e, z) -option: ミディアムオーキッド色を使用する color ='mediumorchid' color = 'mediumorchid' -散布図に黒い右三角マーカーを使用する plt.plot(データ列x, データ列y, marker='>', c='k') plt.plot(データ列x, データ列y, marker='>', c='k') -空の両端キューを生成する deq.appendleft(element) collections.deque() -グリーンイエロー色を用いて散布図を描画する plt.scatter(データ列x, データ列y, color='greenyellow') plt.scatter(データ列x, データ列y, color='greenyellow') -黒い星マーカーを配列とリストの散布図に描く plt.plot(データ列x, データ列y, marker='*', c='k') plt.plot(データ列x, データ列y, marker='*', c='k') -ファイルを改行除外して一行ずつ読み込む f.readline() f.readline() -横棒グラフをオールドレース色として描画する plt.barh(データ列x, データ列y, color='oldlace') plt.barh(データ列x, データ列y, color='oldlace') -線グラフをピンク色を用いて描画する plt.plot(データ列x, データ列y, color='pink') plt.plot(データ列x, データ列y, color='pink') -文字列の最初 s[0] s[0] -線グラフの色を青紫にセットする plt.plot(データ列x, データ列y, color='violet') plt.plot(データ列x, データ列y, color='violet') -横棒グラフをダークブルー色で描画する plt.barh(データ列x, データ列y, color='darkblue') plt.barh(データ列x, データ列y, color='darkblue') -縦棒グラフの色をカーキにする plt.bar(データ列x, データ列y, color='khaki') plt.bar(データ列x, データ列y, color='khaki') -散布図をライトスチールブルー色を用いて描画する plt.scatter(データ列x, データ列y, color='lightsteelblue') plt.scatter(データ列x, データ列y, color='lightsteelblue') -option: ダーク・スラテグレーを使う color = 'darkslategrey' color = 'darkslategrey' -変数を黒色でプリントする print(f'\033[30m{value}\033[0m') print(f'\033[30m{value}\033[0m') -ゴーストホワイト色を用いて横棒グラフを描画する plt.barh(データ列x, データ列y, color='ghostwhite') plt.barh(データ列x, データ列y, color='ghostwhite') -パウダーブルー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='powderblue') plt.bar(データ列x, データ列y, color='powderblue') -整数個のものからk個取り出したときの並べ方の総数を求める math.perm(n, k) math.perm(n, k) -棒プロットの色をする plt.bar(ラベル列, データ列, color=rgb) plt.bar(ラベル列, データ列, color=rgb) -棒グラフをダークシアン色として描画する plt.bar(データ列x, データ列y, color='darkcyan') plt.bar(データ列x, データ列y, color='darkcyan') -辞書をインデント幅nのJSON形式の文字列にする json.dumps(aDict, ensure_ascii=False, indent=n) json.dumps(aDict, ensure_ascii=False, indent=n) -オブジェクトは数値 isinstance(obj, (int,float)) isinstance(obj, (int,float)) -リストと配列についての散布図に赤いダイアモンドマーカーをプロットする plt.plot(データ列x, データ列y, marker='D', c='r') plt.plot(データ列x, データ列y, marker='D', c='r') -スプリンググリーン色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='springgreen') plt.bar(データ列x, データ列y, color='springgreen') -リストを青色でプリントできる文字列に変換する f'\033[34m{value}\033[0m' f'\033[34m{value}\033[0m' -MSDで淡く次元に削減する sklearn.manifold.MSD(n_components=三).fit_transform(多次元データ) sklearn.manifold.MSD(n_components=三).fit_transform(多次元データ) -折れ線グラフの色をダークバイオレットに変更する plt.plot(データ列x, データ列y, color='darkviolet') plt.plot(データ列x, データ列y, color='darkviolet') -option: フォントの色をブルーバイオレットに変更する color = 'blueviolet' color = 'blueviolet' -数列とイテラブルの散布図にバツマーカーを描画する plt.plot(データ列x, データ列y, marker='x') plt.plot(データ列x, データ列y, marker='x') -option: ラインを太くする linewidth = 3.0 linewidth = 3.0 -横棒グラフをコーラル色として描画する plt.barh(データ列x, データ列y, color='coral') plt.barh(データ列x, データ列y, color='coral') -文字列の中の大文字・小文字を無視してパターンによるすべてのマッチを使う re.findall(pattern, s, flags=re.IGNORECASE) re.findall(pattern, s, flags=re.IGNORECASE) -整数nの八進数表記 oct(n) oct(n) -ミディアムターコイズ色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='mediumturquoise') plt.plot(データ列x, データ列y, color='mediumturquoise') -option: グラフの色を黄緑に指定する color = 'chartreuse' color = 'chartreuse' -データフレームを各列と列の組み合わせ毎に集約して、最大値を求める df.groupby([column, column2], as_index=False).max() df.groupby([column, column2], as_index=False).max() -バリーウッド色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='burlywood') plt.bar(データ列x, ��ータ列y, color='burlywood') -オレンジレッド色を使って棒グラフを描画する plt.bar(データ列x, データ列y, color='orangered') plt.bar(データ列x, データ列y, color='orangered') -配列とリストについての散布図に赤い丸マーカーを描画する plt.plot(データ列x, データ列y, marker='o', c='r') plt.plot(データ列x, データ列y, marker='o', c='r') -データフレームの重複する行を数える df.duplicated().sum() df.duplicated().sum() -ブースティングでクラス分類をする model = sklearn.ensemble.AdaBoostClassifier(random_state=0, n_estimators=100) model = sklearn.ensemble.AdaBoostClassifier(random_state=0, n_estimators=100) -日付データにn分を加算する aDate + datetime.timedelta(minutes=n) aDate + datetime.timedelta(minutes=n) -文字列の開始位置から先に部分文字列が含まれないか調べる s.find(sub, start) == -1 s.find(sub, start) == -1 -nが偶数 n % 2 == 1 n % 2 == 0 -折れ線グラフの色をレモンシフォンに変更する plt.plot(データ列x, データ列y, color='lemonchiffon') plt.plot(データ列x, データ列y, color='lemonchiffon') -縦棒グラフを小麦色色で描画する plt.bar(データ列x, データ列y, color='wheat') plt.bar(データ列x, データ列y, color='wheat') -フローラルホワイト色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='floralwhite') plt.barh(データ列x, データ列y, color='floralwhite') -option: フォントの色をバイオレットに変更する color = 'violet' color = 'violet' -JSONファイルのファイル入力を辞書にする json.load(fin) json.load(fin) -プロットにy=0の破線を設定する plt.axhline(y=0, linestyle='dashed') plt.axhline(y=0, linestyle='dashed') -要素を両端キューの先頭に追加する deq.appendleft(element) deq.appendleft(element) -辞書をインデント付きで文字列に変換する json.dumps(aDict, ensure_ascii=False, indent=n) json.dumps(aDict, ensure_ascii=False, indent=n) -ロバストな線形分類器を作る model = sklearn.linear_model.HuberClassifier() model = sklearn.linear_model.HuberClassifier() -JSONLファイルにデータフレームをCSVファイルで保存する df.to_csv(filename) df.to_csv(filename) -ヒストグラムの色をブラックに指定する plt.hist(データ列, color='black') plt.hist(データ列, color='black') -nの2進表現 bin(n) bin(n) -2つのタプルをネスト化する collections.ChainMap(aArray, aArray2) collections.ChainMap(aDict, aDict2) -アンティークホワイト色として散布図を描画する plt.scatter(データ列x, データ列y, color='antiquewhite') plt.scatter(データ列x, データ列y, color='antiquewhite') -タプルをnから番号付けする enumerate(aTuple, start=n) enumerate(aTuple, start=n) -オブジェクトは浮動小数点数クラスかテストする isinstance(obj, float) isinstance(obj, float) -折れ線グラフの印を▼にする plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') -オブジェクトをデバッグ向けの文字列にする repr(obj) repr(obj) -グリーン色を用いて棒グラフを描画する plt.bar(データ列x, データ列y, color='green') plt.bar(データ列x, データ列y, color='green') -横方向に二つのデータフレームをマージする pd.merge(df, df2) pd.merge(df, df2) -あらかじめASCII限定として正規表現をコンパイルする re.compile(pattern, flag=re.ASCI) re.compile(pattern, flag=re.ASCI) -option: ダークゴールデンロッドに色を指定する color = 'darkgoldenrod' color = 'darkgoldenrod' -折れ線グラフをスレートブルー色として描画する plt.plot(データ列x, データ列y, color='slateblue') plt.plot(データ列x, データ列y, color='slateblue') -ミディアムスプリンググリーン色で散布図を描画する plt.scatter(データ列x, データ列y, color='mediumspringgreen') plt.scatter(データ列x, データ列y, color='mediumspringgreen') -stringモジュールをインポートする import string import string -散布図の▼マーカーの線幅を変更する plt.scatter(データ列x, データ列y, marker='v', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='v', markeredgewidth=2.5) -一点鎖線にヒストグラムのスタイルを設定する plt.hist(データ列, linestyle='dashbot') plt.hist(データ列, linestyle='dashbot') -リストと数列についての散布図を大きさnで描画する plt.scatter(データ列x, データ列y, s=n) plt.scatter(データ列x, データ列y, s=n) -文字列が空白文字か s.isspace() s.isspace() -配列とリストについての散布図にrgbのポイントマーカーを描画する plt.plot(データ列x, データ列y, marker='.', c=rgb) plt.plot(データ列x, データ列y, marker='.', c=rgb) -ミディアムスプリンググリーン色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='mediumspringgreen') plt.plot(データ列x, データ列y, color='mediumspringgreen') -リストと数列についての散布図に黒い大バツマーカーを描画する plt.plot(データ列x, データ列y, marker='X', c='k') plt.plot(データ列x, データ列y, marker='X', c='k') -二つ並べてデータ列を箱ひげ図にする plt.boxplot([データ列, データ列]) plt.boxplot([データ列, データ列]) -折れ線グラフをライトスチールブルー色として描画する plt.plot(データ列x, データ列y, color='lightsteelblue') plt.plot(データ列x, データ列y, color='lightsteelblue') -散布図に大バツマーカーを加える plt.scatter(データ列x, データ列y, marker='X') plt.scatter(データ列x, データ列y, marker='X') -ライトグレー色で散布図を描画する plt.scatter(データ列x, データ列y, color='lightgray') plt.scatter(データ列x, データ列y, color='lightgray') -折れ線グラフをオリーブ色として描画する plt.plot(データ列x, データ列y, color='olive') plt.plot(データ列x, データ列y, color='olive') -データフレームのリストカラムの空文字をNaNに変換しドロップする df[aList].replace('', np.nan).dropna() df[aList].replace('', np.nan).dropna() -散布図の色を黄緑にする plt.scatter(データ列x, データ列y, color='chartreuse') plt.scatter(データ列x, データ列y, color='chartreuse') -タプルの文字列が最初に見つかるインデックスを探す aTuple.index(element) aTuple.index(element) -データフレームからランダムに一行抽出する df.sample() df.sample() -データフレームから列を三つだけ選択する df[[column, column2, column3]] df[[column, column2, column3]] -カウンタを少ない方からリストとして得る aCounter.most_common()[::-1] aCounter.most_common()[::-1] -折れ線グラフのバツ印の太さを変更する plt.plot(データ列x, データ列y, marker='x', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='x', markeredgewidth=2.5) -配列を列方向に連結する np.concatenate([aArray, aArray2], axis=1) np.concatenate([aArray, aArray2], axis=0) -青紫色で線グラフを描画する plt.plot(データ列x, データ列y, color='violet') plt.plot(データ列x, データ列y, color='violet') -折れ線グラフの△マーカーを赤色にする plt.plot(データ列x, データ列y, marker='^', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='^', markerfacecolor='r') -カウンタをシーケンスをカウントして、更新する aCounter.update(iterable) aCounter.update(iterable) -option: 書き込み用に指定する color = 'w' mode = 'w' -option: データ型としてブール型を用いる dtype = np.int32 dtype = np.int32 -オールドレース色として散布図を描画する plt.scatter(データ列x, データ列y, color='oldlace') plt.scatter(データ列x, データ列y, color='oldlace') -黒色で実行結果をプリントする print(f'\033[30m{value}\033[0m') print(f'\033[30m{value}\033[0m') -ひとつでも大文字が文字列内にあるか調べる any(c.isupper() for c in s) any(c.isupper() for c in s) -リストとイテラブルをzipする itertools.zip_longest(iterable, iterable2) itertools.zip_longest(iterable, iterable2) -リストを昇順にソートする sorted(aList, reverse=True) sorted(aList, reverse=False) -データ列が正規分布に従うかどうか仮説検定する scipy.stats.shapiro(データ列) scipy.stats.shapiro(データ列) -データフレームを2つの列の値でグループ化して、列挙する [(name, group) for name, group in df.groupby(['A', 'B'])] [(name, group) for name, group in df.groupby(['A', 'B'])] -青い点線を用いてデータ列の推移を描く plt.plot(データ列x, データ列y, linestyle='dotted', color='b') plt.plot(データ列x, データ列y, linestyle='dotted', color='b') -棒グラフをオレンジレッド色を用いて描画する plt.bar(データ列x, データ列y, color='orangered') plt.bar(データ列x, データ列y, color='orangered') -ヒストグラムでカラーマップを用いる "plt.hist(データ列x, color=plt.get_cmap(""Spectral""))" "plt.hist(データ列x, color=plt.get_cmap(""Spectral""))" -混同行列を求める 混同行列 = sklearn.混同行列 = sklearn.metrics.confusion_matrix(混同行列, データ列2) 混同行列 = sklearn.metrics.confusion_matrix(正解データ列, 予測データ列) -option: ゲインズボロを用いる color = 'gainsboro' color = 'gainsboro' -オリベドラブ色でヒストグラムを描画する plt.hist(データ列, color='olivedrab') plt.hist(データ列, color='olivedrab') -option: フォントの色をダークカーキに設定する color = 'darkkhaki' color = 'darkkhaki' -こんにちは世界をプリントする print() print('Hello World') -日付データが日付データより前 aDate < aDate2 aDate < aDate2 -���クトルの平均値 np.mean(aArray) np.mean(aArray) -縦棒グラフの色をピーチパフにする plt.bar(データ列x, データ列y, color='peachpuff') plt.bar(データ列x, データ列y, color='peachpuff') -追加できるように文字列の示すエンコーディングで既存のファイルを開く] open(filepath, mode='a', encoding=s) open(filepath, mode='a', encoding=s) -列の重複組み合せ df.set_index(iterable) itertools.combinations_with_replacement(iterable, n) -ライトブルー色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='lightblue') plt.plot(データ列x, データ列y, color='lightblue') -option: 最初の行をヘッダに設定する header = None header = 0 -nで乱数生成系列を初期化する random.seed(n) random.seed(n) -入力から二つの整数を取り出す A, B = map(int, input().split()) A, B = map(int, input().split()) -タプルの項目名の値 aDict[key] aDict[key] -空のマップ {} {} -折れ線グラフをパウダーブルー色として描画する plt.plot(データ列x, データ列y, color='powderblue') plt.plot(データ列x, データ列y, color='powderblue') -サーモン色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='salmon') plt.barh(データ列x, データ列y, color='salmon') -タプルの中の一番小さい値 min(aTuple) min(aTuple) -線グラフの色をグリーンイエローに設定する plt.plot(データ列x, データ列y, color='greenyellow') plt.plot(データ列x, データ列y, color='greenyellow') +部分文字列で文字列を二分し、先頭の文字列を使う s.partition(sub)[0] s.partition(sub)[0] +ある列のカテゴリごとの合計を求める df.groupby('列A').sum() df.groupby('列A').sum() +データフレームをダミー変数に変換する pd.get_dummies(df) pd.get_dummies(df) +散布図をrgbのバツマーカーでプロットする plt.plot(データ列x, データ列y, marker='x', c=rgb) plt.plot(データ列x, データ列y, marker='x', c=rgb) +リストの重複コンビネーション sorted(aList, key=n) itertools.combinations_with_replacement(iterable, n) +二つのデータフレームを異なる列をキーとして右ジョインする pd.merge(df, df2, left_on='列A', right_on='列B', how='right') pd.merge(df, df2, left_on='列A', right_on='列B', how='right') +マッピングをネスト化する collections.ChainMap(aDict) collections.ChainMap(aDict) +実行時の標準出力の出力先がターミナルかどうか os.isatty() sys.stdout.isatty() +ダークカーキ色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='darkkhaki') plt.plot(データ列x, データ列y, color='darkkhaki') +イテラブルのイミュータブルな集合を使う frozenset(iterable) frozenset(iterable) +グラフの色を濃くする sns.set(pallete='deep') sns.set(pallete='deep') +マップを複製する dict(zip(aDict) aDict.copy() +青緑色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='teal') plt.barh(データ列x, データ列y, color='teal') +実行時の標準出力の出力先がターミナルかどうか調べる os.isatty(sys.stdin.fileno()) sys.stdout.isatty() +ライトグリーン色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='lightgreen') plt.barh(データ列x, データ列y, color='lightseagreen') +option: 珊瑚色を使用する color = 'coral' color = 'coral' +あるカラムの値がx以上、y未満の行を抽出する df[(x <= df['列A']) & (df['列A'] <= y)] df[(x <= df['列A']) & (df['列A'] < y)] +オブジェクトは文字列型か調べる isinstance(obj, str) isinstance(obj, str) +データフレームから指定したデータ型の列名一覧 df.select_dtypes(型).columns df.select_dtypes(型).columns +二つの文字列は同じかどうか s == s2 s == s2 +文字列の開始位置と終了位置の間に部分文字列が含まれるかどうか s.find(sub, start, end) == -1 s.find(sub, start, end) != -1 +データフレームのカラムのKurtosisを求める scipy.stats.kurtosis(df['列A'], bias=False) scipy.stats.kurtosis(df['列A'], bias=False) +右にn個分双方向キューのデータをローテンションする deq.rotate(n) deq.rotate(n) +折れ線グラフに青い四角印を描画する plt.plot(データ列x, データ列y, marker='s', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='s', markerfacecolor='b')