File size: 132,451 Bytes
87c9e6c 6f674a4 87c9e6c 6f674a4 87c9e6c 6f674a4 87c9e6c 6f674a4 87c9e6c 6f674a4 87c9e6c |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 583 584 585 586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 645 646 647 648 649 650 651 652 653 654 655 656 657 658 659 660 661 662 663 664 665 666 667 668 669 670 671 672 673 674 675 676 677 678 679 680 681 682 683 684 685 686 687 688 689 690 691 692 693 694 695 696 697 698 699 700 701 702 703 704 705 706 707 708 709 710 711 712 713 714 715 716 717 718 719 720 721 722 723 724 725 726 727 728 729 730 731 732 733 734 735 736 737 738 739 740 741 742 743 744 745 746 747 748 749 750 751 752 753 754 755 756 757 758 759 760 761 762 763 764 765 766 767 768 769 770 771 772 773 774 775 776 777 778 779 780 781 782 783 784 785 786 787 788 789 790 791 792 793 794 795 796 797 798 799 800 801 802 803 804 805 806 807 808 809 810 811 812 813 814 815 816 817 818 819 820 821 822 823 824 825 826 827 828 829 830 831 832 833 834 835 836 837 838 839 840 841 842 843 844 845 846 847 848 849 850 851 852 853 854 855 856 857 858 859 860 861 862 863 864 865 866 867 868 869 870 871 872 873 874 875 876 877 878 879 880 881 882 883 884 885 886 887 888 889 890 891 892 893 894 895 896 897 898 899 900 901 902 903 904 905 906 907 908 909 910 911 912 913 914 915 916 917 918 919 920 921 922 923 924 925 926 927 928 929 930 931 932 933 934 935 936 937 938 939 940 941 942 943 944 945 946 947 948 949 950 951 952 953 954 955 956 957 958 959 960 961 962 963 964 965 966 967 968 969 970 971 972 973 974 975 976 977 978 979 980 981 982 983 984 985 986 987 988 989 990 991 992 993 994 995 996 997 998 999 1000 1001 |
小数点数の指数部を求める math.frexp(x)[1] math.frexp(x)[1]
集合から要素を除く aSet.discard(element) aSet.remove(element)
実数を整数で割った余り x // y x % y
データフレームのあるカラムを百の位で丸めて整数型にする df['列A'].round(-2).astype(int) df['列A'].round(-2).astype(int)
文字列を両端キューの先頭につけ加える deq.appendleft(element) deq.appendleft(element)
option: グラフの色をダークレッドに設定する color = 'darkred' color = 'darkred'
カラムの欠損値をxに指定する df['列A'].fillna(x) df['列A'].fillna(x)
配列の列ごとの最大値 np.max(aArray, axis=0) np.max(aArray, axis=0)
後ろから空白で文字列を区切る s.rsplit() s.rsplit()
横棒グラフをブルーバイオレット色として描画する plt.barh(データ列x, データ列y, color='blueviolet') plt.barh(データ列x, データ列y, color='blueviolet')
整数nを符号付きでバイナリに変換する n.to_bytes((n.bit_length() + 7) // 8, byteorder='big', signed=True) n.to_bytes((n.bit_length() + 7) // 8, byteorder='big', signed=True)
マッピングのキーとその項目をペアとして取り出す aDict.items() aDict.items()
option: 淡いピンク色色を使用する color = 'lightpink' color = 'lightpink'
二つの列によってデータフレームをグループ分けしてグループ名を列挙する [name for name, _ in df.groupby(['列A', '列B'])] [name for name, _ in df.groupby(['列A', '列B'])]
ゴールデンロッドにヒストグラムの色を設定する plt.hist(データ列, color='goldenrod') plt.hist(データ列, color='goldenrod')
データシリーズの秒を使う ds.dt.second ds.dt.second
折れ線グラフの右三角マーカーを赤色にする plt.plot(データ列x, データ列y, marker='>', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='>', markerfacecolor='r')
パールゴールデンロッドにヒストグラムの色を設定する plt.hist(データ列, color='palegoldenrod') plt.hist(データ列, color='palegoldenrod')
縦棒グラフをクリムゾン色で描画する plt.bar(データ列x, データ列y, color='crimson') plt.bar(データ列x, データ列y, color='crimson')
シアン色として線グラフを描画する plt.plot(データ列x, データ列y, color='cyan') plt.plot(データ列x, データ列y, color='cyan')
実行結果をマゼンタにする int(context='muted') f'\033[35m{value}\033[0m'
折れ線グラフを青い実線を用いて描画する plt.plot(データ列x, データ列y, linestyle='solid', color='b') plt.plot(データ列x, データ列y, linestyle='solid', color='b')
ロバスト推定としてクラス分類をする model = sklearn.linear_model.RANSACClassifier(random_state=0) model = sklearn.linear_model.RANSACClassifier(random_state=0)
ベクトルの要素ごとの最大公約数 np.gcd(aArray, aArray2) np.gcd(aArray, aArray2)
option: オレンジレッドにフォントの色を設定する color = 'orangered' color = 'orangered'
青い大バツマーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='X', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='X', markerfacecolor='b')
カーネル密度分布を描画する sns.kdeplot(x='列名', hue='カテゴリ列', data=df) sns.kdeplot(x='列名', hue='カテゴリ列', data=df)
option: 黄緑を使う color = 'chartreuse' color = 'chartreuse'
オレンジレッド色として棒グラフを描画する plt.bar(データ列x, データ列y, color='orangered') plt.bar(データ列x, データ列y, color='orangered')
行列の要素ごとの最小公倍数 np.quantile(aArray, aArray2) np.lcm(aArray, aArray2)
線グラフの色を紺碧にセットする plt.plot(データ列x, データ列y, color='azure') plt.plot(データ列x, データ列y, color='azure')
データフレームのあるカラムを千の位で丸める df['列A'].round(-3) df['列A'].round(-3)
折れ線グラフのポイントマーカーの色を設定する plt.plot(データ列x, データ列y, marker='.', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='.', markerfacecolor='#800080')
赤いマーカーを散布図に描画する plt.scatter(データ列x, データ列y, markerfacecolor='r') plt.scatter(データ列x, データ列y, markerfacecolor='r')
入力から二つの実数を読む A, B = map(float, input().split()) A, B = map(float, input().split())
データシリーズの未入力値を平均に設定する ds.fillna(ds.mean()) ds.fillna(ds.mean())
列のコンビネーション itertools.combinations(iterable, n) itertools.combinations(iterable, n)
2つの変数をそれぞれ定義する x, y = y, x x, y = i, j
文字列はリストに含まれないかどうか調べる element not in aList element not in aList
両端キューに値をenqueueする deq.pop() deq.appendleft(element)
ファイルからストリームをオープンして]fileとする file = open(filepath, mode='w') file = open(filepath)
データ列の変化を実線で描画する plt.plot(データ列x, データ列y, linestyle='solid') plt.plot(データ列x, データ列y, linestyle='solid')
縦棒グラフをライトイエロー色で描画する plt.bar(データ列x, データ列y, color='lightyellow') plt.bar(データ列x, データ列y, color='lightyellow')
タイタニックのデータセットからデータフレームを読み込む df = sns.load_dataset('titanic') df = sns.load_dataset('titanic')
積み上げ棒グラフを描く plt.bar(ラベル列, データ列, bottom=データ列y, color='#800080') plt.bar(ラベル列, データ列, bottom=データ列y, color='#800080')
青いバツマーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='x', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='x', markerfacecolor='b')
文字列の終了位置以前に部分文字列が含まれないかどうか s.find(sub, 0, end) == -1 s.find(sub, 0, end) == -1
実数の双曲線正弦の逆数を求める math.asinh(x) math.asinh(x)
データフレームの最初5行 df.head(5) df.head(5)
縦棒グラフをスラグレー色として描画する plt.bar(データ列x, データ列y, color='slategrey') plt.bar(データ列x, データ列y, color='slategray')
SJISでファイルをオープンする] open(filepath, encoding='shift_jis') open(filepath, encoding='shift_jis')
データフレームをある列によって整列してNaNを先頭にする df.sort_values(by='列A', na_position='first') df.sort_values(by='列A', na_position='first')
今日の曜日を整数で使う datetime.datetime.today().weekday() datetime.datetime.today().weekday()
赤い左三角マーカーを用いて散布図を描画する plt.plot(データ列x, データ列y, marker='<', c='r') plt.plot(データ列x, データ列y, marker='<', c='r')
option: 色をロージーブラウンに変更する color = 'rosybrown' color = 'rosybrown'
データフレームをTSVファイルで出力する df.to_csv('file.tsv', sep='\t') df.to_csv('file.tsv', sep='\t')
シャルトリューズ色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='chartreuse') plt.plot(データ列x, データ列y, color='chartreuse')
文字列の左側から空白を除く s.lstrip('\ ') s.lstrip()
横方向に2つのデータフレームを合体させる pd.concat([df, df2, df3], axis=1) pd.concat([df, df2], axis=1)
改行を取り除いて1行だけ標準入力から読み込む sys.stdin.readline().rstrip() sys.stdin.readline().rstrip()
シーケンスを文字列リストに変換して、'改行で連結する '\n'.join(map(str, iterable)) '\n'.join(map(str, iterable))
行列の列ごとの標準偏差を求める np.std(aArray, axis=0) np.std(aArray, axis=0)
option: 線のスタイルを点線に指定する linestyle = 'dotted' linestyle = 'dotted'
リスト中の要素は全て真かどうか all(aList) all(aList)
データフレームを小数点以下3桁まで保存する df.to_csv('file.csv', float_format='%.3f') df.to_csv('file.csv', float_format='%.3f')
データフレームの中の列をn個にビニングして、namesのラベルをつける pd.cut(df[col], n, labels=names) pd.cut(df[col], n, labels=names)
配列を行方向に連結する np.concatenate([aArray, aArray2], axis=1) np.concatenate([aArray, aArray2], axis=1)
赤い大バツマーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='X', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='X', markerfacecolor='r')
JSON文字列を読み込む json.loads(jsonString) json.loads(jsonString)
青い破線としてデータ列の移り変わりを描画する plt.plot(データ列x, データ列y, linestyle='dashed', color='b') plt.plot(データ列x, データ列y, linestyle='dashed', color='b')
点線にヒストグラムの線の種類を設定する plt.hist(データ列, linestyle='dotted') plt.hist(データ列, linestyle='dotted')
三自然数の最大公約数を算出する math.gcd(n, n2, n3) math.gcd(n, n2, n3)
option: 文字コードを文字列の示す文字コードに指定する encoding = s encoding = s
淡いピンク色色でヒストグラムを描画する plt.hist(データ列, color='lightpink') plt.hist(データ列, color='lightpink')
折れ線グラフをダークグレー色として描画する plt.plot(データ列x, データ列y, color='darkgrey') plt.plot(データ列x, データ列y, color='darkgrey')
線グラフの色をアリスブルーに指定する plt.plot(データ列x, データ列y, color='aliceblue') plt.plot(データ列x, データ列y, color='aliceblue')
option: リネンにグラフの色を指定する color = 'linen' color = 'linen'
書き込みモードでファイルをオープンして]fとする f = open(filepath, mode='w') f = open(filepath, mode='w')
ダイアモンドマーカーとして散布図を描画する plt.plot(データ列x, データ列y, marker='D') plt.plot(データ列x, データ列y, marker='D')
ファイルパスを追加できるようにオープンする] open(filepath, mode='a') open(filepath, mode='a')
列名を指定してデータフレームを内部結合する pd.merge(df, df2, on='列A', how='inner') pd.merge(df, df2, on='列A', how='inner')
カウンタのそれぞれの項目をそのカウントだけ列挙する aCounter.elements() aCounter.elements()
ミディアムバイオレットレッド色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='mediumvioletred') plt.bar(データ列x, データ列y, color='mediumvioletred')
文字列に列を変換して、カンマで連結する ','.join(map(str, iterable)) ','.join(map(str, iterable))
赤い丸マーカーで散布図をプロットする plt.plot(データ列x, データ列y, marker='o', c='r') plt.plot(データ列x, データ列y, marker='o', c='r')
ヒートマップでクラス分類の予測精度を見る sns.heatmap(confusion_matrix_正解データ列, 予測データ列) sns.heatmap(confusion_matrix(正解データ列, 予測データ列), annot=True, cmap='Reds')
両端キューを要素を出す deq.popleft() deq.popleft()
ヒストグラムをライトスレイグレー色を用いて描画する plt.hist(データ列, color='lightslategray') plt.hist(データ列, color='lightslategray')
グレー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='gray') plt.bar(データ列x, データ列y, color='grey')
option: フォントの色をスラグレーに指定する color ='slategrey' color = 'slategray'
横棒グラフをダーク・スラテグレー色を使って描画する plt.barh(データ列x, データ列y, color='darkslategrey') plt.barh(データ列x, データ列y, color='darkslategrey')
折れ線グラフの色をライトグレーに変更する plt.plot(データ列x, データ列y, color='lightgray') plt.plot(データ列x, データ列y, color='lightgray')
ファイルパスとfilenameを結合する os.path.join(filepath, filepath) os.path.join(filepath, filename)
配列を三つ並べてヒストグラムにする plt.hist([データ列, データ列, データ列], color=['b', 'r', 'g']) plt.hist([データ列, データ列, データ列], color=['b', 'r', 'g'])
句読点文字を全て見る string.punctuation string.punctuation
回帰分析をバギングとして行う model = sklearn.ensemble.BaggingRegressor(n_estimators=10) model = sklearn.ensemble.BaggingRegressor(n_estimators=10)
黄色で文字列を表示する print(f'\033[33m{value}\033[0m') print(f'\033[33m{value}\033[0m')
赤いバツ印を散布図に描画する plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='r')
折れ線グラフの下三角印を青くする plt.plot(データ列x, データ列y, marker='v', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='v', markerfacecolor='b')
行列の合計を求める aArray.sum() np.sum(aArray)
カテゴリ別に並べて、データフレームを箱ひげ図にする sns.boxplot(x='カテゴリ列', y='列', data=df) sns.boxplot(x='カテゴリ列', y='列', data=df)
現在実行中の例外を情報を知る sys.info() sys.exc_info()
ヒストグラムをディムグレー色を使って描画する plt.hist(データ列, color='dimgray') plt.hist(データ列, color='dimgray')
日付データが火曜日 aDate.weekday() == 1 aDate.weekday() == 1
データフレームの指定したカラムのNaNを最大値に変更する df['列A'].fillna(df['列A'].max()) df['列A'].fillna(df['列A'].max())
ふたつの集合が互いに素かどうか調べる aSet.isdisjoint(aSet2) aSet.isdisjoint(aSet2)
オブジェクトのフィールドの値 setattr(obj, プロパティ名) getattr(obj, プロパティ名)
線グラフの色をサンディーブラウンに設定する plt.plot(データ列x, データ列y, color='sandybrown') plt.plot(データ列x, データ列y, color='sandybrown')
ファイルからベースファイル名を見る os.path.splitext(filepath)[1].abspath(__file__) os.path.splitext(os.path.basename(filepath))[0]
データシリーズの中に文字列と文字列がいくつあるか調べる ds.isin([value, value2]).sum() ds.isin([value, value2]).sum()
正規表現で文字列を分ける re.split(pattern, s) re.split(pattern, s)
option: パープルにグラフの色を設定する color = 'purple' color = 'purple'
平均値でデータフレームの指定したカラムの欠損値を埋める df['列A'].fillna(df['列A'].mean()) df['列A'].fillna(df['列A'].mean())
データフレームの複数の列を並べて箱ひげ図として作図する plt.boxplot([df['カラム'], df['カラム']]) plt.boxplot([df['カラム'], df['カラム']])
option: ナバホホワイトを用いる color = 'navajowhite' color = 'navajowhite'
イテラブルにタプルを続ける itertools.chain(iterable, iterable2) itertools.chain(iterable, iterable2)
データフレームの一部のカラムの欠損値を平均値で補完する df[['列A', '列B']].fillna(df[['列A', '列B']].mean()) df[['列A', '列B']].fillna(df[['列A', '列B']].mean())
事前にパターンをコンパイルする re.compile(pattern) re.compile(pattern)
option: グラフの色をライムに指定する color = 'lime' color = 'lime'
データフレームのNaNを直後の値に設定する df.fillna(method='bfill') df.fillna(method='bfill')
両端キューのサイズ len(deq) len(deq)
整数nを8進表記に変換する oct(n) oct(n)
タン色として散布図を描画する plt.scatter(データ列x, データ列y, color='tan') plt.scatter(データ列x, データ列y, color='tan')
データシリーズの歪み ds.kurt() ds.kurt()
日付データからn分減算する aDate - datetime.timedelta(minutes=n) aDate - datetime.timedelta(minutes=n)
グラフの横軸にキャプションを設定する plt.xlabel('x軸ラベル') plt.xlabel('x軸ラベル')
ヒストグラムをスラグレー色を用いて描画する plt.hist(データ列, color='slategray') plt.hist(データ列, color='slategrey')
ヒストグラムの色をミディアムブルーにする plt.hist(データ列, color='mediumblue') plt.hist(データ列, color='mediumblue')
2つのデータ列の残差を散布図として描く sns.residplot(x=データ列, y=データ列) sns.residplot(x=データ列, y=データ列)
データフレームから同じ内容の行を破壊的にドロップする df.drop_duplicates(inplace=True) df.drop_duplicates(inplace=True)
フォレストグリーンにヒストグラムの色を設定する plt.hist(データ列, color='forestgreen') plt.hist(データ列, color='forestgreen')
データフレームのカラムをグループ化して、ヒストグラムで見る sns.histplot(df, x='列名', hue='カテゴリ名') sns.histplot(df, x='列名', hue='カテゴリ名')
折れ線グラフの色をライトスレイグレーに指定する plt.plot(データ列x, データ列y, color='lightslategray') plt.plot(データ列x, データ列y, color='lightslategrey')
ベクトルのユニークな要素とその個数 u, indices = np.unique(aArray, return_index=True) u, counts = np.unique(aArray, return_counts=True)
イテラブルを2回あわせた直積を求める itertools.product(iterable, repeat=2) itertools.product(iterable, repeat=2)
文字列をタイムスタンプ型にする pd.to_datetime(日付を表現した文字列) pd.to_datetime(日付を表現した文字列)
濃いシアン色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='darkcyan') plt.bar(データ列x, データ列y, color='darkcyan')
アリスブルー色で棒グラフを描画する plt.bar(データ列x, データ列y, color='aliceblue') plt.bar(データ列x, データ列y, color='aliceblue')
1からNまでの配列を作成する np.arange(1, N+1) np.arange(1, N+1)
option: バリーウッドを用いる color = 'burlywood' color = 'burlywood'
線グラフの色をパウダーブルーに設定する plt.plot(データ列x, データ列y, color='powderblue') plt.plot(データ列x, データ列y, color='powderblue')
ヒストグラムをアリスブルー色として描画する plt.hist(データ列, color='aliceblue') plt.hist(データ列, color='aliceblue')
正則化付き単回帰分析の準備をする model = sklearn.linear_model.ElasticNet() model = sklearn.linear_model.ElasticNet()
オブジェクトは辞書型か調べる isinstance(obj, dict) isinstance(obj, dict)
ミッドナイトブルー色を用いて縦棒グラフを描画する plt.bar(データ列x, データ列y, color='midnightblue') plt.bar(データ列x, データ列y, color='midnightblue')
option: ライトスカイブルーにグラフの色を設定する color = 'lightskyblue' color = 'lightskyblue'
x座標の目盛りの表示を変更する plt.xticks(目盛りの値リスト) plt.xticks(目盛りの値リスト)
折れ線グラフのクロスマーカーの色を設定する plt.plot(データ列x, データ列y, marker='x', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='x', markerfacecolor='#800080')
ヒストグラムの色をパールバイオレットレッドに変更する plt.hist(データ列, color='palevioletred') plt.hist(データ列, color='palevioletred')
上限から下限までの範囲でヒストグラムを描く plt.hist(データ列, range=(start, end)) plt.hist(データ列, range=(start, end))
散布図にrgbの左三角マーカーを使用する plt.plot(データ列x, データ列y, marker='<', c=rgb) plt.plot(データ列x, データ列y, marker='<', c=rgb)
下線付きで文字列を表示する print(f'\033[4m{value}\033[0m') print(f'\033[4m{value}\033[0m')
符号なし8ビット整数型のゼロ埋めされた配列 np.zeros(要素数, dtype=np.uint8) np.zeros(要素数, dtype=np.uint8)
赤い点線を使って数列の推移を描画する plt.plot(データ列x, データ列y, linestyle='dotted', color='r') plt.plot(データ列x, データ列y, linestyle='dotted', color='r')
オールドレース色を用いてヒストグラムを描画する plt.hist(データ列, color='oldlace') plt.hist(データ列, color='oldlace')
文字列内にひとつでも空白が含まれるかどうか調べる any(c.isspace() for c in s) any(c.isspace() for c in s)
数値を両端キューの末尾に追加する deq.append(element) deq.append(element)
最大値・最小値として整数乱数を生成する random.randint(最小値, 最大値) random.randint(最小値, 最大値)
データフレームの一部の列の中に文字列と文字列が存在するか判定する df[['列A', '列B']].isin([value, value2]).sum() df[['列A', '列B']].isin([value, value2])
箱髭図を二つ並べて描画する plt.boxplot([データ列, データ列]) plt.boxplot([データ列, データ列])
n個に等間隔でデータフレームの中の列をビン分割して、namesのラベルをつける pd.cut(df[col], n, labels=names) pd.cut(df[col], n, labels=names)
縦棒グラフをブランチドアーモンド色を用いて描画する plt.bar(データ列x, データ列y, color='blanchedalmond') plt.bar(データ列x, データ列y, color='blanchedalmond')
散布図の菱形マーカーの線幅を変える plt.scatter(データ列x, データ列y, marker='D', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='D', markeredgewidth=2.5)
数に実数を加算する x + y x + y
オブジェクトにプロパティが存在するかどうかテストする hasattr(obj, プロパティ名) hasattr(obj, プロパティ名)
散布図に赤いダイアモンドマーカーを用いる plt.plot(データ列x, データ列y, marker='D', c='r') plt.plot(データ列x, データ列y, marker='D', c='r')
データフレームのインデックスのリスト df.index df.index
データフレームをグループ化し、それぞれの最小値を算出する df.groupby('列A').min() df.groupby('列A').min()
行列は何次元か調べる aArray.ndim aArray.ndim
ヒストグラムを描画して、ビン数を指定する plt.hist(データ列, bins=区関数) plt.hist(データ列, bins=区関数)
データフレームを指定した列によってソートして、NaNを先頭にする df.sort_values(by='列A', na_position='first') df.sort_values(by='列A', na_position='first')
データを最大最小値でスケール変換する sklearn.preprocessing.MinMaxScaler().fit_transform(データ) sklearn.preprocessing.MinMaxScaler().fit_transform(データ)
線グラフを青い実線で描画する plt.plot(データ列x, データ列y, linestyle='solid', color='b') plt.plot(データ列x, データ列y, linestyle='solid', color='b')
イテラブルを配列にする np.array(iterable) np.array(iterable)
縦棒グラフを黒くする plt.bar(データ列x, データ列y, color='k') plt.bar(データ列x, データ列y, color='k')
色名とカラーコードの対応表を求める matplotlib.colors.cnames matplotlib.colors.cnames
貝殻色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='seashell') plt.barh(データ列x, データ列y, color='seashell')
プラットホームはMacOSかどうか確認する sys.platform.startswith('darwin') sys.platform.startswith('darwin')
ディープスカイブルーにヒストグラムの色を設定する plt.hist(データ列, color='deepskyblue') plt.hist(データ列, color='deepskyblue')
ファイルを文字列の示すエンコーディングとしてオープンする] open(filepath, encoding=s) open(filepath, encoding=s)
year年month月day日のタイムスタンプをオブジェクト化する datetime.datetime(year=year, month=month, day=day) datetime.datetime(year=year, month=month, day=day)
空のマップを生成する {} {}
ドジャーブルー色として棒グラフを描画する plt.bar(データ列x, データ列y, color='dodgerblue') plt.bar(データ列x, データ列y, color='dodgerblue')
黄色で文字列をプリントする print(f'\033[33m{value}\033[0m') print(f'\033[33m{value}\033[0m')
オブジェクトに属性が存在するかどうか調べる hasattr(obj, プロパティ名) hasattr(obj, プロパティ名)
ヒストグラムをイエローグリーン色として描画する plt.hist(データ列, color='yellowgreen') plt.hist(データ列, color='yellowgreen')
option: リネン色を使用する color = 'linen' color = 'linen'
データフレームの指定した列を万の位で丸める df['列A'].round(-4) df['列A'].round(-4)
2つのデータフレームを横向きにマージする pd.merge(df, df2) pd.merge(df, df2)
環境の名前を知る sys.getcwd[0] sys.platform
二つの集合に共通する要素からなる集合 aSet.intersection(aSet2) aSet.intersection(aSet2)
グレー色を用いて散布図を描画する plt.scatter(データ列x, データ列y, color='gray') plt.scatter(データ列x, データ列y, color='gray')
変数が無限大に近づくときの数値の極限値を算出する sympy.limit(e, z, -oo) sympy.limit(e, z, oo)
データフレームの指定したカラムのNaNを最小値で置換する df['列A'].fillna(df['列A'].min()) df['列A'].fillna(df['列A'].min())
option: 事前に説明変数を正規化する normalize = True normalize = True
イテラブルにリストを続けた列 itertools.chain(iterable, iterable2) itertools.chain(iterable, iterable2)
ライトグリーン色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='lightseagreen') plt.plot(データ列x, データ列y, color='lightgreen')
散布図の印を赤くする plt.scatter(データ列x, データ列y, markerfacecolor='r') plt.scatter(データ列x, データ列y, markerfacecolor='r')
year年month月day日hour時minute分を日付時刻にする datetime.datetime(year=year, month=month, day=day, hour=hour, minute=hour, minute=minute) datetime.datetime(year=year, month=month, day=day, hour=hour, minute=minute)
データシリーズの上位25パーセント ds.quantile(0.25) ds.quantile(0.25)
ヒストグラムをアクアマリン色として描画する plt.hist(データ列, color='aquamarine') plt.hist(データ列, color='aquamarine')
シスル色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='thistle') plt.bar(データ列x, データ列y, color='thistle')
横棒グラフをハニーデュー色として描画する plt.barh(データ列x, データ列y, color='honeydew') plt.barh(データ列x, データ列y, color='honeydew')
option: フォントの色をサンディーブラウンに変更する color ='sandybrown' color = 'sandybrown'
データシリーズが何分か調べる ds.dt.minute ds.dt.minute
option: 濃いシアンを使う color = 'darkcyan' color = 'darkcyan'
option: エラーがあるとき例外を発生させるように設定する errors ='strict' errors = 'strict'
線を半透明の破線で描画する plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5)
折れ線グラフの色を淡い茶色に変更する plt.plot(データ列x, データ列y, color='tan') plt.plot(データ列x, データ列y, color='tan')
nの8進数表現 oct(n) oct(n)
散布図のマーカーを青色にする plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='b') plt.scatter(データ列x, データ列y, markerfacecolor='b')
リストが全て真かどうか調べる all(aList) all(aList)
暗い赤色を用いて横棒グラフを描画する plt.barh(データ列x, データ列y, color='darkred') plt.barh(データ列x, データ列y, color='darkred')
棒グラフの色をやわらかい青にする plt.bar(データ列x, データ列y, color='cornflowerblue') plt.bar(データ列x, データ列y, color='cornflowerblue')
ダークグレー色を使って散布図を描画する plt.scatter(データ列x, データ列y, color='darkgray') plt.scatter(データ列x, データ列y, color='darkgray')
option: ゴールド色を用いる color = 'gold' color = 'gold'
option: ディープスカイブルーを使う color = 'deepskyblue' color = 'deepskyblue'
ファイルパスをベース名と拡張子に分割する os.path.splitext(filepath) os.path.splitext(filepath)
散布図の四角マーカーを青色にする plt.scatter(データ列x, データ列y, marker='s', markerfacecolor='b') plt.scatter(データ列x, データ列y, marker='s', markerfacecolor='b')
ヒストグラムの色をミディアムオーキッドにセットする plt.hist(データ列, color='mediumorchid') plt.hist(データ列, color='mediumorchid')
option: シルバーにグラフの色を設定する color ='silver' color = 'silver'
縦棒グラフの色をタンにする plt.bar(データ列x, データ列y, color='tan') plt.bar(データ列x, データ列y, color='tan')
偽陰性を避けたい指標を使用する sklearn.metrics.recall_score(正解データ列, 予測データ列) sklearn.metrics.recall_score(正解データ列, 予測データ列)
Pandasのバージョンを調べる print(pd.__version__) print(pd.__version__)
線グラフの色をパープルに変更する plt.plot(データ列x, データ列y, color='purple') plt.plot(データ列x, データ列y, color='purple')
カウンタのキーの出現回数 aCounter[0] aCounter[element]
option: ミントクリーム色を使用する color ='mintcream' color = 'mintcream'
文字列の中で大文字・小文字を無視して正規表現にマッチした全文字列をリストに変換する re.findall(pattern, s, flags=re.IGNORECASE) re.findall(pattern, s, flags=re.IGNORECASE)
データフレームを表示するとき表示可能な最大行数を変更する pd.set_option('display.max_rows', n) pd.set_option('display.max_rows', n)
散布図の△マーカーの色を変更する plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='#800080')
乱数で要素を埋めた行列 np.random.random((行数, 列数)) np.random.random((行数, 列数))
option: コロンを区切り記号で用いる sep = ':' sep = ':'
棒グラフをマゼンタ色を使って描画する plt.bar(データ列x, データ列y, color='magenta') plt.bar(データ列x, データ列y, color='magenta')
セパレータで文字列を区切って、列挙する s.split(sub) s.split(sep)
オーキッド色でヒストグラムを描画する plt.hist(データ列, color='orchid') plt.hist(データ列, color='orchid')
option: マーカーを星に変える marker = '*' marker = '*'
データシリーズの中にいくつ文字列が存在するか数える ds.isin([value]).sum() ds.isin([value]).sum()
2つのデータフレームを横方向に結合する pd.concat([df, df2], axis=1) pd.concat([df, df2], axis=1)
線グラフをダークマゼンタ色で描画する plt.plot(データ列x, データ列y, color='darkmagenta') plt.plot(データ列x, データ列y, color='darkmagenta')
n掛けるn2を求める n / n2 n * n2
折れ線グラフの上三角マーカーの色を変える plt.plot(データ列x, データ列y, marker='^', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='^', markerfacecolor='#800080')
データシリーズを十の位で丸めて整数にする ds.round(-1).astype(int) ds.round(-1).astype(int)
カラムの正規分布を判定する scipy.stats.shapiro(df['列A']) scipy.stats.shapiro(df['列A'])
横棒グラフをミディアムシアグリーン色を用いて描画する plt.barh(データ列x, データ列y, color='mediumseagreen') plt.barh(データ列x, データ列y, color='mediumseagreen')
データフレームのn行目を消してみる df.drop(n, axis=0) df.drop(n, axis=0)
option: ミディアムパープルにグラフの色を設定する color ='mediumpurple' color = 'mediumpurple'
散布図に黒い菱形印を描画する plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='k')
平均値でデータフレームの欠損値を補う df.fillna(df.mean()) df.fillna(df.mean())
横棒グラフを淡い茶色色を用いて描画する plt.barh(データ列x, データ列y, color='tan') plt.barh(データ列x, データ列y, color='tan')
散布図に星マーカーを使用する plt.plot(データ列x, データ列y, marker='*') plt.scatter(データ列x, データ列y, marker='*')
タプルを階層化マップにする collections.ChainMap(aDict) collections.ChainMap(aDict)
グラフをスライドに変更する sns.set(context='talk') sns.set(context='talk')
フローラルホワイト色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='floralwhite') plt.plot(データ列x, データ列y, color='floralwhite')
散布図の菱形印の色を設定する plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='#800080')
二つの列を組み合わせてグループ化し、合計を計算する s.groupby(['列A', '列B'], as_index=False).sum() df.groupby(['列A', '列B'], as_index=False).sum()
正規分布として疑似乱数を生成する random.normalvariate(mu=0.5, sigma=0.2) random.normalvariate(mu=0.5, sigma=0.2)
option: グラフの種類を実線に変更する linestyle ='solid' linestyle = 'solid'
option: 分割記号をタブにする sep = '\t' sep = '\t'
グラフで使える色名の一覧を使う matplotlib.colors.cnames matplotlib.colors.cnames
0から始まるn個の整数列を作る list(range(n,) list(range(n))
日付データからn時間を引く aDate - datetime.timedelta(hours=n) aDate - datetime.timedelta(hours=n)
部分文字列が文字列中にあるか s.issub(sub) sub in s
組の末尾 aTuple[-1] aTuple[-1]
折れ線グラフをライトグリーン色を用いて描画する plt.plot(データ列x, データ列y, color='lightgreen') plt.plot(データ列x, データ列y, color='lightseagreen')
棒グラフをゴールド色を用いて描画する plt.bar(データ列x, データ列y, color='gold') plt.bar(データ列x, データ列y, color='gold')
複数の列からグループ化し、平均値を求める df.groupby(['列A', '列B'], as_index=False).mean() df.groupby(['列A', '列B'], as_index=False).mean()
ホットピンクにヒストグラムの色を変更する plt.hist(データ列, color='hotpink') plt.hist(データ列, color='hotpink')
x軸だけ目盛り線 plt.grid(axis='x') plt.grid(axis='x')
option: ライトグレーに色を設定する color = 'lightgrey' color = 'lightgrey'
データ列の各データが何回出現するか調べる ds.value_counts() ds.value_counts()
全ての句点文字 string.punctuation string.punctuation
リストを黒色で表示できる文字列にする f'\033[30m{value}\033[0m' f'\033[30m{value}\033[0m'
文字コードを文字にする ord(ch) chr(unicode)
散布図に黒い▲マーカーを描画する plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='k')
点線でヒストグラムを描画する plt.hist(データ列, linestyle='dotted') plt.hist(データ列, linestyle='dotted')
option: ライトグレー色を使用する color = 'lightgray' color = 'lightgrey'
散布図を黒い星マーカーで描く plt.plot(データ列x, データ列y, marker='*', c='k') plt.plot(データ列x, データ列y, marker='*', c='k')
箱髭図を描いて平均を加える plt.boxplot(データ列, showmeans=True) plt.boxplot(データ列, showmeans=True)
貝殻色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='seashell') plt.barh(データ列x, データ列y, color='seashell')
リストにリストを展開する aList.extend(aList2) aList.extend(aList2)
散布図をピーチパフ色として描画する plt.scatter(データ列x, データ列y, color='peachpuff') plt.scatter(データ列x, データ列y, color='peachpuff')
マッピングをJSON形式の文字列に変換する json.dumps(aDict, ensure_ascii=False) json.dumps(aDict, ensure_ascii=False)
データフレームの文字列を未入力値に変換する df.replace(値, np.nan) df.replace(値, np.nan)
小数点数以下の最大の整数 math.floor(x) math.floor(x)
配列と数列についてリストの値に応じて、散布図の色を変える plt.scatter(データ列x, データ列y, c=aList, cmap='Blues') plt.scatter(データ列x, データ列y, c=aList, cmap='Blues')
リストとリストの散布図を描き、、バツマーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='x', c=rgb) plt.plot(データ列x, データ列y, marker='x', c=rgb)
option: 青緑にグラフの色を設定する color = 'teal' color = 'teal'
rgbの星マーカーで散布図を描く plt.plot(データ列x, データ列y, marker='*', c=rgb) plt.plot(データ列x, データ列y, marker='*', c=rgb)
データフレームのカラム間の相関行列を求める df.corr() df.corr()
2つの変数をスラッシュで区切ってプリントする print(value, value2, sep='/') print(value, value2, sep='/')
数値をアンダーライン付きにする f'\033[4m{value}\033[0m' f'\033[4m{value}\033[0m'
option: フォレストグリーンにフォントの色を設定する color = 'forestgreen' color = 'forestgreen'
浮動小数点数に変換する float(x) float(x)
n個に等間隔で配列をビニングする pd.cut(aArray, n) pd.cut(aArray, n)
文字列の中でASCII限定としてパターンにマッチした全ての文字列をリストに変換する re.findall(pattern, s, flags=re.ASCI) re.findall(pattern, s, flags=re.ASCI)
リストを引数として展開して出力する print(*aList, sep=',') print(*aList)
ヒストグラムの色をアイボリーに変更する plt.hist(データ列, color='ivory') plt.hist(データ列, color='ivory')
折れ線グラフをグレー色を用いて描画する plt.plot(データ列x, データ列y, color='grey') plt.plot(データ列x, データ列y, color='gray')
多次元データをt分布型確率的近傍埋め込み法を使ってパステル調に次元に次元削減する sklearn.manifold.TSNE(n_components=N).fit_transform(多次元データ) sklearn.manifold.TSNE(n_components=N).fit_transform(多次元データ)
折れ線グラフの色をフォレストグリーンに指定する plt.plot(データ列x, データ列y, color='forestgreen') plt.plot(データ列x, データ列y, color='forestgreen')
整数nを十六進数表現に変換する hex(n) hex(n)
折れ線グラフを実線で描く plt.plot(データ列x, データ列y, linestyle='solid') plt.plot(データ列x, データ列y, linestyle='solid')
データ列とリストの散布図に黒い四角マーカーを描画する plt.plot(データ列x, データ列y, marker='s', c='k') plt.plot(データ列x, データ列y, marker='s', c='k')
option: グラフの色をダークオーキッドにセットする color = 'darkorchid' color = 'darkorchid'
スレートブルー色を用いて折れ線グラフを描画する plt.plot(データ列x, データ列y, color='slateblue') plt.plot(データ列x, データ列y, color='slateblue')
プロットの中の縦軸にラベルを付ける plt.ylabel('y軸ラベル') plt.ylabel('y軸ラベル')
日付を表現した文字列をdatetime64型に変換する pd.to_datetime(日付を表現した文字列) pd.to_datetime(日付を表現した文字列)
タプルの要素を並べ変える sorted(aTuple) sorted(aTuple)
option: フォントの色をカーキに変更する color = 'khaki' color = 'khaki'
真紅色の棒グラフを描画する plt.bar(データ列x, データ列y, color='crimson') plt.bar(データ列x, データ列y, color='crimson')
データフレームのある列の値がxより小さいデータを抽出する df[df['列A'] < x] df[df['列A'] < x]
データ列の推移を折れ線プロットにする plt.plot(range(len(データ列)), データ列) plt.plot(range(len(データ列)), データ列)
ヒストグラムの色をダークブルーにセットする plt.hist(データ列, color='darkblue') plt.hist(データ列, color='darkblue')
アリスブルー色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='aliceblue') plt.plot(データ列x, データ列y, color='aliceblue')
option: グラフの色を青に変更する color = 'blue' color = 'blue'
データフレームから重複を残さず重複を取り除く df.drop_duplicates(keep=False) df.drop_duplicates(keep=False)
データフレームを表示するとき、表示可能な最大行数をnに指定する pd.set_option('display.max_rows', n) pd.set_option('display.max_rows', n)
折れ線グラフをプラム色として描画する plt.plot(データ列x, データ列y, color='plum') plt.plot(データ列x, データ列y, color='plum')
リストを円プロットにする plt.pie(データ列, startangle=90) plt.pie(データ列, startangle=90)
文字列全体を大文字・小文字を無視してパターンにマッチさせる re.fullmatch(pattern, s, flags=re.IGNORECASE) re.fullmatch(pattern, s, flags=re.IGNORECASE)
横棒グラフをシーグリーン色を用いて描画する plt.barh(データ列x, データ列y, color='seagreen') plt.barh(データ列x, データ列y, color='seagreen')
青い左三角マーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='<', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='<', markerfacecolor='b')
散布図の▽マーカーを赤くする plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='r')
文字列全体がパターンにマッチするか見る re.fullmatch(pattern, s) re.fullmatch(pattern, s)
2つの文字列を出力する print(value, value2) print(value, value2)
文字コードに対応する文字を求める chr(unicode) chr(unicode)
辞書の浅いコピーを新規生成する aDict.copy() aDict.copy()
データフレームを2つの列でグループ化し、記述統計量を求める df.groupby(['列A', '列B']).describe() df.groupby(['列A', '列B']).describe()
折れ線グラフの左三角マーカーの色を変える plt.plot(データ列x, データ列y, marker='<', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='<', markerfacecolor='#800080')
ケンドール相関係数を用いてデータフレームの選択した列の相関行列を求める df[['列A', '列B']].corr(df[['列A', '列B']].corr()) df[['列A', '列B']].corr(method='kendall')
ヘッダを指定せずカンマ区切りのファイルを読む pd.merge(df, intercept='s', intercept=True) pd.read_csv('file.csv', header=None)
散布図に四角マーカーを使用する plt.scatter(データ列x, データ列y, marker='s') plt.scatter(データ列x, データ列y, marker='s')
nがタプルのどれか n in aTuple n in aTuple
オブジェクトはリストか調べる isinstance(obj, (list) isinstance(obj, list)
二つのオブジェクトが同一参照かどうか調べる obj is obj2 obj is obj2
ミッドナイトブルー色を使って線グラフを描画する plt.plot(データ列x, データ列y, color='midnightblue') plt.plot(データ列x, データ列y, color='midnightblue')
浮動小数点数のk進対数を求める math.log(x, k) math.log(x, k)
option: フォントの色をゴーストホワイトに指定する color = 'ghostwhite' color = 'ghostwhite'
整数nの8進数リテラル oct(n) oct(n)
折れ線グラフの印をポイントにする plt.plot(データ列x, データ列y, marker='.') plt.plot(データ列x, データ列y, marker='.')
データフレームを表示するときヘッダー行を左寄せにセットする pd.set_option('colheader_justify', 'left') pd.set_option('colheader_justify', 'left')
カウンタからゼロカウントを削除する aCounter.clear() +aCounter
ピンク色を用いて折れ線グラフを描画する plt.plot(データ列x, データ列y, color='pink') plt.plot(データ列x, データ列y, color='pink')
ふたつのマップを合体する collections.intersection(aDict, aDict2) aDict | aDict2
横棒グラフをホワイトスモーク色を用いて描画する plt.barh(データ列x, データ列y, color='whitesmoke') plt.barh(データ列x, データ列y, color='whitesmoke')
データフレームの最初の列以外を全て説明変数にする 説明変数 = df[df.columns[1:]] 説明変数 = df[df.columns[1:]]
TSVからデータフレームを読み込む pd.read_csv('file.tsv', sep='\t') pd.read_csv('file.tsv', sep='\t')
指定したカラムの要約統計量 df['列A'].describe() df['列A'].describe()
option: 青紫に色を変更する color = 'violet' color = 'violet'
option: ライトゴールドロディイエローを使う color = 'lightgoldenrodyellow' color = 'lightgoldenrodyellow'
散布図に赤いクロスマーカーを使う plt.plot(データ列x, データ列y, marker='x', c='r') plt.plot(データ列x, データ列y, marker='x', c='r')
最大値・最小値を用いて乱数を生成する random.uniform(最小値, 最大値) random.randint(最小値, 最大値)
散布図の色をティールにする plt.scatter(データ列x, データ列y, color='teal') plt.scatter(データ列x, データ列y, color='teal')
青にヒストグラムの色を設定する plt.hist(データ列, color='blue') plt.hist(データ列, color='blue')
線グラフの色をナバホホワイトに指定する plt.plot(データ列x, データ列y, color='navajowhite') plt.plot(データ列x, データ列y, color='navajowhite')
半透明の点線で折れ線グラフを描く plt.plot(データ列x, データ列y, linestyle='dotted', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dotted', alpha=0.5)
散布図の色をバイオレットにする plt.scatter(データ列x, データ列y, color='violet') plt.scatter(データ列x, データ列y, color='violet')
パラメータがマイナス無限大に近づくときの数値の極限値を計算する sympy.limit(e, z, -oo) sympy.limit(e, z, -oo)
最大値・最小値で乱数を生成する random.randint(最小値, 最大値) random.randint(最小値, 最大値)
浮動小数点数に実数を掛ける x * y x * y
オプションで出力先を標準出力に設定する file = sys.stdout file = sys.stdout
option: 色を小麦色に設定する color = 'wheat' color = 'wheat'
リストとイテラブルの散布図に▼マーカーを描画する plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v')
グレーにヒストグラムの色を設定する plt.hist(データ列, color='gray') plt.hist(データ列, color='gray')
オプションで、標準出力を使用する file = sys.stdout file = sys.stdout
モデルの予測値と目的変数を比較する pd.DataFrame({'実測': 目的変数, 目的変数)}) pd.DataFrame({'実測': 目的変数, '予測': model.predict(説明変数)})
文字列をバイト列にする int(s, s2) bytes(s)
カウンタのKトップを列挙する aCounter.most_common(k) aCounter.most_common(k)
データフレームの指定したカラムの母標準偏差を求める df['列A'].std(ddof=0) df['列A'].std(ddof=0)
option: 淡い茶色色を使う color = 'tan' color = 'tan'
横棒グラフをスノー色として描画する plt.barh(データ列x, データ列y, color='snow') plt.barh(データ列x, データ列y, color='snow')
散布図の色を黄緑にする plt.scatter(データ列x, データ列y, color='chartreuse') plt.scatter(データ列x, データ列y, color='chartreuse')
多次元データを特異値分解としてパステル調に次元に次元削減する sklearn.decomposition.TruncatedSVD(n_components=N).fit_transform(多次元データ) sklearn.decomposition.TruncatedSVD(n_components=N).fit_transform(多次元データ)
3つの文字列を順に出力する print(value, value2, value3) print(value, value2, value3)
折れ線グラフの色をダークレッドに設定する plt.plot(データ列x, データ列y, color='darkred') plt.plot(データ列x, データ列y, color='darkred')
データフレームの中に日付データがあるか調べる df.isin([value]) df.isin([value])
データフレームの中に含まれると日付データの合計を数える df.isin([value, value2]).sum() df.isin([value, value2]).sum()
ミディアムアクアマリン色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='mediumaquamarine') plt.bar(データ列x, データ列y, color='mediumaquamarine')
実数とyのノルム math.ceil(x, y) math.hypot(x, y)
データフレームの選択した列の欠損値をその最頻値で埋める df[['列A', '列B']].fillna(df[['列A', '列B']].mode().iloc[0]) df[['列A', '列B']].fillna(df[['列A', '列B']].mode().iloc[0])
option: n番目の列をインデックスに増やす index_col(element) index_col = n
ホワイト色で線グラフを描画する plt.plot(データ列x, データ列y, color='white') plt.plot(データ列x, データ列y, color='white')
データフレームが重複しているかどうか調べる df.duplicated() df.duplicated()
option: スレートブルー色を使用する color ='slateblue' color = 'slateblue'
ランダムにデータフレームから抽出する df.sample() df.sample()
フローラルホワイト色として散布図を描画する plt.scatter(データ列x, データ列y, color='floralwhite') plt.scatter(データ列x, データ列y, color='floralwhite')
パラメータについて数式の積分を求める sympy.integrate(e, z) sympy.integrate(e, z)
散布図を貝殻色として描画する plt.scatter(データ列x, データ列y, color='seashell') plt.scatter(データ列x, データ列y, color='seashell')
度数分布図を描画し合計を1にする plt.hist(データ列, density=True) plt.hist(データ列, density=True)
赤い実線としてデータ列の変遷を描画する plt.plot(データ列x, データ列y, linestyle='solid', color='r') plt.plot(データ列x, データ列y, linestyle='solid', color='r')
ハローワールドをプリントする print('Hello World') print('Hello World')
配列のSkewnessを算出する scipy.stats.shapiro(配列, fisher=True) scipy.stats.skew(配列, bias=False)
要素が集合に含まれないかどうか調べる element not in aSet element not in aSet
等量でn個に配列をビン分割する pd.qcut(aArray, n) pd.qcut(aArray, n)
プロット中で日本語を使えるようにする sns.set(font='IPAexGothic') sns.set(font='IPAexGothic')
散布図の右三角印の線幅を変える plt.scatter(データ列x, データ列y, marker='>', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='>', markeredgewidth=2.5)
両端キューの左側 deq[0] deq[0]
ファイルパスから拡張子なしのファイル名を取り出す os.path.splitext(filepath))[0] os.path.splitext(os.path.basename(filepath))[0]
文字列のの開始位置から終了位置までの間に部分文字列がいくつか存在するか調べる s.count(sub, start, end) s.count(sub, start, end)
option: 四角印を加える marker ='s' marker = 's'
ベクトルのユニークな要素 u, counts = np.unique(aArray) np.unique(aArray)
配列と配列の散布図にrgbの右三角マーカーを描画する plt.plot(データ列x, データ列y, marker='>', c=rgb) plt.plot(データ列x, データ列y, marker='>', c=rgb)
ヒストグラムをライトグリーン色を用いて描画する plt.hist(データ列, color='lightseagreen') plt.hist(データ列, color='lightseagreen')
オブジェクトが関数 callable(obj) callable(obj)
線グラフをライトスレイグレー色で描画する plt.plot(データ列x, データ列y, color='lightslategray') plt.plot(データ列x, データ列y, color='lightslategray')
折れ線グラフのバツ印を赤くする plt.plot(データ列x, データ列y, marker='x', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='x', markerfacecolor='r')
表をグループ化し、ある列の記述統計量を算出する df.groupby('列A').describe()['列B'] df.groupby('列A').describe()['列B']
データ列のUNIX秒を日付データに変換する pd.to_datetime(ds, unit='s', utc=True) pd.to_datetime(ds, unit='s', utc=True)
文字列は全て識別子名かどうか調べる s.isidentifier() s.isidentifier()
option: 小麦色を使う color = 'wheat' color = 'wheat'
標準化する sklearn.preprocessing.StandardScaler().fit_transform(データ) sklearn.preprocessing.StandardScaler().fit_transform(データ)
表示可能な最大列数を変更する pd.set_option('display.max_columns', n) pd.set_option('display.max_columns', n)
2つのカウンタのいずれかに含まれる要素 aCounter | aCounter2 aCounter | aCounter2
ヒストグラムの色をイエローグリーンに指定する plt.hist(データ列, color='yellowgreen') plt.hist(データ列, color='yellowgreen')
2つの文字列は同じでないか調べる s!= s2 s != s2
ヒストグラムを真紅色で描画する plt.hist(データ列, color='crimson') plt.hist(データ列, color='crimson')
データフレームのカラムを各グループごとに散布図にする sns.scatterplot(data=df, x='列名', y='列名', hue='カテゴリ列') sns.scatterplot(data=df, x='列名', y='列名', hue='カテゴリ列')
ランダム性を強化したランダムフォレストでクラス分類をする model = sklearn.ensemble.ExtraTreeClassifier(n_estimators=10) model = sklearn.ensemble.ExtraTreeClassifier(n_estimators=10)
option: 黄色にグラフの色を変更する color = 'yellow' color = 'yellow'
折れ線グラフの色をダークグレーに指定する plt.plot(データ列x, データ列y, color='darkgray') plt.plot(データ列x, データ列y, color='darkgray')
ヒストグラムをホットピンク色を用いて描画する plt.hist(データ列, color='hotpink') plt.hist(データ列, color='hotpink')
データシリーズを丸めて整数にする ds.round().astype(int) ds.round().astype(int)
option: ペルーにフォントの色を設定する color = 'peru' color = 'peru'
折れ線グラフの色をタンに指定する plt.plot(データ列x, データ列y, color='tan') plt.plot(データ列x, データ列y, color='tan')
最小値でデータフレームの選択したカラムの欠損値を埋める df[['列A', '列B']].fillna(df[['列A', '列B']].min()) df[['列A', '列B']].fillna(df[['列A', '列B']].min())
整数nがセットのどれかかどうか調べる n in aSet n in aSet
データフレームを表示するとき、表示可能な列数の最大値をnに指定する pd.set_option('display.max_columns', n) pd.set_option('display.max_columns', n)
ミントクリームにヒストグラムの色を設定する plt.hist(データ列, color='mintcream') plt.hist(データ列, color='mintcream')
ダークオリーブグリーン色で線グラフを描画する plt.plot(データ列x, データ列y, color='darkolivegreen') plt.plot(データ列x, データ列y, color='darkolivegreen')
データフレームとデータフレームの列を合体させる df.T pd.concat([df, ds], axis=1)
グラフの色使いを暗くする sns.set(pallete='dark') sns.set(pallete='dark')
配列とリストの散布図にrgbのバツマーカーを描画する plt.plot(データ列x, データ列y, marker='x', c=rgb) plt.plot(データ列x, データ列y, marker='x', c=rgb)
単回帰モデルの残差をヒストグラムにする plt.hist(目的変数 - model.predict(説明変数)) plt.hist(目的変数 - model.predict(説明変数))
変数を赤色化する f'\033[31m{value}\033[0m' f'\033[31m{value}\033[0m'
ベクトルの次元数を計算する aArray.shape aArray.ndim
タプルの値を列挙する aTuple.index() aDict.values()
option: 色をモカシンに指定する color ='moccasin' color = 'moccasin'
データフレームの指定した列の欠損値を直前の値で置き換える df['列A'].fillna(method='ffill') df['列A'].fillna(method='ffill')
データフレームの指定した列の名前一覧の列だけ選択する df[columns] df[columns]
折れ線グラフの色をグレーに指定する plt.plot(データ列x, データ列y, color='gray') plt.plot(データ列x, データ列y, color='gray')
ティール色を用いて棒グラフを描画する plt.bar(データ列x, データ列y, color='teal') plt.bar(データ列x, データ列y, color='teal')
オリベドラブ色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='olivedrab') plt.plot(データ列x, データ列y, color='olivedrab')
線グラフをスレートブルー色として描画する plt.plot(データ列x, データ列y, color='slateblue') plt.plot(データ列x, データ列y, color='slateblue')
プロットを使う準備をする import matplotlib.pyplot as plt import matplotlib.pyplot as plt
散布図の丸マーカーの色を設定する plt.scatter(データ列x, データ列y, marker='o', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='o', markerfacecolor='#800080')
ミディアムパープル色を用いてヒストグラムを描画する plt.hist(データ列, color='mediumpurple') plt.hist(データ列, color='mediumpurple')
指定した列によってデータフレームを並べ直す df.sort_values(by='列A') df.sort_values(by='列A')
データフレームから指定した列名一覧の列のみ選ぶ df.select_dtypes('object').columns df[columns]
データフレームを二つのカラムによって小さい順に破壊的に並べる df.sort_values(by=['列A', '列B'], ascending=True, inplace=True) df.sort_values(by=['列A', '列B'], ascending=True, inplace=True)
option: 青緑色を用いる color = 'teal' color = 'teal'
ふたつの集合の∪ aSet.intersection(aSet2) aSet.union(aSet2)
横棒グラフをダークオレンジ色として描画する plt.barh(データ列x, データ列y, color='darkorange') plt.barh(データ列x, データ列y, color='darkorange')
2つのデータフレームを連結する pd.concat([df, df2], axis=0) pd.concat([df, df2])
等間隔の行列 np.arange(開始値, 終了値, 等差) np.arange(開始値, 終了値, 等差)
線グラフをミディアムシアグリーン色として描画する plt.plot(データ列x, データ列y, color='mediumseagreen') plt.plot(データ列x, データ列y, color='mediumseagreen')
インデックスにしてCSVファイルのn行目を読み込む pd.read_csv('file.csv', index_col=n) pd.read_csv('file.csv', index_col=n)
文字列の中で大文字・小文字を無視してパターンにマッチした全ての文字列をリストにする re.findall(pattern, s, flags=re.IGNORECASE) re.findall(pattern, s, flags=re.IGNORECASE)
ヒストグラムの色をミディアムブルーに変更する plt.hist(データ列, color='mediumblue') plt.hist(データ列, color='mediumblue')
オブジェクトはタプルに含まれないか調べる element not in aTuple element not in aTuple
ブルーバイオレット色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='blueviolet') plt.bar(データ列x, データ列y, color='blueviolet')
双方向キューから最初の要素を取り出す deq.index(element) deq.remove(element)
ティール色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='teal') plt.plot(データ列x, データ列y, color='teal')
リストとリストの散布図を描画し、、マーカーを星に変更する plt.plot(データ列x, データ列y, marker='*') plt.plot(データ列x, データ列y, marker='*')
縦棒グラフをレベッカパープル色として描画する plt.bar(データ列x, データ列y, color='rebeccapurple') plt.bar(データ列x, データ列y, color='rebeccapurple')
option: グラフの色をディムグレーに指定する color = 'dimgrey' color = 'dimgrey'
変数を紫色で表示する print(f'\033[35m{value}\033[0m') print(f'\033[35m{value}\033[0m')
日付データからn秒を減算する aDate - datetime.timedelta(seconds=n) aDate - datetime.timedelta(seconds=n)
デックのn番目 deq[n] deq[n]
横軸の目盛りに文字列を設定する plt.xticks([0, 60, 90], ['不可', '秀']) plt.xticks([0, 60, 90], ['不可', '可', '秀'])
折れ線グラフに青い左三角印を描画する plt.plot(データ列x, データ列y, marker='<', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='<', markerfacecolor='b')
ヒストグラムを実線として描画する plt.hist(データ列, linestyle='solid') plt.hist(データ列, linestyle='solid')
散布図をアンティークホワイト色を使って描画する plt.scatter(データ列x, データ列y, color='antiquewhite') plt.scatter(データ列x, データ列y, color='antiquewhite')
データシリーズの文字列を未入力値にする ds.replace(値, np.nan) ds.replace(値, np.nan)
左三角マーカーで散布図を描く plt.plot(データ列x, データ列y, marker='<') plt.plot(データ列x, データ列y, marker='<')
データフレームの指定した列を百の位で丸める df['列A'].round(-2) df['列A'].round(-2)
データフレームの選択したカラムの中に日付データがあるか調べる df[['列A', '列B']].isin([value]) df[['列A', '列B']].isin([value])
ヒストグラムをライトシアン色として描画する plt.hist(データ列, color='lightcyan') plt.hist(データ列, color='lightcyan')
データフレームを表示するとき、表示できる最大行数をnに設定する pd.set_option('display.max_rows', n) pd.set_option('display.max_rows', n)
縦棒グラフの色をダークシアグリーンにする plt.bar(データ列x, データ列y, color='darkseagreen') plt.bar(データ列x, データ列y, color='darkseagreen')
コーラル色で棒グラフを描画する plt.bar(データ列x, データ列y, color='coral') plt.bar(データ列x, データ列y, color='coral')
シーケンスから行列を作る np.array(iterable) np.array(iterable)
ミスティローズにヒストグラムの色を変更する plt.hist(データ列, color='mistyrose') plt.hist(データ列, color='mistyrose')
空のガウス過程分類モデルを用意する model = sklearn.gaussian_process.GaussianProcessClassifier() model = sklearn.gaussian_process.GaussianProcessClassifier()
散布図に黒い丸マーカーを用いる plt.plot(データ列x, データ列y, marker='o', c='k') plt.plot(データ列x, データ列y, marker='o', c='k')
未初期化の行列 np.empty(要素数, dtype=np.int) np.empty(要素数, dtype=np.int)
折れ線グラフの左三角印を青くする plt.plot(データ列x, データ列y, marker='<', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='<', markerfacecolor='b')
データフレームの欠損値を数値で埋める df.fillna(x) df.fillna(x)
オブジェクトがリストの要素でないか element not in aList element not in aList
データフレームを行を付けず出力する df.to_csv('file.csv', header=None) df.to_csv('file.csv', index=None)
実数を万の位で四捨五入する round(x, -4) round(x, -4)
データシリーズのSkewness ds.skew() ds.skew()
配列とリストの散布図に黒い右三角マーカーを描画する plt.plot(データ列x, データ列y, marker='>', c='k') plt.plot(データ列x, データ列y, marker='>', c='k')
option: 色をディムグレーに設定する color = 'dimgrey' color = 'dimgrey'
縦棒グラフを描画し、、バーの横幅を調整する plt.bar(ラベル列, データ列, width=0.5) plt.bar(ラベル列, データ列, width=0.5)
今日が何曜日か知る datetime.datetime.today().weekday() datetime.datetime.today().weekday()
リストとリストについて散布図を描画して、マーカーを丸に変更する plt.plot(データ列x, データ列y, marker='o') plt.plot(データ列x, データ列y, marker='o')
カウンタを低頻出な方から列挙する aCounter.most_common()[::-1] aCounter.most_common()[::-1]
データ列の推移を半透明の一点鎖線でプロットする plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5)
リストとリストについて散布図をプロットし、、マーカーを大バツに設定する plt.plot(データ列x, データ列y, marker='X') plt.plot(データ列x, データ列y, marker='X')
データフレームのある列の文字列を欠損値に変換する df['列A'].replace(値, np.nan) df['列A'].replace(値, np.nan)
赤いポイントマーカーを散布図に描画する plt.scatter(データ列x, データ列y, marker='.', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='.', markerfacecolor='r')
ひとつでも非アスキー文字が文字列中に含まれる any(not c.isascii() for c in s) any(not c.isascii() for c in s)
マップのキーに対応した値 aDict.keys() aDict.get(key)
ヒストグラムをリネン色を使って描画する plt.hist(データ列, color='linen') plt.hist(データ列, color='linen')
オリーブ色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='olive') plt.plot(データ列x, データ列y, color='olive')
ライトグレー色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='lightgrey') plt.plot(データ列x, データ列y, color='lightgrey')
option: タブを分割記号で用いる sep = '\t' sep = '\t'
散布図の四角印の大きさを変更する plt.scatter(データ列x, データ列y, marker='s', markersize=2.0) plt.scatter(データ列x, データ列y, marker='s', markersize=2.0)
n足すn2を求める n + n2 n + n2
ホワイト色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='white') plt.bar(データ列x, データ列y, color='white')
スクリプトファイルと同じフォルダのファイルパスのパスを使う os.path.join(os.path.dirname(os.path.abspath(__file__)), filepath) os.path.join(os.path.dirname(os.path.abspath(__file__)), filepath)
データフレームの指定した列がどの程度、分散しているか見る df['列A'].var() df['列A'].var()
データフレームをソートし、、新しいインデックスを加える df.sort_values('キーとなる列').reset_index() df.sort_values('キーとなる列').reset_index()
本日は何月か知る datetime.datetime.today().month datetime.datetime.today().month
データフレームのカラムを目的変数にする 目的変数 = df['列名'] 目的変数 = df['列名']
2つのデータフレームを合体させる pd.concat([df, df2]) pd.concat([df, df2])
散布図をゲインズボロ色を用いて描画する plt.scatter(データ列x, データ列y, color='gainsboro') plt.scatter(データ列x, データ列y, color='gainsboro')
実数のハイパボリック・サイン math.acosh(x) math.sinh(x)
バイナリできるようにファイルをオープンする] open(filepath, mode='rb') open(filepath, mode='rb')
線グラフの色をカデットブルーに指定する plt.plot(データ列x, データ列y, color='cadetblue') plt.plot(データ列x, データ列y, color='cadetblue')
カウンタから最も頻出な文字列の件数 aCounter.most_common()[1] aCounter.most_common()[1]
5行をランダムに表から抽出する df.sample(5) df.sample(5)
2つのカウンタの共通する要素 aCounter & aCounter2 aCounter & aCounter2
線グラフの色をラベンダーに指定する plt.plot(データ列x, データ列y, color='lavender') plt.plot(データ列x, データ列y, color='lavender')
マッピングを並べ直してJSON形式の文字列に変換する json.dumps(aDict, ensure_ascii=False, sort_keys=True) json.dumps(aDict, ensure_ascii=False, sort_keys=True)
ダークスラテグレー色として縦棒グラフを描画する plt.bar(データ列x, データ列y, color='darkslategray') plt.bar(データ列x, データ列y, color='darkslategray')
スーパーセットもしくは等しいかどうか aSet or aSet2 aSet > aSet2
データフレームの一部のカラムの空文字を欠損値に変換し、ドロップする df[['列A', '列B']].replace('', np.nan).dropna() df[['列A', '列B']].replace('', np.nan).dropna()
カウンタの文字列のカウント aCounter[element] aCounter[element]
option: シーグリーンにグラフの色を変更する color ='seagreen' color = 'seagreen'
ラベル付きの円プロットを描画する plt.pie(データ列, startangle=90, labels=ラベル列) plt.pie(データ列, startangle=90, labels=ラベル列)
sepを区切りとして文字列リストを結合する sep.join(aStringList) sep.join(aStringList)
文字列がカタカナ ('ァ' <= ch <= 'ン') ('ァ' <= ch <= 'ン')
ヒストグラムを深紅色で描画する plt.hist(データ列, color='crimson') plt.hist(データ列, color='crimson')
文字コードtextで追加できるようにファイルをオープンする] open(filepath, mode='a', encoding=text) open(filepath, mode='a', encoding=text)
オブジェクトは集合型 isinstance(obj, set) isinstance(obj, set)
RANSACでクラス分類を行う model = sklearn.linear_model.RANSACClassifier(random_state=0) model = sklearn.linear_model.RANSACClassifier(random_state=0)
option: ピーチパフ色を用いる color = 'peachpuff' color = 'peachpuff'
線グラフの色をフクシアに設定する plt.plot(データ列x, データ列y, color='fuchsia') plt.plot(データ列x, データ列y, color='fuchsia')
データ列を分割数nで分割してnamesのラベルをつける pd.cut(ds, n, labels=names) pd.cut(ds, n, labels=names)
パパイヤウィップ色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='papayawhip') plt.plot(データ列x, データ列y, color='papayawhip')
データフレームを複数の列で降順にソートする df.sort_values(by=['列A', '列B'], ascending=False) df.sort_values(by=['列A', '列B'], ascending=False)
正規分布による累積分布関数の逆関数を使う scipy.stats.norm.cdf(x, loc=平均値, scale=標準偏差) scipy.stats.norm.cdf(x, loc=平均値, scale=標準偏差)
ヒストグラムの色をダークオリーブグリーンに変更する plt.hist(データ列, color='darkolivegreen') plt.hist(データ列, color='darkolivegreen')
行列の行ごとの最大を求める np.max(aArray, axis=1) np.max(aArray, axis=1)
空白文字を全部見る string.whitespace string.whitespace
線グラフをバイオレット色として描画する plt.plot(データ列x, データ列y, color='violet') plt.plot(データ列x, データ列y, color='violet')
双方向キューを全て取り除く deq.clear() deq.clear()
横棒グラフをマルーン色として描画する plt.barh(データ列x, データ列y, color='maroon') plt.barh(データ列x, データ列y, color='maroon')
データフレームの中に文字列がある df.isin([value]) df.isin([value])
CSVのn行目をインデックスとして読み込む pd.read_csv('file.csv', index_col=n) pd.read_csv('file.csv', index_col=n)
option: フォントの色を白に設定する color = 'white' color = 'white'
データフレームの列概要 df.info() df.info()
nがn2より大きいかどうか確認する n > n2 n > n2
現在を文字列でフォーマットする "datetime.datetime.today().strftime(""%d/%m/%y"")" "datetime.datetime.today().strftime(""%d/%m/%y"")"
折れ線グラフの色をブランチドアーモンドに変更する plt.plot(データ列x, データ列y, color='blanchedalmond') plt.plot(データ列x, データ列y, color='blanchedalmond')
グラフの色を暗くする sns.set(pallete='dark') sns.set(pallete='dark')
分子n分母mの有理数を作る fractions.Fraction(numerator=n, denominator=m) fractions.Fraction(numerator=n, denominator=m)
データシリーズのNaNを直前の値に指定する ds.fillna(method='ffill') ds.fillna(method='ffill')
日付と時間から日付時刻 aDate - datetime.timedelta(hours=n) datetime.datetime(年, 月, 日, 時, 分, 秒)
option: シルバーを使う color ='silver' color = 'silver'
破線に折れ線グラフを設定する plt.plot(データ列x, データ列y, linestyle='dashed') plt.plot(データ列x, データ列y, linestyle='dashed')
ロイヤルブルーにヒストグラムの色を設定する plt.hist(データ列, color='royalblue') plt.hist(データ列, color='royalblue')
青紫色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='violet') plt.barh(データ列x, データ列y, color='violet')
縦棒グラフをブランチドアーモンド色で描画する plt.bar(データ列x, データ列y, color='blanchedalmond') plt.bar(データ列x, データ列y, color='blanchedalmond')
option: グリーンにフォントの色を設定する color = 'green' color = 'green'
データフレームをインデックスによって降順で並べ直す df.sort_index(ascending=False) df.sort_index(ascending=False)
カラム名を指定して2つのデータフレームを内部結合する pd.merge(df, df2, on='列A', how='inner') pd.merge(df, df2, on='列A', how='inner')
配列を等間隔でn個に分割する pd.cut(aArray, n) pd.cut(aArray, n)
データフレームの指定した列のNaNをxに設定する df['列A'].fillna(x) df['列A'].fillna(x)
非大文字が文字列中にあるかどうか確認する any(not c.isupper() for c in s) any(not c.isupper() for c in s)
option: ライトサーモンにグラフの色を変更する color = 'lightsalmon' color = 'lightsalmon'
行列の行ごとの標準偏差を求める np.std(aArray, axis=1) np.std(aArray, axis=1)
プラットホーム名 sys.platform sys.platform
データフレームの選択したカラムの中にいくつNaNがあるか数える df[['列A', '列B']].isna().sum() df[['列A', '列B']].isna().sum()
折れ線グラフをライトイエロー色として描画する plt.plot(データ列x, データ列y, color='lightyellow') plt.plot(データ列x, データ列y, color='lightyellow')
折れ線グラフの色をターコイズに指定する plt.plot(データ列x, データ列y, color='turquoise') plt.plot(データ列x, データ列y, color='turquoise')
ブルーバイオレット色としてヒストグラムを描画する plt.hist(データ列, color='blueviolet') plt.hist(データ列, color='blueviolet')
JSON形式の文字列を辞書にする json.loads(jsonString) json.loads(jsonString)
ある列の値がx以上y以下の行を抽出する df[df['列A'] <= x] df[(x <= df['列A']) & (df['列A'] <= y)]
オブジェクトのプロパティの値をする getattr(obj, プロパティ名) setattr(obj, プロパティ名, 値)
データフレームを表示するとき、最大行数をnに設定する pd.set_option('display.max_rows', n) pd.set_option('display.max_rows', n)
多次元データをt分布型確率的近傍埋め込み法でパステル調に次元に次元削減する sklearn.manifold.TSNE(n_components=N).fit_transform(多次元データ) sklearn.manifold.TSNE(n_components=N).fit_transform(多次元データ)
データフレームの統計量を確認する df.describe() df.describe()
option: グラフの色をペールグリーンに指定する color = 'palegreen' color = 'palegreen'
データフレームの指定した列を千の位で丸めて、整数型にする df['列A'].round(-3).astype(int) df['列A'].round(-3).astype(int)
nが2で割り切れないか n % 2 == 1 n % 2 == 1
データフレームを表示するとき、表示可能な列数の最大値をnにセットする pd.set_option('display.max_rows', n) pd.set_option('display.max_columns', n)
ライムグリーン色で線グラフを描画する plt.plot(データ列x, データ列y, color='limegreen') plt.plot(データ列x, データ列y, color='limegreen')
茶色色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='brown') plt.plot(データ列x, データ列y, color='brown')
折れ線グラフの色をパールゴールデンロッドにセットする plt.plot(データ列x, データ列y, color='palegoldenrod') plt.plot(データ列x, データ列y, color='palegoldenrod')
折れ線グラフの丸印の太さを設定する plt.plot(データ列x, データ列y, marker='o', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='o', markeredgewidth=2.5)
イテラブルの各要素を順に双方向キューの左側につけ加える deq.extendleft(iterable) deq.extendleft(iterable)
option: 色をミントクリームに設定する color ='mintcream' color = 'mintcream'
日付データをISO書式の文字列にする aDate.isoformat() aDate.isoformat()
データフレームから列を1つのみ選択する df[['列A']] df[['列A']]
箱ひげ図をプロットして、平均値を追加する plt.boxplot(データ列, showmeans=True) plt.boxplot(データ列, showmeans=True)
ダークシアン色で散布図を描画する plt.scatter(データ列x, データ列y, color='darkcyan') plt.scatter(データ列x, データ列y, color='darkcyan')
データフレームの欠損値を平均値で補う df.fillna(df.mean()) df.fillna(df.mean())
データフレームのカラムを型に変換する df[col].astype(ty) df[col] = df[col].astype(ty)
スカイブルー色としてヒストグラムを描画する plt.hist(データ列, color='skyblue') plt.hist(データ列, color='skyblue')
折れ線グラフを赤い点線として描く plt.plot(データ列x, データ列y, linestyle='dotted', color='r') plt.plot(データ列x, データ列y, linestyle='dotted', color='r')
ロバストな線形回帰モデルを作成する model = sklearn.linear_model.HuberRegressor() model = sklearn.linear_model.HuberRegressor()
option: ミントクリームを使う color ='mintcream' color = 'mintcream'
データフレームをCSVファイルからロードする pd.read_csv('file.csv', sep=',') pd.read_csv('file.csv', sep=',')
横棒グラフをピンク色として描画する plt.barh(データ列x, データ列y, color='pink') plt.barh(データ列x, データ列y, color='pink')
色付きの破線を用いてリストの推移を描画する plt.plot(データ列x, データ列y, linestyle='dashed', color='#800080') plt.plot(データ列x, データ列y, linestyle='dashed', color='#800080')
十六進文字列をバイナリに変換する hex(s, hex) int(s, 16).to_bytes(length=bytesize, byteorder='big')
最初のカテゴリーを除いてデータフレームのある列をワンホット・ベクトルに変換する pd.get_dummies(df['列A'], drop_first=True) pd.get_dummies(df['列A'], drop_first=True)
データシリーズのNaNを最頻値で置換する ds.fillna(ds.mode().iloc[0]) ds.fillna(ds.mode().iloc[0])
ファイルから1文字読む f.read(1) f.read(1)
線形回帰モデルのR2を求める model = sklearn.linear_model.R2 sklearn.metrics.r2_score(目的変数, model.predict(説明変数))
ベクトル間のユークリッド距離 aArray.pointsize(point, point2) math.dist(point, point2)
データ列を2つ並べて箱ひげ図にする plt.boxplot([データ列, データ列]) plt.boxplot([データ列, データ列])
横棒グラフをデピンク色として描画する plt.barh(データ列x, データ列y, color='deeppink') plt.barh(データ列x, データ列y, color='deeppink')
ヒストグラムで配列を作図する plt.hist(データ列) plt.hist(データ列)
ヒストグラムをライトコーラル色を用いて描画する plt.hist(データ列, color='lightcoral') plt.hist(データ列, color='lightcoral')
モカシン色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='moccasin') plt.bar(データ列x, データ列y, color='moccasin')
縦棒グラフをパウダーブルー色として描画する plt.bar(データ列x, データ列y, color='powderblue') plt.bar(データ列x, データ列y, color='powderblue')
散布図のマーカーを▽印にする plt.scatter(データ列x, データ列y, marker='v') plt.scatter(データ列x, データ列y, marker='v')
赤い大バツマーカーとして散布図を描画する plt.plot(データ列x, データ列y, marker='X', c='r') plt.plot(データ列x, データ列y, marker='X', c='r')
option: ライトスレイグレー色を用いる color = 'lightslategrey' color = 'lightslategray'
option: 星マーカーを加える marker = '*' marker = '*'
列とシーケンスをペアのリストにする itertools.zip_longest(iterable, iterable2) itertools.zip_longest(iterable, iterable2)
散布図を丸印で描画する plt.scatter(データ列x, データ列y, marker='o') plt.scatter(データ列x, データ列y, marker='o')
色を全般的に色差別なくする sns.set(pallete='colorblind') sns.set(pallete='colorblind')
最後の部分文字列で文字列を分けた場合の最初の文字列を取り出す s.rpartition(sub) s.rpartition(sub)[0]
最後の部分文字列によって文字列を二分する s.rpartition(sub) s.rpartition(sub)
平均値付き箱ヒゲ図をプロットする plt.boxplot(データ列, showmeans=True) plt.boxplot(データ列, showmeans=True)
データシリーズの不偏標準偏差を計算する ds.std() ds.std()
2進数文字列を整数にする int(s, 2) int(s, 2)
ディープスカイブルー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='deepskyblue') plt.bar(データ列x, データ列y, color='deepskyblue')
多次元データをMSDで淡く次元に次元削減する sklearn.manifold.MSD(n_components=三).fit_transform(多次元データ) sklearn.manifold.MSD(n_components=三).fit_transform(多次元データ)
配列の平均 np.mean(aArray) np.mean(aArray)
文字列の中で大文字・小文字を無視して正規表現にマッチしたすべての文字列をリストに変換する re.findall(pattern, s, flags=re.IGNORECASE) re.findall(pattern, s, flags=re.IGNORECASE)
八進文字列をbytesizeバイトのバイト列に変換する int(s, 8).to_bytes(length=bytesize, byteorder='big') int(s, 8).to_bytes(length=bytesize, byteorder='big')
リストとリストについての散布図に文字列という凡例用のラベルをつける plt.scatter(データ列x, データ列y, label=s) plt.scatter(データ列x, データ列y, label=s)
シエナにヒストグラムの色を変更する plt.hist(データ列, color='sienna') plt.hist(データ列, color='sienna')
データフレームの指定した三つの列を取り出す df[['列A', '列B', '列C']] df[['列A', '列B', '列C']]
option: グラフの色をローングリーンにセットする color = 'lawngreen' color = 'lawngreen'
散布図に青い印を描画する plt.scatter(データ列x, データ列y, markerfacecolor='b') plt.scatter(データ列x, データ列y, markerfacecolor='b')
データフレームのあるカラムの不偏分散 df['列A'].var(ddof=1) df['列A'].var(ddof=1)
特異値分解として淡く次元に次元削減する sklearn.decomposition.TruncatedSVD(n_components=三).fit_transform(多次元データ) sklearn.decomposition.TruncatedSVD(n_components=三).fit_transform(多次元データ)
ヒストグラムの色をライトスチールブルーに指定する plt.hist(データ列, color='lightsteelblue') plt.hist(データ列, color='lightsteelblue')
オブジェクトが集合 isinstance(obj, set) isinstance(obj, set)
実線に折れ線グラフの線の種類を設定する plt.plot(データ列x, データ列y, linestyle='solid') plt.plot(データ列x, データ列y, linestyle='solid')
option: アクアを使用する color = 'aqua' color = 'aqua'
ファイルパスをSJISで書き込み用にオープンする] open(filepath, encoding='shift_jis') open(filepath, mode='w', encoding='shift_jis')
オプションで標準エラーを出力先にする file = sys.stderr file = sys.stderr
縦棒グラフをモカシン色で描画する plt.bar(データ列x, データ列y, color='moccasin') plt.bar(データ列x, データ列y, color='moccasin')
オブジェクトがタプルの要素かどうか element in aTuple element in aTuple
ヒストグラムをインディアンレッド色を使って描画する plt.hist(データ列, color='indianred') plt.hist(データ列, color='indianred')
文字列を特殊文字も含め小文字にする s.casefold() s.casefold()
イエローグリーン色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='yellowgreen') plt.plot(データ列x, データ列y, color='yellowgreen')
今日の日付を使う datetime.date.today() datetime.date.today()
異なる列をキーとしてデータフレームを右結合する df.merge(df, df2, left_on='列A', right_on='列B', = map(df.columns, how='right') pd.merge(df, df2, left_on='列A', right_on='列B', how='right')
オブジェクトは浮動小数点数型 isinstance(obj, float) isinstance(obj, float)
やわらかい青色の棒グラフを描画する plt.bar(データ列x, データ列y, color='cornflowerblue') plt.bar(データ列x, データ列y, color='cornflowerblue')
文字列全体が正規表現に大文字・小文字を無視してマッチするか調べる re.fullmatch(pattern, s, flags=re.IGNORECASE) re.fullmatch(pattern, s, flags=re.IGNORECASE)
本日は何年か知る datetime.datetime.today().year datetime.datetime.today().year
散布図に右三角印を加える plt.scatter(データ列x, データ列y, marker='>') plt.scatter(データ列x, データ列y, marker='>')
グリッドの線種を破線に変更する plt.grid(linestyle='dashed') plt.grid(linestyle='dashed')
ヒストグラムをグリーン色として描画する plt.hist(データ列, color='green') plt.hist(データ列, color='green')
データフレームのインデックスがnの行を取り出す df.loc[n] df.loc[n]
データフレームから列を一つのみ選択する df[['列A']] df[['列A']]
折れ線グラフに簡単な説明を付ける plt.plot(データ列x, データ列y, label='s') plt.plot(データ列x, データ列y, label='ラベル')
散布図を黒いクロスマーカーとして描く plt.plot(データ列x, データ列y, marker='x', c='k') plt.plot(データ列x, データ列y, marker='x', c='k')
イテラブルを折れ線グラフとして可視化する plt.plot(データ列x, データ列y) plt.plot(データ列x, データ列y)
ゼロ埋めされたブール型のベクトルを作成する np.zeros(要素数, dtype=np.int32) np.zeros(要素数, dtype=np.int32)
ロバストな単回帰モデルを新規作成する model = sklearn.linear_model.HuberRegressor() model = sklearn.linear_model.HuberRegressor()
データシリーズの中に文字列と日付データがあるか調べる ds.isin([value, value2]) ds.isin([value, value2])
自然数個のものからk個取り出した場合の並べ方の総数を求める math.perm(n, k) math.perm(n, k)
option: グラフの色をスラグレーに指定する color ='slategrey' color = 'slategray'
折れ線グラフの四角マーカーを青色にする plt.plot(データ列x, データ列y, marker='s', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='s', markerfacecolor='b')
コーンフラワーブルー色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='cornflowerblue') plt.plot(データ列x, データ列y, color='cornflowerblue')
セットの補集合 aSet.difference(aSet2) aSet.difference(aSet2)
ダークシアグリーン色を用いて横棒グラフを描画する plt.barh(データ列x, データ列y, color='darkseagreen') plt.barh(データ列x, データ列y, color='darkseagreen')
横棒グラフをローングリーン色を使って描画する plt.barh(データ列x, データ列y, color='lawngreen') plt.barh(データ列x, データ列y, color='lawngreen')
タイムスタンプ型の表データのあるカラムをデータフレームのインデックスにする df.index = pd.DatetimeIndex(df['列A']) df.index = pd.DatetimeIndex(df['列A'])
イエローグリーンにヒストグラムの色を変更する plt.hist(データ列, color='yellowgreen') plt.hist(データ列, color='yellowgreen')
横棒グラフをオリーブ色として描画する plt.barh(データ列x, データ列y, color='olive') plt.barh(データ列x, データ列y, color='olive')
リストと配列の散布図に大バツマーカーを描画する plt.plot(データ列x, データ列y, marker='X') plt.plot(データ列x, データ列y, marker='X')
折れ線グラフをラベンダーブラッシュ色を使って描画する plt.plot(データ列x, データ列y, color='lavenderblush') plt.plot(データ列x, データ列y, color='lavenderblush')
線形のクラス分類を行う model = sklearn.linear_model.LinearRegression() model = sklearn.linear_model.LogisticRegression()
折れ線グラフをアクアマリン色として描画する plt.plot(データ列x, データ列y, color='aquamarine') plt.plot(データ列x, データ列y, color='aquamarine')
実測値を回帰モデルの予測値と対比させる pd.DataFrame({'実測': 目的変数, '予測': model.predict(説明変数)}) pd.DataFrame({'実測': 目的変数, '予測': model.predict(説明変数)})
ビスク色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='bisque') plt.barh(データ列x, データ列y, color='bisque')
分割数nとしてリストを等量でビン分割する pd.qcut(aList, n) pd.qcut(aList, n)
文字列全体がパターンにASCII限定としてマッチするか調べる re.fullmatch(pattern, s, flags=re.ASCI) re.fullmatch(pattern, s, flags=re.ASCI)
折れ線グラフをクリムゾン色を使って描画する plt.plot(データ列x, データ列y, color='crimson') plt.plot(データ列x, データ列y, color='crimson')
rgbの四角マーカーをリストと数列についての散布図に描画する plt.plot(データ列x, データ列y, marker='s', c=rgb) plt.plot(データ列x, データ列y, marker='s', c=rgb)
ヒストグラムを黄緑色を用いて描画する plt.hist(データ列, color='chartreuse') plt.hist(データ列, color='chartreuse')
グラフで利用可能な色名の一覧 matplotlib.colors.cnames matplotlib.colors.cnames
二つの列からグループ化し個数を求める df.groupby(['列A', '列B'], as_index=False).count() df.groupby(['列A', '列B'], as_index=False).count()
データフレームの列のユニークな値の個数を調べる df[col].nunique() df[col].nunique()
セットから任意の要素を取り除く aSet.pop() aSet.pop()
日付データにn日分、加える aDate + datetime.timedelta(days=n) aDate + datetime.timedelta(days=n)
線グラフの色をレベッカパープルに設定する plt.plot(データ列x, データ列y, color='rebeccapurple') plt.plot(データ列x, データ列y, color='rebeccapurple')
ダークサーモンにヒストグラムの色を指定する plt.hist(データ列, color='darksalmon') plt.hist(データ列, color='darksalmon')
データシリーズの分散を求める ds.var() ds.var()
平均値でデータフレームの一部のカラムの欠損値を埋める df[['列A', '列B']].fillna(df[['列A', '列B']].mean()) df[['列A', '列B']].fillna(df[['列A', '列B']].mean())
等量でn個に配列を分割する pd.qcut(aArray, n) pd.qcut(aArray, n)
三整数のLCMを求める math.lcm(n, n2, n3) math.lcm(n, n2, n3)
2つのデータフレームを縦方向に一つにする pd.concat([df, df2], axis=0) pd.concat([df, df2], axis=0)
データフレームのカラムをに箱ひげ図で可視化する plt.boxplot(df[column]) sns.boxplot(x='カテゴリ列', y='列', data=df)
ふたつのカラムからグループ化し、標準偏差を求める df.groupby(['列A', '列B'], as_index=False).std() df.groupby(['列A', '列B'], as_index=False).std()
横棒グラフを描画して、中央寄せする plt.barh(ラベル列, データ列, align='center') plt.barh(ラベル列, データ列, align='center')
ヒストグラムの色をミディアムスプリンググリーンに変更する plt.hist(データ列, color='mediumspringgreen') plt.hist(データ列, color='mediumspringgreen')
ヒストグラムをアンティークホワイト色として描画する plt.hist(データ列, color='antiquewhite') plt.hist(データ列, color='antiquewhite')
スクリプトファイルのフォルダ名 os.path.path.dirname(os.path.abspath(__file__)) os.path.dirname(os.path.abspath(__file__))
データフレームの選択したカラムのパーセンタイルを求める df[['列A', '列B']].quantile(パーセント/100) df[['列A', '列B']].quantile(パーセント/100)
データフレームの一部のカラムの母標準偏差 df[['列A', '列B']].std(ddof=0) df[['列A', '列B']].std(ddof=0)
シーケンスをカウンタに変換する collections.Counter(iterable) collections.Counter(iterable)
y軸だけ目盛り線 plt.grid(axis='y') plt.grid(axis='y')
ヒストグラムをホワイト色で描画する plt.hist(データ列, color='white') plt.hist(データ列, color='white')
スレートブルー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='slateblue') plt.bar(データ列x, データ列y, color='slateblue')
ヒストグラムの色をペールグリーンに変更する plt.hist(データ列, color='palegreen') plt.hist(データ列, color='palegreen')
option: 区切りをスラッシュにする sep = ':' sep = '/'
option: カデットブルーにフォントの色を設定する color = 'cadetblue' color = 'cadetblue'
カテゴリでグループ化して、データフレームを棒プロットにする sns.barplot(x='カテゴリ列', y='列', hue='カテゴリ', data=df) sns.barplot(x='カテゴリ列', y='列名', hue='カテゴリ', data=df)
マップの項目名の値 aDict[key] aDict[key]
見やすいグラフを用いる準備をする import seaborn as sns import seaborn as sns
リストを昇順にソートする sorted(aList, reverse=False) sorted(aList, reverse=False)
線グラフの色をライトグリーンに指定する plt.plot(データ列x, データ列y, color='lightgreen') plt.plot(データ列x, データ列y, color='lightseagreen')
列をビン数nで分割して、namesのラベルをつける pd.cut(ds, n, labels=names) pd.cut(ds, n, labels=names)
オーキッド色を使って棒グラフを描画する plt.bar(データ列x, データ列y, color='orchid') plt.bar(データ列x, データ列y, color='orchid')
天井を求める math.ceil(x) math.ceil(x)
折れ線グラフをピンク色として描画する plt.plot(データ列x, データ列y, color='pink') plt.plot(データ列x, データ列y, color='pink')
リストと配列についての散布図に星マーカーを描画する plt.plot(データ列x, データ列y, marker='*') plt.plot(データ列x, データ列y, marker='*')
データ列と数列についての散布図に赤い星マーカーを描画する plt.plot(データ列x, データ列y, marker='*', c='r') plt.plot(データ列x, データ列y, marker='*', c='r')
option: ライトイエロー色を使用する color = 'lightyellow' color = 'lightyellow'
オレンジレッド色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='orangered') plt.plot(データ列x, データ列y, color='orangered')
データフレームの指定した列の中に存在する文字列と文字列の合計を数える df['列A'].isin([value, value2]).sum() df['列A'].isin([value, value2]).sum()
チョコレート色でヒストグラムを描画する plt.hist(データ列, color='chocolate') plt.hist(データ列, color='chocolate')
黒いバツマーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='x', markerfacecolor='k') plt.plot(データ列x, データ列y, marker='x', markerfacecolor='k')
データフレーム中の未入力値を除く df.dropna(inplace=True) df.dropna(inplace=True)
データフレームのあるカラムが正規分布からどの程度、尖っているか確認する df['列A'].skew() df['列A'].skew()
グラフのx軸を対数目盛に変更する plt.xscale('log') plt.xscale('log')
データフレームの指定したカラムの標準偏差などを確認する df['列A'].std() df['列A'].describe()
カウンタを多い順にリストとして得る aCounter.most_common() aCounter.most_common()
赤い▲マーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='^', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='^', markerfacecolor='r')
数式のn階微分を求める sympy.diff(e, z, n) sympy.diff(e, z, n)
非数値データ列を連番化する sklearn.preprocessing.LabelEncoder().fit_transform(データ列, labels=True) sklearn.preprocessing.LabelEncoder().fit_transform(データ列)
有理数モジュールをインポートする import fractions import fractions
option: グラフの色をダークスラテグレーに指定する color = 'darkslategray' color = 'darkslategray'
option: 整数型を使用する dtype = np.int dtype = np.int
キーがマッピング上で定義済み key in aDict key in aDict
縦棒グラフをアリスブルー色を用いて描画する plt.bar(データ列x, データ列y, color='aliceblue') plt.bar(データ列x, データ列y, color='aliceblue')
データフレームの中に日付データと文字列がいくつあるか数える df.isin([value, value2]).sum() df.isin([value, value2]).sum()
データフレームの選択した列の分位数 df[['列A', '列B']].quantile(パーセント/100) df[['列A', '列B']].quantile(パーセント/100)
散布図の左三角印を黒くする plt.scatter(データ列x, データ列y, marker='<', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='<', markerfacecolor='k')
データ列を書式としてタイムスタンプ型に変換する pd.to_datetime(ds) pd.to_datetime(ds, format='%Y-%m-%d')
データフレームをグループ化し、それぞれの分散を計算する df.groupby('列A').var() df.groupby('列A').var()
文字列を区切りで分割して文字列リストに変換する s.split(sep) s.split(sep)
option: 色をトマトに設定する color = 'tomato' color = 'tomato'
項目名が辞書上で定義されているか調べる key in aDict key in aDict
日付データをn日前にする aDate - datetime.timedelta(days=n) aDate - datetime.timedelta(days=n)
線グラフの色をペールグリーンに変更する plt.plot(データ列x, データ列y, color='palegreen') plt.plot(データ列x, データ列y, color='palegreen')
日付データが日付データよりあと aDate < aDate2 aDate > aDate2
option: ラベンダーブラッシュ色を用いる color = 'lavenderblush' color = 'lavenderblush'
表計算ファイルのシートをデータフレームとして読み込む pd.read_excel('file.xlsx') pd.read_excel('file.xlsx', sheet_name=シート名)
n×n2の二次元リストを得る [[0] * n for _ in range(n2)] [[0] * n for _ in range(n2)]
線グラフをオレンジ色を用いて描画する plt.plot(データ列x, データ列y, color='orange') plt.plot(データ列x, データ列y, color='orange')
散布図をrgbのバツマーカーで描く plt.plot(データ列x, データ列y, marker='x', c=rgb) plt.plot(データ列x, データ列y, marker='x', c=rgb)
リストを分割数nでビン分割する pd.cut(aList, n) pd.cut(aList, n)
データシリーズを整数に丸める ds.round() ds.round()
option: フォントの色をミディアムオーキッドに指定する color ='mediumorchid' color = 'mediumorchid'
縦棒グラフをダークオレンジ色で描画する plt.bar(データ列x, データ列y, color='darkorange') plt.bar(データ列x, データ列y, color='darkorange')
実数のコサインの逆数 math.acos(x) math.acos(x)
データフレームの一部の列を十の位で丸めて整数型にする df[['列A', '列B']].round(-1).astype(int) df[['列A', '列B']].round(-1).astype(int)
棒グラフをゴーストホワイト色を用いて描画する plt.bar(データ列x, データ列y, color='ghostwhite') plt.bar(データ列x, データ列y, color='ghostwhite')
データフレームのカラムの中にいくつ文字列があるか数える df['列A'].isin([value]).sum() df['列A'].isin([value]).sum()
データフレームのポイントプロットをプロットする sns.pointplot(x='カテゴリ列', y='列名', hue='カテゴリ列', data=df) sns.pointplot(x='カテゴリ列', y='列', hue='カテゴリ列', data=df)
レモンシフォン色を用いてヒストグラムを描画する plt.hist(データ列, color='lemonchiffon') plt.hist(データ列, color='lemonchiffon')
データフレームの行を条件で取り除く df[(df['列A'] == x) & (df['列B'] == y)] df[(df['列A'] == x) & (df['列B'] == y)]
折れ線グラフのポイント印の大きさを変更する plt.plot(データ列x, データ列y, marker='.', markersize=2.0) plt.plot(データ列x, データ列y, marker='.', markersize=2.0)
ディープスカイブルー色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='deepskyblue') plt.plot(データ列x, データ列y, color='deepskyblue')
イテラブル自身の長さnの順列 itertools.permutations(iterable, n) itertools.permutations(iterable, n)
プロットを濃くする sns.set(pallete='deep') sns.set(pallete='deep')
折れ線グラフの色を耐火レンガに変更する plt.plot(データ列x, データ列y, color='firebrick') plt.plot(データ列x, データ列y, color='firebrick')
ふたつの集合の交わり aSet.intersection(aSet2) aSet.intersection(aSet2)
日付データは何日か知る aDate.day aDate.day
ミッドナイトブルー色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='midnightblue') plt.bar(データ列x, データ列y, color='midnightblue')
カデットブルー色でヒストグラムを描画する plt.hist(データ列, color='cadetblue') plt.hist(データ列, color='cadetblue')
線グラフをライトスレイグレー色として描画する plt.plot(データ列x, データ列y, color='lightslategrey') plt.plot(データ列x, データ列y, color='lightslategray')
水色で文字列をプリントする print(f'\033[36m{value}\033[0m') print(f'\033[36m{value}\033[0m')
EUCでファイルをオープンする] open(filepath, encoding='euc_jp') open(filepath, encoding='euc_jp')
セットから値を取り除く aSet.remove(element) aSet.remove(element)
表計算ファイルを読み込む pd.read_excel('file.xlsx') pd.read_excel('file.xlsx')
散布図を丸マーカーでプロットする plt.plot(データ列x, データ列y, marker='o') plt.plot(データ列x, データ列y, marker='o')
データフレームのカーネル密度による分布図を描画する sns.kdeplot(x='列名', hue='カテゴリ列', data=df) sns.kdeplot(x='列名', hue='カテゴリ列', data=df)
印字可能な文字を使う string.printable string.printable
リストの折れ線グラフを描画し、、色をカラーコードで変更する plt.plot(データ列x, データ列y, color='#800080') plt.plot(データ列x, データ列y, color='#800080')
読み込みモードを用いてファイルをオープンして]、fとする f = open(filepath, mode='r') f = open(filepath, mode='r')
小数点以下の表示精度を設定する pd.set_option('precision', n) pd.set_option('precision', n)
option: フォントの色をアクアに設定する color = 'aqua' color = 'aqua'
データフレームの内容を調べる df.head() df.head()
マッピングからキーの値を得る aDict.get(key) aDict.get(key)
CSVをヘッダを指定せずロードする pd.read_csv('file.csv', header=None) pd.read_csv('file.csv', header=None)
グラフの描画を綺麗にする import seaborn as sns import seaborn as sns
データフレームの選択したカラムの中に文字列と文字列が存在する df[['列A', '列B']].isin([value, value2]) df[['列A', '列B']].isin([value, value2])
縦棒プロットを描画して、ラベルを左寄せする plt.bar(ラベル列, データ列, align='edge') plt.bar(ラベル列, データ列, align='edge')
文字列中にひとつでも非アルファベットが含まれるか any(not c.isalpha() for c in s) any(not c.isalpha() for c in s)
列をカテゴリデータに変換する ds.asympify(iterable) ds.astype(object)
列を両端キューに変換する collections.deque(iterable) collections.deque(iterable)
列の名前を列挙する df.columns df.columns
ヒストグラムの色をグリーンに指定する plt.hist(データ列, color='green') plt.hist(データ列, color='green')
データフレームの中の未入力値の数を数える df.isna().sum() df.isna().sum()
多次元データを特異値分解で淡く次元に削減する sklearn.decomposition.TruncatedSVD(n_components=三).fit_transform(多次元データ) sklearn.decomposition.TruncatedSVD(n_components=三).fit_transform(多次元データ)
横棒グラフを耐火レンガ色を用いて描画する plt.barh(データ列x, データ列y, color='firebrick') plt.barh(データ列x, データ列y, color='firebrick')
ヒストグラムをマゼンタ色を使って描画する plt.hist(データ列, color='magenta') plt.hist(データ列, color='magenta')
貝殻色で散布図を描画する plt.scatter(データ列x, データ列y, color='seashell') plt.scatter(データ列x, データ列y, color='seashell')
option: ゴーストホワイト色を用いる color = 'ghostwhite' color = 'ghostwhite'
ライトブルー色で線グラフを描画する plt.plot(データ列x, データ列y, color='lightblue') plt.plot(データ列x, データ列y, color='lightblue')
データシリーズの中にと文字列がある ds.isin([value, value2]) ds.isin([value, value2])
棒グラフをライトグリーン色を用いて描画する plt.bar(データ列x, データ列y, color='lightseagreen') plt.bar(データ列x, データ列y, color='lightseagreen')
三整数のLCM math.lcm(n, n2, n3) math.lcm(n, n2, n3)
行列間の要素ごとの最小公倍数 np.gcd(aArray, aArray2) np.lcm(aArray, aArray2)
option: 色を黄緑に設定する color = 'chartreuse' color = 'chartreuse'
ブルーバイオレット色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='blueviolet') plt.plot(データ列x, データ列y, color='blueviolet')
ヒストグラムを紺色として描画する plt.hist(データ列, color='darkblue') plt.hist(データ列, color='darkblue')
データフレームを関数の値に集約し、、列挙する [(name, group_df) for _ in df.groupby(関数)] [(name, group_df) for name, group_df in df.groupby(関数)]
データシリーズの分位数を求める ds.quantile(パーセント/100) ds.quantile(パーセント/100)
縦棒グラフをグレー色を用いて描画する plt.bar(データ列x, データ列y, color='gray') plt.bar(データ列x, データ列y, color='gray')
データフレームは正規分布からどの程度歪んでいるか見る df.kurt() df.kurt()
赤い大バツマーカーを用いて散布図を描画する plt.plot(データ列x, データ列y, marker='X', c='r') plt.plot(データ列x, データ列y, marker='X', c='r')
セットの全ての要素が別の集合に含まれる aSet.issubset(aSet2) aSet.issubset(aSet2)
双方向キューが空であるか調べる len(deq) == 0 len(deq) == 0
多重集合を辞書から作成する collections.ChainMap(aDict) collections.Counter(aDict)
option: ミスティローズにフォントの色を設定する color ='mistyrose' color = 'mistyrose'
全要素を0で初期化した行列を作成する np.zeros(行数, 列数, dtype=np.int) np.zeros(行数, 列数)
nがn2 n >= n2 n == n2
ファイルパスの拡張子なしのファイル名を使う os.path.splitext(filepath)[1]!= -1 os.path.splitext(os.path.basename(filepath))[0]
赤いポイントマーカーで散布図をプロットする plt.plot(データ列x, データ列y, marker='.', c='r') plt.plot(データ列x, データ列y, marker='.', c='r')
ヒストグラムの色をダークバイオレットにする plt.hist(データ列, color='darkviolet') plt.hist(データ列, color='darkviolet')
データフレームの最後のカラム以外を全て説明変数にする 説明変数 = df[df.columns[:-1]] 説明変数 = df[df.columns[:-1]]
ヒストグラムの描画して正規化する plt.hist(データ列, density=True) plt.hist(データ列, density=True)
散布図をゴールデンロッド色を用いて描画する plt.scatter(データ列x, データ列y, color='goldenrod') plt.scatter(データ列x, データ列y, color='goldenrod')
nがn2より小さいか判定する n < n2 n < n2
数列のスピアマンの相関係数を計算する scipy.stats.spearmanr(数列, 数列2) scipy.stats.spearmanr(数列, 数列2)
タイムスタンプデータをn時間前に戻す aDatetime - datetime.timedelta(hours=n) aDatetime - datetime.timedelta(hours=n)
スラグレー色で棒グラフを描画する plt.bar(データ列x, データ列y, color='slategrey') plt.bar(データ列x, データ列y, color='slategrey')
リストとイテラブルについての散布図にrgbの▽マーカーをプロットする plt.plot(データ列x, データ列y, marker='v', c=rgb) plt.plot(データ列x, データ列y, marker='v', c=rgb)
折れ線グラフをレモンシフォン色として描画する plt.plot(データ列x, データ列y, color='lemonchiffon') plt.plot(データ列x, データ列y, color='lemonchiffon')
option: グラフの色をスラグレーにする color ='slategrey' color = 'slategray'
小麦色色で散布図を描画する plt.scatter(データ列x, データ列y, color='wheat') plt.scatter(データ列x, データ列y, color='wheat')
グリーンイエローにヒストグラムの色をセットする plt.hist(データ列, color='greenyellow') plt.hist(データ列, color='greenyellow')
numpyをインポートする import numpy as np import numpy as np
option: フローラルホワイトにグラフの色を設定する color = 'floralwhite' color = 'floralwhite'
オプションで標準出力を出力にする file = sys.stdout file = sys.stdout
横棒グラフをハニーデュー色を使って描画する plt.barh(データ列x, データ列y, color='honeydew') plt.barh(データ列x, データ列y, color='honeydew')
折れ線グラフの印を左三角にする plt.plot(データ列x, データ列y, marker='<') plt.plot(データ列x, データ列y, marker='<')
散布図をバツ印を用いる描画する plt.scatter(データ列x, データ列y, marker='x') plt.scatter(データ列x, データ列y, marker='x')
横棒プロットをプロットする plt.barh(ラベル列, データ列) plt.barh(ラベル列, データ列)
数値でデータフレームの選択したカラムの欠損値を埋める df[['列A', '列B']].fillna(x) df[['列A', '列B']].fillna(x)
ケースを無視して正規表現に文字列の先頭でマッチさせる re.match(pattern, s, flags=re.IGNORECASE) re.match(pattern, s, flags=re.IGNORECASE)
データフレームを列名を指定して全ジョインする pd.merge(df, df2, on='列A', how='outer') pd.merge(df, df2, on='列A', how='outer')
縦棒グラフの色をシーグリーンにする plt.bar(データ列x, データ列y, color='seagreen') plt.bar(データ列x, データ列y, color='seagreen')
線グラフの色をオリベドラブに指定する plt.plot(データ列x, データ列y, color='olivedrab') plt.plot(データ列x, データ列y, color='olivedrab')
リストと数列の散布図に菱形マーカーを描画する plt.plot(データ列x, データ列y, marker='D') plt.plot(データ列x, データ列y, marker='D')
散布図に大バツマーカーを用いる plt.plot(データ列x, データ列y, marker='X') plt.plot(データ列x, データ列y, marker='X')
xが1、もしくは2、もしくは3に等しいか確認する x == 1 or x == 2 or x == 3 x == 1 or x == 2 or x == 3
文字列からformatのパターンで日付時刻にする datetime.datetime.strptime(日付の書かれた文字列, format) datetime.datetime.strptime(日付の書かれた文字列, format)
グラフから格子線を消す plt.grid(linewidth=3.0) plt.grid(False)
option: ライトイエローを使う color = 'lightyellow' color = 'lightyellow'
日付時刻データがタイムスタンプデータと同時か確認する aDatetime == aDatetime2 aDatetime == aDatetime2
ヒストグラムをライトイエロー色を用いて描画する plt.hist(データ列, color='lightyellow') plt.hist(データ列, color='lightyellow')
散布図のバツ印の色を設定する plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='#800080')
折れ線グラフの色をネイビーに変更する plt.plot(データ列x, データ列y, color='navy') plt.plot(データ列x, データ列y, color='navy')
ヒストグラムの色をライトブルーに指定する plt.hist(データ列, color='lightblue') plt.hist(データ列, color='lightblue')
CSVファイルにデータフレームをインデックスを付けず保存する df.to_csv('file.csv', index=None) df.to_csv('file.csv', index=None)
文字列を下線付き化する f'\033[4m{value}\033[0m' f'\033[4m{value}\033[0m'
プロットにx=0の破線を設定する plt.axvline(x=0, linestyle='dashed') plt.axvline(x=0, linestyle='dashed')
線グラフの色をグリーンに設定する plt.plot(データ列x, データ列y, color='green') plt.plot(データ列x, データ列y, color='green')
表計算から全てのシートを読み込む pd.read_excel('file.xlsx', sheet_name=None) pd.read_excel('file.xlsx', sheet_name=None)
分類モデルの決定係数を求める sklearn.metrics.hmean_squared_error(データ列, データ列2) sklearn.metrics.r2_score(目的変数, model.predict(説明変数))
option: グラフの色をオールドレースにセットする color = 'oldlace' color = 'oldlace'
数式のパラメータを数式で置き換える e.subs(z, e2) e.subs(z, e2)
コロンによって文字列を分割して、列挙する s.split(':') s.split(':')
データフレームの指定したカラムの中にいくつ文字列があるかカウントする df['列A'].isin([value]).sum() df['列A'].isin([value]).sum()
nからn2までの一つ置きの整数列を作る list(range(n, n2+1)) list(range(n, n2+1, 2))
耐火レンガ色を使って棒グラフを描画する plt.bar(データ列x, データ列y, color='firebrick') plt.bar(データ列x, データ列y, color='firebrick')
option: BOM付きを使用する encoding = 'utf_8_sig' encoding = 'utf_8_sig'
データフレームの指定したカラムの中にいくつNaNが存在するか調べる df['列A'].isna().sum() df['列A'].isna().sum()
データフレームを並べ直して、下位n件を取り出す df.sort_values('キーとなる列').tail(n) df.sort_values('キーとなる列').tail(n)
option: リネンを用いる color = 'linen' color = 'linen'
rgbの左三角マーカーをリストとリストについての散布図に描画する plt.plot(データ列x, データ列y, marker='<', c=rgb) plt.plot(データ列x, データ列y, marker='<', c=rgb)
折れ線グラフの色を淡いピンク色にする plt.plot(データ列x, データ列y, color='lightpink') plt.plot(データ列x, データ列y, color='lightpink')
組の中の最大値を算出する max(aTuple) max(aTuple)
N未満までの配列 np.arange(N) np.arange(N)
100行をデータフレームからランダムに取り出す df.sample(100) df.sample(100)
折れ線グラフをアンティークホワイト色を用いて描画する plt.plot(データ列x, データ列y, color='antiquewhite') plt.plot(データ列x, データ列y, color='antiquewhite')
ファイルを開いて]、バイナリ書き込みストリームを使う open(filepath, mode='wb') open(filepath, mode='wb')
イエローグリーン色でヒストグラムを描画する plt.hist(データ列, color='yellowgreen') plt.hist(データ列, color='yellowgreen')
散布図の下三角印の線幅を変更する plt.scatter(データ列x, データ列y, marker='v', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='v', markeredgewidth=2.5)
データフレームのあるカラムの分を使う df['列A'].dt.minute df['列A'].dt.minute
データフレームの一部のカラムの尖度を求める df[['列A', '列B']].skew() df[['列A', '列B']].skew()
分類結果の適合率を求める sklearn.metrics.precision_score(正解データ列, 予測データ列) sklearn.metrics.precision_score(正解データ列, 予測データ列)
option: フローラルホワイトを使う color = 'floralwhite' color = 'floralwhite'
ケンドールの相関係数を求める scipy.stats.kendalltau(配列, 配列2) scipy.stats.kendalltau(df['列A'], df['列B'])
ダークマゼンタ色で散布図を描画する plt.scatter(データ列x, データ列y, color='darkmagenta') plt.scatter(データ列x, データ列y, color='darkmagenta')
ゼロ埋めされた複素数型のベクトル np.zeros(要素数, dtype=bool) np.zeros(要素数, dtype=bool)
リストとリストについて散布図を描いて、マーカーを星に変更する plt.plot(データ列x, データ列y, marker='*') plt.plot(データ列x, データ列y, marker='*')
データシリーズの未入力値を最大値で埋める ds.fillna(ds.max()) ds.fillna(ds.max())
辞書をカウンタにする collections.Counter() collections.Counter(aDict)
グラフに水平方向の実線を設定する plt.axvline(y=0, linestyle='solid') plt.axhline(y=0, linestyle='solid')
データ列のユニークな要素 ds.unique() ds.unique()
ダークシアンにヒストグラムの色を設定する plt.hist(データ列, color='darkcyan') plt.hist(データ列, color='darkcyan')
綺麗なグラフを使う import seaborn as sns import seaborn as sns
文字列は漢字 s in s ('\u4E00' <= ch <= '\u9FD0')
オプションで、標準エラーを用いる file = sys.stderr file = sys.stderr
プラム色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='plum') plt.barh(データ列x, データ列y, color='plum')
2つのデータフレームを横向きに連結する pd.merge(df, df2, df3) pd.concat([df, df2], axis=1)
ブラック色で散布図を描画する plt.scatter(データ列x, データ列y, color='black') plt.scatter(データ列x, データ列y, color='black')
インディゴ色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='indigo') plt.plot(データ列x, データ列y, color='indigo')
option: 青緑を使用する color = 'turquoise' color = 'teal'
散布図をオリーブ色を用いて描画する plt.scatter(データ列x, データ列y, color='olive') plt.scatter(データ列x, データ列y, color='olive')
線グラフを青色で描画する plt.plot(データ列x, データ列y, color='blue') plt.plot(データ列x, データ列y, color='blue')
JSONファイルの入力を読み込んで、dataとする data = json.load(fin) data = json.load(fin)
データフレームの一部の列を10の位で丸める df[['列A', '列B']].round(-1) df[['列A', '列B']].round(-1)
列名を指定せずCSVファイルを読み込む pd.read_csv('file.csv', not_on='列A','strict') pd.read_csv('file.csv', header=None)
折れ線グラフを白色として描画する plt.plot(データ列x, データ列y, color='white') plt.plot(データ列x, データ列y, color='white')
型が名前付きタプルか調べる issubclass(C, tuple) issubclass(C, tuple)
棒グラフをダークゴールデンロッド色を用いて描画する plt.bar(データ列x, データ列y, color='darkgoldenrod') plt.bar(データ列x, データ列y, color='darkgoldenrod')
ヒストグラムをミッドナイトブルー色を用いて描画する plt.hist(データ列, color='midnightblue') plt.hist(データ列, color='midnightblue')
マッピングのキーを要素にする aDict[key] = element aDict[key] = element
サンディーブラウン色を使って縦棒グラフを描画する plt.bar(データ列x, データ列y, color='sandybrown') plt.bar(データ列x, データ列y, color='sandybrown')
SJISでCSVファイルにデータフレームを保存する df.to_csv('file.csv', index=None) df.to_csv('file.csv', encoding='shift_jis')
データフレームの一部のカラムの欠損値を直前の値に設定する df[['列A', '列B']].fillna(method='ffill') df[['列A', '列B']].fillna(method='ffill')
線グラフの色をライトコーラルに設定する plt.plot(データ列x, データ列y, color='lightcoral') plt.plot(データ列x, データ列y, color='lightcoral')
文字列内にひとつでもアスキー文字が含まれる any(c.isascii() for c in s) any(c.isascii() for c in s)
year年month月day日hour時minute分をタイムスタンプに変換する datetime.datetime(year=year, month=month, day=day, hour=hour, minute=minute) datetime.datetime(year=year, month=month, day=day, hour=hour, minute=minute)
集合が空でない len(aSet) - aSet2) len(aSet) != 0
ヒストグラムをミディアムオーキッド色を使って描画する plt.hist(データ列, color='mediumorchid') plt.hist(データ列, color='mediumorchid')
ある列の値によってデータフレームを集約する df.groupby('列A') df.groupby('列A')
折れ線グラフの色をゴールデンロッドに指定する plt.plot(データ列x, データ列y, color='goldenrod') plt.plot(データ列x, データ列y, color='goldenrod')
rgbの大バツマーカーを散布図に使う plt.plot(データ列x, データ列y, marker='X', c=rgb) plt.plot(データ列x, データ列y, marker='X', c=rgb)
データフレームの指定したカラムの欠損値をその最頻値で置き換える df['列A'].fillna(df['列A'].mode().iloc[0]) df['列A'].fillna(df['列A'].mode().iloc[0])
日付データが日付データより後ろ aDate > aDate2 aDate > aDate2
ポイントマーカーとしてデータ列の折れ線グラフを描画する plt.plot(データ列x, データ列y, marker='.') plt.plot(データ列x, データ列y, marker='.')
行列の全要素の値を変更する aArray[:, :] = 指定の値 aArray[:, :] = 指定の値
インディアンレッド色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='indianred') plt.barh(データ列x, データ列y, color='indianred')
データフレームのカラムの母標準偏差を求める df['列A'].std(ddof=0) df['列A'].std(ddof=0)
イテラブルを文字列に変換して、'改行で連結する '\n'.join(map(str, iterable)) '\n'.join(map(str, iterable))データフレームの選択したカラムの平均 df[['列A', '列B']].mean() df[['列A', '列B']].mean()
ある列のカテゴリ毎の個数 df.groupby('列A').count() df.groupby('列A').count()
ゴールド色を用いてヒストグラムを描画する plt.hist(データ列, color='gold') plt.hist(データ列, color='gold')
要素を両端キューの最後から取り除く deq.pop() deq.pop()
option: マーカーを三角に変える marker = '^' marker = '^'
文字列のn番目の文字を使う s[n] s[n]
ヒストグラムを破線で描く plt.hist(データ列, linestyle='dashed') plt.hist(データ列, linestyle='dashed')
横棒グラフをペールグリーン色として描画する plt.barh(データ列x, データ列y, color='palegreen') plt.barh(データ列x, データ列y, color='palegreen')
ヒストグラムの色をトマトに変更する plt.hist(データ列, color='tomato') plt.hist(データ列, color='tomato')
キューの中に要素は含まれてる element in deq element in deq
ファイルパスを読み込みモードで開く] open(filepath, mode='r') open(filepath, mode='r')
option: パールゴールデンロッド色を用いる color = 'palegoldenrod' color = 'palegoldenrod'
文字列の開始位置番目と終了位置番目の間に部分文字列が存在しないか調べる s.find(sub, start, end) == -1 s.find(sub, start, end) == -1
両端キュー中の値の数をカウントする deq.count(element) deq.count(element)
新しいガウス過程分類モデルを作る model = sklearn.gaussian_process.GaussianProcessClassifier() model = sklearn.gaussian_process.GaussianProcessClassifier()
散布図の△マーカーを赤くする plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='r')
オブジェクトをイテレータに変換する iter(obj) iter(obj)
横棒グラフをペルー色として描画する plt.barh(データ列x, データ列y, color='peru') plt.barh(データ列x, データ列y, color='peru')
データフレームの欠損値を平均で補う df.fillna(df.mean()) df.fillna(df.mean())
小数点数の正接を求める math.tan(x) math.tan(x)
option: 三角マーカーを使用する marker = '^' marker = '^'
ある列の値がx以上y未満の行を抽出する df[(x <= y)] df[(x <= df['列A']) & (df['列A'] < y)]
箱ひげ図を描画し、、平均線を加える plt.boxplot(データ列, meanline=True) plt.boxplot(データ列, meanline=True)
ベージュにヒストグラムの色を指定する plt.hist(データ列, color='beige') plt.hist(データ列, color='beige')
option: 右三角印を用いる marker = '>' marker = '>'
折れ線グラフのアルファを設定する plt.plot(データ列x, データ列y, color='a') plt.plot(データ列x, データ列y, alpha=0.5)
データフレームの指定したカラムが正規分布からどの程度歪んでいるか見る df['列A'].kurt() df['列A'].kurt()
散布図を赤いダイアモンドマーカーで描画する plt.plot(データ列x, データ列y, marker='D', c='r') plt.plot(データ列x, データ列y, marker='D', c='r')
データフレームのカラムをグループ化してヒストグラムにする sns.histplot(df, x='列名', hue='カテゴリ名') sns.histplot(df, x='列名', hue='カテゴリ名')
マッピングをチェーンマップに変換する collections.ChainMap(aDict) collections.ChainMap(aDict)
データフレームの選択したカラムの分散を算出する df[['列A', '列B']].var() df[['列A', '列B']].var()
部分文字列が文字列の開始位置からと終了位置の間に含まれるか s.find(sub, start, end)!= -1 s.find(sub, start, end) != -1
棒グラフをライトイエロー色として描画する plt.bar(データ列x, データ列y, color='lightyellow') plt.bar(データ列x, データ列y, color='lightyellow')
部分文字列で文字列を二分し、先頭の文字列を使う s.partition(sub)[0] s.partition(sub)[0]
ある列のカテゴリごとの合計を求める df.groupby('列A').sum() df.groupby('列A').sum()
データフレームをダミー変数に変換する pd.get_dummies(df) pd.get_dummies(df)
散布図をrgbのバツマーカーでプロットする plt.plot(データ列x, データ列y, marker='x', c=rgb) plt.plot(データ列x, データ列y, marker='x', c=rgb)
リストの重複コンビネーション sorted(aList, key=n) itertools.combinations_with_replacement(iterable, n)
二つのデータフレームを異なる列をキーとして右ジョインする pd.merge(df, df2, left_on='列A', right_on='列B', how='right') pd.merge(df, df2, left_on='列A', right_on='列B', how='right')
マッピングをネスト化する collections.ChainMap(aDict) collections.ChainMap(aDict)
実行時の標準出力の出力先がターミナルかどうか os.isatty() sys.stdout.isatty()
ダークカーキ色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='darkkhaki') plt.plot(データ列x, データ列y, color='darkkhaki')
イテラブルのイミュータブルな集合を使う frozenset(iterable) frozenset(iterable)
グラフの色を濃くする sns.set(pallete='deep') sns.set(pallete='deep')
マップを複製する dict(zip(aDict) aDict.copy()
青緑色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='teal') plt.barh(データ列x, データ列y, color='teal')
実行時の標準出力の出力先がターミナルかどうか調べる os.isatty(sys.stdin.fileno()) sys.stdout.isatty()
ライトグリーン色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='lightgreen') plt.barh(データ列x, データ列y, color='lightseagreen')
option: 珊瑚色を使用する color = 'coral' color = 'coral'
あるカラムの値がx以上、y未満の行を抽出する df[(x <= df['列A']) & (df['列A'] <= y)] df[(x <= df['列A']) & (df['列A'] < y)]
オブジェクトは文字列型か調べる isinstance(obj, str) isinstance(obj, str)
データフレームから指定したデータ型の列名一覧 df.select_dtypes(型).columns df.select_dtypes(型).columns
二つの文字列は同じかどうか s == s2 s == s2
文字列の開始位置と終了位置の間に部分文字列が含まれるかどうか s.find(sub, start, end) == -1 s.find(sub, start, end) != -1
データフレームのカラムのKurtosisを求める scipy.stats.kurtosis(df['列A'], bias=False) scipy.stats.kurtosis(df['列A'], bias=False)
右にn個分双方向キューのデータをローテンションする deq.rotate(n) deq.rotate(n)
折れ線グラフに青い四角印を描画する plt.plot(データ列x, データ列y, marker='s', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='s', markerfacecolor='b')
|