アクア色で散布図を描画する plt.scatter(データ列x, データ列y, color='aqua') plt.scatter(データ列x, データ列y, color='aqua') データフレームの欠損値を平均値に変更する df.fillna(df.mean()) df.fillna(df.mean()) option: フローラルホワイトを用いる color = 'floralwhite' color = 'floralwhite' option: ダークマゼンタにフォントの色を変更する color = 'darkmagenta' color = 'darkmagenta' 行列の列ごとの最大 np.max(aArray, axis=0) np.max(aArray, axis=0) 散布図のダイアモンド印の色を設定する plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='#800080') データフレームの一部の列の欠損値を平均値に変更する df[['列A', '列B']].fillna(df[['列A', '列B']].mean()) df[['列A', '列B']].fillna(df[['列A', '列B']].mean()) データフレームの欠損値を後の行の値に設定する df[df.fillna(method='bfill') df.fillna(method='bfill') 双方向キューの中に整数が含まれてるか調べる 整数 in 両端キュー 整数 in 両端キュー xを記号にする x = sympy.Symbol('x') x = sympy.Symbol('x') キーが辞書に存在する キー not in 辞書 キー not in 辞書 整数の無限なイテレータ itertools.repeat(整数) itertools.repeat(整数) option: ミディアムターコイズを使う color ='mediumturquoise' color = 'mediumturquoise' 指定された列リストついて、データフレームの重複を確認する df.duplicated(subset=['列A', '列B']) df.duplicated(subset=['列A', '列B']) 赤い丸マーカーを散布図に用いる plt.plot(データ列x, データ列y, marker='o', c='r') plt.plot(データ列x, データ列y, marker='o', c='r') 小数点数の逆余弦 x = 0.33math.acos(x) x = 0.33math.acos(x) 散布図をスプリンググリーン色として描画する plt.scatter(データ列x, データ列y, color='springgreen') plt.scatter(データ列x, データ列y, color='springgreen') option: リネンにフォントの色を設定する color = 'linen' color = 'linen' 散布図に青い三角印を描画する plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='b') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='b') セットが空か判定する len(セット) == 0 len(セット) == 0 折れ線グラフを青い点線を使って描画する plt.plot(データ列x, データ列y, linestyle='dotted', color='b') plt.plot(データ列x, データ列y, linestyle='dotted', color='b') 棒グラフの色をダークレッドにする plt.bar(データ列x, データ列y, color='darkred') plt.bar(データ列x, データ列y, color='darkred') 棒グラフをレモンシフォン色として描画する plt.bar(データ列x, データ列y, color='lemonchiffon') plt.bar(データ列x, データ列y, color='lemonchiffon') 2つの列でデータフレームをグループ分けし、、列挙する [(name, group_df) for name, group_df in df.groupby(['列A', '列B'])] [(name, group_df) for name, group_df in df.groupby(['列A', '列B'])] 文字列を最初のセパレータで二分して、後ろの方を使う 文字列.partition(セパレータ)[-1] 文字列.partition(セパレータ)[-1] ライム色を用いて棒グラフを描画する plt.bar(データ列x, データ列y, color='lime') plt.bar(データ列x, データ列y, color='lime') option: ダークシアグリーンにグラフの色を設定する color = 'darkseagreen' color = 'darkseagreen' データをJSON形式としてファイルに出力する json.dump(データ, ファイル出力, ensure_ascii=False) with open('file.json', 'w') as f:json.dump(データ, f, ensure_ascii=False) ふたつの列を組み合わせてグループ化し、合計を求める df.groupby(['列A', '列B'], as_index=False).sum() df.groupby(['列A', '列B'], as_index=False).sum() 数列と数列の散布図を描いて星マーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='*', c=rgb) plt.plot(データ列x, データ列y, marker='*', c=rgb) ヒストグラムの色をシーグリーンに指定する plt.hist(データ列, color='seagreen') plt.hist(データ列, color='seagreen') データフレームを2つの列で昇順に破壊的にソートする df.sort_values(by=['列A', '列B'], ascending=True, inplace=True) df.sort_values(by=['列A', '列B'], ascending=True, inplace=True) K最近傍法でクラス分類をする model = sklearn.neighbors.KNeighborsClassifier(n_neighbors=5) model = sklearn.neighbors.KNeighborsClassifier(n_neighbors=5) 2つのデータフレームを列名を指定してジョインする 'pd.merge(df, df2, on='列A') 'pd.merge(df, df2, on='列A') トマト色で棒グラフを描画する plt.bar(データ列x, データ列y, color='tomato') plt.bar(データ列x, データ列y, color='tomato') option: グラフの色をティールに変更する color = 'teal' color = 'teal' 数から浮動小数点数を引く x - y x - y エンディアンを調べる イテラブル(イディコ) sys.byteorder 線グラフを半透明の実線で描画する plt.plot(データ列x, データ列y, linestyle='solid', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='solid', alpha=0.5) 主成分分析を用いて多次元データを文字列次元に次元削減する N = 2.0sklearn.decomposition.PCA(n_components=N).fit_transform(多次元データ) N = 2sklearn.decomposition.PCA(n_components=N).fit_transform(多次元データ) ヒストグラムと勾配ブースティングを使ってクラス分類を行う model = sklearn.ensemble.HistGradientBoostingClassifier() model = sklearn.ensemble.HistGradientBoostingClassifier() 文字列の最初の余分な空白を取り除く 文字列.lstrip() 文字列.lstrip() 黒い大バツマーカーとして散布図をプロットする plt.plot(データ列x, データ列y, marker='X', c='k') plt.plot(データ列x, データ列y, marker='X', c='k') 要素はタプルの要素でないか調べる 要素 not in タプル 要素 not in タプル 空の勾配ブースティング回帰木を作る model = sklearn.ensemble.GradientBoostingRegressor() model = sklearn.ensemble.GradientBoostingRegressor() 淡いピンク色色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='lightpink') plt.barh(データ列x, データ列y, color='lightpink') 空の勾配ブースティング分類木を作成する model = sklearn.ensemble.GradientBoostingClassifier() model = sklearn.ensemble.GradientBoostingClassifier() シエナ色として散布図を描画する plt.scatter(データ列x, データ列y, color='sienna') plt.scatter(データ列x, データ列y, color='sienna') ヒストグラムの色を赤に変更する plt.hist(データ列, color='red') plt.hist(データ列, color='red') 折れ線グラフをスチールブルー色を用いて描画する plt.plot(データ列x, データ列y, color='steelblue') plt.plot(データ列x, データ列y, color='steelblue') 文字列はタイトルケースかどうか調べる 文字列.istitle() 文字列.istitle() 指定した列を百の位で丸めて、整数型にする df['列A'].round(-2).astype(int) df['列A'].round(-2).astype(int) マルーンにヒストグラムの色を設定する plt.hist(データ列, color='maroon') plt.hist(データ列, color='maroon') 日付データが金曜日か aDate.weekday() == 4 aDate.weekday() == 4 ▼印を使って散布図を描画する plt.scatter(データ列x, データ列y, marker='v') plt.scatter(データ列x, データ列y, marker='v') 線グラフをサーモン色で描画する plt.plot(データ列x, データ列y, color='salmon') plt.plot(データ列x, データ列y, color='salmon') 変数が0に近づく場合の極限値を求める sympy.limit(数式, 変数, 0) sympy.limit(数式, 変数, 0) タプルの最後 タプル[-1] タプル[-1] deqのstart〜endの部分要素を見る collections.deque(itertools.islice(deq, start, end)) collections.deque(itertools.islice(deq, start, end)) 折れ線グラフにバツ印を使う plt.plot(データ列x, データ列y, marker='x') plt.plot(データ列x, データ列y, marker='x') 横棒グラフをデピンク色として描画する plt.barh(データ列x, データ列y, color='deeppink') plt.barh(データ列x, データ列y, color='deeppink') カウンタを高頻度方からリストとして得る aCounter.most_common() aCounter.most_common() 折れ線グラフを半透明の破線として描画する plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) マッピングの項目名を列挙する 辞書.keys() 辞書.keys() 浮動小数点数以下の最大の整数 math.floor(x) math.floor(x) 予測値とデータの離れ具合を描画する sns.resid(x='列名', y='列名', data=df) sns.residplot(x='列名', y='列名', data=df) ピーチパフ色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='peachpuff') plt.plot(データ列x, データ列y, color='peachpuff') データフレームのあるカラムのタイムゾーンを東京に設定する df['列A'].tz_convert('Asia/Tokyo') df['列A'].tz_convert('Asia/Tokyo') 黒い▽マーカーで散布図をプロットする plt.plot(データ列x, データ列y, marker='v', c='k') plt.plot(データ列x, データ列y, marker='v', c='k') 辞書の値の一覧を参照する 辞書.values() list(辞書.values()) 0からN未満までのベクトル np.arange(N) np.arange(N) リストと数列についての散布図に赤い大バツマーカーを描画する plt.plot(データ列x, データ列y, marker='X', c='r') plt.plot(データ列x, データ列y, marker='X', c='r') 赤い下三角マーカーとして散布図を描く plt.plot(データ列x, データ列y, marker='v', c='r') plt.plot(データ列x, データ列y, marker='v', c='r') ファイルを書き込み用にオープンする] open(filepath, mode='w') 'w' = 'a'open(filepath, mode='w') option: 濃い青を使用する color = 'darkblue' color = 'darkblue' 二つのデータ列の残差を散布図として描く sns.residplot(x=データ列, y=データ列) sns.residplot(x=データ列, y=データ列) データフレームを表示するとき、ヘッダー行を右寄せに指定する pd.set_option('colheader_justify', 'right') pd.set_option('colheader_justify', 'right') 赤い一点鎖線で折れ線グラフをプロットする plt.plot(データ列x, データ列y, linestyle='dashbot', color='r') plt.plot(データ列x, データ列y, linestyle='dashbot', color='r') 散布図をオリーブ色を用いて描画する plt.scatter(データ列x, データ列y, color='olive') plt.scatter(データ列x, データ列y, color='olive') 辞書の項目名に対応した値 辞書[キー] 辞書.get(キー, 見つからない場合の値) 小数点数の整数部 math.modf(x)[0] math.modf(x)[1] 折れ線グラフの色をサドルブラウンに指定する plt.plot(データ列x, データ列y, color='saddlebrown') plt.plot(データ列x, データ列y, color='saddlebrown') 折れ線グラフをラベンダー色として描画する plt.plot(データ列x, データ列y, color='lavender') plt.plot(データ列x, データ列y, color='lavender') 折れ線グラフの色をブルーバイオレットに変更する plt.plot(データ列x, データ列y, color='blueviolet') plt.plot(データ列x, データ列y, color='blueviolet') 指定した列の値で集計し各合計を求める df.groupby('列A').sum() df.groupby('列A').sum() プロットに鉛直方向の一点鎖線を付ける plt.axvline(x=0, linestyle='dashbot') plt.axvline(x=0, linestyle='dashbot') カウンタの項目一覧を使う aCounter.keys() aCounter.keys() ヒストグラムをパープル色として描画する plt.hist(データ列, color='purple') plt.hist(データ列, color='purple') 整数型のゼロ埋めされた行列を作る np.zeros(要素数, dtype=np.int) np.zeros(要素数, dtype=np.int) 配列のピアソンの積立相関係数 scipy.stats.pearsonr(配列, 配列2) scipy.stats.pearsonr(配列, 配列2) 整数が1、もしくは2、もしくは3に等しいかどうか調べる 整数 == 1 or 整数 == 2 or 整数 == 3 整数 == 1 or 整数 == 2 or 整数 == 3 行列の値を求める aArray[行番号, 列番号] aArray[行番号, 列番号] t-SNEで整数次元に削減する sklearn.manifold.TSNE(n_components=三).fit_transform(多次元データ) sklearn.manifold.TSNE(n_components=三).fit_transform(多次元データ) 二つの表データを横方向にマージする pd.merge(df, df2) pd.merge(df, df2) 散布図をホワイトスモーク色として描画する plt.scatter(データ列x, データ列y, color='whitesmoke') plt.scatter(データ列x, データ列y, color='whitesmoke') ふたつの条件が成り立つ 条件 and 条件2 条件 and 条件2 スカイブルーにヒストグラムの色を指定する plt.hist(データ列, color='skyblue') plt.hist(データ列, color='skyblue') 縦棒グラフをピンク色で描画する plt.bar(データ列x, データ列y, color='pink') plt.bar(データ列x, データ列y, color='pink') 指定した列の標本分散を求める df['列A'].var(ddof=0) df['列A'].var(ddof=0) を大きくする x = 0.33model = sklearn.metrics.mean_squared_error(データ列) 変数 += 整数 整数が2で割り切れない 整数 % 2 == 0 整数 % 2 == 1 棒グラフを黄緑色で描画する plt.bar(データ列x, データ列y, color='chartreuse') plt.bar(データ列x, データ列y, color='chartreuse') パーセント付きの円プロットを描画する plt.pie(データ列, startangle=90, autopct='%.2f%%') plt.pie(データ列, startangle=90, autopct='%.2f%%') ASCII限定として正規表現で文字列を区切る re.split(pattern, s, flags=re.ASCII) re.split(pattern, s, flags=re.ASCI) 赤い星マーカーとして散布図を描画する plt.plot(データ列x, データ列y, marker='*', c='r') plt.plot(データ列x, データ列y, marker='*', c='r') データフレームの列のユニークな値の個数を確認する df[col].nunique() df[col].nunique() 棒グラフを紺色として描画する plt.bar(データ列x, データ列y, color='darkblue') plt.bar(データ列x, データ列y, color='darkblue') 縦棒グラフをパールバイオレットレッド色として描画する plt.bar(データ列x, データ列y, color='palevioletred') plt.bar(データ列x, データ列y, color='palevioletred') 前の値でデータシリーズの欠損値を埋める ds.fillna(method='ffill') ds.fillna(method='ffill') 黒い下三角マーカーを散布図に描画する plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='k') カラムのモードを求める mode, count = scipy.stats.mode(df['列A']) mode, count = scipy.stats.mode(df['列A']) リストとリストについての散布図に下三角マーカーを描く plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') データ列のエポック秒をPandasの日付型に変換する pd.to_datetime(ds, unit='s', utc=True) pd.to_datetime(ds, unit='s', utc=True) カウンタの最頻出な文字列 aCounter.most_common()[0] aCounter.most_common()[0] 線グラフの色をアンティークホワイトにする plt.plot(データ列x, データ列y, color='antiquewhite') plt.plot(データ列x, データ列y, color='antiquewhite') 線グラフの色をシーグリーンに指定する plt.plot(データ列x, データ列y, color='seagreen') plt.plot(データ列x, データ列y, color='seagreen') 分類木を可視化する plt.barh(X.columns, model.feature_importances_) sklearn.tree.plot_tree(model, feature_names=X.columns, filled=True) 数字を全て見る string.digits string.digits ピアソンでデータフレームの一部のカラムの相関行列を求める df[['列A', '列B']].corr(method='pearson') df[['列A', '列B']].corr(method='pearson') 円プロットを真円にする plt.axis('equals') plt.axis('equals') カラムの歪みを計算する df['列A'].kurt() scipy.stats.skew(df['列A'], bias=False) 折れ線グラフの線種を実線にセットする plt.plot(データ列x, データ列y, linestyle='solid') plt.plot(データ列x, データ列y, linestyle='solid') ファイルパスのフォルダ名を求める os.path.dirname(filepath) os.path.dirname(filepath) 数列のピアソンの積立相関係数 scipy.stats.pearsonr(数列, 数列2) scipy.stats.pearsonr(数列, 数列2) n個に等間隔でリストを分割する pd.cut(aList, n) pd.cut(aList, n) タン色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='tan') plt.barh(データ列x, データ列y, color='tan') 文字列はキーワードか調べる 文字列.iskeyword() keyword.iskeyword(文字列) option: アイボリーにフォントの色を変更する color = 'ivory' color = 'ivory' プロットの描画で明るくカラーパレットを用いる sns.set(pallete='bright') sns.set(pallete='bright') ブルーバイオレット色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='blueviolet') plt.bar(データ列x, データ列y, color='blueviolet') 半透明の一点鎖線で折れ線グラフを描画する plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) グラフの描画で淡く色を用いる sns.set(pallete='muted') sns.set(pallete='muted') 横棒グラフを青緑色として描画する plt.barh(データ列x, データ列y, color='teal') plt.barh(データ列x, データ列y, color='teal') 文字列で区切ってxとyを出力する print(x, y, sep='\t') print(x, y, sep=s) セットの要素数を求める len(セット) len(セット) データフレームのあるカラムの文字列を未入力値に変換する df['列A'].replace(値, np.nan) df['列A'].replace(値, np.nan) 表データのあるカラムを日付データに変換し、インデックスにする df.index = pd.DatetimeIndex(pd.to_datetime(df['列A'])) df.index = pd.DatetimeIndex(pd.to_datetime(df['列A'])) 折れ線グラフに右三角マーカーを使用する plt.plot(データ列x, データ列y, marker='>') plt.plot(データ列x, データ列y, marker='>') ValueMapでデータフレームの選択したカラムを全て置換する df[['列A', '列B']].replace(ValueMap) df[['列A', '列B']].replace(ValueMap) スレートブルー色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='slateblue') plt.plot(データ列x, データ列y, color='slateblue') データフレームを関数の値ごとにグループ化して、列挙する [(name, group_df) for name, group_df in df.groupby(関数)] [(name, group_df) for name, group_df in df.groupby(関数)] オレンジレッド色で棒グラフを描画する plt.bar(データ列x, データ列y, color='orangered') plt.bar(データ列x, データ列y, color='orangered') option: ライトスレイグレーにグラフの色を設定する color = 'lightslategrey' color = 'lightslategray' ダークグレー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='darkgrey') plt.bar(データ列x, データ列y, color='darkgray') 作画に使うフォントを指定する sns.set(font=フォント名) sns.set(font=フォント名) ファイルを読み込みモードでオープンして]fとする f = open(filepath, mode='r') f = open(filepath, mode='r') データフレームを100の位で丸める df.round(-2) df.round(-2) データ列とリストの散布図を描画して大バツマーカーの色をrgbにする plt.plot(データ列x, データ列y, marker='X', c=rgb) plt.plot(データ列x, データ列y, marker='X', c=rgb) 数をn乗する x ** n x ** n 線グラフを青い破線で描く plt.plot(データ列x, データ列y, linestyle='dashed', color='b') plt.plot(データ列x, データ列y, linestyle='dashed', color='b') 作画で使うカラーパレットを指定する sns.set(pallete='パレット名') sns.set(pallete=パレット名) プラム色でヒストグラムを描画する plt.hist(データ列, color='plum') plt.hist(データ列, color='plum') データフレームの散布図をグループ化して横に配置する sns.relplot(data=df, x='列名', y='列名', hue='カテゴリ列', row='カテゴリ列', row='カテゴリ列') sns.relplot(data=df, x='列名', y='列名', hue='カテゴリ列', col='カテゴリ列') 変数を定義したい 変数 += 整数 X = 0 データフレームのカラムのトリム分散を計算する scipy.stats.tvar(df['列A'], limits=(下限, 上限), inclusive=(True, True)) scipy.stats.tvar(df['列A'], limits=(下限, 上限), inclusive=(True, True)) Xの四乗を求めたい X ** 4 X ** 4 クラス分類をガウス過程として行う model = sklearn.gaussian_process.GaussianProcessClassifier() model = sklearn.gaussian_process.GaussianProcessClassifier() 全要素を0で初期化したベクトル np.zeros(要素数) np.zeros(要素数) ▲印を用いる散布図を描画する plt.scatter(データ列x, データ列y, marker='^') plt.scatter(データ列x, データ列y, marker='^') 文字列をソートしてJSONにエンコードする json.dumps(文字列, ensure_ascii=False, sort_keys=True) json.dumps(文字列, ensure_ascii=False, sort_keys=True) リストの値を小さい順に並べる sorted(リスト, reverse=True) sorted(リスト, reverse=True) 数列から重複なく、ランダムにn要素選んでリストにする random.sample(数列, k=n) random.sample(数列, k=n) イテラブルをランダムにシャッフルしてリスト化する random.sample(イテラブル, len(イテラブル)) random.sample(イテラブル, len(イテラブル)) 項がセットに含まれないか確認する 要素 not in セット 要素 not in セット 文字列を改行で分割し、文字列リストにする 文字列.splitlines() 文字列.splitlines() 本日の曜日を整数で求める datetime.datetime.today().astype(int) datetime.datetime.today().weekday() 淡い茶色色で散布図を描画する plt.scatter(データ列x, データ列y, color='tan') plt.scatter(データ列x, データ列y, color='tan') option: アイボリーに色を指定する color = 'ivory' color = 'ivory' option: ドジャーブルーにグラフの色を変更する color = 'dodgerblue' color = 'dodgerblue' 整数が-9以上9以下か判定する -9 <= 整数 <= 9 -9 <= 整数 <= 9 棒グラフをペールグリーン色を用いて描画する plt.bar(データ列x, データ列y, color='palegreen') plt.bar(データ列x, データ列y, color='palegreen') データフレーム中の欠損値をインプレイスでドロップする df.dropna(inplace=True) df.dropna(inplace=True) 分類モデルの当てはめを実行する model.fit(説明変数, 目的変数) model.fit(説明変数, 目的変数) CSVファイルをカラム名を指定せず読み込む pd.read_csv('file.csv', header=None) pd.read_csv('file.csv', header=None) データシリーズの曜日は何日目か調べる ds.dt.dayofweek ds.dt.dayofweek ヒストグラムの色をライトサーモンに指定する plt.hist(データ列, color='lightsalmon') plt.hist(データ列, color='lightsalmon') 散布図をスカイブルー色として描画する plt.scatter(データ列x, データ列y, color='skyblue') plt.scatter(データ列x, データ列y, color='skyblue') 度数分布図としてデータフレームのカラムをプロットする plt.hist(df[column]) plt.hist(df[column]) 文字列を最後のカンマを用いて二つに分ける 文字列.rpartition(',') 文字列.rpartition(',') 整数の3乗を算出する 整数 ** 3 整数 ** 3 散布図の右三角マーカーの線幅を設定する plt.scatter(データ列x, データ列y, marker='>', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='>', markeredgewidth=2.5) 線形回帰モデルの回帰変数を使う model.intercept_decomposition.PLSRegression() model.coef_ 折れ線グラフの色をゲインズボロにする plt.plot(データ列x, データ列y, color='gainsboro') plt.plot(データ列x, データ列y, color='gainsboro') 整数が2で割り切れないか 整数 % 2 == 1 整数 % 2 == 1 ロバストな線形クラス分類を行う model = sklearn.linear_model.HuberClassifier() model = sklearn.linear_model.HuberClassifier() ある列の文字列が部分文字列で終わらないデータを抽出する df[~ df['列A'].str.endswith(部分文字列)] df[~ df['列A'].str.endswith(部分文字列)] 線グラフをライトスレイグレー色で描画する plt.plot(データ列x, データ列y, color='lightslategrey') plt.plot(データ列x, データ列y, color='lightslategrey') ラインを赤い一点鎖線で描画する plt.plot(データ列x, データ列y, linestyle='dashbot', color='r') plt.plot(データ列x, データ列y, linestyle='dashbot', color='r') 割りを書きたい X // Y X / Y option: グラフの色をバリーウッドに変更する color = 'burlywood' color = 'burlywood' option: 箱ひげ図を横方向にする linewidth = 3.0 vert = False データフレームをにバイオリン図で見る sns.violinplot(x='カテゴリ列', y='列', data=df) sns.violinplot(x='カテゴリ列', y='列', data=df) 赤い大バツマーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='X', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='X', markerfacecolor='r') ヒストグラムの色をローングリーンに変更する plt.hist(データ列, color='lawngreen') plt.hist(データ列, color='lawngreen') 折れ線グラフの色をインディアンレッドに指定する plt.plot(データ列x, データ列y, color='indianred') plt.plot(データ列x, データ列y, color='indianred') 文字列をセパレータで二分し、後半を見る 文字列.partition(セパレータ)[-1] 文字列.partition(セパレータ)[-1] ロッソ回帰モデルを新規作成する model.fit(説明変数, 目的変数) model = sklearn.linear_model.Rosso(alpha=正則化項) 書式で列を日付データに変換する pd.to_datetime(df['列A'], format='%Y-%m-%d') pd.to_datetime(df['列A'], format='%Y-%m-%d') 箱ひげ図を横に並べて描く plt.boxplot([データ列, データ列]) plt.boxplot([データ列, データ列]) option: コーラル色を用いる color = 'coral' color = 'coral' データ列の折れ線グラフを右三角印を使って描画する plt.plot(データ列x, データ列y, marker='>') plt.plot(データ列x, データ列y, marker='>') 毎回異なるように乱数を初期化する random.seed() random.seed() option: ライトイエローにグラフの色を設定する color = 'lightyellow' color = 'lightyellow' データフレームのNaNを前の行の値で補完する df.fillna(method='ffill') df.fillna(method='ffill') option: 小麦色を使う color = 'wheat' color = 'wheat' バツマーカーで散布図を描く plt.plot(データ列x, データ列y, marker='x') plt.plot(データ列x, データ列y, marker='x') オブジェクトが名前付きタプル型かどうか調べる hasattr(obj, '_asdict') and hasattr(obj, '_fields') hasattr(obj, '_asdict') and hasattr(obj, '_fields') 浮動小数点数の最小値を算出する sys.float_info.min sys.float_info.min option: フォントの色をラベンダーにセットする color = 'lavender' color = 'lavender' 指定したカラムの欠損値を直後の値に指定する df['列A'].fillna(method='bfill') df['列A'].fillna(method='bfill') 配列を等量で分割数nでビンニングする pd.qcut(aArray, n) pd.qcut(aArray, n) ゴールドにヒストグラムの色を設定する plt.hist(データ列, color='gold') plt.hist(データ列, color='gold') 縦棒グラフの色を淡いピンク色にする plt.bar(データ列x, データ列y, color='lightpink') plt.bar(データ列x, データ列y, color='lightpink') 縦棒グラフをフォレストグリーン色で描画する plt.bar(データ列x, データ列y, color='forestgreen') plt.bar(データ列x, データ列y, color='forestgreen') 部分文字列で文字列を二分割し、前半を使う 文字列.partition(部分文字列)[0] 文字列.partition(部分文字列)[0] 平均絶対誤差を求める sklearn.metrics.mean_absolute_denominator(alpha=0.5) sklearn.metrics.mean_absolute_error(データ列, データ列2) ゼロ埋めされた複素数型のベクトルを作る np.zeros(要素数, dtype=bool) np.zeros(要素数, dtype=bool) 文字列をバイト列にする bytes(s) bytes(s) 折れ線グラフの色をフクシアにセットする plt.plot(データ列x, データ列y, color='fuchsia') plt.plot(データ列x, データ列y, color='fuchsia') option: フォントの色をオリベドラブに指定する color = 'olivedrab' color = 'olivedrab' ヒストグラムをミスティローズ色として描画する plt.hist(データ列, color='mistyrose') plt.hist(データ列, color='mistyrose') 横棒グラフをラベンダーブラッシュ色を用いて描画する plt.barh(データ列x, データ列y, color='lavenderblush') plt.barh(データ列x, データ列y, color='lavenderblush') 折れ線グラフの▽印の大きさを設定する plt.plot(データ列x, データ列y, marker='v', markersize=2.0) plt.plot(データ列x, データ列y, marker='v', markersize=2.0) キーがマップに存在する キー not in 辞書 キー not in 辞書 線グラフをブラウン色で描画する plt.plot(データ列x, データ列y, color='brown') plt.plot(データ列x, データ列y, color='brown') 既存の行列をベースに全要素が1の配列を作成する np.ones_like(aArray) np.ones_like(aArray) 文字列を区切り記号で分割して、文字列リストにする 文字列.split(セパレータ) 文字列.split(セパレータ) ファイルからファイル名を求める os.path.basename(filepath) os.path.basename(filepath) コサインを求める math.cosh(x) math.cos(x) 数式の変数をある数式で置き換える 数式.subs(変数, 数式2) 数式.subs(変数, 数式2) 線グラフの色をシエナに設定する plt.plot(データ列x, データ列y, color='sienna') plt.plot(データ列x, データ列y, color='sienna') 散布図をポイント印で描画する plt.scatter(データ列x, データ列y, marker='.') plt.scatter(データ列x, データ列y, marker='.') 縦棒グラフの色をディムグレーにする plt.bar(データ列x, データ列y, color='dimgrey') plt.bar(データ列x, データ列y, color='dimgrey') パスのセパレータ記号を見る os.sep os.sep データフレームの指定した列の欠損値を直前の値で埋める df['列A'].fillna(method='ffill') df['列A'].fillna(method='ffill') 整数のモジュロを計算する 整数 % 整数2 整数 % 整数2 列一覧 df.info() df.info() option: 色をロージーブラウンに変更する color = 'rosybrown' color = 'rosybrown' y座標を対数に変更する plt.yscale('log') plt.yscale('log') ヒストグラムを黄緑色で描画する plt.hist(データ列, color='chartreuse') plt.hist(データ列, color='chartreuse') 両端キューの先頭に数列の値を追加する 両端キュー.extendleft(数列) 両端キュー.extendleft(数列) 折れ線グラフのマーカーを▽にする plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') 横棒グラフをライトスレイグレー色を用いて描画する plt.barh(データ列x, データ列y, color='lightslategrey') plt.barh(データ列x, データ列y, color='lightslategrey') xの小数点以下'1'桁の文字列に変換する ':.1f'.format(x) ':.1f'.format(x) 文字列を空白を用いて分割する 文字列.partition() 文字列.split() 配列の列ごとの平均値を算出する np.mean(aArray, axis=0) np.mean(aArray, axis=0) 書き出すCSV形式の小数点以下の桁数を設定する df.to_csv('file.csv', float_format='%.3f') df.to_csv('file.csv', float_format='%.3f') 双方向キューの先頭にイテラブルの各データを追加する 両端キュー.extendleft(イテラブル) 両端キュー.extendleft(イテラブル) 大文字を小文字に変換する 文字列.lower() 文字列.lower() データフレームを関数の値によって集約して、列挙する [(name, group_df) for name, group_df in df.groupby(関数)] [(name, group_df) for name, group_df in df.groupby(関数)] インデント幅を指定してデータをJSONにエンコードする json.dumps(データ, ensure_ascii=False, indent=n) json.dumps(データ, ensure_ascii=False, indent=n) データフレームの最後10行を抽出する df.tail(10) df.tail(10) ひとつでも非アスキー文字が文字列中にあるか調べる any(not c.isascii() for c in 文字列) any(not c.isascii() for c in 文字列) セットを変更不能な集合にする frozenset(セット) frozenset(セット) 棒グラフをピーチパフ色を使って描画する plt.bar(データ列x, データ列y, color='peachpuff') plt.bar(データ列x, データ列y, color='peachpuff') 配列のユニークな要素とその位置を調べる u, indices = np.unique(aArray, return_index=True) u, indices = np.unique(aArray, return_index=True) 散布図をピンク色として描画する plt.scatter(データ列x, データ列y, color='pink') plt.scatter(データ列x, データ列y, color='pink') 最大長を指定して、スタック 両端キュー.extend(maxlen=最大長) collections.deque(maxlen=最大長) ハニーデュー色として散布図を描画する plt.scatter(データ列x, データ列y, color='honeydew') plt.scatter(データ列x, データ列y, color='honeydew') 線グラフをラベンダー色で描画する plt.plot(データ列x, データ列y, color='lavender') plt.plot(データ列x, データ列y, color='lavender') option: マーカーの色を青緑にする markerfacecolor = 'teal' markerfacecolor = 'turquoise' 二つの文字列はケースを無視して同じか 文字列.casefold() == 文字列2.casefold() 文字列.casefold() == 文字列2.casefold() データフレームの指定した列の空文字を欠損値に変換し、ドロップする df['列A'].replace('', np.nan).dropna() df['列A'].replace('', np.nan).dropna() option: 四角マーカーを使用する marker ='s' marker = 's' 散布図に右三角マーカーを用いる plt.plot(データ列x, データ列y, marker='>') plt.scatter(データ列x, データ列y, marker='>') 黒い三角印を折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='^', markerfacecolor='k') plt.plot(データ列x, データ列y, marker='^', markerfacecolor='k') データフレームの指定した列の標準偏差など df['列A'].describe() df['列A'].describe() カラーパレットを色差別なくする sns.set(pallete='colorblind') sns.set(pallete='colorblind') イテラブルとイテラブルについての散布図にrgbの丸マーカーを描画する plt.plot(データ列x, データ列y, marker='o', c=rgb) plt.plot(データ列x, データ列y, marker='o', c=rgb) 散布図に下三角マーカーを用いる plt.scatter(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') 配列と数列について散布図を描画し、、文字列という補足用のラベルをつける plt.scatter(データ列x, データ列y, label=s) plt.scatter(データ列x, データ列y, label=s) 文字列を文字コード列にする [ord(ch) for ch in 文字列] [ord(ch) for ch in 文字列] option: サドルブラウンにグラフの色を設定する color ='saddlebrown' color = 'saddlebrown' ゼロ埋めされた3二ビット整数型の配列を初期化する np.zeros(要素数, dtype=np.int16) np.zeros(要素数, dtype=np.int16) 線形回帰モデルを作る model.fit(説明変数, 目的変数) model = sklearn.linear_model.LinearRegression() 指定した列のカテゴリで集計し最小値を求める df.groupby('列A').min() df.groupby('列A').min() 横棒プロットを描画して、ラベルを下寄せする plt.barh(ラベル列, データ列, align='edge') plt.barh(ラベル列, データ列, align='edge') 散布図に赤い下三角マーカーを使用する plt.plot(データ列x, データ列y, marker='v', c='r') plt.plot(データ列x, データ列y, marker='v', c='r') 濃いシアンにヒストグラムの色を変更する plt.hist(データ列, color='darkcyan') plt.hist(データ列, color='darkcyan') 縦棒グラフをダークオーキッド色として描画する plt.bar(データ列x, データ列y, color='darkorchid') plt.bar(データ列x, データ列y, color='darkorchid') 指定したカラムの中に文字列と文字列が存在する df['列A'].isin([value, value2]) df['列A'].isin([value, value2]) リストと配列の散布図に黒い右三角マーカーを描画する plt.plot(データ列x, データ列y, marker='>', c='k') plt.plot(データ列x, データ列y, marker='>', c='k') グラフで利用可能な色名の一覧を知る matplotlib.colors.cnames matplotlib.colors.cnames 折れ線グラフを暗い赤色として描画する plt.plot(データ列x, データ列y, color='darkred') plt.plot(データ列x, データ列y, color='darkred') option: フォレストグリーンを用いる color = 'forestgreen' color = 'forestgreen' 配列とイテラブルの散布図を描画して、マーカーを左三角に設定する plt.plot(データ列x, データ列y, marker='<') plt.plot(データ列x, データ列y, marker='<') ヒストグラムをスラグレー色を用いて描画する plt.hist(データ列, color='slategray') plt.hist(データ列, color='slategrey') 散布図に赤い▽マーカーを描画する plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='r') 文字列から部分文字列を取り除く 文字列.replace(部分文字列, '') 文字列.replace(部分文字列, '') ヒストグラムを描画して、半透明化にする plt.hist(データ列x, alpha=0.5) plt.hist(データ列x, alpha=0.5) 入力から2つの文字列を読み込む A, B = map(str, input().split()) A, B = map(str, input().split()) rgbのポイントマーカーを散布図に用いる plt.plot(データ列x, データ列y, marker='.', c=rgb) plt.plot(データ列x, データ列y, marker='.', c=rgb) option: フォントの色をパレットトルコイズに指定する color = 'paleturquoise' color = 'paleturquoise' データフレームをValueMapでまとめて置き換える df.replace(ValueMap) df.replace(ValueMap) 整数がセットのいずれ 数 in セット 数 in セット 散布図の右三角印の色を変える plt.scatter(データ列x, データ列y, marker='>', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='>', markerfacecolor='#800080') 折れ線グラフに赤い△マーカーを描画する plt.plot(データ列x, データ列y, marker='^', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='^', markerfacecolor='r') 横棒グラフをダークレッド色で描画する plt.barh(データ列x, データ列y, color='darkred') plt.barh(データ列x, データ列y, color='darkred') 折れ線グラフをサドルブラウン色として描画する plt.plot(データ列x, データ列y, color='saddlebrown') plt.plot(データ列x, データ列y, color='saddlebrown') 全般的に色を淡くする sns.set(pallete='muted') sns.set(pallete='muted') シーケンスを行列に変換する np.array(iterable) np.array(iterable) 横棒グラフをゲインズボロ色として描画する plt.barh(データ列x, データ列y, color='gainsboro') plt.barh(データ列x, データ列y, color='gainsboro') リストの最後 リスト[-1] リスト[-1] 見やすいグラフを描画する準備をする import seaborn as sns import seaborn as sns 数値がセットに含まれるか確認する 数 in セット 数 in セット データフレームのカラムの欠損値を平均に指定する df['列A'].fillna(df['列A'].mean()) df['列A'].fillna(df['列A'].mean()) 配列とリストについての散布図に黒い上三角マーカーを描く plt.plot(データ列x, データ列y, marker='^', c='k') plt.plot(データ列x, データ列y, marker='^', c='k') ライムグリーン色として散布図を描画する plt.scatter(データ列x, データ列y, color='limegreen') plt.scatter(データ列x, データ列y, color='limegreen') 線グラフをレモンシフォン色を使って描画する plt.plot(データ列x, データ列y, color='lemonchiffon') plt.plot(データ列x, データ列y, color='lemonchiffon') リストとリストについて散布図を描画して、マーカーを大バツにセットする plt.plot(データ列x, データ列y, marker='X') plt.plot(データ列x, データ列y, marker='X') 縦棒グラフをホットピンク色で描画する plt.bar(データ列x, データ列y, color='hotpink') plt.bar(データ列x, データ列y, color='hotpink') 文字列の右側から範囲を指定して部分文字列を探す 文字列.find(部分文字列, 開始位置, 終了位置) # 見つからない場合は-1 文字列.find(部分文字列, 開始位置, 終了位置) # 見つからない場合は-1 データフレームの一部のカラムにおいてどの値が最も出現するか見る df[['列A', '列B']].mode() df[['列A', '列B']].mode() データフレームの行を条件で消す df[df.columns + 値) & (df['列A'] == x] df[(df['列A'] == x) & (df['列B'] == y)] あるカラムの文字列が部分文字列で始まらない行を抽出する df[~ df['列A'].str.startswith(部分文字列)] df[~ df['列A'].str.startswith(部分文字列)] 二つの集合の差集合を求める セット.difference(セット2) セット.difference(セット2) セットを複製する セット.copy() セット.copy() 文字列の中でASCII限定としてパターンにマッチした全文字列をリストに変換する re.findall(pattern, s, flags=re.ASCI) re.findall(pattern, s, flags=re.ASCI) 横棒グラフをダークサーモン色として描画する plt.barh(データ列x, データ列y, color='darksalmon') plt.barh(データ列x, データ列y, color='darksalmon') ダークカーキにヒストグラムの色を指定する plt.hist(データ列, color='darkkhaki') plt.hist(データ列, color='darkkhaki') データフレーム中のNaNをドロップする df.dropna(inplace=True) df.dropna(inplace=True) データ列を閾値でバイナリ化する sklearn.preprocessing.Binarizer(threshold=閾値).fit_transform(データ列) sklearn.preprocessing.Binarizer(threshold=閾値).fit_transform(データ列) 条件に応じて、動作を変えたい if 条件式:print('真のとき') # 直してelse:print('そうでなければ') # 直して if 条件式:print('真のとき') # 直してelse:print('そうでなければ') # 直して n進文字列をバイト列に変換する int(文字列, n).to_bytes(length=バイト数, byteorder='big') int(文字列, n).to_bytes(length=バイト数, byteorder='big') 辞書が欲しい 辞書 = {} 辞書 = {} option: グラフの色をターコイズに変更する color = 'turquoise' color = 'turquoise' ミディアムバイオレットレッドにヒストグラムの色を設定する plt.hist(データ列, color='mediumvioletred') plt.hist(データ列, color='mediumvioletred') わり算の小数点以下を切り上げたい (X + Y - 1) // Y (X + Y - 1) // Y 数列のケンドールの相関係数 scipy.stats.kendalltau(数列, 数列2) scipy.stats.kendalltau(数列, 数列2) xを白色で表示できる文字列にする f'\033[37m{x}\033[0m' f'\033[37m{x}\033[0m' 折れ線グラフの丸マーカーの太さを変更する plt.plot(データ列x, データ列y, marker='o', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='o', markeredgewidth=2.5) 横棒グラフを黄色色として描画する plt.barh(データ列x, データ列y, color='yellow') plt.barh(データ列x, データ列y, color='yellow') 配列をダミー変数にする pd.get_dummies(配列) pd.get_dummies(配列) 文字列が無限に繰り返すイテラブルを使う itertools.repeat(element) itertools.repeat(文字列) 線グラフを半透明の破線を用いて描画する plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) データフレームの選択したカラムの不偏分散を求める df[['列A', '列B']].var(ddof=1) df[['列A', '列B']].var(ddof=1) 配列と数列についての散布図に赤い大バツマーカーを描画する plt.plot(データ列x, データ列y, marker='X', c='r') plt.plot(データ列x, データ列y, marker='X', c='r') 横軸の目盛りを非表示にする plt.xticks([]) plt.xticks([]) 線グラフの色を耐火レンガにセットする plt.plot(データ列x, データ列y, color='firebrick') plt.plot(データ列x, データ列y, color='firebrick') 散布図に赤い左三角マーカーを使用する plt.plot(データ列x, データ列y, marker='<', c='r') plt.plot(データ列x, データ列y, marker='<', c='r') 指定された列のカテゴリで集計し、最小値を求める df.groupby('列A').min() df.groupby('列A').min() インディゴ色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='indigo') plt.plot(データ列x, データ列y, color='indigo') 指定した列の値はNaNか df['列A'].isna() df['列A'].isna() リストの推移を色付きの点線として描く plt.plot(データ列x, データ列y, linestyle='dotted', color='#800080') plt.plot(データ列x, データ列y, linestyle='dotted', color='#800080') オブジェクトが非同期ジェネレータ関数か inspect.isasyncgenfunction(オブジェクト) inspect.isasyncgenfunction(オブジェクト) 辞書にキーが存在するか確認する キー in 辞書 キー in 辞書 データフレームの中に文字列がある df.isin([value]) df.isin([value]) 珊瑚色を用いて棒グラフを描画する plt.bar(データ列x, データ列y, color='coral') plt.bar(データ列x, データ列y, color='coral') エラーなくリストの要素の位置を見る リスト.index(要素) リスト.index(要素) if 要素 in リスト else -1 ファイルパスからストリームを読み込んで、fileとする file = open(filepath) file = open(filepath) 散布図の▲印を青くする plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='b') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='b') 日付データが木曜日か aDate.weekday() == 3 aDate.weekday() == 3 日付時刻データと日付時刻データの時間差を秒数で計算する (aDatetime - aDatetime2).total_seconds() (aDatetime - aDatetime2).total_seconds()//60 重複した行のみを抽出する df[df.duplicated(keep=False)] df[df.duplicated(keep=False)] 青い星マーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='*', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='*', markerfacecolor='b') データフレームを二つのカラムで小さい順にソートする df.sort_values(by=['列A', '列B'], ascending=True) df.sort_values(by=['列A', '列B'], ascending=True) 行列の標準偏差を計算する np.std(aArray) np.std(aArray) 整数を8進文字列に変換する oct(整数)[2:] oct(整数)[2:] パールバイオレットレッドにヒストグラムの色を指定する plt.hist(データ列, color='palevioletred') plt.hist(データ列, color='palevioletred') オブジェクトがクラス inspect.isclass(オブジェクト) isinstance(obj, クラス) 太字でxを出力する print(f'\033[1m{x}\033[0m') print(f'\033[1m{x}\033[0m') 散布図をグリーンイエロー色を使って描画する plt.scatter(データ列x, データ列y, color='greenyellow') plt.scatter(データ列x, データ列y, color='greenyellow') フローラルホワイト色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='floralwhite') plt.plot(データ列x, データ列y, color='floralwhite') 暗い赤色を用いて棒グラフを描画する plt.bar(データ列x, データ列y, color='darkred') plt.bar(データ列x, データ列y, color='darkred') リネン色で棒グラフを描画する plt.bar(データ列x, データ列y, color='linen') plt.bar(データ列x, データ列y, color='linen') データフレームのあるカラムの尖度を算出する df['列A'].skew() df['列A'].skew() 数列の推移を半透明の点線でプロットする plt.plot(データ列x, データ列y, linestyle='dotted', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dotted', alpha=0.5) ニューラルネットとしてクラス分類を行う model = sklearn.linear_model.Normalizer(alpha=正則化項) model = sklearn.neural_network.MLPClassifier(hidden_layer_sizes=(10, 10)) 日付データは日付データより後ろか調べる aDate > aDate2 aDate > aDate2 色差別なくカラーパレットをグラフの描画で使う sns.set(pallete='colorblind') sns.set(pallete='colorblind') プログラムを正しく終了する sys.exit(0) sys.exit(0) 散布図のポイント印を青くする plt.scatter(データ列x, データ列y, marker='.', markerfacecolor='b') plt.scatter(データ列x, データ列y, marker='.', markerfacecolor='b') ヒストグラムの色をミスティローズに指定する plt.hist(データ列, color='mistyrose') plt.hist(データ列, color='mistyrose') データフレームの末尾n行を選択する df.tail(n) df.tail(n) 折れ線グラフの色をブラックに指定する plt.plot(データ列x, データ列y, color='black') plt.plot(データ列x, データ列y, color='black') イテラブルとリストについて散布図を描画してその大きさをnに指定する plt.scatter(データ列x, データ列y, s=n) plt.scatter(データ列x, データ列y, s=n) 配列の行ごとの合計値を求める np.sum(aArray, axis=1) np.sum(aArray, axis=1) 青い左三角マーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='<', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='<', markerfacecolor='b') 浮動小数点数を三乗する x ** 3 x ** 3 2つの配列を箱髭図にする plt.boxplot([データ列, データ列]) plt.boxplot([データ列, データ列]) アルファベットを見る string.ascii_letters string.ascii_letters ライトイエロー色でヒストグラムを描画する plt.hist(データ列, color='lightyellow') plt.hist(データ列, color='lightyellow') タプルの要素を関数に適用した結果でソートする sorted(タプル, key=func) sorted(タプル, key=func) グラフに水平方向の実線をつける plt.axhline(y=0, linestyle='solid') plt.axhline(y=0, linestyle='solid') TSVファイルファイル名がか確認する filename = 'file.txt' # ファイル name'.tsv' = '.csv'filename.startswith('.tsv') filename = 'file.txt' # ファイル name'.tsv' = '.csv'filename.startswith('.tsv') ISO書式の文字列を日付時刻にする datetime.datetime.fromisoformat(日付の書かれた文字列) datetime.datetime.fromisoformat(日付の書かれた文字列) 散布図に下三角マーカーを使用する plt.scatter(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') リストと配列についての散布図に赤い下三角マーカーを描画する plt.plot(データ列x, データ列y, marker='v', c='r') plt.plot(データ列x, データ列y, marker='v', c='r') 複数のリストを箱髭図にする plt.boxplot([データ列, データ列]) plt.boxplot([データ列, データ列]) タプルの総和 sum(タプル) sum(タプル) グラフの描画でパステル調にテーマを使う sns.set(pallete='pastel') sns.set(pallete='pastel') 表を二つの列によってまとめたグループを求める df.groupby(['列A', '列B']) df.groupby(['列A', '列B']) 辞書の内部も複製する 辞書.copy() {k: copy.copy(v) for k, v in 辞書.items()} option: ピンクにグラフの色を設定する color = 'pink' color = 'pink' ライムグリーン色で棒グラフを描画する plt.bar(データ列x, データ列y, color='limegreen') plt.bar(データ列x, データ列y, color='limegreen') 英字を全部使う string.ascii_letters string.ascii_letters 2つの変数の大きい方を欲しい max(X, Y) max(X, Y) ダークグリーン色で棒グラフを描画する plt.bar(データ列x, データ列y, color='darkgreen') plt.bar(データ列x, データ列y, color='darkgreen') 折れ線グラフとしてデータ列の推移を作図する plt.plot(range(len(データ列)), データ列) plt.plot(range(len(データ列)), データ列) 一点鎖線グラフを描く plt.plot(データ列x, データ列y, linestyle='dashbot') plt.plot(データ列x, データ列y, linestyle='dashbot') 度数分布図を描画して、ビンを設定する plt.hist(データ列, bins=区関数) plt.hist(データ列, bins=区関数) JSONファイルファイル名が filename = 'file.txt'.date('.json') filename = 'file.txt' # ファイル name'.json' = '.csv'filename.startswith('.json') データシリーズの中にあるの合計をカウントする ds.isin([value]).sum() ds.isin([value]).sum() 日付時刻データを浮動小数点数にする aDatetime.timestamp() aDatetime.timestamp() 赤い▲マーカーで散布図を描画する plt.plot(データ列x, データ列y, marker='^', c='r') plt.plot(データ列x, データ列y, marker='^', c='r') 日付データが土曜日か確認する aDate.weekday() == 5 aDate.weekday() == 5 線グラフをミディアムスプリンググリーン色で描画する plt.plot(データ列x, データ列y, color='mediumspringgreen') plt.plot(データ列x, データ列y, color='mediumspringgreen') データフレームを指定されたカラムの値によってグループ化し記述統計量を計算する df.groupby('列A').describe() df.groupby('列A').describe() グリーン色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='green') plt.bar(データ列x, データ列y, color='green') デックの要素数 len(両端キュー) len(両端キュー) 複数の条件が同時に成り立つ 条件 and 条件2 and 条件3 条件 and 条件2 and 条件3 黒い▼マーカーとして散布図を描画する plt.plot(データ列x, データ列y, marker='v', c='k') plt.plot(データ列x, データ列y, marker='v', c='k') データフレームの選択したカラムの値が欠損値か判定する df[['列A', '列B']].isna() df[['列A', '列B']].isna() データシリーズのタイムゾーンを指定する ds.tz_convert('Asia/Tokyo') ds.tz_convert('Asia/Tokyo') 辞書のエントリ数を得る len(辞書) len(辞書) データフレームの選択したカラムの平均 df[['列A', '列B']].mean() df[['列A', '列B']].mean() ヒストグラムの色をシルバーに指定する plt.hist(データ列, color='silver') plt.hist(データ列, color='silver') 横棒グラフをクリムゾン色として描画する plt.barh(データ列x, データ列y, color='crimson') plt.barh(データ列x, データ列y, color='crimson') データフレームをグループ化し、それぞれの合計を算出する df.groupby('列A').sum() df.groupby('列A').sum() 空白を使う import numpy as np ' ' 変数名をキーとして辞書 dict(name='kogi', age=6) dict(name='kogi', age=6) 棒グラフをスラグレー色を用いて描画する plt.bar(データ列x, データ列y, color='slategray') plt.bar(データ列x, データ列y, color='slategray') 縦棒グラフをシルバー色として描画する plt.bar(データ列x, データ列y, color='silver') plt.bar(データ列x, データ列y, color='silver') ある列のカテゴリで集計し、それぞれの標準偏差を計算する df.groupby('列A').std() df.groupby('列A').std() 日付時刻データからn時間分減算する aDatetime - datetime.timedelta(hours=n) aDatetime - datetime.timedelta(hours=n) 識別子は抽象クラスかどうか調べる inspect.isabstract(識別子) inspect.isabstract(識別子) 散布図の下三角印の色を設定する plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='#800080') 配列から双方向キューを用意する collections.deque(配列) collections.deque(配列) 折れ線グラフを赤い一点鎖線で描く plt.plot(データ列x, データ列y, linestyle='dashbot', color='r') plt.plot(データ列x, データ列y, linestyle='dashbot', color='r') 実数から整数を減ずる math.floor(x) x - y ヒストグラムの色をスノーにする plt.hist(データ列, color='snow') plt.hist(データ列, color='snow') オリーブにヒストグラムの色を設定する plt.hist(データ列, color='olive') plt.hist(データ列, color='olive') 文字列の先頭の文字を使う 文字列[0] 文字列[0] 両端キュー 両端キュー = collections.deque() 両端キュー = collections.deque() リストの最初を使う リスト[0] リスト[0] 部分文字列で文字列を二分する 文字列.partition(部分文字列) 文字列.partition(部分文字列) リストを中央値でビニングする pd.qcut(aList, 2) pd.qcut(aList, 2) 数を3乗する x ** 3 x ** 3 option: グラフのラインスタイルを一点鎖線に設定する linestyle = 'dashbot' linestyle = 'dashbot' t分布型確率的近傍埋め込み法で要素次元に次元削減する sklearn.manifold.TSNE(n_components=二).fit_transform(多次元データ) sklearn.manifold.TSNE(n_components=二).fit_transform(多次元データ) 3つの最も大きい値を求める max(x, y, z) max(x, y, z) 表データをグループ化し、最小値を求める df.groupby('列A').min() df.groupby('列A').min() ローングリーンにヒストグラムの色をする plt.hist(データ列, color='lawngreen') plt.hist(データ列, color='lawngreen') データフレームの指定したカラムがどの程度、正規分布から尖っているか確認する df['列A'].skew() df['列A'].skew() アンサンブル学習を用いてクラス分類を行う sklearn.ensemble.VotingClassifier() sklearn.ensemble.VotingClassifier() ライトスカイブルー色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='lightskyblue') plt.bar(データ列x, データ列y, color='lightskyblue') 3つ並べてデータ列をヒストグラムにする plt.hist([データ列, データ列, データ列], color=['b', 'r'], 'g']) plt.hist([データ列, データ列, データ列], color=['b', 'r', 'g']) 折れ線グラフのダイアモンド印を赤くする plt.plot(データ列x, データ列y, marker='D', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='D', markerfacecolor='r') データシリーズの不偏分散を計算する ds.var(ddof=1) ds.var(ddof=1) 折れ線グラフのポイントマーカーを青色にする plt.plot(データ列x, データ列y, marker='.', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='.', markerfacecolor='b') 要素の無限列 itertools.repeat(要素) itertools.repeat(要素) カウンタを辞書から作る collections.Counter(aDict) collections.Counter(aDict) プログラムを異常止める sys.exit(1) sys.exit(1) 折れ線グラフをライムグリーン色を使って描画する plt.plot(データ列x, データ列y, color='limegreen') plt.plot(データ列x, データ列y, color='limegreen') 散布図の大バツ印を黒くする plt.scatter(データ列x, データ列y, marker='X', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='X', markerfacecolor='k') 書き込み用にSJISでファイルをオープンする] open(filepath, mode='w', encoding='shift_jis') open(filepath, mode='w', encoding='shift_jis') 折れ線グラフをシスル色として描画する plt.plot(データ列x, データ列y, color='thistle') plt.plot(データ列x, データ列y, color='thistle') データフレームのある列を取り出す df['列A'] df['列A'] 現在の日付を求める datetime.date.today().hour datetime.date.today() ディープスカイブルー色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='deepskyblue') plt.barh(データ列x, データ列y, color='deepskyblue') キーが辞書に存在しない時、要素を追加する 辞書.setdefault(キー, element) 辞書.setdefault(キー, element) 指定したカラムの文字列を欠損値にする df['列A'].replace(値, np.nan) df['列A'].replace(値, np.nan) 行列の累積積 np.cumprod(aArray, aArray2) np.cumprod(aArray) 二つの列からグループ化し、最小値を求める df.groupby(['列A', '列B'], as_index=False).min() df.groupby(['列A', '列B'], as_index=False).min() パターンに文字列の先頭でASCII限定としてマッチさせる re.match(pattern, s, flags=re.ASCI) re.match(pattern, s, flags=re.ASCI) 箱髭図を描き、平均線を加える plt.boxplot(データ列, meanline=True) plt.boxplot(データ列, meanline=True) 横方向に二つのデータフレームを合体させる pd.concat([df, df2], axis=1) pd.merge(df, df2) 赤い点線としてデータ列の推移を描く plt.plot(データ列x, データ列y, linestyle='dotted', color='r') plt.plot(データ列x, データ列y, linestyle='dotted', color='r') 濃い青色でヒストグラムを描画する plt.hist(データ列, color='darkblue') plt.hist(データ列, color='darkblue') 文字列が全て数字かどうか 文字列.isdigit() 文字列.isdigit() ふたつの集合のインターセクション セット.intersection(セット2) セット.intersection(セット2) 文字列の開始位置先に部分文字列があるか調べる 文字列.find(部分文字列, 開始位置) == -1 文字列.find(部分文字列, 開始位置) != -1 あるカラムの文字列が部分文字列で終わらない行を抽出する df[~ df['列A'].str.endswith(部分文字列)] df[~ df['列A'].str.endswith(部分文字列)] ヒストグラムをミディアムスプリンググリーン色を使って描画する plt.hist(データ列, color='mediumspringgreen') plt.hist(データ列, color='mediumspringgreen') option: どの行もカラムの名前にしない header = None header = None 折れ線グラフの印を丸にする plt.plot(データ列x, データ列y, marker='o') plt.plot(データ列x, データ列y, marker='o') 行列の行ごとの合計値を使う np.sum(aArray, axis=1) np.sum(aArray, axis=1) 折れ線グラフを四角印として描画する plt.plot(データ列x, データ列y, marker='s') plt.plot(データ列x, データ列y, marker='s') 文字列を最後のコロンで二分して後ろの方を使う 文字列.rpartition(':')[-1] 文字列.rpartition(':')[-1] option: グラフの色をミントクリームにセットする color ='mintcream' color = 'mintcream' CSVファイルにカラムの名前を付けずデータフレームを保存する df.to_csv('file.csv', header=None) df.to_csv('file.csv', header=None) データフレームから列を3つ選択する df[['列A', '列B', '列C']] df[['列A', '列B', '列C']] プログラムを異常終了する sys.exit(0) sys.exit(1) 実数のn乗して実数による余りを計算する pow(x, n, y) pow(x, n, y) ふたつの集合の共通部分を使う セット.intersection(セット2) セット.intersection(セット2) option: どの列もインデックスに設定しない index_col = None index_col = None 整数が一桁の数か -9 <= 整数 <= 9 0 <= 整数 <= 9 黒いポイントマーカーとして散布図を描画する plt.plot(データ列x, データ列y, marker='.', c='k') plt.plot(データ列x, データ列y, marker='.', c='k') 関数の値によってデータフレームを分類する df.groupby(関数) df.groupby(関数) 文字列中に小文字が含まれるか any(c.islower() for c in 文字列) any(c.islower() for c in 文字列) TSVから文字エンコーディングを指定して読む sys.stdin.read(1) pd.read_csv('file.tsv', sep='\t', encoding=文字エンコーディング) ヒストグラムの色をオールドレースに変更する plt.hist(データ列, color='oldlace') plt.hist(データ列, color='oldlace') データシリーズの未入力値を最大値に設定する ds.fillna(ds.max()) ds.fillna(ds.max()) 整数がいつまでも繰り返すイテラブル itertools.repeat(整数) itertools.repeat(整数) option: ホワイトスモーク色を用いる color = 'whitesmoke' color = 'whitesmoke' 折れ線グラフの色をオリベドラブに指定する plt.plot(データ列x, データ列y, color='olivedrab') plt.plot(データ列x, データ列y, color='olivedrab') グリーンイエロー色で線グラフを描画する plt.plot(データ列x, データ列y, color='greenyellow') plt.plot(データ列x, データ列y, color='greenyellow') データフレームのあるカラムの空文字をドロップする df['列A'].replace('', np.nan).dropna() df['列A'].replace('', np.nan).dropna() 折れ線グラフの色をドジャーブルーに変更する plt.plot(データ列x, データ列y, color='dodgerblue') plt.plot(データ列x, データ列y, color='dodgerblue') データフレームの指定したカラムの中に文字列と日付データがいくつあるか数える df['列A'].isin([value, value2]).sum() df['列A'].isin([value, value2]).sum() キーが辞書上で未定義かどうか調べる キー not in 辞書 キー not in 辞書 折れ線グラフの色をゲインズボロに変更する plt.plot(データ列x, データ列y, color='gainsboro') plt.plot(データ列x, データ列y, color='gainsboro') 外れ値に強い線形回帰分析を行う model = sklearn.linear_model.HuberRegressor() model = sklearn.linear_model.HuberRegressor() タン色を用いてヒストグラムを描画する plt.hist(データ列, color='tan') plt.hist(データ列, color='tan') コーラル色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='coral') plt.barh(データ列x, データ列y, color='coral') 複数のカラムからグループ化し、分散を求める df.groupby(['列A', '列B'], as_index=False).var() df.groupby(['列A', '列B'], as_index=False).var() option: 耐火レンガにフォントの色を設定する color = 'firebrick' color = 'firebrick' 線グラフをレモンシフォン色で描画する plt.plot(データ列x, データ列y, color='lemonchiffon') plt.plot(データ列x, データ列y, color='lemonchiffon') 浮動小数点数を複素数に変換する complex(x) complex(x) ヒストグラムの色をコーンズシルクに指定する plt.hist(データ列, color='cornsilk') plt.hist(データ列, color='cornsilk') 折れ線グラフをミディアムシアグリーン色として描画する plt.plot(データ列x, データ列y, color='mediumseagreen') plt.plot(データ列x, データ列y, color='mediumseagreen') 折れ線グラフのクロス印を青くする plt.plot(データ列x, データ列y, marker='x', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='x', markerfacecolor='b') データをL2ノルムとして正規化する "sklearn.preprocessing.Normalizer(norm=""l2"").fit_transform(データ列)" "sklearn.preprocessing.Normalizer(norm=""l2"").fit_transform(データ列)" 散布図をフォレストグリーン色を用いて描画する plt.scatter(データ列x, データ列y, color='forestgreen') plt.scatter(データ列x, データ列y, color='forestgreen') 折れ線グラフをアクアマリン色として描画する plt.plot(データ列x, データ列y, color='aquamarine') plt.plot(データ列x, データ列y, color='aquamarine') データシリーズを万の位で四捨五入する ds.round(-4) ds.round(-4) データフレームの指定した二つの列を取り出す df['列A'].isin([value]) df[['列A', '列B']] ミディアムシアグリーン色で散布図を描画する plt.scatter(データ列x, データ列y, color='mediumseagreen') plt.scatter(データ列x, データ列y, color='mediumseagreen') 棒グラフをマゼンタ色として描画する plt.bar(データ列x, データ列y, color='magenta') plt.bar(データ列x, データ列y, color='magenta') 配列とリストについて散布図を描画して、上三角マーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='^', c=rgb) plt.plot(データ列x, データ列y, marker='^', c=rgb) 配列の歪みを算出する scipy.stats.skew(配列, bias=False) scipy.stats.skew(配列, bias=False) マップの値の一覧 辞書.values() list(辞書.values()) xを赤色で表示する print(f'\033[31m{x}\033[0m') print(f'\033[31m{x}\033[0m') イテラブルを横棒グラフにする plt.barh(ラベル列, データ列) plt.barh(ラベル列, データ列) 折れ線グラフの色をダーク・スラテグレーに変更する plt.plot(データ列x, データ列y, color='darkslategrey') plt.plot(データ列x, データ列y, color='darkslategrey') マップのキーを要素に変更する 辞書[キー] = element 辞書[キー] = element データフレームの選択した列の欠損値を最大値で埋める df[['列A', '列B']].fillna(df[['列A', '列B']].max()) df[['列A', '列B']].fillna(df[['列A', '列B']].max()) パープル色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='purple') plt.barh(データ列x, データ列y, color='purple') キュー中の整数のインデックス 両端キュー.index(整数) 両端キュー.index(整数) リストをヒストグラムにする plt.hist(データ列) plt.hist(データ列) 区切り記号で文字列を二分する 文字列.partition(セパレータ) 文字列.partition(セパレータ) 折れ線グラフに赤い▽マーカーを描画する plt.plot(データ列x, データ列y, marker='v', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='v', markerfacecolor='r') 整数プラス整数を求める 整数 + 整数2 整数 + 整数2 データフレームを関数の値によってグループ化し要約統計量を計算する df.groupby(関数).describe() df.groupby(関数).describe() 横棒グラフをダークスラテグレー色として描画する plt.barh(データ列x, データ列y, color='darkslategray') plt.barh(データ列x, データ列y, color='darkslategray') 散布図に青い▽マーカーを描画する plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='b') plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='b') 分子n、分母mの有理数を生成する fractions.Fraction(numerator=n, denominator=m) fractions.Fraction(numerator=n, denominator=m) クラス分類の予測精度をヒートマップで確認する sns.heatmap(confusion_matrix(正解データ列, 予測データ列), annot=True, cmap='Reds') sns.heatmap(confusion_matrix(正解データ列, 予測データ列), annot=True, cmap='Reds') 両端キューの順序を左にローテーションする 両端キュー.rotate(-1) 両端キュー.rotate(-1) 文字列全体がパターンにマッチするか見る re.fullmatch(pattern, s) re.fullmatch(pattern, s) option: オーキッドにグラフの色を指定する color = 'orchid' color = 'orchid' インデント幅を指定して文字列をJSON文字列に変換する json.dumps(文字列, ensure_ascii=False, indent=n) json.dumps(文字列, ensure_ascii=False, indent=n) ふたつのリストの積集合を計算する list(set(リスト).intersection(set(リスト2))) list(set(リスト).intersection(set(リスト2))) 文字列がタイトルケースかどうか調べる 文字列.istitle() 文字列.istitle() 要素はタプルの要素でないか確認する 要素 not in タプル 要素 not in タプル 折れ線グラフにバツマーカーを使用する plt.plot(データ列x, データ列y, marker='x') plt.plot(データ列x, データ列y, marker='x') ミディアムターコイズ色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='mediumturquoise') plt.barh(データ列x, データ列y, color='mediumturquoise') 配列からn個サンプリングしてリスト化する random.sample(配列, k=n) random.sample(配列, k=n) データフレームの欠損値を最小値に指定する df.fillna(df.min()) df.fillna(df.min()) option: ダークブルーにフォントの色を変更する color = 'darkblue' color = 'darkblue' 右にデックの順序をローテーションする 両端キュー.rotate(1) 両端キュー.rotate(1) option: ホワイトスモークを使用する color = 'whitesmoke' color = 'whitesmoke' クラス分類をスタッキングで行う sklearn.ensemble.StackingClassifier() sklearn.ensemble.StackingClassifier() データフレームの一部のカラムの空文字を欠損値に変換し、ドロップする df[['列A', '列B']].replace('', np.nan).dropna() df[['列A', '列B']].replace('', np.nan).dropna() 折れ線グラフの色をトマトに指定する plt.plot(データ列x, データ列y, color='tomato') plt.plot(データ列x, データ列y, color='tomato') ライトスレイグレー色を使って散布図を描画する plt.scatter(データ列x, データ列y, color='lightslategray') plt.scatter(データ列x, データ列y, color='lightslategrey') ファイルをバイナリ用にオープンして]fとする f = open(filepath, mode='rb') f = open(filepath, mode='rb') オレンジにヒストグラムの色を変更する plt.hist(データ列, color='orange') plt.hist(データ列, color='orange') リストの要素の位置をエラーなく見る リスト.index(要素) if (リスト[1:] リスト.index(要素) if 要素 in リスト else -1 縦棒グラフを紺碧色で描画する plt.bar(データ列x, データ列y, color='azure') plt.bar(データ列x, データ列y, color='azure') グリッドの線種を点線に変更する plt.grid(linestyle='dotted') plt.grid(linestyle='dotted') キュー中の整数の出現数を数える 両端キュー.count(整数) 両端キュー.count(整数) 横棒グラフをスレートブルー色として描画する plt.barh(データ列x, データ列y, color='slateblue') plt.barh(データ列x, データ列y, color='slateblue') スノー色として棒グラフを描画する plt.bar(データ列x, データ列y, color='snow') plt.bar(データ列x, データ列y, color='snow') 日付データと日付データの時間差を算出する aDate - aDate2 aDate - aDate2 配列をフラット化する aArray.flatten() aArray.flatten() パープル色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='purple') plt.plot(データ列x, データ列y, color='purple') 列名一覧をデータ型でフィルタする df.select_dtypes(型).columns df.select_dtypes(型).columns 折れ線グラフの印を三角にする plt.plot(データ列x, データ列y, marker='^') plt.plot(データ列x, データ列y, marker='^') 数列を一つの文字列にする ''.join(map(str, 数列)) ''.join(map(str, 数列)) ファイルパスを開いて]、バイナリストリームを求める 'rb' = 'a'open(filepath, mode='rb') 'rb' = 'a'open(filepath, mode='rb') ダークカーキ色として棒グラフを描画する plt.bar(データ列x, データ列y, color='darkkhaki') plt.bar(データ列x, データ列y, color='darkkhaki') イテラブルから双方向キューを作る collections.deque(イテラブル) collections.deque(イテラブル) 線グラフの色をフクシアに設定する plt.plot(データ列x, データ列y, color='fuchsia') plt.plot(データ列x, データ列y, color='fuchsia') 線グラフの色をロージーブラウンに設定する plt.plot(データ列x, データ列y, color='rosybrown') plt.plot(データ列x, データ列y, color='rosybrown') データフレームの中の列を分割数nでビン分割する pd.cut(df[col], n) pd.cut(df[col], n) マゼンタにヒストグラムの色を変更する plt.hist(データ列, color='magenta') plt.hist(データ列, color='magenta') option: 色をレモンシフォンにする color = 'lemonchiffon' color = 'lemonchiffon' 既存のファイルを文字コードtextとして追加できるようにオープンする] open(filepath, mode='a', encoding=text) open(filepath, mode='a', encoding=text) 縦棒グラフをローングリーン色で描画する plt.bar(データ列x, データ列y, color='lawngreen') plt.bar(データ列x, データ列y, color='lawngreen') 線グラフをマルーン色で描画する plt.plot(データ列x, データ列y, color='maroon') plt.plot(データ列x, データ列y, color='maroon') 文字列の最初から改行を消す 文字列.rstrip('\n') 文字列.lstrip('\n') 末尾から文字列を部分文字列で区切る 文字列.rsplit() 文字列.rsplit(部分文字列) 文字列が指定した文字列に含まれるか調べる 文字列 in 別の文字列 文字列 in 別の文字列 最大値・最小値の範囲で一様な疑似乱数 x = 0.0random.uniform(最小値, 最大値) x = 0.0x2 = 1.0random.uniform(最小値, 最大値) 表データのあるカラムの曜日が何日目か見る df['列A'].dt.dayofweek df['列A'].dt.dayofweek 切片なしの線形モデルを作る model = sklearn.linear_model.LinearRegression(fit_intercept=False) model = sklearn.linear_model.LinearRegression(fit_intercept=False) 二つのオブジェクトは同一か調べる obj is obj2 obj is obj2 rgbの左三角マーカーとして散布図を描画する plt.plot(データ列x, データ列y, marker='<', c=rgb) plt.plot(データ列x, データ列y, marker='<', c=rgb) 文字列がリストに含まれないか 文字列 not in リスト 文字列 not in リスト タプル内の要素は全て真か判定する all(タプル) all(タプル) 散布図の印の色を変更する plt.scatter(データ列x, データ列y, markerfacecolor='#800080') plt.scatter(データ列x, データ列y, markerfacecolor='#800080') 小数点数が無限大かどうか math.isinf(x) math.isinf(x) 要素はセットに含まれないか 要素 not in セット 要素 not in セット イテラブルと数列について散布図を描画し、、マーカーを左三角に設定する plt.plot(データ列x, データ列y, marker='<') plt.plot(データ列x, データ列y, marker='<') 実行時の標準出力の出力先がターミナルか sys.stdout.isatty() sys.stdout.isatty() option: スプリンググリーンにグラフの色を変更する color ='springgreen' color = 'springgreen' 同じでないと書きたい not 条件式 X != Y データフレームのカラムの相関係数を算出する scipy.stats.pearsonr(df['列A'], df['列B']) scipy.stats.pearsonr(df['列A'], df['列B']) 青い点線で数列の変遷をプロットする plt.plot(データ列x, データ列y, linestyle='dotted', color='b') plt.plot(データ列x, データ列y, linestyle='dotted', color='b') 時計回りに円グラフを描く plt.pie(データ列, startangle=90, labels=データ列) plt.pie(データ列, startangle=90, counterclock=False) キーがマップに存在するかどうか調べる キー not in 辞書 キー in 辞書 オレンジ色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='orange') plt.bar(データ列x, データ列y, color='orange') nからいつまでもカウントダウンする itertools.count(start=n, step=-1) itertools.count(start=n, step=-1) データフレームを使う import pandas as pd import pandas as pd 文字列を改行で分割する 文字列.splitlines() 文字列.splitlines() option: 小麦色色を用いる color = 'wheat' color = 'wheat' 長さが一致しないときのzip 0f' - 10minutes(loc=(2, 4)) itertools.zip_longest(iterable, iterable2) option: 文字列を区切り記号で使う sep = s sep = s データ列の折れ線グラフをポイント印で描画する plt.plot(データ列x, データ列y, marker='.') plt.plot(データ列x, データ列y, marker='.') ラインを半透明の一点鎖線で描画する plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) 数値がセットのいずれでもないどうか 数 not in セット 数 not in セット シーケンスを2回あわせたデカルト積 itertools.product(iterable, repeat=2) itertools.product(iterable, repeat=2) 入力から二つの少数を取り出す A, B = map(float, input().split()) A, B = map(float, input().split()) 文字列をdatetime64型に変換する 文字列.replace(文字列, np.to_datetime) pd.to_datetime(日付を表現した文字列) 数を十の位で丸める round(x, -1) round(x, -1) データフレームの値は未入力値か df.isna() df.isna() ふたつのタプルを加える タプル + タプル2 タプル + タプル2 青緑色を使って折れ線グラフを描画する plt.plot(データ列x, データ列y, color='teal') plt.plot(データ列x, データ列y, color='turquoise') 指定したカラムの中に日付データが存在するか確認する df['列A'].isin([value]) df['列A'].isin([value]) ネイビー色を使って横棒グラフを描画する plt.barh(データ列x, データ列y, color='navy') plt.barh(データ列x, データ列y, color='navy') 折れ線グラフの色をパパイヤウィップにセットする plt.plot(データ列x, データ列y, color='papayawhip') plt.plot(データ列x, データ列y, color='papayawhip') リネンにヒストグラムの色を指定する plt.hist(データ列, color='linen') plt.hist(データ列, color='linen') 識別子が抽象クラスか inspect.isabstract(識別子) inspect.isabstract(識別子) 柱状グラフを描画し、ビン数を指定する plt.hist(データ列, bins=区関数) plt.hist(データ列, bins=区関数) option: シスル色を使用する color = 'thistle' color = 'thistle' y軸の目盛を整数のみにする plt.yticks(np.arange(最小値, 最大値, 間隔)) plt.yticks(np.arange(最小値, 最大値, 間隔)) データフレームの一部の列を丸めて整数型にする df[['列A', '列B']].round().astype(int) df[['列A', '列B']].round().astype(int) データフレームの記述統計量を見る df.describe() df.describe() グラフのデザインをいい感じに設定する sns.set() sns.set() ミディアムターコイズ色として散布図を描画する plt.scatter(データ列x, データ列y, color='mediumturquoise') plt.scatter(データ列x, データ列y, color='mediumturquoise') 識別子はメソッドか調べる inspect.ismethod(識別子) inspect.ismethod(識別子) option: ターコイズにフォントの色を設定する color = 'turquoise' color = 'turquoise' 折れ線グラフをコーンフラワーブルー色を使って描画する plt.plot(データ列x, データ列y, color='cornflowerblue') plt.plot(データ列x, データ列y, color='cornflowerblue') データフレームの値はNaNか調べる df.isna() df.isna() オブジェクトが名前付きタプルかどうか hasattr(obj, '_asdict') and hasattr(obj, '_fields') hasattr(obj, '_asdict') and hasattr(obj, '_fields') ファイルパスを文字コードtextでオープンする] text = 'utf-8'open(filepath, encoding=text) text = 'utf-8'open(filepath, encoding=text) option: グラフの色をダークシアンに指定する color = 'darkcyan' color = 'darkcyan' ピアソンとしてデータフレームの相関行列を求める df.corr(method='pearson') df.corr(method='pearson') 横棒グラフをライトグレー色を使って描画する plt.barh(データ列x, データ列y, color='lightgray') plt.barh(データ列x, データ列y, color='lightgrey') option: 書き込みモードに指定する mode = 'w' mode = 'w' ある列の文字列が正規表現にマッチする行を選ぶ df[df['列A'].str.match(正規表現)] df[df['列A'].str.match(正規表現)] 配列の最小を求める np.min(配列) np.min(aArray) 散布図をダークオーキッド色を用いて描画する plt.scatter(データ列x, データ列y, color='darkorchid') plt.scatter(データ列x, データ列y, color='darkorchid') 折れ線グラフをオレンジレッド色を使って描画する plt.plot(データ列x, データ列y, color='orangered') plt.plot(データ列x, データ列y, color='orangered') 横棒グラフをミディアムシアグリーン色として描画する plt.barh(データ列x, データ列y, color='mediumseagreen') plt.barh(データ列x, データ列y, color='mediumseagreen') ヒストグラムの色をサンディーブラウンに指定する plt.hist(データ列, color='sandybrown') plt.hist(データ列, color='sandybrown') データフレームの一部のカラムの平均値を求める df[['列A', '列B']].mean() df[['列A', '列B']].mean() 部分文字列が文字列の指定した区間に存在するか 文字列.find(部分文字列, 開始位置, 終了位置)!= -1 文字列.find(部分文字列, 開始位置, 終了位置) != -1 重複した行だけを取り出す df[df.duplicated(keep=False)] df[df.duplicated(keep=False)] 黒いポイントマーカーで散布図を描く plt.plot(データ列x, データ列y, marker='.', c='k') plt.plot(データ列x, データ列y, marker='.', c='k') 二つのデータフレームを異なる列をキーとして内部結合する pd.merge(df, df2, left_on='列A', right_on='列B', how='inner') pd.merge(df, df2, left_on='列A', right_on='列B', how='inner') 文字列を区切り記号で分割して、列挙する 文字列.split(セパレータ) 文字列.split(セパレータ) 外れ値を除いた配列の分散 scipy.stats.tvar(配列, limits=(下限, 上限), inclusive=(True, True)) scipy.stats.tvar(配列, limits=(下限, 上限), inclusive=(True, True)) 読み込み用にファイルをオープンして]、fとする f = open(filepath, mode='r') f = open(filepath, mode='r') 散布図に黒い丸印を描画する plt.scatter(データ列x, データ列y, marker='o', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='o', markerfacecolor='k') 文字が別の文字列にあるか 文字 in 文字列 文字 in 文字列 やわらかい青色を用いて散布図を描画する plt.scatter(データ列x, データ列y, color='cornflowerblue') plt.scatter(データ列x, データ列y, color='cornflowerblue') 二つのセットが互いに素 セット.isdisjoint(セット2) セット.isdisjoint(セット2) option: フォントの色をカデットブルーに変更する color = 'cadetblue' color = 'cadetblue' データフレームを指定した列の値毎にグループ化して、列挙する [(name, group_df) for name, group_df in df.groupby('列A')] [(name, group_df) for name, group_df in df.groupby('列A')] 改行なしに2つの変数をプリントする print(変数名, 変数名, end='') print(変数名, 変数名, end='') 横棒グラフを黄色色を用いて描画する plt.barh(データ列x, データ列y, color='yellow') plt.barh(データ列x, データ列y, color='yellow') predicateFuncがTrueとなるイテラブルの要素を得る itertools.takewhile(predicateFunc, iterable) itertools.takewhile(predicateFunc, iterable) ヒストグラムをアイボリー色として描画する plt.hist(データ列, color='ivory') plt.hist(データ列, color='ivory') 二つの集合のいずれか一方だけの集合 セット.symmetric_difference(セット2) セット.symmetric_difference(セット2) 文字列から一つずつ文字を列挙する [文字列].astype(文字列) list(文字列) 開始位置から終了位置までに部分文字列がいくつか存在するか調べる 文字列.count(部分文字列, 開始位置, 終了位置) 文字列.count(部分文字列, 開始位置, 終了位置) 横棒グラフを描画して、バーの縦幅を設定する plt.barh(ラベル列, データ列, width=0.5) plt.barh(ラベル列, データ列, width=0.5) 識別子はスタックフレームか調べる inspect.isframe(識別子) inspect.isframe(識別子) 黒い大バツマーカーを散布図に描画する plt.scatter(データ列x, データ列y, marker='X', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='X', markerfacecolor='k') データフレームの一部のカラムの尖度 df[['列A', '列B']].skew() df[['列A', '列B']].skew() 英字の大文字列 string.ascii_uppercase string.ascii_uppercase 表をグループ化し、あるカラムに対し平均値を求める df.groupby('列A')['列B'].mean() df.groupby('列A')['列B'].mean() 文字列の左側から文字を取り除く 文字列.lstrip(文字) 文字列.lstrip(文字) option: ミディアムスレートブルーを使う color ='mediumslateblue' color = 'mediumslateblue' 句読点文字を全部見る string.punctuation string.punctuation データフレームのNaNを数値で置き換える df.fillna(x) df.fillna(x) 散布図の下三角マーカーの大きさを変える plt.scatter(データ列x, データ列y, marker='v', markersize=2.0) plt.scatter(データ列x, データ列y, marker='v', markersize=2.0) 散布図をダークグレー色を用いて描画する plt.scatter(データ列x, データ列y, color='darkgray') plt.scatter(データ列x, データ列y, color='darkgray') 横棒グラフをプロットして、下寄せする plt.barh(ラベル列, データ列, align='edge') plt.barh(ラベル列, データ列, align='edge') データフレームからランダムに100行を重複ありでサンプリングする df.sample(100, replace=True) df.sample(100, replace=True) 両端キューの上限長 両端キュー.maxlen 両端キュー.maxlen 文字列の右側から部分文字列を消す 文字列.rstrip(部分文字列) 文字列.rstrip(部分文字列) 回帰モデルの残差を求める sklearn.metrics.precision_score(目的変数, model.predict(説明変数)) 目的変数 - model.predict(説明変数) データシリーズを百の位で丸めて整数型にする ds.round(-2).astype(int) ds.round(-2).astype(int) ベクトルの要素数 len(aArray) aArray.size ファイルを書き込みできるように開く] 'w' = 'a'open(filepath, mode='w') 'w' = 'a'open(filepath, mode='w') 小さい方を欲しい min(X, Y) min(X, Y) option: ダークグレーを用いる color = 'darkgray' color = 'darkgray' 青色でxを出力する print(f'\033[34m{x}\033[0m') print(f'\033[34m{x}\033[0m') 散布図をrgbの大バツマーカーとしてプロットする plt.plot(データ列x, データ列y, marker='X', c=rgb) plt.plot(データ列x, データ列y, marker='X', c=rgb) option: マーカーを菱形に指定する marker = 'D' marker = 'D' カテゴリデータをベクトル化する sklearn.preprocessing.LabelEncoder().fit_transform(データ列) sklearn.preprocessing.OneHotEncoder(sparse=False).fit_transform(データ列) セットの浅いコピーを作る セット.copy() セット.copy() 文字列をパターンによって置換する re.sub(pattern, newsub, s) re.sub(pattern, newsub, s) 文字列中に大文字がないかどうか any(not c.isupper() for c in 文字列) any(not c.isupper() for c in 文字列) 縦棒グラフをミスティローズ色で描画する plt.bar(データ列x, データ列y, color='mistyrose') plt.bar(データ列x, データ列y, color='mistyrose') レベッカパープルにヒストグラムの色を設定する plt.hist(データ列, color='rebeccapurple') plt.hist(データ列, color='rebeccapurple') ヒストグラムをダークオレンジ色を使って描画する plt.hist(データ列, color='darkorange') plt.hist(データ列, color='darkorange') オレンジ色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='orange') plt.barh(データ列x, データ列y, color='orange') 浮動小数点数以上の最小の整数 min(x, y) math.ceil(x) 範囲を指定して乱数を求める random.randint(最小値, 最大値) random.randint(最小値, 最大値) 折れ線グラフの色をグリーンイエローに変更する plt.plot(データ列x, データ列y, color='greenyellow') plt.plot(データ列x, データ列y, color='greenyellow') 整数が1もしくは2 整数 == 1 or 整数 == 2 整数 == 1 or 整数 == 2 三項演算子を書きたい X + Y X if 条件式 else Y 折れ線グラフのクロスマーカーの色を変える plt.plot(データ列x, データ列y, marker='x', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='x', markerfacecolor='#800080') データフレームのデータ型リストを使う df.dtypes df.dtypes シルバーにヒストグラムの色を設定する plt.hist(データ列, color='silver') plt.hist(データ列, color='silver') リストと配列について散布図を描画して、▼マーカーの色をrgbに変更する plt.plot(データ列x, データ列y, marker='v', c=rgb) plt.plot(データ列x, データ列y, marker='v', c=rgb) 要素はタプルの要素でない 要素 not in タプル 要素 not in タプル option: 色をミディアムスプリンググリーンに変更する color ='mediumspringgreen' color = 'mediumspringgreen' 平均と分散で標準化を行う sklearn.preprocessing.StandardScaler().fit_transform(データ) sklearn.preprocessing.StandardScaler().fit_transform(データ) 無限に整数が続くイテラブルを使う itertools.repeat(整数) itertools.repeat(整数) データフレームを二つの列によって大きい順に破壊的にソートする df.sort_values(by=['列A', '列B'], ascending=False, inplace=True) df.sort_values(by=['列A', '列B'], ascending=False, inplace=True) BOM付きでファイルパスを書き込み用に開く] open(filepath, mode='w', encoding='utf_8_sig') open(filepath, mode='w', encoding='utf_8_sig') 文字列の指定した範囲位置の間に部分文字列が含まれるかどうか 文字列.find(部分文字列, 開始位置, 終了位置)!= -1 文字列.find(部分文字列, 開始位置, 終了位置) != -1 ヒストグラムの色をイエローグリーンに変更する plt.hist(データ列, color='yellowgreen') plt.hist(データ列, color='yellowgreen') ホットピンク色で線グラフを描画する plt.plot(データ列x, データ列y, color='hotpink') plt.plot(データ列x, データ列y, color='hotpink') 線グラフをホットピンク色で描画する plt.plot(データ列x, データ列y, color='hotpink') plt.plot(データ列x, データ列y, color='hotpink') 茶色色でヒストグラムを描画する plt.hist(データ列, color='brown') plt.hist(データ列, color='brown') 日付データが水曜日かどうか aDate.weekday() == 2 aDate.weekday() == 2 option: グラフの色をスカイブルーに変更する color ='skyblue' color = 'skyblue' オブジェクトの型 isinstance(obj, type=1) type(obj) 棒グラフをハニーデュー色として描画する plt.bar(データ列x, データ列y, color='honeydew') plt.bar(データ列x, データ列y, color='honeydew') データフレームの行名を全て付け直す df.rename(index={x: y}) df.rename(index={x: y}) 改行なしにxを出力する print(x, end='') print(x, end='') 本日の月数を見る datetime.datetime.today().month datetime.datetime.today().month 配列のトリム平均を算出する scipy.stats.tmean(配列, limits=(下限, 上限), inclusive=(True, True)) scipy.stats.tmean(配列, limits=(下限, 上限), inclusive=(True, True)) データフレームを各カテゴリにグループ化してバイオリン図にする sns.violinplot(x='カテゴリ列', y='列', hue='カテゴリ列', data=df) sns.violinplot(x='カテゴリ列', y='列', data=df) 列名を指定してデータフレームを全結合する pd.merge(df, df2, on='列A', how='outer') pd.merge(df, df2, on='列A', how='outer') 折れ線グラフをアンティークホワイト色を用いて描画する plt.plot(データ列x, データ列y, color='antiquewhite') plt.plot(データ列x, データ列y, color='antiquewhite') 線グラフをアイボリー色として描画する plt.plot(データ列x, データ列y, color='ivory') plt.plot(データ列x, データ列y, color='ivory') スカイブルー色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='skyblue') plt.plot(データ列x, データ列y, color='skyblue') ゴールド色でヒストグラムを描画する plt.hist(データ列, color='gold') plt.hist(データ列, color='gold') 散布図を丸印で描画する plt.scatter(データ列x, データ列y, marker='o') plt.scatter(データ列x, データ列y, marker='o') データフレームのひとつのカラムだけ説明変数にする 説明変数 = df[['列名']] 説明変数 = df[['列名']] 文字列をコロンで二分割して前半を見る 文字列.partition(':')[0] 文字列.partition(':')[0] シンボル計算を使う math.Symbol(x) import sympy グラフに水平方向の一点鎖線をつける plt.axhline(y=0, linestyle='dashbot') plt.axhline(y=0, linestyle='dashbot') セットから全ての要素を消す セット.clear() セット.clear() 配列をひとつの文字列にする ''.join(map(str, 配列)) ''.join(map(str, 配列)) rgbの▲マーカーとして散布図をプロットする plt.plot(データ列x, データ列y, marker='^', c=rgb) plt.plot(データ列x, データ列y, marker='^', c=rgb) 文字列の先頭で正規表現に複数行対応としてマッチするか確認する re.match(pattern, s, flags=re.MULTILINE) re.match(pattern, s, flags=re.MULTILINE) データシリーズの欠損値を最大値に変更する ds.fillna(ds.max()) ds.fillna(ds.max()) 二つの列によってデータフレームをまとめた表を使う df.groupby(['列A', '列B']) df.groupby(['列A', '列B']) データフレームのn行目を取り出す df.head(n) df.loc[n] 黒い星マーカーを用いて散布図を描く plt.plot(データ列x, データ列y, marker='*', c='k') plt.plot(データ列x, データ列y, marker='*', c='k') 五乗を書きたい X ** 5 X ** 5 ホットピンク色を用いて縦棒グラフを描画する plt.bar(データ列x, データ列y, color='hotpink') plt.bar(データ列x, データ列y, color='hotpink') option: アクアにグラフの色を設定する color = 'aqua' color = 'aqua' リストとリストについて散布図を描画し、、マーカーを星に変更する plt.plot(データ列x, データ列y, marker='*') plt.plot(データ列x, データ列y, marker='*') option: シスルを使う color = 'thistle' color = 'thistle' ブラック色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='black') plt.bar(データ列x, データ列y, color='black') 整数の八分の一を算出する 整数 / 8 整数 / 8 条件演算子が書きたい X == Y X if 条件式 else Y 複数行対応として事前にパターンをコンパイルする re.compile(pattern, flag=re.MULTILINE) re.compile(pattern, flag=re.MULTILINE) option: ミディアムターコイズ色を使用する color ='mediumturquoise' color = 'mediumturquoise' 散布図を下三角印で描画する plt.scatter(データ列x, データ列y, marker='v') plt.scatter(データ列x, データ列y, marker='v') 文字列中に非空白があるか調べる any(not c.isspace() for c in 文字列) any(not c.isspace() for c in 文字列) option: ダークブルー色を用いる color = 'darkblue' color = 'darkblue' データフレームの未入力値を直後の値に設定する df.fillna(method='bfill') df.fillna(method='bfill') ガウス過程を使ってクラス分類をする model = sklearn.gaussian_process.GaussianProcessClassifier() model = sklearn.gaussian_process.GaussianProcessClassifier() 散布図の▽マーカーの線幅を変える plt.scatter(データ列x, データ列y, marker='v', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='v', markeredgewidth=2.5) グラフの中の縦軸に軸名を付ける plt.ylabel('y軸ラベル') plt.ylabel('y軸ラベル') 文字列の開始位置以降がsubで始まるかどうか調べる 文字列.startswith(部分文字列, 開始位置) 文字列.startswith(部分文字列, 開始位置) データフレームから型リストで指定されたデータ型の列のみ取り出す df.select_dtypes(include=typeList) df.select_dtypes(include=typeList) year年month月day日hour時minute分を日付時刻にする datetime.datetime(year=year, month=month, day=day, hour=hour, minute=minute) datetime.datetime(year=year, month=month, day=day, hour=hour, minute=minute) ライトグリーン色で棒グラフを描画する plt.bar(データ列x, データ列y, color='lightgreen') plt.bar(データ列x, データ列y, color='lightseagreen') 中央値でデータ列をビン分割する pd.qcut(ds, 2) pd.qcut(ds, 2) ファイルからJSON形式のデータを読み込む with open('file.json') as f:data = json.load(f) with open('file.json') as f:data = json.load(f) 配列をn個に分割して、namesのラベルをつける pd.cut(aArray, n, labels=names) pd.cut(aArray, n, labels=names) 横棒グラフをカデットブルー色を用いて描画する plt.barh(データ列x, データ列y, color='cadetblue') plt.barh(データ列x, データ列y, color='cadetblue') option: アイボリーを使う color = 'ivory' color = 'ivory' 辞書の値に要素は含まれていないか element not in 辞書.values() element not in 辞書.values() 変数計算を使う import pandas as pd import sympy データフレームの歪み df.kurt() df.kurt() イテラブルのイミュータブルな集合を準備する frozenset(イテラブル) frozenset(イテラブル) ファイルパスのディレクトリ名を求める os.path.dirname(filepath) os.path.dirname(filepath) データ列とリストについての散布図に黒い丸マーカーを描画する plt.plot(データ列x, データ列y, marker='o', c='k') plt.plot(データ列x, データ列y, marker='o', c='k') セットが上位集合か調べる セット.issuperset(セット2) セット.issuperset(セット2) 縦棒グラフをパウダーブルー色で描画する plt.bar(データ列x, データ列y, color='powderblue') plt.bar(データ列x, データ列y, color='powderblue') データフレームの選択したカラムの中にあると文字列の合計を数える df[['列A', '列B']].isin([value, value2]).sum() df[['列A', '列B']].isin([value, value2]).sum() 文字列中のタブを空白にする 文字列.expandtabs(tabsize=n) 文字列.expandtabs(tabsize=n) マゼンタ色でヒストグラムを描画する plt.hist(データ列, color='magenta') plt.hist(データ列, color='magenta') 多次元データをSVDとして文字列次元に削減する sklearn.decomposition.TruncatedSVD(n_components=N).fit_transform(多次元データ) sklearn.decomposition.TruncatedSVD(n_components=N).fit_transform(多次元データ) データフレームの代表値 df.mode() df.describe() ミディアムパープル色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='mediumpurple') plt.barh(データ列x, データ列y, color='mediumpurple') わり算のあまりの計算を書きたい X % Y X % Y クリムゾン色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='crimson') plt.bar(データ列x, データ列y, color='crimson') 空のロッソ回帰モデルを用意する model = sklearn.linear_model.Rosso(alpha=正則化項) model = sklearn.linear_model.Rosso(alpha=正則化項) データフレームを2つのカラムの値毎にグループ化して、列挙する [(name, group_df) for name, group_df in df.groupby(['列A', '列B'])] [(name, group_df) for name, group_df in df.groupby(['列A', '列B'])] 箱ひげ図を描画して平均を加える plt.boxplot(データ列, showmeans=True) plt.boxplot(データ列, showmeans=True) 縦棒グラフをグレー色で描画する plt.bar(データ列x, データ列y, color='gray') plt.bar(データ列x, データ列y, color='grey') グラフで用いる縦軸のラベルをuntitledに変更する plt.ylabel('y軸ラベル') plt.ylabel('y軸ラベル') 実数の整数部を計算する math.modf(x)[0] math.modf(x)[1] 線グラフをスカイブルー色で描画する plt.plot(データ列x, データ列y, color='skyblue') plt.plot(データ列x, データ列y, color='skyblue') option: ダークサーモンにグラフの色を設定する color = 'darksalmon' color = 'darksalmon' データフレームの中のカラムを等間隔でn個にビン分割する pd.cut(df[col], n) pd.cut(df[col], n) 整数型のゼロ埋めされた行列 np.zeros(要素数, dtype=np.int) np.zeros(要素数, dtype=np.int) データフレームの列の各データ値の出現数を求める df[col].value_counts() df[col].value_counts() カーキ色を用いて折れ線グラフを描画する plt.plot(データ列x, データ列y, color='khaki') plt.plot(データ列x, データ列y, color='khaki') 文字列のn番目をアスキーコードにする ord(文字列[n]) ord(文字列[n]) 散布図をライトブルー色として描画する plt.scatter(データ列x, データ列y, color='lightblue') plt.scatter(データ列x, データ列y, color='lightblue') データフレームの選択したカラムはどの程度、正規分布から歪んでいるか調べる df[['列A', '列B']].kurt() df[['列A', '列B']].kurt() データフレームの選択したカラムの未入力値を最小値に設定する df[['列A', '列B']].fillna(df[['列A', '列B']].min()) df[['列A', '列B']].fillna(df[['列A', '列B']].min()) 実数を浮動小数点数で除した余り x % y x % y 実数の逆双曲線余弦を求める math.acosh(x) math.acosh(x) option: 線の種類を実線に変更する linestyle ='solid' linestyle = 'solid' 横棒グラフをライトゴールドロディイエロー色として描画する plt.barh(データ列x, データ列y, color='lightgoldenrodyellow') plt.barh(データ列x, データ列y, color='lightgoldenrodyellow') 文字列中に空白が含まれる any(c.isspace() for c in 文字列) any(c.isspace() for c in 文字列) データフレームから同じ行を消す df.drop_duplicates(axis=1) df.drop_duplicates(inplace=True) 四乗を計算したい X ** 4 X ** 4 ベクトルの和 aArray + aArray2 aArray + aArray2 Pandasの日付型のデータシリーズをデータフレームのインデックスにする df.index = pd.DatetimeIndex(ds) df.index = pd.DatetimeIndex(ds) 今日の日を使う datetime.datetime.today().day datetime.datetime.today().day 横棒グラフをサンディーブラウン色を使って描画する plt.barh(データ列x, データ列y, color='sandybrown') plt.barh(データ列x, データ列y, color='sandybrown') 小数点以下'5'桁まで表示する ':.5f' = ':.3f'print(':.5f'.format(x)) ':.5f' = ':.3f'print(':.5f'.format(x)) 折れ線グラフのバツ印を赤くする plt.plot(データ列x, データ列y, marker='x', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='x', markerfacecolor='r') セットからエラーなく項を除く セット.discard(要素) セット.discard(要素) データフレームのあるカラムは何年か見る df['列A'].dt.year df['列A'].dt.year 決定係数を算出する sklearn.metrics.r2_score(正解データ列, 予測データ列) sklearn.metrics.r2_score(データ列, データ列2) numpyを使用する import numpy as np import numpy as np データ列の各値は何回出現するか確認する ds.value_counts() ds.value_counts() 積み上げ横棒グラフをプロットする plt.barh(ラベル列, データ列, bottom=データ列y, color='#800080') plt.barh(ラベル列, データ列, bottom=データ列y, color='#800080') 折れ線グラフの色をダークスラテグレーにセットする plt.plot(データ列x, データ列y, color='darkslategray') plt.plot(データ列x, データ列y, color='darkslategray') データフレームから列を三つのみ選択する df[['列A', '列B', '列C']] df[['列A', '列B', '列C']] 折れ線グラフのクロスマーカーの線幅を設定する plt.plot(データ列x, データ列y, marker='x', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='x', markeredgewidth=2.5) データフレームの選択したカラムを十の位で丸めて、整数にする df[['列A', '列B']].round(-1).astype(int) df[['列A', '列B']].round(-1).astype(int) データフレームの選択したカラムのNaNを前の行の値で埋める df[['列A', '列B']].fillna(method='ffill') df[['列A', '列B']].fillna(method='ffill') 散布図をパパイヤウィップ色を使って描画する plt.scatter(データ列x, データ列y, color='papayawhip') plt.scatter(データ列x, データ列y, color='papayawhip') option: マーカーの色を珊瑚にする markerfacecolor = 'coral' markerfacecolor = 'coral' 散布図のポイントマーカーの線幅を指定する plt.scatter(データ列x, データ列y, marker='.', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='.', markeredgewidth=2.5) データフレームのあるカラムをリストとして選択する df['列A'].values.tolist() df['列A'].values.tolist() データフレームのNaNを後の行の値に指定する df.fillna(method='bfill') df.fillna(method='bfill') オブジェクトは整数クラス int = intisinstance(obj, int) int = intisinstance(obj, int) イテラブルと配列について散布図を描画して、ポイントマーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='.', c=rgb) plt.plot(データ列x, データ列y, marker='.', c=rgb) 文字列をカンマを使って区切り、列挙する 文字列.split(',') 文字列.split(',') 縦棒グラフの色をパウダーブルーにする plt.bar(データ列x, データ列y, color='powderblue') plt.bar(データ列x, データ列y, color='powderblue') 配列からランダムに1個選んでリストにする random.choice(配列) random.choice(配列) option: コロンをセパレータで用いる sep = ':' sep = ':' 回帰分析をK最近傍法として行う model = sklearn.neighbors.KNeighborsRegressor(hidden_importances_) model = sklearn.neighbors.KNeighborsRegressor(n_neighbors=5) 二変数の最大値を計算する max(x, y) max(x, y) ゲインズボロにヒストグラムの色を指定する plt.hist(データ列, color='gainsboro') plt.hist(データ列, color='gainsboro') ヒストグラムの色をオリベドラブに変更する plt.hist(データ列, color='olivedrab') plt.hist(データ列, color='olivedrab') 標準入力から入力される sys.stdin.readline() input() 2つの辞書を階層化する collections.ChainMap(aDict, aDict2) collections.ChainMap(aDict, aDict2) バイオレット色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='violet') plt.bar(データ列x, データ列y, color='violet') ヒストグラムをフォレストグリーン色を用いて描画する plt.hist(データ列, color='forestgreen') plt.hist(データ列, color='forestgreen') 太字にする f'\033[1m{x}\033[0m' f'\033[1m{x}\033[0m' option: ピーチパフにグラフの色を指定する color = 'peachpuff' color = 'peachpuff' 数値時刻のデータ列からタイムスタンプ型に変換する pd.to_datetime(ds, unit='s', utc=True) pd.to_datetime(ds, unit='s', utc=True) リストとイテラブルについての散布図を大きさnで描画する plt.scatter(データ列x, データ列y, s=n) plt.scatter(データ列x, データ列y, s=n) 整数の4分の一 整数 / 4 整数 / 4 表データから列を一つ選択する df[['列A']] df[['列A']] option: ダークスラテグレー色を用いる color = 'darkslategray' color = 'darkslategray' 黒いダイアモンドマーカーを散布図に使う plt.plot(データ列x, データ列y, marker='D', c='k') plt.plot(データ列x, データ列y, marker='D', c='k') 2つの文字列が同じか調べる 文字列 == 文字列2 文字列 == 文字列2 option: △マーカーを加える marker = '^' marker = '^' タイムスタンプデータが何分か知る aDatetime.minute aDatetime.minute サーモン色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='salmon') plt.bar(データ列x, データ列y, color='salmon') データ列の推移を青い破線として描く plt.plot(データ列x, データ列y, linestyle='dashed', color='b') plt.plot(データ列x, データ列y, linestyle='dashed', color='b') option: 色を黄緑に設定する color = 'chartreuse' color = 'chartreuse' 縦棒グラフの色をレベッカパープルにする plt.bar(データ列x, データ列y, color='rebeccapurple') plt.bar(データ列x, データ列y, color='rebeccapurple') データフレームを表示するとき表示可能な列数の最大値をnに指定する pd.set_option('display.max_columns', n) pd.set_option('display.max_columns', n) セットの補集合を求める セット.difference(セット2) セット.difference(セット2) option: インディゴ色を用いる color = 'indigo' color = 'indigo' データフレームの選択したカラムを1000の位で丸める df[['列A', '列B']].round(-3) df[['列A', '列B']].round(-3) 折れ線グラフを半透明の破線を用いて描画する plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) JSONフォーマットのファイルをパースする with open('file.json') as f:data = json.load(f) with open('file.json') as f:data = json.load(f) 変数名はモジュールか調べる inspect.ismodule(識別子) inspect.ismodule(識別子) 線グラフの色をダークシアグリーンに設定する plt.plot(データ列x, データ列y, color='darkseagreen') plt.plot(データ列x, データ列y, color='darkseagreen') リストの末尾に要素を加える リストがあとあとには休憩(要素) リスト.append(要素) 折れ線グラフをドジャーブルー色を用いて描画する plt.plot(データ列x, データ列y, color='dodgerblue') plt.plot(データ列x, データ列y, color='dodgerblue') 数列を横棒グラフにする plt.barh(ラベル列, データ列) plt.barh(ラベル列, データ列) 線グラフの色をレベッカパープルに設定する plt.plot(データ列x, データ列y, color='rebeccapurple') plt.plot(データ列x, データ列y, color='rebeccapurple') option: フォントの色をダークサーモンに設定する color = 'darksalmon' color = 'darksalmon' 横に並べて配列を度数分布図にする plt.hist([データ列, データ列], color=['b', 'r']) plt.hist([データ列, データ列], color=['b', 'r']) option: 大バツマーカーを用いる marker = 'X' marker = 'X' 双方向キューの中に文字列は存在するかどうか調べる 文字列 in 両端キュー 文字列 in 両端キュー 指定したカラムの文字列を未入力値に変換する df['列A'].replace(値, np.nan) df['列A'].replace(値, np.nan) 折れ線プロットにラベルを付ける plt.plot(データ列x, データ列y, label='ラベル') plt.plot(データ列x, データ列y, label='ラベル') 緑色化する f'\033[32m{x}\033[0m' f'\033[32m{x}\033[0m' データフレームとデータシリーズをつなぐ pd.concat([df, ds], axis=1) pd.concat([df, ds], axis=1) 部分文字列を文字列の開始位置から終了位置まで探す 文字列.find(部分文字列, 開始位置, 終了位置) # 見つからない場合は-1 文字列.find(部分文字列, 開始位置, 終了位置) # 見つからない場合は-1 option: 色の透明度を指定する alpha = 0.5 alpha = 0.5 カラムの欠損値を中央値で埋める df['列A'].fillna(df['列A'].median()) df['列A'].fillna(df['列A'].median()) 指定したカラムのパーセンタイルを求める df['列A'].quantile(パーセント/100) df['列A'].quantile(パーセント/100) パープルにヒストグラムの色を設定する plt.hist(データ列, color='purple') plt.hist(データ列, color='purple') データフレームの最初100行 df.head(100) df.head(100) option: フォントの色をシーグリーンにセットする color ='seagreen' color = 'seagreen' 散布図の印を黒くする plt.scatter(データ列x, データ列y, markerfacecolor='k') plt.scatter(データ列x, データ列y, markerfacecolor='k') option: フォントの色をミスティローズに変更する color ='mistyrose' color = 'mistyrose' ファイルを文字コードtextとして書き込み用にオープンする] open(filepath, mode='w', encoding=text) open(filepath, mode='w', encoding=text) 折れ線グラフの色をディムグレーに変更する plt.plot(データ列x, データ列y, color='dimgray') plt.plot(データ列x, データ列y, color='dimgrey') データ列間の平均2乗誤差を計算する sklearn.metrics.mean_squared_error(データ列, データ列2) sklearn.metrics.mean_squared_error(データ列, データ列2) option: 色をミッドナイトブルーに変更する color ='midnightblue' color = 'midnightblue' データフレームの指定したカラムのNaNを直後の値で埋める df['列A'].fillna(method='bfill') df['列A'].fillna(method='bfill') ランタイムの再帰の最大回数 sys.getrecursionlimit() sys.getrecursionlimit() 配列から両端キューを新規生成する collections.deque(配列) collections.deque(配列) 黒いバツマーカーで散布図を描く plt.plot(データ列x, データ列y, marker='x', c='k') plt.plot(データ列x, データ列y, marker='x', c='k') リストとリストについての散布図に黒い左三角マーカーを描く plt.plot(データ列x, データ列y, marker='<', c='k') plt.plot(データ列x, データ列y, marker='<', c='k') 破線に折れ線グラフの線の種類を変更する plt.plot(データ列x, データ列y, linestyle='dashed') plt.plot(データ列x, データ列y, linestyle='dashed') option: フォントの色をオレンジレッドに指定する color = 'orangered' color = 'orangered' 今日が水曜日か判定する datetime.datetime.today().weekday() == 2 datetime.datetime.today().weekday() == 2 ヒストグラムを青緑色を用いて描画する plt.hist(データ列, color='turquoise') plt.hist(データ列, color='turquoise') 文字コードtextでファイルパスを開く] text = 'utf-8'open(filepath, encoding=text) text = 'utf-8'open(filepath, encoding=text) 配列とリストの散布図に丸マーカーを描画する plt.plot(データ列x, データ列y, marker='o') plt.plot(データ列x, データ列y, marker='o') ヒストグラムの色をパレットトルコイズに変更する plt.hist(データ列, color='paleturquoise') plt.hist(データ列, color='paleturquoise') 文字列の右端から部分文字列を取り除く 文字列.rstrip(部分文字列) 文字列.rstrip(部分文字列) データフレームの選択した列の値をValueMapで一度に置換する df[['列A', '列B']].replace(ValueMap) df[['列A', '列B']].replace(ValueMap) 出力ストリームを改行除外して一行ずつ読み込む f.readline() f.readline() 文字列を最後の区切り記号で分割して前半を求める 文字列.rpartition(セパレータ)[0] 文字列.rpartition(セパレータ)[0] グラフのデザインをよくする import seaborn as sns import seaborn as sns データフレームの中のカラムを等しい量になるようにn個にビン分割する pd.qcut(df[col], n) pd.qcut(df[col], n) stringをインポートする import string import string 折れ線グラフの色をペールグリーンに指定する plt.plot(データ列x, データ列y, color='palegreen') plt.plot(データ列x, データ列y, color='palegreen') 整数を8進表記に変換する oct(整数) oct(整数) 横棒グラフをオーキッド色を使って描画する plt.barh(データ列x, データ列y, color='orchid') plt.barh(データ列x, データ列y, color='orchid') ベクトルの要素ごとのアダマール積を求める np.multiply(aArray, aArray2) np.multiply(aArray, aArray2) 二つのカウンタのいずれかに含まれる要素を計算する aCounter & aCounter2 aCounter | aCounter2 リストとデータ列についての散布図に赤い左三角マーカーを描画する plt.plot(データ列x, データ列y, marker='<', c='r') plt.plot(データ列x, データ列y, marker='<', c='r') 行列の合計値を求める np.sum(aArray) np.sum(aArray) エポック秒の列から日付データにする pd.to_datetime(df['列A'], unit='s', utc=True) pd.to_datetime(df['列A'], unit='s', utc=True) データフレームの選択したカラムの中にある文字列の数を求める df[['列A', '列B']].isin([value]).sum() df[['列A', '列B']].isin([value]).sum() 散布図を黒いダイアモンドマーカーでプロットする plt.plot(データ列x, データ列y, marker='D', c='k') plt.plot(データ列x, データ列y, marker='D', c='k') option: フォントの色をライトグレーに変更する color = 'lightgray' color = 'lightgrey' 折れ線グラフの菱形マーカーを黒くする plt.plot(データ列x, データ列y, marker='D', markerfacecolor='k') plt.plot(データ列x, データ列y, marker='D', markerfacecolor='k') 整数の2進数表現 bin(整数) bin(整数) テキストファイルファイル名がか filename = 'file.txt' # ファイル name'.txt' = '.csv'filename.startswith('.txt') filename = 'file.txt' # ファイル name'.txt' = '.csv'filename.startswith('.txt') 星印としてデータ列の折れ線グラフを描画する plt.plot(データ列x, データ列y, marker='*') plt.plot(データ列x, データ列y, marker='*') 整数の四乗を計算する 整数 ** 4 整数 ** 4 横方向に二つのデータフレームをマージする pd.merge(df, df2) pd.merge(df, df2) 新しいガウス過程回帰モデルを新規作成する model = sklearn.gaussian_process.GaussianProcessRegressor() model = sklearn.gaussian_process.GaussianProcessRegressor() 散布図に黒い星マーカーを使用する plt.plot(データ列x, データ列y, marker='*', c='k') plt.plot(データ列x, データ列y, marker='*', c='k') 度数分布図を上限から下限までの範囲で描画する plt.hist(データ列, range=(start, end)) plt.hist(データ列, range=(start, end)) 浮動小数点数の双曲線正接の逆数を求める math.atanh(x) math.atanh(x) 整数がnで割り切れる 整数 % n == 0 整数 % n == 0 折れ線グラフの色をライトグリーンに指定する plt.plot(データ列x, データ列y, color='lightgreen') plt.plot(データ列x, データ列y, color='lightseagreen') 日付時刻データにn時間分、足す aDatetime + datetime.timedelta(hours=n) aDatetime + datetime.timedelta(hours=n) エポック秒を日付時刻にする datetime.datetime.fromtimestamp(timestamp) datetime.datetime.fromtimestamp(timestamp) フォーマットで列をdatetime64型に変換する pd.to_datetime(df['列A'], format='%Y-%m-%d') pd.to_datetime(df['列A'], format='%Y-%m-%d') もしコマンドラインが与えられたなら、処理する if len(sys.argv) > 10:print(sys.argv[1]) # 具体的な処理にする if len(sys.argv) > 1:print(sys.argv[1]) # 具体的な処理にする option: ミディアムバイオレットレッドにグラフの色を設定する color ='mediumvioletred' color = 'mediumvioletred' クラス分類をKNNを使ってする model = sklearn.neighbors.KNeighborsClassifier(n_neighbors=5) model = sklearn.neighbors.KNeighborsClassifier(n_neighbors=5) 小数点数のタンジェントの逆数 math.atanh(x) math.atan(x) カウンタから最も頻出な項目の件数 aCounter.most_common()[1] aCounter.most_common()[1] データフレームから5行ランダムサンプリングする df.sample(5) df.sample(5) L1ノルムでデータを正則化する "sklearn.preprocessing.Normalizer(norm=""l1"").fit_transform(""l1"")" "sklearn.preprocessing.Normalizer(norm=""l1"").fit_transform(データ)" データフレームの指定したカラムの文字列をNaNにする df['列A'].replace(値, np.nan) df['列A'].replace(値, np.nan) 青色を用いて散布図を描画する plt.scatter(データ列x, データ列y, color='blue') plt.scatter(データ列x, データ列y, color='blue') 本日をISO8601形式の文字列にする datetime.datetime.today().isoformat() datetime.datetime.today().isoformat() 日付時刻データは日付時刻データより先 aDatetime > aDatetime2 aDatetime2 = aDatetimeaDatetime < aDatetime2 耐火レンガ色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='firebrick') plt.barh(データ列x, データ列y, color='firebrick') 要素はセットのいずれか確認する 要素 in セット 要素 in セット 青い一点鎖線でイテラブルの推移を描く plt.plot(データ列x, データ列y, linestyle='dashbot', color='b') plt.plot(データ列x, データ列y, linestyle='dashbot', color='b') 折れ線グラフをバイオレット色として描画する plt.plot(データ列x, データ列y, color='violet') plt.plot(データ列x, データ列y, color='violet') 日付データの曜日を使う aDate.weekday() aDate.weekday() 散布図にrgbの四角マーカーを使用する plt.plot(データ列x, データ列y, marker='s', c=rgb) plt.plot(データ列x, データ列y, marker='s', c=rgb) 横棒グラフを描画してバーの縦幅を調整する plt.barh(ラベル列, データ列, width=0.5) plt.barh(ラベル列, データ列, width=0.5) リストと配列の散布図に赤い丸マーカーを描画する plt.plot(データ列x, データ列y, marker='o', c='r') plt.plot(データ列x, データ列y, marker='o', c='r') ロバスト推定で回帰分析をする model = sklearn.linear_model.RANSACRegressor(random_state=0) model = sklearn.linear_model.RANSACRegressor(random_state=0) option: ミッドナイトブルー色を用いる color ='midnightblue' color = 'midnightblue' 実数のn乗の実数剰余を算出する pow(x, n, y) pow(x, n, y) エポック秒のカラムからPandasの日付型にする pd.to_datetime(df['列A'], unit='s', utc=True) pd.to_datetime(df['列A'], unit='s', utc=True) 横軸の目盛の値を変更する plt.xticks(目盛りの値リスト) plt.xticks(目盛りの値リスト) option: ブラック色を用いる color = 'black' color = 'black' データ列を平方根変換する np.sqrt(データ列) np.sqrt(データ列) option: 色をダークオーキッドに設定する color = 'darkorchid' color = 'darkorchid' グレー色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='grey') plt.barh(データ列x, データ列y, color='grey') ダークターコイズ色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='darkturquoise') plt.barh(データ列x, データ列y, color='darkturquoise') 昇順にある列をキーにしてデータフレームを並べる df.sort_values(by='列A', ascending=True) df.sort_values(by='列A', ascending=True) xを青色で表示できる文字列に変換する f'\033[34m{x}\033[0m' f'\033[34m{x}\033[0m' option: フォントの色をミントクリームにする color ='mintcream' color = 'mintcream' リストと配列についての散布図に赤い星マーカーを描画する plt.plot(データ列x, データ列y, marker='*', c='r') plt.plot(データ列x, データ列y, marker='*', c='r') 散布図をグリーンイエロー色を用いて描画する plt.scatter(データ列x, データ列y, color='greenyellow') plt.scatter(データ列x, データ列y, color='greenyellow') 散布図のクロス印の大きさを変更する plt.scatter(データ列x, データ列y, marker='x', markersize=2.0) plt.scatter(データ列x, データ列y, marker='x', markersize=2.0) 小数点以下'4'桁までの文字列にする ':.4f'.format(x) ':.4f'.format(x) 棒グラフを濃い青色で描画する plt.bar(データ列x, データ列y, color='darkblue') plt.bar(データ列x, データ列y, color='darkblue') 列の名前を列挙する 文字列.values() df.columns 行列の最大値 np.max(aArray) np.max(aArray) データフレームから重複を残さず重複を消す df.drop_duplicates(keep=False) df.drop_duplicates(keep=False) データ列とリストについての散布図にrgbの上三角マーカーを描画する plt.plot(データ列x, データ列y, marker='^', c=rgb) plt.plot(データ列x, データ列y, marker='^', c=rgb) シスル色として散布図を描画する plt.scatter(データ列x, データ列y, color='thistle') plt.scatter(データ列x, データ列y, color='thistle') 散布図に赤い三角マーカーを使用する plt.plot(データ列x, データ列y, marker='^', c='r') plt.plot(データ列x, データ列y, marker='^', c='r') ロバストな線形分類器を作る model = sklearn.linear_model.HuberClassifier() model = sklearn.linear_model.HuberClassifier() option: ラベンダー色を使用する color = 'lavender' color = 'lavender' 棒グラフを淡い茶色色で描画する plt.bar(データ列x, データ列y, color='tan') plt.bar(データ列x, データ列y, color='tan') カテゴリ別に並べてデータフレームを箱ひげ図にする sns.boxplot(x='カテゴリ列', y='列', data=df) sns.boxplot(x='カテゴリ列', y='列', data=df) 棒グラフをダークスレートブルー色を用いて描画する plt.bar(データ列x, データ列y, color='darkslateblue') plt.bar(データ列x, データ列y, color='darkslateblue') ファイルパスを文字コードtextとして書き込み用にオープンする] open(filepath, mode='w', encoding=text) open(filepath, mode='w', encoding=text) リストをn個にビンニングし、namesのラベルをつける pd.cut(aList, n, labels=names) pd.cut(aList, n, labels=names) xとyをスラッシュで区切って表示する print(x, y, sep='/') print(x, y, sep='/') 辞書の全を消去する 辞書.clear() 辞書.clear() オリーブ色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='olive') plt.barh(データ列x, データ列y, color='olive') カテゴリで色分けして、に箱ひげ図でデータフレームを図示する sns.boxplot(x='カテゴリ列', y='列', hue='カテゴリ列', data=df) sns.boxplot(x='カテゴリ列', y='列', hue='カテゴリ列', data=df) 数値をゼロ埋めした文字列に変換する str(n).zfill(文字列幅) str(n).zfill(文字列幅) option: 青を用いる color = 'blue' color = 'blue' パープル色として線グラフを描画する plt.plot(データ列x, データ列y, color='purple') plt.plot(データ列x, データ列y, color='purple') 横軸の目盛を整数化する plt.xticks(np.arange(最小値, 最大値, 間隔)) plt.xticks(np.arange(最小値, 最大値, 間隔)) option: グラフの色をロージーブラウンにセットする color = 'rosybrown' color = 'rosybrown'