Pandas
concat 概要 使用方法 concat 概要 pd.concatで任意の数のDataFrameを結合させることができます。 第1引数に結合させたい変数をリストで指定し、axisで結合方向を決定します。axis=0のときは縦方向、1のときは横方向に結合します。 a, bを結合させるときのax…
概要 基本的な使用方法 データの宣言 残したい行のnumpy配列を宣言 除外できたか確認 応用例(kFold)との併用 概要 pandasのDataFrameにおけて1, 3行目を取り出すは簡単にできますが、これらを除外する処理の実装に一苦労したのでまとめておきます。 基本的な…
LeaveOneOutEncodingについて 使用するデータ 使用方法 fit_transform fit からの transform 例(dfとdf2をターゲットエンコーディング) LeaveOneOutEncodingについて ざっくりいうと、自分自身を除いた目的変数の平均値を割り出す手法です。 例) 以下のデー…
使用するデータ 積み上げ棒グラフの場合 Class別のAnswerの内訳を取得 描画 100%積み上げ棒グラフの場合 Class別のAnswerの内訳を取得 描画 使用するデータ import pandas as pd df = pd.DataFrame({ 'Class': ['A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'], 'A…
3行で説明 原因の説明 使用例 3行で説明 軸ラベルやタイトルを日本語でするには plt.rcParams['font.family'] = 'MS Gothic' とした後に、描画を行えばOKです。 原因の説明 デフォルトのフォントでは日本語非対応なことが原因みたいです。 そのため、フォン…
img{border: solid 1px black;} はじめに 基本編 0. 使用するデータについて 1. データの表示 2. 平均値での補完 3. 中央値での補完 4. 最頻値での補完 発展(ピボットテーブルによる補完) 0. 使用するデータセット 1. データの読み込みと表示 2. 欠損値の確…
PandasのDataFrameにおけるiat, at, loc, ilocなどを使ったデータへのアクセス方法を解説。条件指定でのアクセスの方法も。
使用するCSVファイル プログラム 使用するCSVファイル 以下のプログラムでは次のCSVファイルを使用します。 名前,英語,数学 タカシ,53,27 エミ,24,58 ボブ,98,48 プログラム import pandas as pd import bs4 #0行目をcolumns、0列目をindexに指定する df = p…
PandasにおけるDataFrameと2次元numpy配列の相互変換の方法を紹介。