パープルハット

※当サイトではGoogleアドセンス広告を利用しています

Pandas

Pandas データの結合(concat)

concat 概要 使用方法 concat 概要 pd.concatで任意の数のDataFrameを結合させることができます。 第1引数に結合させたい変数をリストで指定し、axisで結合方向を決定します。axis=0のときは縦方向、1のときは横方向に結合します。 a, bを結合させるときのax…

Pandas DataFrame 指定した行を除外する

概要 基本的な使用方法 データの宣言 残したい行のnumpy配列を宣言 除外できたか確認 応用例(kFold)との併用 概要 pandasのDataFrameにおけて1, 3行目を取り出すは簡単にできますが、これらを除外する処理の実装に一苦労したのでまとめておきます。 基本的な…

Python LeaveOneOutEncoding(category_encoders)の使い方

LeaveOneOutEncodingについて 使用するデータ 使用方法 fit_transform fit からの transform 例(dfとdf2をターゲットエンコーディング) LeaveOneOutEncodingについて ざっくりいうと、自分自身を除いた目的変数の平均値を割り出す手法です。 例) 以下のデー…

Pandas DataFrameの積み上げ棒グラフ

使用するデータ 積み上げ棒グラフの場合 Class別のAnswerの内訳を取得 描画 100%積み上げ棒グラフの場合 Class別のAnswerの内訳を取得 描画 使用するデータ import pandas as pd df = pd.DataFrame({ 'Class': ['A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'], 'A…

matplotlib グラフの軸名などを日本語で表示

3行で説明 原因の説明 使用例 3行で説明 軸ラベルやタイトルを日本語でするには plt.rcParams['font.family'] = 'MS Gothic' とした後に、描画を行えばOKです。 原因の説明 デフォルトのフォントでは日本語非対応なことが原因みたいです。 そのため、フォン…

Pandas 欠損値の補完(fillna、pivot_table)

img{border: solid 1px black;} はじめに 基本編 0. 使用するデータについて 1. データの表示 2. 平均値での補完 3. 中央値での補完 4. 最頻値での補完 発展(ピボットテーブルによる補完) 0. 使用するデータセット 1. データの読み込みと表示 2. 欠損値の確…

Pandas loc, at, iloc, iatで要素抽出

PandasのDataFrameにおけるiat, at, loc, ilocなどを使ったデータへのアクセス方法を解説。条件指定でのアクセスの方法も。

BeautifulSoup CSVをhtmlのテーブルに変換

使用するCSVファイル プログラム 使用するCSVファイル 以下のプログラムでは次のCSVファイルを使用します。 名前,英語,数学 タカシ,53,27 エミ,24,58 ボブ,98,48 プログラム import pandas as pd import bs4 #0行目をcolumns、0列目をindexに指定する df = p…

Pandas DataFrameとnumpy配列の相互変換

PandasにおけるDataFrameと2次元numpy配列の相互変換の方法を紹介。