パープルハット

※当サイトではGoogleアドセンス広告を利用しています

Python

ydata_profilingの使い方(conda)

インストール(condaを使った方法) conda install -c conda-forge ydata-profiling コード実行 公式サイトのクイックスタート(https://docs.profiling.ydata.ai/latest/getting-started/quickstart/)を参考にしました。 HTMLファイルに出力する場合 import pa…

pypdfの使い方

pypdfとは? インストール 読み取りの基本機能 インポート ファイルの読み取り 指定したページの取得 ページ数の取得 テキストの抽出 書き取りに必要な機能 インポート 変数の宣言 readerからページの追加 出力 サンプルコード 1ページごとに分けて保存 pypdf…

Python Wordの表に画像を挿入

Pythonを使ってWordに画像をまとめて挿入する方法を紹介。表に挿入することで綺麗に整列することができます。

Anaconda OpenCV インストール

AnacondaでのOpenCVのインストール方法の備忘録。多くのほかサイトで紹介されている「conda install -c conda-forge opencv」ではなく「conda install conda-forge::py-opencv」を使いました。

tensorflow インストールエラー(UnsatisfiableError)の解決策

Tensorflowをcondaでインストールしようとしたときに「UnsatisfiableError」というエラーが出たので解決しました。Python3.11に太陽していないのが原因みたいです。

【Windows版】Anacondaのインストールからコード実行まで

Pythonの動作環境を整えるためにAnacondaのセットアップをしていきます。仮想環境の作成・パッケージの追加方法とコードの動作確認前でを行っていきます。

Pandas データの結合(concat)

concat 概要 使用方法 concat 概要 pd.concatで任意の数のDataFrameを結合させることができます。 第1引数に結合させたい変数をリストで指定し、axisで結合方向を決定します。axis=0のときは縦方向、1のときは横方向に結合します。 a, bを結合させるときのax…

Python 列挙型Enumの使い方

Pythonにおける列挙型(Enum)の使い方の解説。name⇔valueの相互変換、for文でのループなど。

Numpy 固有値・固有ベクトル計算

Pythonのnumpyを使い固有値及び固有ベクトルを求めます。

opntuna 「FutureWarning: suggest_loguniform has been deprecated in v3.0.0.」

概要 params = { 'C': trial.suggest_loguniform('C', 0.1, 10), } を使うと、次の警告が出ました。 FutureWarning: suggest_loguniform has been deprecated in v3.0.0. This feature will be removed in v6.0.0. See https://github.com/optuna/optuna/rel…

Pandas DataFrame 指定した行を除外する

概要 基本的な使用方法 データの宣言 残したい行のnumpy配列を宣言 除外できたか確認 応用例(kFold)との併用 概要 pandasのDataFrameにおけて1, 3行目を取り出すは簡単にできますが、これらを除外する処理の実装に一苦労したのでまとめておきます。 基本的な…

Python LeaveOneOutEncoding(category_encoders)の使い方

LeaveOneOutEncodingについて 使用するデータ 使用方法 fit_transform fit からの transform 例(dfとdf2をターゲットエンコーディング) LeaveOneOutEncodingについて ざっくりいうと、自分自身を除いた目的変数の平均値を割り出す手法です。 例) 以下のデー…

Pandas DataFrameの積み上げ棒グラフ

使用するデータ 積み上げ棒グラフの場合 Class別のAnswerの内訳を取得 描画 100%積み上げ棒グラフの場合 Class別のAnswerの内訳を取得 描画 使用するデータ import pandas as pd df = pd.DataFrame({ 'Class': ['A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'], 'A…

matplotlib グラフの軸名などを日本語で表示

3行で説明 原因の説明 使用例 3行で説明 軸ラベルやタイトルを日本語でするには plt.rcParams['font.family'] = 'MS Gothic' とした後に、描画を行えばOKです。 原因の説明 デフォルトのフォントでは日本語非対応なことが原因みたいです。 そのため、フォン…

sklearn GridSearchCVによるモデル作成

sklearnにある「GridSearchCV」というグリッドサーチ(ハイパパラメータの調整)と交差検証をまとめてやってくれる機能を解説していきます。

Pandas 欠損値の補完(fillna、pivot_table)

img{border: solid 1px black;} はじめに 基本編 0. 使用するデータについて 1. データの表示 2. 平均値での補完 3. 中央値での補完 4. 最頻値での補完 発展(ピボットテーブルによる補完) 0. 使用するデータセット 1. データの読み込みと表示 2. 欠損値の確…

Pandas loc, at, iloc, iatで要素抽出

PandasのDataFrameにおけるiat, at, loc, ilocなどを使ったデータへのアクセス方法を解説。条件指定でのアクセスの方法も。

BeautifulSoup CSVをhtmlのテーブルに変換

使用するCSVファイル プログラム 使用するCSVファイル 以下のプログラムでは次のCSVファイルを使用します。 名前,英語,数学 タカシ,53,27 エミ,24,58 ボブ,98,48 プログラム import pandas as pd import bs4 #0行目をcolumns、0列目をindexに指定する df = p…

Python beautifulsoup タグの取得・追加

beautifulsoupを使ったタグの取得及び追加方法を消化8位。追加方法には、末尾に追加するappendと位置指定ができるinsertの2種類があります。

Python BeautifulSoupの基本(タグの作成、HTMLファイルの作成など)

基本 インポート soupオブジェクト タグ 作成 タグ内への文字の追加 クラスの指定 ファイル出力 soupオブジェクトへのタグ追加 ファイル出力 基本 インポート import bs4 soupオブジェクト 作成したsoupオブジェクトを利用して色々編集していく。 import bs4…

「UnicodeDecodeError: 'cp932' codec can't decode~」の解決策

Pythonのwith openを使ったときの遭遇したエラー「UnicodeDecodeError: 'cp932' codec can't decode~」の解決策をまとめました。

Python for文の多重ループを1行で記述(productを使用)

productについて 2重ループの場合 サンプル1(rangeでループ) サンプル2(listでループ) 3重ループの場合 productについて from itertools import product を使用すればfor文の多重ループをまとめて1行にすることができます。 これを利用すると for a in A: fo…

Pandas DataFrameとnumpy配列の相互変換

PandasにおけるDataFrameと2次元numpy配列の相互変換の方法を紹介。