投稿34

Generic placeholder image

2020年5月18日 - データ分析&機械学習

【scikit-learn】BaseEstimatorを継承して自作変換器のハイパーパラメータを取得する

今回は、機械学習ライブラリのscikit-learnからBaseEstimatorを継承して自作変換器のハイパーパラメータを取得していきたいと思います。 ハイパーパラメータ?と思う方もいらっしゃ ...

Generic placeholder image

2020年5月17日 - データ分析&機械学習

【scikit-learn】OneHotEncoderによるカテゴリー属性の数値化とラベルの保存

今回は機械学習ライブラリscikit-learnのOneHotEncoderを使用して、カテゴリー属性の数値化を行っていきたいと思います。 カテゴリー属性を数値にする理由は、機械学習モデルは文字 ...

Generic placeholder image

2020年5月10日 - データ分析&機械学習

【scikit-learn】SimpleImputerで欠損値を補完し、統計情報を保存する

今回は機械学習ライブラリのscikit-learnから、SimpleImputerという機能を使用してデータ内の欠損値や値を置き換えて、置き換える為に計算された統計値をいつでも使用できるように保管して ...

Generic placeholder image

2020年4月30日 - データ分析&機械学習

【第5回カリフォルニア住宅価格の予測】Webアプリケーションの作成

今回は第5回カリフォルニア住宅価格の予測最終回ということで、これまで行ってきたデータの前処理や最良の機械学習モデルを使って、住宅価格の予測システムを作成していきたいと思います。 第3~4回の記事 ...

Generic placeholder image

2020年4月25日 - データ分析&機械学習

【第4回カリフォルニア住宅価格の予測】学習曲線を利用して各モデルの汎化性能を検証

※誤ってscaler.fit_transform(X_test)とテストセットに対して平均と標準の計算をし直してしまったため(正確にはscaler.transfor ...

Generic placeholder image

2020年4月21日 - データ分析&機械学習

【第3回カリフォルニア住宅価格の予測】最良の機械学習モデルを選び評価を行う

※誤ってscaler.fit_transform(X_test)とテストセットに対して平均と標準の計算をし直してしまったため(正確にはscaler.transfor ...

Generic placeholder image

2020年4月15日 - データ分析&機械学習

【第2回カリフォルニア住宅価格の予測】特徴量エンジニアリング&データクリーニング(データクレンジング)

今回は、カリフォルニア住宅価格の予測第2回ということで、特徴量エンジニアリングとデータクリーニングの実装を行っていきたいと思います。 第1回目では、scikit-leanrモジュールからデータセ ...

Generic placeholder image

2020年4月8日 - データ分析&機械学習

【第1回カリフォルニア住宅価格の予測】前処理無しで精度を確認

今回は有名なデータセットであるカリフォルニア住宅価格の予測を行っていきたいと思います。 このデータセットでの予測は3部作で予定しており、第1回はデータの中身を確認してどのようなタスクか、機械学習 ...

Generic placeholder image

2020年3月3日 - データ分析&機械学習

【機械学習】Jupyter Notebook & ブログ記事で数式記号を表示させる

今回はJupyter Notebookやブログサイトの記事などで数式を綺麗に表示させるための方法をご紹介したいと思います。 Jupyter Notebookでは、デフォルトで数式表示の設定がされ ...