投稿10件
2021年1月28日 - データ分析&機械学習
今回はPython外部ライブラリのPandasとMatplotlibを使用して円グラフとドーナッツグラフを描画していきたいと思います。 データ分析ではよくカテゴリーデータを扱うことが多いので、…
2020年9月14日 - データ分析&機械学習
今回は、pandasのread_csvメソッドを使用して、GoogleAdSenseレポートで取得したExcel用CSVファイルを読み込んでいきたいと思います。 なぜこのような記事を書くに至っ…
2020年5月22日 - データ分析&機械学習
今回はscikit-learnモジュールのFeatureUnionを使用して、機械学習モデルなどに与える際のデータの前処理を自動化させていきたいと思います。 データの前処理は、概ねpandas…
2020年5月21日 - データ分析&機械学習
今回は、scikit-learnのPipelineモジュールを使用して、scikit-learnのモジュールである変換器や機械学習モデルを一括処理させる実装を行っていきたいと思います。 一度P…
2020年5月19日 - データ分析&機械学習
今回は自作変換器にscikit-learnのTransformerMixinクラスを継承して、適合と変換を一括で処理できるfit_transformメソッドを使えるようにしていきたいと思います。 …
2020年5月18日 - データ分析&機械学習
今回は、機械学習ライブラリのscikit-learnからBaseEstimatorを継承して自作変換器のハイパーパラメータを取得していきたいと思います。 ハイパーパラメータ?と思う方もいらっし…
2020年5月17日 - データ分析&機械学習
今回は機械学習ライブラリscikit-learnのOneHotEncoderを使用して、カテゴリー属性の数値化を行っていきたいと思います。 カテゴリー属性を数値にする理由は、機械学習モデルは文…
2020年5月10日 - データ分析&機械学習
今回は機械学習ライブラリのscikit-learnから、SimpleImputerという機能を使用してデータ内の欠損値や値を置き換えて、置き換える為に計算された統計値をいつでも使用できるように保管し…
2020年4月30日 - データ分析&機械学習
今回は第5回カリフォルニア住宅価格の予測最終回ということで、これまで行ってきたデータの前処理や最良の機械学習モデルを使って、住宅価格の予測システムを作成していきたいと思います。 第3~4回の記…
2020年4月25日 - データ分析&機械学習
※誤ってscaler.fit_transform(X_test)とテストセットに対して平均と標準の計算をし直してしまったため(正確にはscaler.transfo…