データ分析 10件
今回は、pandasのread_csvメソッドを使用して、GoogleAdSenseレポートで取得したExcel用CSVファイルを読み込んでいきたいと思います。 なぜこのような記事を書くに至ったかというと、データの形式、つまり文字コードに乏しかったため「UnicodeDecodeError」に随分…
データ分析
更新日:2023/03/01
今回はPython標準ライブラリのdatetimeモジュールとPython外部ライブラリのjpholidayを使用して、国民の祝日や月の第何何曜日(週数・週番)という日時表記をデータセットとして作成していきたいと思います。 日時表記のデータセットをどのように活用していくのか? 私の場合ですと、W…
更新日:2023/03/02
今回は世界中のデータサイエンティストが集うと言われているKaggle(カグル)について解説していこうと思います。 「Kaggleを触ったことはあるけど実はよく知らない人」や「データ分析や機械学習をこれからやるつもりの人」に向けてKaggleの概要、特徴、魅力などを簡単に紹介していきたいと思います。…
今回は構文解析の基礎技術である係り受け解析器CaboChaを使って、解析された文章の関係性をNetworkXという描画ライブラリで実装していきたいと思います。 CaboChaの導入に関してはこちら「【Python】構文解析器(係り受け解析)CaboChaの導入(エラー回避&成功例)」で紹介してい…
今回はデータ分析(データサイエンス)に必要なソフトウェアパッケージをまとめて提供しているAnacondaの最小構成版であるMinicondaをインストールしていきたいと思います。 なぜ私がMinicondaにしたのかというと、ファイルサイズがAnacondaに比べて約1/10と非常に軽量だったのと…
今回はjupyter notebookを使用する際の「No such file or directory」エラーについて取り上げたいと思います。 翻訳すると「そのようなファイル、又はディレクトリはありません」といった意味になりますが、最初は訳が分かりませんでした。 エラー内容のディレクトリを…
今回はpandasとnumpyを使って重複している要素の総和を取得していこうと思います。 重複している要素とは[1, 2, 2, 1, 3, 4, 5, 4]だったり['python', 'django', 'python', 'flask', 'django', 'flask']といったかたちで…
前回の改定版ということで今回も簡単にデータベースからPandasのデータフレームにし、CSVファイルを作成したいと思います。 SQLAlchemyの簡単な操作はこちらをご覧ください「SQLAlchemyとPandasを使いスムーズにCSVファイルを作成する」 必要なモジュールは以下となります。ち…
更新日:2020/08/02
今回はSQLAlchemyとPandasを使いCSVファイルを作成していきたいと思います。 データベースの種類は豊富であれもこれもと操作するのはキャパシティ的に限界なところがある。そんな苦労も和らげてくれるツールがPythonのサードパーティであるSQLAlchemyです。 SQLAlchemy…
注意 2023年3月2日現在、Yahooファイナンスからの株価及び為替レートの取得ができませんので、以下の記事は参考程度でお願いします。 今回はpandas-datareaderというツールを使ってGAFA(google、Apple、Facebook、Amazon)の2018年6月から2019…
© 2019-2024 ZerofromLight