インプレス[コンピュータ・IT]ムック スラスラ読める Pythonふりがなプログラミング スクレイピング入門
インプレス / 2021年12月01日 / 全191ページ
「プログラムの読み方をすべて載せる」という手法で究極のやさしさを目指した「ふりがなプログラミング」シリーズから、Pythonを使ったスクレイピングの入門書が登場。スクレイピングを使えばWeb上のサイトを定期的にチェックしたり、一覧になったURLのリンク先を順番に参照したりといった作業を自動化できます。応用できる範囲は趣味から仕事まで幅広く、Pythonで行えることが一気に広がります。本書ではWebサイトの構造を把握することからしっかり解説。データの収集・整理・加工といった一連の流れを学べます。
目次
- 著者プロフィール
- はじめに
- プログラムの読み方
- Chapter 1 スクレイピング最初の一歩
- 01 スクレイピングって何?
- 02 本書の読み進め方
- 03 Pythonのインストール
- 04 Visual Studio Codeのインストール
- 05 スクレイピングに必要なライブラリのインストール
- 06 VS Codeでプログラムを作成してみよう
- Chapter 2 スクレイピングをやってみよう
- 01 HTMLを理解することがスクレイピングの第一歩
- 02 Webページから要素を取り出す
- 03 HTML属性を指定して要素を取り出す
- 04 Webページから要素を複数取り出す
- 05 パターンに一致した要素を取り出す
- 06 取り出した要素をさらに絞り込む
- 07 実際のWebページでスクレイピングする
- 08 要素を取り出せない場合は(1)
- 09 CSSセレクタってどんなもの?
- 著者プロフィール
- はじめに
- プログラムの読み方
- Chapter 1 スクレイピング最初の一歩
- 01 スクレイピングって何?
- 02 本書の読み進め方
- 03 Pythonのインストール
- 04 Visual Studio Codeのインストール
- 05 スクレイピングに必要なライブラリのインストール
- 06 VS Codeでプログラムを作成してみよう
- Chapter 2 スクレイピングをやってみよう
- 01 HTMLを理解することがスクレイピングの第一歩
- 02 Webページから要素を取り出す
- 03 HTML属性を指定して要素を取り出す
- 04 Webページから要素を複数取り出す
- 05 パターンに一致した要素を取り出す
- 06 取り出した要素をさらに絞り込む
- 07 実際のWebページでスクレイピングする
- 08 要素を取り出せない場合は(1)
- 09 CSSセレクタってどんなもの?
- 10 CSSセレクタを使って要素を取り出す
- Chapter 3 スクレイピングの応用テクニック
- 01 Webページ内のリンクを取り出す
- 02 画像を取り出す
- 03 前後の要素を取り出す
- 04 ページ遷移しながらスクレイピングする
- 05 要素を取り出せない場合は(2)
- 06 エラーに強いプログラムを作成する
- Chapter 4 集めたデータを整理・加工しよう
- 01 集めたデータを使うには
- 02 全角・半角の表記ゆれをなくす
- 03 大文字・小文字の表記ゆれをなくす
- 04 文字列を置換する
- 05 表形式のデータを扱う
- 06 表形式のデータから列や行を取り出す
- 07 条件に一致したデータを取り出す
- 08 欠損値があるデータを加工する
- 09 表形式のデータを集計する
- 10 グラフでデータを可視化する
- Chapter 5 Web APIでデータを集めよう
- 01 Web APIを使ってみよう
- 02 その他のスクレイピングライブラリ
- あとがき
- 索引
- 本書サンプルプログラムのダウンロードについて
- 奥付
※このデジタル雑誌には目次に記載されているコンテンツが含まれています。それ以外のコンテンツは、本誌のコンテンツであっても含まれていません のでご注意ください。
※電子版では、紙の雑誌と内容が一部異なる場合や、掲載されないページがある場合があります。