【業務自動化】Chapter4-2:静的ページをスクレイピングしよう

ながみえ

一つ前のページでは Webスクレイピングの基礎 について学習しました。

今回は 静的ページの情報収集 を体験しましょう。

Chapter1:PythonによるExcel自動化の基本を身につけよう
Chapter2:自動化ツールを.exe化して配布しよう
Chapter3:現場で使える便利な自動化ツールを4つ作ろう
Chapter4:Webスクレイピングでデータを自動で集めよう
 ・Chapter4-1:Webスクレイピングとは何か
 ・Chapter4-2:静的ページをスクレイピングしよう ◁今回はここ
 ・Chapter4-3:動的ページをスクレイピングしよう
Chapter5:自動化ツールを作ってお金を稼ごう

業務で扱う情報の多くはインターネット上から入手できますが、毎日手作業でコピー&ペーストするのは非効率です。

Pythonを使えば、Webサイトから自動的にデータを収集し、Excelに整理して保存する仕組みを簡単に作れます。

この記事では 静的ページのスクレイピング をテーマに、Webサイトに表示されているニュース見出しなどを自動で取得し、Excelにまとめる方法を解説します。

静的ページは仕組みがシンプルで初心者でも扱いやすいため、スクレイピングの第一歩として最適です。

<<前のページ

業務自動化の記事一覧

次のページ>>

静的ページとは|Webスクレイピングで扱いやすいページの種類

Webスクレイピングを行う上で最初に押さえておきたいのが、Webページの種類です。

大きく分けると「静的ページ」と「動的ページ」がありますが、静的ページはその名の通り内容が固定されており、HTMLを取得すればそのまま必要な情報が含まれています。

例えば、企業の会社概要ページや記事本文など、ページを開くたびに内容が変わらないものは静的ページにあたります。

この特徴により、PythonでアクセスしてHTMLを解析するだけで情報を抜き出せるため、初心者がスクレイピングを学ぶ入り口として適しています。

あわせて読みたい
openpyxl使える関数・メソッド・クラス一覧【Excel自動化の基本リファレンス】
openpyxl使える関数・メソッド・クラス一覧【Excel自動化の基本リファレンス】
ここから先は限定公開です

すでに購入済みの方はこちら

購読には会員登録が必要です

「半角英数字」と「大文字1個以上」を含む、8文字以上

会員登録には 利用規約/特定商取引法に基づく表記 への同意が必要です。

すでに会員の方はこちら

ログインして記事を読む

メールアドレス
パスワード
パスワードを忘れた方
新規会員登録はこちら

パスワード再設定

パスワードを再設定します。入力したメールアドレスに再設定用のURLをお送りしますので、パスワードの再設定を行なってください。
キャンセル
記事URLをコピーしました