「Webサイトの情報を自動で集めたい!」 そう思ってスクレイピングを始めたものの、requests で取得した HTMLの壁(大量のタグの羅列) を前に絶望したことはありませんか? 正規表現で <p>.*?</p> のようなパターンを書いて抽出するのは、もうやめましょう。
前回は「selemium」を使ってWeb上のデータを抽出するというのをやりました。 今回は別のPythonのライブラリを使ってスクレイピングで遊んでみたいと思います。 自身の勉強ログとして書いています。 【Pythonの使用環境】 Google Collaboratory Google Collaboratoryなら ...