GASでWebスクレイピング 01:ParserのインストールとURLへの接続
GASでWebスクレイピング これまでPythonでしたWebスクレイピングをしたことがなかったので GASでもチャレンジしてみます。 処理速度や柔軟性を考えたらPythonでやるメリットの方が大きいのですが、 GASだ…
GASでWebスクレイピング これまでPythonでしたWebスクレイピングをしたことがなかったので GASでもチャレンジしてみます。 処理速度や柔軟性を考えたらPythonでやるメリットの方が大きいのですが、 GASだ…
XPath Helperとは XPath Helperは簡単にxpathを取得出来るChromeのツール。 らしいです。 これまでxpathをコピーする際は、 ・右クリック > 検証 > コピー > xpathをコピー …
Yahooニュースのスクレイピング 今回はYahooニュースの「ニュース」タブの部分の取得、 それぞれのニュースの詳細(記事全文を読む)の部分を SeleniumとBeautifulSoupを使用して取得してみたいと思い…
検索結果をCSVへ! 前回スクレイピングした内容をテキストへ保存しました! CSVへの保存も簡単に行えます。 前回のソースコードを少し綺麗に?しながらCSVファイルへ落とし込みたいと思います。 【イメージ】 ↓ の検索結…
検索結果をスクレイピング 前回はメルカリのスクレイピングをSeleniumで行いました。 今回は「BeautifulSoup」を使ってみたいということで、 メルカリと比べると大分短いソースコードになりますが、 ・Goog…
classが見つからない! 前回は「Selenium」のみのWebスクレイピングを行ったので 今回は「BeautifulSoup」を使用したいと思い、 Googleの検索結果で以下のような1件ずつの タイトルとURLを取…
今回行うこと 前回はメルカリを開いて検索して「新しい順」 でソートするまでを行いました。 今回は以下を行って完結です! ・表示された内容に対してタイトルや価格を取得する ・何件まで取得するかを確定する ・取得した内容をC…
トップページを開いて検索してみる 前回はWebドライバーの準備から、 実際にWebサイト(メルカリ)を開くまでを行いました。 今回は開いたメルカリで「キーワード検索」を行って 表示された内容を「ソート」するまでを行ってみ…
Webスクレイピングとは この記事をご覧になってくださる方は既にご存じかと思いますが、 Webスクレイピングとは、Webサイトから自分が必要な情報を収集できる。 ことだと考えています(ザックリ) 例えば ・グーグルの検索…