Google検索後に検証ツールから取得したClassが見つからない

前回は「Selenium」のみのWebスクレイピングを行ったので
今回は「BeautifulSoup」を使用したいと思い、
Googleの検索結果で以下のような1件ずつの
タイトルとURLを取得したいと思いました。
ということで検索結果後に
Chrome検証ツールから確認すると、こんな感じになります
class = "yuRUbf"

そこでBeautifulSoupにて、
下記のコードを実装。

list_title = soup.find_all(class_="yuRUbf")

1	list_title = soup.find_all(class_="yuRUbf")

最初はホントになぜ？と思い調べてみると
javascriptが関係しているみたいでした。
いくつか対応方法がありましたが、下記を試してみようかと思います。

1.単純にjavascriptをオフにして検証ツールから確認する
2.Seleniumからpage_sourceを渡す

今回は1の方のjavascriptをオフにする方法です。
まずchromeのjavascriptをオフにします。

【javascriptオフの手順】
1. chromeの画面右上の三点リーダー > 設定をクリック
2. セキュリティとプライバシー > サイトの設定をクリック
3. 下へスクロールするとJavaScriptが表示されるのでクリック
4. 「サイトに JavaScript の使用を許可しない」を選択
→ 自動保存されます。

ずっとJavaScriptがオフだと何かと不便なので、
実装が終わったらオンにしたいと思いますｗ
オフにしてみて、再度検索結果から検証ツールを起動します。
そしたらなんと

全然違いますね！！！
class = "egMi0 kCrYT"

list_title = soup.find_all(class_="egMi0 kCrYT")

1	list_title = soup.find_all(class_="egMi0 kCrYT")

すんなりと取得することが出来ました。

次回は「2.Seleniumからpage_sourceを渡す」を試してみたいと思います。
絶対にこっちの方が良さそうｗ

今回は以上となります。
最後までお読みいただき、ありがとうございました。

カテゴリー

アーカイブ

Google検索後に検証ツールから取得したClassが見つからない

classが見つからない！

カテゴリー

最近の投稿記事

Google Colaboratory を使ってみる01(環境構築)

SyntaxError: invalid syntax が出た時の原因と…

Googleの検索結果を別タブ(javascript)で開きながらフルサ…

メモ03【append】

【4章】 制御構造ツール

メモ07【配列】

メモ15【少数の計算式】

【CSVへ保存】Googleの検索結果をスクレイピング02

【4章】　制御構造ツール