Googleの検索結果を別タブ(javascript)で開きながらフルサイズのスクリーンショットを取得する
行いたいこと 前回Googleの検索結果を別タブで開いていきました。 今回は別タブで開いた画面内で上から下までのスクリーンショット を取得したいと思います。 ↓実行結果イメージ コード [crayon-672ad2615…
行いたいこと 前回Googleの検索結果を別タブで開いていきました。 今回は別タブで開いた画面内で上から下までのスクリーンショット を取得したいと思います。 ↓実行結果イメージ コード [crayon-672ad2615…
行いたいこと Googleの検索結果を別タブで開いてみたいと思います。 実行結果は以下のイメージ。 コード
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 |
from bs4 import BeautifulSoup import time from selenium import webdriver driver = webdriver.Chrome("chromedriver_win32/chromedriver.exe") # 上位から何件までのサイトを抽出するか指定する pages_num = 3 # キーワード key_word = 'webスクレイピング' # Google検索で「webスクレイピング」の結果を格納する url = 'https://www.google.com/search?num={}&q={}'.format(pages_num,key_word) # URLを開く driver.get(url) time.sleep(3) # WebサイトのHTMLデータをBeautifulSoupで解析する soup = BeautifulSoup(driver.page_source,'html.parser') # 検索結果のまとまり page_titles = soup.find_all(class_="tF2Cxc") i = 1 # 1件別でURLを取得する for page_title in page_titles: url = page_title.find("a").get("href").replace('/url?q=','') print("url = " , url) # タブを右隣に新規追加 driver.execute_script("window.open()") # 操作対象のタブを追加したタブに設定 driver.switch_to.window(driver.window_handles[i]) # 検索結果から取得したURLへ遷移させる driver.get(url) # タブを右に追加していきたいので数字をプラスする i = i + 1 time.sleep(2) # 開き終わったら一番左のタブへ操作対象を戻す driver.switch_to.window(driver.window_handles[0]) |
解説 タブで開く前に、開く先のURLを取得して…
行いたいこと 今回は前回構築した「Google Colaboratory」から実行してみたいと思います。 といってもそれほど行うことはないですが、 ・ファイル名の変更 ・サンプルの実行 です。 Google Colabo…
行いたいこと 今回は「Google Colaboratory」を使用して Pythonを実行してみたいと思います。 既にPythonを実行する環境は整っていたのですが、 Google Colaboratoryを使用する利…
行いたいこと 前回画面のスクロールを行いました。 今回はSeleniumでChromeを起動 > 画面を下へスクロールして、 表示されているブラウザのスクリーンショット(範囲指定) を行いたいと思います。 ■ Googl…
行いたいこと PythonからJavascriptを使用して画面のスクロールをしたいと思います。 厳密にはSeleniumでChromeを起動して、 表示されているブラウザのスクロール処理ですね。 コード [crayon…
行いたいこと いらすとやの画像より、 複数の画像を一気にダウンロードする。 ということを試してみたいと思います。 例えば以下のようなページの場合、サッカーを行っている画像だけではなく 表示されている全ての画像ファイルが対…
行いたいこと 今回は凄くシンプルにウェブ上の画像を1枚ダウンロードしてみたいと思います。 ダウンロードする画像は「いらすとや」の任意の画像1枚だけです。 プログラムを実行したら同フォルダ内に指定したURLの画像を保存する…
行いたいこと かなり前にスプレッドシートのショートカットから書式を変更してみました。 その時の記事はこちら 今回はGASから書式を変更してみたいと思います。 ↓ 今回のゴールイメージ 書式を設定するコード [crayon…
Cannot convert ‘function またまたエラーが発生! 訳してみると以下とのこと。 例外:’function(){[ネイティブコード]}’をintに変換できません。 …