GASでWebスクレイピング 02:Yahooの上部から文字列を取得してみる

今回行うこと

今回は下記を行いたいと思います。
・前回取得したHTMLをParserして中身を確認する
・Yahooの画面上部に存在する文字列の取得

↓ 下記赤枠の文字列取得です。

Yahoo スクレイピングコード

今回のコードは以下になります。

解説

途中までは前回と同じですね、↓で「Parser」を行っています。

from:に検索を開始する文字列
to:終了の文字列
をそれぞれ記入します。

From:これはYahooページの下記部分です。全部で6件ヒットしています。

to:続いてtoへ。見えづらいですが、トラベルの部分です。


変数「other」へ「Parser」後の値を格納しています。
出力すると以下が表示されています。
欲しかった値は取得できているようですね!


欲しい文字列は
PayPay STEP、カード、メール、トラベル、ヤフオク!、ショッピング
なので、forで余計な文字列を削除します。

変数「other1 」をconsoleへと出力し確認してみると、

が出力されています。
「”>」までが毎回不要ですね!
replace関数を使用し、正規表現を用いて「/”.*>/,””」を行います。
正規表現の条件は「“始まりで、>を見つけたら、該当部分を空白にする。
という意味です。
変数「other2」へ正規表現後を行った内容を格納しているので出力してみます。
・other2 = PayPay STEP
・other2 = カード

として無事に欲しかった値が格納されていることを確認できました!
Pythonと比べると簡単に出来るような、逆に難しいような、、、
これからも学習が必要になりそうです。

今回は以上になります。
最後までお読みいただきありがとうございました!