GASでWebスクレイピング 03:タウンワークをスクレイピングしてみる

今回行うこと

タウンワークのページをスクレイピングしてみたいと思います。
GASだとクリックの操作が苦手みたいなので、
各種条件:地域や職種などの条件が指定されたページを対象としています。
条件は以下としてみました。
・地域:北海道
・エリア:札幌市
・職種:IT/コンピュータすべて

URLはこちらとなっています。

今回は対象ページから「社名」と「業務名」を取得してみます。

タウンワーク スクレイピングコード
解説

UrlFetchAppしてURLの情報を取得するまでは前回と同じですね。
次に取得したhtmlから社名と業務名を抜き出しています。

これは以下の部分になります。
From:job-lst-main-contents で30件ヒットしています。
To:pとして、業務名のテキスト表示の部分で終了です。


この時点での変数「ArrayFull」のconsole.logを確認すると
社名と業務名が取得されていることが分かります。


続いて変数「Array01」へ「社名」だけ抜き出して格納しています。
class名に「job-lst-main-ttl-txt」
h3タグに「社名」
のテキストが格納されています。

下記の部分で抜き出しています。



業務名も同様です。下記の部分で抜き出しています。

最後にforでループを回して30件分のデータを確認です。

・Array01の配列には社名

・Array02の配列には業務名

が入っていることが確認出来ました!

今回は以上となります。
最後までお読みいただきありがとうございました!