ここでは「定期設定」メニューに関する基本的な機能および操作方法について解説いたします。
発展的な内容については以下もあわせてご確認ください。

流れ
基本的な流れは以下の通りです。
① スケジュール追加(新規作成)
▼
② 実行日時を設定する
▼
③ スクレイピング対象URLを設定する
▼
④ パーサーをセットし、④を必要数行う
▼
⑤ スケジュール追加設定を確定する
▼
⑥ 即実行もしくはスケジュールを有効化する
この流れを以下の操作手順によって実行していきます。
操作手順
① スケジュール追加(新規作成)
まず「スケジュール追加」を押下して「スケジュール追加」画面を開きます。
「スケジュール名」の入力と、必要であれば「メモ」にスケジュールについての覚え書きを記載しておきましょう。
② 実行日時を設定する
スクレイピングを実行する日時を設定します。
日付ベースの「日次」か週(曜日)ベースの「週次」かで設定が可能です。
1:「スケジュール」を押下し、詳細設定(ポップアップ)を開いて「日次」か「週次」かを選択。
2:「日付」もしくは「曜日」を選択。
3:「稼働開始時間」、「稼働開始分数」を選択。
※ 詳細ついては<<こちら>>をご参考ください。
4:「OK」を押して詳細設定を確定する。
▼ 詳細設定(ポップアップ)画面

③ スクレイピング対象URLを設定する
スクレイピング対象サイトページのURLを設定します。
ページネーションを使った大量取得の仕方については特によくご確認ください。
1:「URL選択」を押下してURLの対象(ポップアップ)画面を開く。
2:「URLの追加」にてURLを入力し、「追加」を押下。
※ エンターキーで改行できるので、一度に複数URLを入力できます。
3:「OK」を押下し、追加したURLを確定。
大量取得したい時は
”サイト内の検索結果画面に表示された店舗の詳細ページ全てを取得したい場合”など、大量のデータを取得する場合は「ページネーション」という概念を利用します。
詳しくは<<こちらのページ>>もご覧ください。

④ パーサーをセットする
「データ収集」にて作成したパーサー(スクレイピングモデル)をセットします。
また、複数のパーサーを組み合わせて使うことで、大量データの取得も可能にします。
※ 詳しくは「定期設定の機能説明」もあわせてご確認ください。
セットするパーサーは、上流(大枠) > 下流 (詳細)のデータに向かって取得するため、一覧パーサー > 詳細パーサー の順序でセットします。
※ 発展要素として「ページネーションパーサー」を使う場合もありますが、上記の内容を基本としてください。
1:「パーサー」選択にて「一覧パーサー」として作成したパーサー、もしくは「詳細パーサー」として作成したパーサーを選択。
2:「列を選択する」にて「url」を選択する。
※ 「url」= 次のパーサーの「source_url」と紐付けるキーとなります。
3:次のパーサーの「パーサー選択」にて「詳細パーサー」として作成したパーサーを選択。
※ 1で「詳細パーサー」を選択した場合は不要です。
4:次のパーサーの「列を選択」にて「source_url」を選択。
※ 1で「詳細パーサー」を選択した場合は不要です。

⑤ スケジュール追加設定を確定する
設定が完了したら「登録」を押下してスケジュール設定を確定します。
▼ 一覧パーサーと詳細パーサーをセットした場合の例

▼ 詳細パーサーのみをセットした場合の例

▼ ページネーションを使った場合の例(発展)

▼ ページネーションパーサーを使った場合の例(発展)

⑥ 即実行もしくはスケジュールを有効化する
「即実行」を押下して今すぐスクレイピングを開始する、もしくは「OFF」を「ON」に切り替えてスケジュールを有効化してスクレイピングを実行します。
実行結果は「結果確認」メニューからご確認ください。


