ここでは簡単に Struccle のメニューと基本操作について解説いたします。
基本メニュー
Struccle の基本メニューについて簡単に解説いたします。
機能について
各メニューにおける基本機能・操作を簡単に解説いたします。
詳しくは初心者ガイドや FAQ をご参考ください。
Extractor(エクストラクター)
目的・用途:パーサーを作成・管理します。
基本操作:NEW CHAT > URL 入力 > SCRAPE > MAKE > CHECK >(DATA SAVING)> (パーサーに名前をつける)
NEW CHAT
パーサーの新規作成をします。
URL
スクレイピング対象のページ URL を入力します。
IP
応用:対象サイトページにアクセスする際の IP を変更します。
SCRAPE
スクレイピングモデルを生成します。
WORK
応用:動的なサイトのデータを取得します。
VIEW
データの取得項目を、対象のページ画面から直接選択して追加・調整します。
MAKE
スクレイピングモデルを使ってデータを作成します。
CHECK
作成した最新のデータを確認・CSV ダウンロードします。
Prompt
AI に取得データ項目の修正などを指示します。
Extractor > Parse Result(CHECK画面)
作成した最新のデータを確認する画面です。
CSV 形式でダウンロードも可能です。
Data format conversion
応用:Conversion Format とColumn を設定し「CONVERSION」を押すことで、データ形式を変更します。
リスト形式や JSON 形式など、1カラム(項目)に複数のデータが集約する際に、個々のカラムに分割することが可能です。
Url(line break delimited)→ CHECK ボタン
対象のページと同一構造の別ページ URL を入れてCHECK を押し、データが取得できるかなど作成したスクレイピングモデルの汎用性を確認したりします。
Operation Selection
応用:WORK で登録した機能を選択します。
DATA SAVING
取得されたデータを CSV ダウンロードします。Windows にも Mac にも対応したファイル形式です。
SUBSCRIBE TO SCHEDULE LIST
応用:ページネーションパーサーの CHECK で作成した URL データを、ADD SCHEDULE のURL 設定で利用できるようにします。
Scheduler(スケジューラー)
目的・用途:タスクを作成してスクレイピングを自動で定期実行できるようにします。
基本操作:Add Schedule > 設定内容入力 > Register > Start now(or ON & Save)
Add Schedule
新規スケジュールタスクを作成します。
パーサーのセットや詳細設定を行います。
Changeable info
スケジュールタスク一覧を押すと表示される、タスクの詳細です。
設定した内容の確認や、今すぐにスクレイピングを開始したい場合の「Start now」、タスクのアクティベート化をする「ON/OFF」があります。
SHARE SCHEDULE
作成したスケジュールタスクを他のユーザーと共有します。
共有したいタスクを選択し、共有先のユーザーID を入力してください。
Scheduler > Add Schedule(アド スケジュール)
scd_name *
タスク名をつけてください。
Memo
タスクに関するメモを入力できます。
Schedule
タスクの実行日時を設定してください(何かしら日付を選択してください)。
Primary Proc *
最初に処理をするパーサー(上流工程)を選択します。
複数のパーサーをセットする場合、基本的にページネーションパーサーや一覧パーサーが該当します。
Primary Use Cols *
次に処理をする配下のパーサーと接続するためのカラムを選択します。
基本的に「url」であることが多いです。
Primary Proc Select *
タスクを実行する対象ページの URL を追加します。
subsequentProc
次に処理をする配下のパーサーをセットし、上位のパーサーと接続するためのカラムを選択します。
複数のパーサーをセットする場合、基本的に一覧パーサーや詳細パーサーが該当します。
カラムは基本的に「source_url」であることが多いです。
NEXT
配下のパーサーを追加したい場合に押します。
Register
設定が完了したら押して登録します。
Scheduler > Changeable info(チェンジネイブル インフォ)
Add Schedule で設定した内容を確認したり、タスクのアクティベートや今すぐスクレイピングを開始する、タスクの削除などができます。
ON/OFF
タスクのアクティベート/非アクティベートをします。
変更後、Save を忘れずにしましょう。
Start now
今すぐスクレイピングを開始します。
Save
設定した内容を保存します。
Delete
タスクを削除します。
Results(リザルツ)
Scheduler で作成・実行したタスクの進捗・結果が確認できます。
完了したタスクの CSV データダウンロードも可能です。
OPEN
タスクが完了すると押せるようになります。
取得データの確認や、データ形式の変更・ダウンロードなどが可能です。
DL
タスクが完了すると押せるようになります。
CSV データのダウンロードが可能です。
STATE
タスクの進捗状況の確認ができます。
実行が開始されたパーサーから表示されるようになり、終了時刻の確認が可能です。