ジョブ(調査)の作成
基本的な説明
Section titled “基本的な説明”Index Workerの右上ボタンからジョブを作成できます。

入力項目の説明
Section titled “入力項目の説明”-
ジョブ名: わかりやすい名称を自由につけてください。
-
メモ(任意): 自由に記載してください。
-
Search Console プロパティ: 調査を実施するSearch Console プロパティを選択してください。 (Google側のAPI制限で1プロパティごとに2,000URL/日が上限です)
-
URLタイプ: XMLサイトマップ、RSSフィード、手動入力/CSVが選択できます。 XMLサイトマップやRSSフィードの場合はURLを入力する枠が直後に現れますので、URLを入力してください。 CSVの場合、見出しは不要です。URLのみがカンマ区切りで羅列されたファイルをご用意ください。
-
サンプリング期間(RSSフィード調査のみ): RSSフィード調査でのみ指定可能です。 最新記事のクロール状況を把握するときにご活用ください。
-
サンプリングサイズ: 最大2,000URLを指定できます。500程度の指定を推奨しています。
-
スケジュール: 「スケジュール(繰り返し実行)」と「一度だけ実行(即時実行)」が選べます。
-
備考: メモ欄としてご自由にお使いください。
-
無視する URL パラメーター: 調査URLの中に無視したいパラメーターがある場合のみ指定してください。
🧩 【重要な機能】 XMLサイトマップを指定してから「サンプリング条件を指定」のボタンを押してみてください。
例えば、すべてのURLが表示されるXMLサイトマップを指定した後に「そのサイトマップの中からあるディレクトリのみ調査する」といったサンプリング条件を追加することができます。
📣 XMLサイトマップは、サイトマップインデックスファイルを登録することもできます。
🎨 ジョブを作成する際、URLグループでURLをフィルタすることができます。XMLサイトマップを使用する場合でも調査したい範囲を指定することができ、便利です。
🖇️ 1つのSearch Consoleプロパティごとに1日あたり2,000URLの調査ができます。 これはGoogle側のAPIの制限のためで、 Amethystの機能制限ではありません。
1サイト2,000ではなく、プロパティごとの制限です。
🔬 Index Workerに2,000を超えるURLが設定された場合は、全数調査ではなく適切なサンプリングが行われます。実務で使うのに信頼できるレベルのインデックス率とクロール率を計算します。調査結果のグラフでは95%信頼区間が表示されます。(参考情報の95% Wilson Confidence Intervalを参照)
💡 全数調査は非推奨です。多くの場合、サンプルサイズは500で十分です。サンプリングを行うことで全数調査をしなくてもインデックス率を算出できるのがAmethystの利点です。
(参考) 95% Wilson Confidence Interval
| p̂ / n | 2000 | 1000 | 500 | 300 | 100 |
|---|---|---|---|---|---|
| 99% | 0.9891 ± 0.004457 | 0.9881 ± 0.006434 | 0.9863 ± 0.009457 | 0.9838 ± 0.01279 | 0.9719 ± 0.02636 |
| 95% | 0.9491 ± 0.009581 | 0.9483 ± 0.01359 | 0.9466 ± 0.01934 | 0.9443 ± 0.02516 | 0.9334 ± 0.0451 |
| 70% | 0.6996 ± 0.02007 | 0.6992 ± 0.02836 | 0.6985 ± 0.04004 | 0.6975 ± 0.05159 | 0.6926 ± 0.08845 |
| 50% | 0.5 ± 0.02189 | 0.5 ± 0.03093 | 0.5 ± 0.04366 | 0.5 ± 0.05622 | 0.5 ± 0.09617 |