Як сканувати великі сайти Screaming Frog SEO Spider

Що більше даних ви скануєте, то більше пам’яті необхідно для їхнього зберігання та обробки. Screaming Frog SEO Spider використовує гібридний механізм з параметрами, що налаштовуються, який вимагає певного налаштування для ефективного сканування у великому масштабі.

За замовчуванням SEO Spider використовує оперативну пам’ять для оброблення та зберігання даних замість жорсткого диска на ПК. Це забезпечує високу швидкість і гнучкість, але може призвести до деяких недоліків, особливо за великого масштабу сканування.

Щоб уникнути цих проблем при скануванні, необхідно налаштувати параметри програми Screaming Frog SEO Spider.

По-перше, потрібно змінити режим зберігання даних:

  1. Натисніть опцію «Configuration» → Перейти у «System»
  2. Далі пункт «Storage Mode» → та встановити «Database Storage».
Налаштування Storage Mod у Screaming Frog
Встановити Database Storage у Screaming Frog

Тепер дані записуватимуться на жорсткий диск, а не в оперативну пам’ять. Бажано використовувати SSD для жорсткого диска. Один із головних плюсів такого налаштування – всі результати просто дозаписуються в базу, і якщо станеться збій, дані не будуть втрачені (примітка: після перемикання в цей режим падінь не було).

По-друге, необхідно задати обсяг оперативної пам’яті:

  1. Натисніть опцію «Configuration» → Перейти у «System».
  2. Далі пункт «Memory Allocation».
Налаштування оперативної пам'яті у Screaming Frog

Розробники рекомендують використовувати не менше 4 Гб для сканування 2 мільйонів сторінок і не менше 8 Гб для більш ніж 5 мільйонів сторінок. Однак, для більшості користувачів достатньо 16-32 Гб пам’яті.

Для сканування великої кількості сторінок вебсайту, необхідно вимкнути деякі функції:

  1. Натисніть опцію «Configuration»
  2. Перейти у «Spider».
  3. Де залишаємо тільки внутрішні посилання, якщо не планується шукати биті зовнішні посилання.
Налаштування сканування великої кількості сторінок
  1. Далі необідно відключити збір зображень, щоб програма не забирала їх на сайті. Для цього натисніть опцію «Configuration» → Перейти у «Exclude» та вставляємо такі винятки:
http.*\.jpg
http.*\.JPG
http.*\.jpeg
http.*\.JPEG
http.*\.png
http.*\.PNG
http.*\.gif
http.*\.pdf
http.*\.PDF
Відключити збору зображень у Screaming Froog
  1. Далі необхідно налаштувати: Натисніть опцію «Configuration» → та перейти у «Speed». Рекомендується встановити від 7 до 10 потоків (10-30 URL на секунду), щоб забезпечити комфортну роботу при скануванні великих сайтів.
  2. Потім натисніть опцію «Configuration» та замініть User-Agent c Screaming Frog SEO Spider на Googlebot, щоб виключити можливе блокування сканування/парсингу конкурентами.
Заміна User-Agent з Screaming Frog SEO Spider на Googlebot
Встановлення User-Agent Googlebot
  1. Останній крок, потрібно зберегти всі наші налаштування і зміни та зробити їх дефолтними за замовчуванням, щоб не налаштовувати щоразу, під час сканування нового проєкту. Натисніть опцію «Configuration» потім перейдіть → «Profiles» та натисніть → «Save Current Configuration as Default».
Зберегти налаштування за замовчуванням у Screaming Froog

Після цих налаштувань додайте url потрібний вам URL сайту і можете сканувати без проблем великі вебсайти.

5/5 - (8 votes)