Очі бояться, руки роблять: чистимо трафік сайту від ботів

  1. Перші кроки
  2. У твоїй компанії не дотримуються дедлайни?
  3. Приклади аномальної статистики з GA, яка допоможе виявити ботів
  4. висновок

Припустимо, у вас є сайт з якоюсь невеликою аудиторією, для якого поки немає медійного просування. З якоїсь причини ви відчуваєте, що частина цієї аудиторії вам нерелевантні, але не знаєте, наскільки ця частина більша. За даними дослідження Bot Traffic Report 2016 , До половини трафіку в інтернеті - боти.

Bot Traffic Report 2016

Розповідаємо, як зрозуміти, чи є боти на вашому сайті, скільки їх і як позбутися від цієї зарази за допомогою Google Analytics.

Перші кроки

Спочатку потрібно вивантажити всі можливі показники активності користувачів на сайті (показник відмов, відсоток нових користувачів, середній час сесії та інше) по різних фільтрів (джерела трафіку, канали, операційні системи, браузери, типи пристроїв).

Далі знаходимо статистичні показники, які сильно відрізняються від норми, за норму можна прийняти середнє значення по всіх сайтах, з якими ви працюєте. Якщо такого досвіду у вас немає, то можна приблизно розрахувати норму, ґрунтуючись на показниках одного сайту.

У твоїй компанії не дотримуються дедлайни?

Опановуй гнучкі методології в управлінні проектами під керівництвом затребуваних Agile-коучів всього за 18 днів, пройшовши онлайн-курс по Agile від бізнес-школи City Business School. Як виглядають результати компанії після курсу:

  • Команда згуртована, все відчувають відповідальність за кінцевий результат.
  • Виставлені вірні пріоритети в процесі роботи над продуктом.
  • Дедлайни завжди дотримуються.
Дізнатися більше

Реклама


Приклад. Припустимо, трафік на сайт приходить з 10 браузерів, показники в GA по 9 з них приблизно схожі, а ось по одному сильно відрізняються, це і буде приводом для більш детальної перевірки даного джерела. Для геолокації підхід такий же.

Такі аномалії можуть викликати боти. Але буває і так, що дає збої сам лічильник. Це можливо в наступних випадках.

1. Встановлено два і більше лічильника GA на один сайт. В такому випадку лічильники можуть перебивати дані один одного.

2. Лічильник встановлено не там. Рекомендується встановлювати лічильник аналітики перед закриває тегом head.

3. Встановлено стара версія Google Analytics.

4. У вас лише однієї сторінки сайт, навігація по якому здійснюється без зміни url. У такому випадку без додатково налаштованих подій показник відмов буде прагнути до 100%, а час на сайті до 0.

5. Налаштовані події на різні pop-up events, які автоматично спрацьовують на сайті і скручують показник відмов до 0%.

6. Лічильник GA встановлений не на всі сторінки сайту.

Приклади аномальної статистики з GA, яка допоможе виявити ботів

Приклад 1. Нових сеансів менше 5% (зазвичай можна подивитися, скільки у вас нових сеансів в ретаргетінге, і поставити це значення). Занадто високі або дуже низькі показники відсотка відмов, сторінок за сеанс, середньої тривалості сеансу.

В даному випадку неможливо дати які-небудь точні бенчмарки, так як потрібно орієнтуватися на середні показники, а вони індивідуальні для кожного сайту.

Приклад 2. Аномальний коефіцієнт досягнення мети як в загальному по каналу, так і по якомусь фільтру.

Ось конкретний приклад такого аналізу, завдяки якому ми змогли обчислити нечесну CPA мережу.

Ось конкретний приклад такого аналізу, завдяки якому ми змогли обчислити нечесну CPA мережу

Показники вибиваються із загальної картини

Як видно на скріншоті з GA, існує дуже велика різниця в коефіцієнті конверсії як мінімум для двох міст. При середньому значенні конверсії в 17% в Ступіно ми маємо 0,13%, а в Тамбові аж 95%. Якщо бачите щось подібне, це привід розібратися в джерелі трафіку.

Приклад 3. Великий відсоток трафіку припадає на користувачів, у яких GA не зміг розпізнати вік або стать.

Раніше в GA цей трафік вказувався як not set або взагалі не показується в фільтрі по демографії. Це не самий очевидний параметр для визначення шахрайського трафіку, так як Google фізично не може визначати стать і вік у 100% трафіку, але якщо ми бачимо велику частку таких сеансів, то краще з цим розібратися.

Приклад 4. Дуже низький відсоток нових сеансів на сайті з певного каналу.

Низький відсоток, звичайно, може бути обумовлений тим, що аудиторія сайту в принципі невелика і на нього заходять одні і ті ж користувачі, але в інших випадках варто перевірити джерело таких відвідувань, так як цілком можливо, що дані сесії генеруються одним ботом, тому і показник нових сеансів низький.

Приклад 5. Дивна активність з інших технологічних фільтрів: ОС, браузера, пристрої, IP-адреси.

Іноді слід звернути увагу на технологічні звіти GA, так як там також зустрічається багато цікавого. Часто ми можемо бачити великий відсоток трафіку з нецільового для нас гео або дивні показники з будь-якого браузера або операційної системи.

висновок

Описане вище - елементи «обов'язкової програми» по боротьбі з ботами. Якщо ми маємо справу з більш досконалими «створіннями», які ведуть себе як нормальні користувачі, є ще один підхід.

Поведінка людини і бота на сайті може відрізнятися тим, що людина, перейшовши на сайт, розуміє, які області тут клікабельні, які йому цікаві, і звертає увагу тільки на деякі кнопки.

Бот ж скліківает на сайті всі елементи, які для цього призначені. Щоб відсіяти даний тип шахрайства, ми можемо додати на сайт невидимий оку клікабельним піксель і налаштувати в GA відповідні події і цілі, пов'язані з кліком по цьому пікселю. Таким чином канал, з якого будуть приходити сеанси зі спрацювали цілями при натисканні на даний піксель, потрібно буде додатково перевірити на якість трафіку, так як справжній відвідувач (Не бот) може зробити таку подію на сайті тільки випадковим чином.

Ми провели такий тест для клієнта і побачили подібні спрацювали події, але таких сеансів було не більше 0,1% від загальної кількості аудиторії на сайті. Більш детальну інформацію по налаштуванню такого фільтра ви знайдете в інструкції .

У цьому матеріалі ми розглянули кілька способів провести швидку діагностику трафіку сайту і знайти неблагонадійні джерела. У наступній статті розповімо про системи бот-фільтрації, що відтинають непотрібні сеанси на рівні рекламної кампанії. Stay tuned!

Думка редакції може не збігатися з думкою автора. Ваші статті надсилайте нам на [email protected] . А наші вимоги до них - ось тут .

У твоїй компанії не дотримуються дедлайни?