Як відсіяти "розумних ботів" в статистиці Google Analytics

Є такі "хлопці" - непрохані гості на ваш сайт. На щастя, практично всі сучасні інструменти аналізу трафіку для веб-ресурсів дозволяють таких гостей фільтрувати, не помічати і не виводити в статистиці. Пояснення цьому просте: коли жива людина приходить на сайт (відкривши його за допомогою стандартного браузера), інструмент аналізу для ідентифікації такого клієнта використовує ява скрипт, і коли цей скрипт успішно спрацьовує - система зараховує відвідування. У будь-яких роботів, ботів і інших нелюдів відпрацювання скриптів відключена, тому система їх не розпізнає.

Але є і такі "розумні боти", які майже як живі відвідувачі. Тут виникають складнощі у систем аналітики, які використовують ява скрипти: вони зараховують такі відвідування, як справжні. Все б нічого, якби рівень таких відвідувань був мізерно малий. Він малий, але не шкода.

Ось, наприклад, графік відвідувань сайту одного з наших клієнтів:

Ось, наприклад, графік відвідувань сайту одного з наших клієнтів:

Синім кольором відзначені всі відвідування, а помаранчевим - відвідування одного з видів таких ось смарт ботів, в ролі якого виступає Mozilla Compatible Agent. Не буду детально зупинятися на них, тому що на лунаметрікс вже давно описано : Що, як і чому. Нас тут цікавить те, що на рівень відвідувань в 3-4 тисячі на добу - "непроханих гостей" - 1%, тобто стабільно - 30-40 ботів в день. Припустимо, тут це не критично, а тепер уявіть, що у вас сайт з 100-200 тисячами відвідувань на добу, з яких смарт ботів буде вже 1-2 тисячі. Але ж Google Analytics дозволяє обробляти до 10 мільйонів хітів в місяць, якщо звичайно ви прив'язані саме до даного інструменту. Та й статистика ботів не радує - ті ж показники відмов. Ось, наприклад, графік відвідувань цих ботів без загальних даних:

Ось, наприклад, графік відвідувань цих ботів без загальних даних:

Благо, останнім часом відвідуваність таких "хлопців" знизилася, але хто знає, що чекає нас попереду. А для того, щоб убезпечити свою дорогоцінну статистику і не псувати її незрозуміло якими даними є кілька рішень. На одній з великих конференцій (iForum 2013, доповідь Роми Рибальченко ) Слухач запитав: навіщо в Google Analytics фільтри і сегменти, якщо функція одна і та ж? Ще тоді я розумів, що різниця в чомусь істотному. В якійсь мірі проблема зі смарт ботами допомогла мені в цьому розібратися.

У Google Analytics є сегментація і є фільтрація. Сегментація дозволяє вам фільтрувати вже наявні дані і, відсіявши непотрібне, отримати те, що ви шукаєте. Фільтри роблять те ж саме, але з одним дуже важливим нюансом: застосувати фільтр на вже наявні дані ви не можете. Ви можете налаштувати фільтр - натиснути кнопку «вкл.» В своєму поданні Google Analytics. Саме з цього моменту дані, що збираються в статистиці, будуть вже відфільтрованими. До цих пір статистика все ще буде тримати історичні невідфільтровані дані, які ніяк не прибрати, крім сегментів.

У нашому випадку для створення сегмента, потрібно всього лише скористатися імпортом вже готового рішення в шаблонах Google Analytics. А для фільтрації створити новий простий користувальницький фільтр, виключивши Браузер з назвою «Mozilla Compatible Agent».

А для фільтрації створити новий простий користувальницький фільтр, виключивши Браузер з назвою «Mozilla Compatible Agent»

Усе. Тепер ваша статистика буде чиста, як і ваша совість.

Підготував Андрій Карякін, менеджер комплексних проектів «Ольшанський і партнери»