Семальт: Супер Руководство по блокировке спама реферера в вашей Google Analytics

Ник Чайковский, эксперт из Семальта , уверяет, что реферальный спам является одной из проблем, с которой в настоящее время сталкиваются веб-мастера. Ситуация ухудшалась с годами, что означает, что кто-то где-то зарабатывает много денег от создания реферального спама.

Призрачный и реферальный спам

Спам попал в отчеты Google Analytics. Спамеры ищут уязвимости в системе, чтобы они могли появляться в отчетах данных веб-сайта. Они делают это с надеждой, что они вызовут достаточно любопытства, чтобы веб-мастер посетил их веб-сайт, чтобы понять, почему они включены в отчет. Проблема в том, что они не увеличивают трафик. Они даже не делают это, так как они боты. Они используют код отслеживания JavaScrip, используемый Google Analytics, чтобы создать уведомление о том, что был визит. В конечном итоге они искажают показатели жизненно важной статистики, такие как показатели отказов и другие элементы, используемые для анализа взаимодействия. Крайне важно заблокировать реферальный спам, если нужны точные данные, особенно если они полагаются на них при принятии маркетинговых решений.

Становится трудно блокировать реферальный спам, особенно потому, что спамеры работают очень быстро, увеличивая как количество спам-хитов, так и источники. Это означает, что веб-мастерам необходимо улучшить усилия, которые они прилагают для устранения и внесения в черный список этих источников. Это особенно неприятно для людей, у которых есть новые сайты, которые не получают много законного трафика. Увеличение количества спама на таких сайтах может привести к большей асимметрии, которая может быть даже больше, чем ежедневные хиты, которые он получает.

Насколько это просто?

Одна страница загружает записи как одно посещение. Призрачные спамеры используют код отслеживания Google Analytics и отправляют данные о трафике прямо в отчеты, тем самым подделывая визит. Загрузка одной страницы на сервер может занять 0,001 секунды. Тем не менее, они, возможно, принудили более 100 таких поддельных посещений к учетным записям Google на многих других сайтах по всему миру. Это довольно легко купить один хост. Пока спамеры уверены в рентабельности инвестиций, они могут нанести им большой ущерб.

Решения, которые не дотягивают

Некоторые методы иногда настолько продвинуты, что решения, используемые для блокировки реферального спама, не работают. Одним из них является таинственный онлайн-сервис под названием Darodar. Следующие методы не очистили его от GA.

  • Файл .htaccess. Это не работает, так как призрачный спам не затрагивает сайт
  • Список исключений рефералов. Не хватает обновлений.
  • Фильтры исключения. Это устаревший метод, поскольку он ориентирован только на будущий спам, а не имеет обратной силы для прошлых баз данных спама.

Фильтр исключения почти приблизился к удалению спам-ссылок Darodar. Единственным ограничением было то, что он не имеет постоянного и постоянно обновляемого списка реферальных спамеров.

Недостающий кусок головоломки

Действенное решение для идентификации и блокировки реферальных и фиктивных данных должно быть очень обновлено, получено из более широкой базы данных и иметь обратную силу для прошлой информации. Основываясь на трех элементах для оптимального решения, вот тот, который работает.

Шаг 1. Использование сегментов для исключения спама

Сегменты лучше использовать, поскольку они не изменяют данные постоянно. Если кто-то случайно отфильтровывает реальных рефералов при использовании фильтров, вернуть их обратно невозможно. Можно строить старые данные, используя сегменты, несмотря на то, как давно они там находятся. Можно также применить их задним числом.

Шаг 2. Ведение списка исключений

Slack - это инструмент, который веб-мастера могут использовать для мониторинга источников рефералов. Он уведомляет пользователя о любых новых рефералах и дает им подсказку: занести в белый или черный список подозрительный источник рефералов.

1. Slack получает все рефералы, и

2. Он использует PHP для сортировки всех результатов по порядку подсчета, а затем отправляет окончательный список веб-мастеру, чтобы узнать, выглядит ли он знакомым. Если не,

3. Он перенаправляет весь подозрительный спам в свободный канал, который предлагает пользователю выбор между белым или черным списком. Какой бы вариант они не выбрали, он ведет к шагу 4,

4. Он перенаправляет на страницу, которая проверяет вердикт как подтверждение выбора.

5. Slack затем сохраняет и блокирует всех идентифицированных спамеров в базе данных.

6. Окончательное отображение чистых данных будет в формате регулярных выражений. Скопируйте и вставьте его в Google Analytics.

Slack позволяет веб-мастерам обновлять список исключений как минимум пять раз в день.

В действительности, несколько решений могут работать:

Несмотря на то, что это проверенный метод, он будет работать еще лучше, если веб-мастер дополнит его другими методами, просто чтобы убедиться, что они охватывают все основы. В дополнение к указанному решению:

  • Нажмите на флажок, который предлагает Google Analytics исключить известных ботов и пауков,
  • Применить «включить фильтр имени хоста»
  • Используйте куки

Упомянутый выше инклюзивный фильтр иногда эффективен, но не является лучшим решением в долгосрочной перспективе, потому что:

  • Подделка имени хоста не представляет особой сложности, и спаммеры-аналитики все чаще используют его в качестве уязвимого.
  • Если настройка неверна, это может привести к отфильтровыванию реальных рефералов.

mass gmail