Удаление данных электронной почты и параметров запроса URL в Google Analytics 4
3 октября 2023 года в Google Analytics 4 появилась новая опция, позволяющая исключать/удалять определенные данные из URL - электронную почту пользователя и любые параметры запроса, которые вы зададите самостоятельно в настройках счетчика. Как это сделать? Читайте ниже.
Не так давно я написал подробное руководство по удалению данных из Google Analytics 4. В нем затрагивались такие темы, как:
- типы и примеры запросов на удаление данных;
- как удаление данных влияет на другие функции GA4?
- удаление данных конкретного пользователя из Исследования "Статистика пользователей";
- удаление данных из Google BigQuery.
А еще чуть раньше в блоге я разбирал настройку, с помощью которой вы можете исключить любые параметры запроса URL, как с использованием Google Tag Manager, так и без. Но для этого нужно использовать специальную конструкцию gtag('config') и переопределить значение параметра события page_location. Именно в нем передаются все параметра запроса. Обязательно прочтите эти два материала:
Все дело в том, что в предыдущей версии Google Analytics (Universal Analytics, GA3) на уровне представления была функция Исключить параметры запроса URL, которая позволяла прямо в интерфейсе задавать нужные параметры и удалять их автоматически из URL-адресов. Так мы получали более правильную статистику в отчетах.
Но представлений в Google Analytics 4 нет, как и не было такого функционала до 3 октября 2023 года. Теперь в вашем счетчике GA4 есть новая функция удаления данных. Найти ее можно, перейдя в раздел Потоки данных и выбрав веб-поток:
В открывшемся окне в блоке События вы увидите новую опцию Удаление данных:
Здесь вы можете выбрать данные для удаления:
- электронную почту;
- параметры запросов URL.
На момент выхода этой статьи настройка доступна только веб-потоков (сайтов).
Удаление данных электронной почты
Google очень трепетно относится к конфиденциальности данных пользователей и возможности самих владельцев сайтов повлиять на итоговое отображение информации внутри Google Analytics 4. Поскольку существует проблема, при которой в URL-адресах могут передаваться персональные данные пользователей (имя, фамилия, телефон, электронная почта и т.д.) в качестве дополнительных параметров, в GA4 теперь предусмотрена возможность удалять их автоматически после активации.
Предположим, на вашем сайте пользователи могут заказать товары или услуги. При оформлении заказа они заполняют форму, в которой указывают свои персональные данные, а затем отправляют ее вам. В некоторых случаях сведения о заказе передаются в ссылке как GET-параметры:
Или когда какой-нибудь сервис или платежный шлюз на стороне отправляет дополнительные данные в URL-адресе. Например, на моем сайте osipenkov.ru некоторое время назад интернет-эквайринг Тинькофф сохранял в явном виде данные моей организации (электронную почту, номер телефона, название организации и т.п.) и подставлял все это в ссылку.
В результате чего Google Analytics 4 регистрировал событие просмотра страницы page_view и передавал в отчеты информацию по параметру page_location, в котором сохранялся весь этот хвост:
Точно так же может происходить и с данными пользователей, посещающих ваш сайт. Получается, что приватность и безопасность нарушается, а сам GA4 в отчетах фиксирует запрещенные данные, что противоречит их же условиям использования Google Analytics. Именно поэтому Google добавил удаление данных электронной почты отдельной настройкой:
Теперь простым переключением вы можете сообщить Google, чтобы он удалял адреса электронной почты из данных о событиях. После ее включения рядом с настройкой удаления данных будет отображаться характерный статус, свидетельствующий об активности:
Но, как вы понимаете, электронная почта - это не единственная информация, которая может передаваться в URL-адресе и сохраняться в отчетах Google Analytics 4. В page_location регистрируются абсолютно все параметры, которые присутствуют ссылке в момент совершения того или иного события. И чтобы гибко управлять результатами, в GA4 появилась еще одна опция выбора данных для удаления.
Параметры запросов URL
Активировав ее, вы сможете самостоятельно через запятую или с помощью переноса строки (клавиша Enter) указать нужные вам параметры запросов URL (до 30 штук), которые требуется исключить из Google Analytics 4.
Каждый параметр запроса URL содержит ключ и значение, разделенные знаком равенства. Например, в URL https://gtm-exam.ru/?name=Яков&email=ya.osipenkov@icloud.com ключи - это name и email, а значения - Яков и ya.osipenkov@icloud.com (см. скриншот выше). Их и можно указать в качестве параметров.
Удаление данных использует текстовые шаблоны для выявления строк, похожих на адреса электронной почты, в любом параметре события или параметре запроса URL, которые передаются в составы параметров событий page_location, page_referrer, page_path, link_url, video_url и form_destination. Новая настройка удаления данных выполняет проверку событий до того, как они будут собраны, и удаляет любой текст, который будет распознан как адрес электронной почты или как параметр запроса в формате ключ = значение. После удаления недопустимого текста выполняется обычный сбор данных.
Важно помнить, что Google перекладывает ответственность за соблюдение любых регламентов на владельцев сайтов, в том числе и за отслеживание конфиденциальной информации о пользователях, поэтому обязательно будьте начеку и старайтесь избегать подобных ситуаций. А чтобы нам было проще с обнаружением параметров, которые могут быть сохранены в URL-адресе, разработчики добавили инструмент проверки удаления данных.
В качестве примера я добавил два параметра запросов URL в список исключения - name и email, а в поле проверки удаления указал еще один - phone. Таким образом, ссылка получилась такого вида:
1 |
https://osipenkov.ru/?name=yakov&email=ya.osipenkov@icloud.com&phone=79169793610 |
Нажав на кнопку Посмотреть удаление данных, Google отобразит итоговый результат с учетом удаленных параметров:
1 |
https://osipenkov.ru/?name=(redacted)&email=(redacted)&phone=79169793610 |
, где (redacted) - измененное значение параметра события.
Параметр phone передал значение 79169793610 полностью, поскольку он не был добавлен в поле исключения.
После того, как вы зададите все необходимые параметры запросов URL, не забудьте сохранить изменения, нажав в правом верхнем углу кнопку Сохранить. Рядом с настройкой удаления начнет отображаться новое уведомление, характеризующее использование 1 или нескольких ключей:
В любой момент вы можете скорректировать окончательный список ключей параметров запросов URL или вовсе отключить новые функции, изменив положение переключателей.
Дополнительная информация по удалению данных
- удаление данных выполняется на стороне клиента после того, как Google Analytics 4 изменит или создаст событие (выполняются на стороне клиента/в браузере пользователя), но до отправки на сервер Google;
- удаление данных проверяет любые параметры запроса URL с кодировкой в формате URL, в том числе с любыми символами Unicode, которые поддерживаются браузерами;
- удаление данных может ошибочно удалять строки, которые не являются адресами электронной почты, например, если в тексте есть символ @ и имя домена верхнего уровня;
- удаление данных не анализирует значения в сегменте HTTP-header, (например, заголовок referer в некоторых старых браузерах может содержать параметры запроса);
- удаление данных не сможет защитить от сбора информации, позволяющей идентифицировать личность, если сбор выполняется через Measurement Protocol или функцию импорта данных.