Географические идентификаторы и местоположение в Google Analytics 4
При построении Исследования в свободной форме в Google Analytics 4 вы можете выбрать несколько параметров, определяющих географию ваших пользователей с помощью идентификаторов - Идентификатор города, Идентификатор континента, Идентификатор региона, Идентификатор страны и Идентификатор субконтинента. Что они означают, где можно посмотреть полный список геокодов и как вообще Google Analytics 4 определяет местоположения пользователей?
Например, когда вы добавите параметры с географическими идентификаторами, ваше Исследование может выглядеть так:
Идентификаторы, которые можно выбрать в GA4:
- Идентификатор города (City ID)
- Идентификатор континента (Continent ID)
- Идентификатор региона (Region ID)
- Идентификатор страны (Country ID)
- Идентификатор субконтинента (Subcontinent ID)
Географические параметры, такие как город, страна, континент и т.д. (то есть местоположение) в Google Analytics определяются на основе IP-адреса устройства пользователя. Полученные значения посетителя сопоставляются с информацией из базы данных по географическим идентификаторам, после чего в отчетах вы видите фактическое местоположение пользователя. Как вы понимаете, такой способ определения геоданных является приблизительным, поскольку ваш интернет-провайдер, вышки сотовой связи, браузеры и даже ваш антивирус могут изменять/переопределять или скрывать ваш IP-адрес. А он, в свою очередь, может отличаться от фактического IP-адреса. Другими словами, Google Analytics думает, что ваш IP-адрес - это IP 123, который находится в Нижнем Новгороде, а на самом деле вы делаете покупки на сайте в Москве и ваш настоящий IP-адрес XYZ.
Google Analytics предоставляет приблизительные данные о местоположении, выводя из IP-адресов следующие метаданные:
- город (и его географическую широту и долготу);
- континент;
- страну;
- регион;
- субконтинент (и соответствующие идентификаторы).
Для трафика из Европейского союза (ЕС) информация об IP-адресах используется только для получения данных о местоположении, после чего сразу же удаляется. Она не регистрируется, не хранится и не используется для каких-либо других целей.
Помимо этого, значения стандартных географических параметров локализуются на язык пользователя. Это может усложнить обмен географическими данными с теми, кто говорит на других языках или работает с другими инструментами.
Примечание: именно поэтому в отчетах аналитики вы видите определенные аномалии по обращениям из городов, на которые вы либо не настраивали рекламу (не таргетировались), либо вообще не имеете каналы сбыта и свою аудиторию.
Но если даже это так, то где посмотреть список всех географических идентификаторов, на которые ориентируется Google Analytics при определении местоположения пользователя? Ниже представлены списки, которые используются не только в Google Analytics, но и в Google Ads. Это так называемые географические цели (геотаргетинг):
- полный список географических идентификаторов для Google Analytics;
- полный список геотаргетинга для Google Ads;
Эти базы постоянно обновляются. На момент публикации этой статьи последняя версия датируется 03.05.2023.
Вы можете скачать этот файл в формате .CSV и открыть на своем компьютере с помощью Microsoft Excel. А используя функцию Текст по столбцам с разделителем запятая, вы получите классическую таблицу с данными по столбцам:
Эти параметры основаны на широко используемых в отрасли стандартах, что упрощает обмен данными с другими пользователями и приложениями:
- Идентификатор города - Geographical Criteria ID
- Код ISO страны - ISO-3166-1 alpha-2
- Идентификатор региона - Geographical Criteria ID
- Код субконтинента - UN M.49
Например, на первом скриншоте этого материала Идентификатор города равен 1011969. Google Analytics распознает его как RU - MOW. Согласно стандарту Международной организации по стандартизации (ISO 3166-2), который определяет геокоды, это Москва. Мы можем выполнить простой поиск по файлу географических идентификаторов в Excel и убедиться, что это действительно так:
Также есть очень хороший сайт analyticscodes.com, на котором представлены все географические идентификаторы, используемые в Google Analytics.
Вбив в адресной строке нужный идентификатор после https://analyticscodes.com/id/ вы увидите итоговое местоположение. Например, 1011969 для Москвы:
Такие идентификаторы существуют со времен предыдущей версии Google Analytics (Universal Analytics). Но этот метод определения местоположения также используется и в новой версии GA4.
Использование IP-адреса при определении местоположения в качестве основного критерия является серьезной проблемой, особенно для компаний, работавших в регионах, которые не обозначены на карте. Например, в Северной Америке это могут быть восточные, центральные и западные штаты или провинции, а в Европе - северные, центральные или южные группы стран. Именно поэтому в GA3 вместо определения регионов по IP вы могли задать собственные регионы с помощью набора параметров географических идентификаторов, используя функцию Импорт данных.
Пока такой настройки в импорте данных для Google Analytics 4 нет. Возможно, разработчики добавят ее в ближайшем будущем. Но сами идентификаторы можно использовать в Исследованиях.
При сборе данных Google Analytics 4 не регистрирует и не сохраняет IP-адреса. Прежде чем регистрировать данные о пользователях из Европейского союза (ЕС) через размещенные в ЕС домены и серверы, Google Analytics исключает из них все IP-адреса.
Кроме того, в GA4 предусмотрены настройки, с помощью которых можно:
- отключить сбор данных сигналов Google (Google Signals) в зависимости от региона;
- отключить сбор точных данных о местоположении и устройствах в зависимости от региона (по умолчанию сбор производится)
Если вы отключите его, GA4 не будет собирать следующие данные:
- город;
- широта расположения города;
- долгота расположения города;
- промежуточная версия браузера;
- строка User-Agent браузера;
- бренд устройства;
- модель устройства;
- название устройства;
- промежуточная версия операционной системы;
- промежуточная версия платформы;
- разрешение экрана.
Если вы измените настройки и отключите сбор для региона, то Google Analytics 4 перестанет собирать новые данные, но будет хранить ранее собранные данные. Если вы отключите сбор точных данных о местоположении и устройствах для региона, количество смоделированных конверсий в этом регионе значительно уменьшится. Это также повлияет на моделирование конверсий и отчеты в связанных аккаунтах Google Рекламы и Поисковой рекламы 360.
Подробнее об этом читайте в официальной справке Google.
Примечание: деидентифицировать IP-адреса в Google Analytics 4 не обязательно, поскольку они не регистрируются и не сохраняются.
Однако сам механизм определения в GA4 несколько запутан. Например, при отправке события через Measurement Protocol, в котором передается город или страна пользователя, данные в отчетах вашего ресурса Google Analytics 4 буду отображаться как (not set). Все дело в том, что информацию о местоположении можно получить только с помощью автоматического сбора из глобального тега (Global Site Tag), Google Tag Manager или Google Analytics для Firebase. Об этом очень кратко написано в официальной документации разработчиков Google.
Значение (not set) / (не указано) в отчетах по географическим данным может появляться не только при отправке события через Measurement Protocol, но и просто. Вы можете убедиться в этом самостоятельно, открыв отчет по источникам трафика и добавив в качестве дополнительного параметра Город или Регион:
Наверняка и в вашем счетчике GA4 будут строчки с (not set). Почему так происходит?
Все дело в GDPR, TCF v 2.0 и Европейском союзе. GDPR рассматривает IP-адрес как PII (Personally Identifiable Information, личную информацию). В современном цифровом мире конфиденциальность данных выходит на первый план. Хоть IP-адрес не позволяет идентифицировать конкретного человека и точно раскрыть его местоположение, он все равно приравнивается к личной информации. Именно поэтому Google должен соблюдать правила игры и учитывать законы различных стран и регуляторов. К сожалению, нам как владельцев счетчиков GA4 остается лишь смирится с данными ограничениями, и в некоторых случаях просто ими пренебрегать.
Также точность местоположения зависит от степени детализации вашего отчета. Например, создав Исследование только по параметру Страна, ваш отчет может содержать полную информацию:
Но как только вы добавите параметр Регион, то точность данных будет снижена - в таблице появятся строки с (not set):
А если еще применить и параметр Город, то количество строчек с (not set) станет больше:
Связав аккаунты Google Analytics 4 и BigQuery, вы получите возможность использования следующих параметров географических данных (все определяются по IP-адресу):
- geo.continent - континент, где были зарегистрированы события;
- geo.sub_continent - макрорегион, где были зарегистрированы события;
- geo.country - страна, где были зарегистрированы события;
- geo.region - регион, где были зарегистрированы события;
- geo.metro - городская агломерация, где были зарегистрированы события;
- geo.city - город, где были зарегистрированы события.
Ключевой вывод, который можно сделать исходя из того, что вы узнали об определении местоположении пользователя в Google Analytics 4:
- не принимать важных решений ТОЛЬКО на основе географических данных;
- поскольку местоположение пользователя определяется по IP-адресу, то данные в отчетах могут быть неверными;
- статистика в вашем ресурсе GA4 будет неполной, поскольку Google соблюдает GDPR и заботится о конфиденциальности данных пользователей;
- чем больше географических параметров вы будете добавлять в отчет, тем больше будет (not set). При увеличении степени детализации отчета точность данных снижается;
- поскольку Google соблюдает законы и регламенты различных стран, ваш статистика в отчетах может быть неполной. Нам остается только с этим смириться.