Географические идентификаторы и местоположение в Google Analytics 4

28 июля, 2023

При построении Исследования в свободной форме в Google Analytics 4 вы можете выбрать несколько параметров, определяющих географию ваших пользователей с помощью идентификаторов - Идентификатор города, Идентификатор континента, Идентификатор региона, Идентификатор страны и Идентификатор субконтинента. Что они означают, где можно посмотреть полный список геокодов и как вообще Google Analytics 4 определяет местоположения пользователей?

Например, когда вы добавите параметры с географическими идентификаторами, ваше Исследование может выглядеть так:

Географические идентификаторы в Исследовании

Идентификаторы, которые можно выбрать в GA4:

  • Идентификатор города (City ID)
  • Идентификатор континента (Continent ID)
  • Идентификатор региона (Region ID)
  • Идентификатор страны (Country ID)
  • Идентификатор субконтинента (Subcontinent ID)

Географические параметры, такие как город, страна, континент и т.д. (то есть местоположение) в Google Analytics определяются на основе IP-адреса устройства пользователя. Полученные значения посетителя сопоставляются с информацией из базы данных по географическим идентификаторам, после чего в отчетах вы видите фактическое местоположение пользователя. Как вы понимаете, такой способ определения геоданных является приблизительным, поскольку ваш интернет-провайдер, вышки сотовой связи, браузеры и даже ваш антивирус могут изменять/переопределять или скрывать ваш IP-адрес. А он, в свою очередь, может отличаться от фактического IP-адреса. Другими словами, Google Analytics думает, что ваш IP-адрес - это IP 123, который находится в Нижнем Новгороде, а на самом деле вы делаете покупки на сайте в Москве и ваш настоящий IP-адрес XYZ.

Google Analytics предоставляет приблизительные данные о местоположении, выводя из IP-адресов следующие метаданные:

  • город (и его географическую широту и долготу);
  • континент;
  • страну;
  • регион;
  • субконтинент (и соответствующие идентификаторы).

Для трафика из Европейского союза (ЕС) информация об IP-адресах используется только для получения данных о местоположении, после чего сразу же удаляется. Она не регистрируется, не хранится и не используется для каких-либо других целей.

Помимо этого, значения стандартных географических параметров локализуются на язык пользователя. Это может усложнить обмен географическими данными с теми, кто говорит на других языках или работает с другими инструментами.

Примечание: именно поэтому в отчетах аналитики вы видите определенные аномалии по обращениям из городов, на которые вы либо не настраивали рекламу (не таргетировались), либо вообще не имеете каналы сбыта и свою аудиторию.

Но если даже это так, то где посмотреть список всех географических идентификаторов, на которые ориентируется Google Analytics при определении местоположения пользователя? Ниже представлены списки, которые используются не только в Google Analytics, но и в Google Ads. Это так называемые географические цели (геотаргетинг):

Эти базы постоянно обновляются. На момент публикации этой статьи последняя версия датируется 03.05.2023.

Географические идентификаторы Google Analytics

Вы можете скачать этот файл в формате .CSV и открыть на своем компьютере с помощью Microsoft Excel. А используя функцию Текст по столбцам с разделителем запятая, вы получите классическую таблицу с данными по столбцам:

Географические идентификаторы (фрагмент в Excel)

Эти параметры основаны на широко используемых в отрасли стандартах, что упрощает обмен данными с другими пользователями и приложениями:

Например, на первом скриншоте этого материала Идентификатор города равен 1011969. Google Analytics распознает его как RU - MOW. Согласно стандарту Международной организации по стандартизации (ISO 3166-2), который определяет геокоды, это Москва. Мы можем выполнить простой поиск по файлу географических идентификаторов в Excel и убедиться, что это действительно так:

Идентификатор города (Criteria ID = 1011969) соответствует Москве

Также есть очень хороший сайт analyticscodes.com, на котором представлены все географические идентификаторы, используемые в Google Analytics.

Географические идентификаторы на сайте analyticscodes.com

Вбив в адресной строке нужный идентификатор после https://analyticscodes.com/id/ вы увидите итоговое местоположение. Например, 1011969 для Москвы:

Поиск на сайте analyticscodes.com по геокодам

Такие идентификаторы существуют со времен предыдущей версии Google Analytics (Universal Analytics). Но этот метод определения местоположения также используется и в новой версии GA4.

Использование IP-адреса при определении местоположения в качестве основного критерия является серьезной проблемой, особенно для компаний, работавших в регионах, которые не обозначены на карте. Например, в Северной Америке это могут быть восточные, центральные и западные штаты или провинции, а в Европе - северные, центральные или южные группы стран. Именно поэтому в GA3 вместо определения регионов по IP вы могли задать собственные регионы с помощью набора параметров географических идентификаторов, используя функцию Импорт данных.

Импорт данных по геоданным в Universal Analytics (Идентификатор города, Идентификатор региона, Код ISO страны и Код субконтинента)

Пока такой настройки в импорте данных для Google Analytics 4 нет. Возможно, разработчики добавят ее в ближайшем будущем. Но сами идентификаторы можно использовать в Исследованиях.

При сборе данных Google Analytics 4 не регистрирует и не сохраняет IP-адреса. Прежде чем регистрировать данные о пользователях из Европейского союза (ЕС) через размещенные в ЕС домены и серверы, Google Analytics исключает из них все IP-адреса.

Кроме того, в GA4 предусмотрены настройки, с помощью которых можно:

  • отключить сбор данных сигналов Google (Google Signals) в зависимости от региона;

Сбор данных - Сбор данных с помощью сигналов Google в конкретных регионах

  • отключить сбор точных данных о местоположении и устройствах в зависимости от региона (по умолчанию сбор производится)

Сбор данных - Сбор данных о местоположении и устройствах в конкретных регионах

Если вы отключите его, GA4 не будет собирать следующие данные:

  • город;
  • широта расположения города;
  • долгота расположения города;
  • промежуточная версия браузера;
  • строка User-Agent браузера;
  • бренд устройства;
  • модель устройства;
  • название устройства;
  • промежуточная версия операционной системы;
  • промежуточная версия платформы;
  • разрешение экрана.

Если вы измените настройки и отключите сбор для региона, то Google Analytics 4 перестанет собирать новые данные, но будет хранить ранее собранные данные. Если вы отключите сбор точных данных о местоположении и устройствах для региона, количество смоделированных конверсий в этом регионе значительно уменьшится. Это также повлияет на моделирование конверсий и отчеты в связанных аккаунтах Google Рекламы и Поисковой рекламы 360.

Подробнее об этом читайте в официальной справке Google.

Примечание: деидентифицировать IP-адреса в Google Analytics 4 не обязательно, поскольку они не регистрируются и не сохраняются.

Однако сам механизм определения в GA4 несколько запутан. Например, при отправке события через Measurement Protocol, в котором передается город или страна пользователя, данные в отчетах вашего ресурса Google Analytics 4 буду отображаться как (not set). Все дело в том, что информацию о местоположении можно получить только с помощью автоматического сбора из глобального тега (Global Site Tag), Google Tag Manager или Google Analytics для Firebase. Об этом очень кратко написано в официальной документации разработчиков Google.

Значение (not set) / (не указано) в отчетах по географическим данным может появляться не только при отправке события через Measurement Protocol, но и просто. Вы можете убедиться в этом самостоятельно, открыв отчет по источникам трафика и добавив в качестве дополнительного параметра Город или Регион:

(not set) в стандартных отчетах Google Analytics 4 по геоданным

Наверняка и в вашем счетчике GA4 будут строчки с (not set). Почему так происходит?

Все дело в GDPR, TCF v 2.0 и Европейском союзе. GDPR рассматривает IP-адрес как PII (Personally Identifiable Information, личную информацию). В современном цифровом мире конфиденциальность данных выходит на первый план. Хоть IP-адрес не позволяет идентифицировать конкретного человека и точно раскрыть его местоположение, он все равно приравнивается к личной информации. Именно поэтому Google должен соблюдать правила игры и учитывать законы различных стран и регуляторов. К сожалению, нам как владельцев счетчиков GA4 остается лишь смирится с данными ограничениями, и в некоторых случаях просто ими пренебрегать.

Также точность местоположения зависит от степени детализации вашего отчета. Например, создав Исследование только по параметру Страна, ваш отчет может содержать полную информацию:

Статистика по параметру "Страна"

Но как только вы добавите параметр Регион, то точность данных будет снижена - в таблице появятся строки с (not set):

Статистика по параметру "Страна" и "Регион"

А если еще применить и параметр Город, то количество строчек с (not set) станет больше:

Статистика по параметру "Страна", "Регион" и "Город"

Связав аккаунты Google Analytics 4 и BigQuery, вы получите возможность использования следующих параметров географических данных (все определяются по IP-адресу):

  • geo.continent - континент, где были зарегистрированы события;
  • geo.sub_continent - макрорегион, где были зарегистрированы события;
  • geo.country - страна, где были зарегистрированы события;
  • geo.region - регион, где были зарегистрированы события;
  • geo.metro - городская агломерация, где были зарегистрированы события;
  • geo.city - город, где были зарегистрированы события.

Пример SQL-запроса в Google BigQuery

Ключевой вывод, который можно сделать исходя из того, что вы узнали об определении местоположении пользователя в Google Analytics 4:

  • не принимать важных решений ТОЛЬКО на основе географических данных;
  • поскольку местоположение пользователя определяется по IP-адресу, то данные в отчетах могут быть неверными;
  • статистика в вашем ресурсе GA4 будет неполной, поскольку Google соблюдает GDPR и заботится о конфиденциальности данных пользователей;
  • чем больше географических параметров вы будете добавлять в отчет, тем больше будет (not set). При увеличении степени детализации отчета точность данных снижается;
  • поскольку Google соблюдает законы и регламенты различных стран, ваш статистика в отчетах может быть неполной. Нам остается только с этим смириться.

Получайте бесплатные уроки и фишки

По контекстной, таргетированной рекламе и аналитике