Меню
Закрыть
MSK-IX / Новости / Статистика зависит от подхода к сбору данных
20 сентября 2023 г.

Статистика зависит от подхода к сбору данных

Для анализа использования DNS-резолверов интернет APNIC разработал систему измерений на основе рекламных площадок. После 27 февраля 2022 года, когда Google перестал транслировать рекламные блоки на пользователей из российских сетей полнота и репрезентативность этих измерений существенно изменились. Это существенно ограничило возможность проверки различных гипотез относительно использования системы
Статистика зависит от подхода к сбору данных
Руководитель проекта DNS MSK-IX Павел Храмцов

Руководитель проекта DNS компании MSK-IX, научный руководитель проектов фонда развития сетевых технологий «Индата» Павел Храмцов представил на конференции TLDCON 2023 доклад «Статистика открытых резолверов: сравнение взгляда снаружи и изнутри».

На примере классической задачи по определению, какими резолверами пользуются конечные пользователи, он наглядно продемонстрировал, что все измерения сильно зависят от соответствия заявленных в методике условий проведения экспериментов реальным текущим условиям.

Резолвер – это инструмент, который выполняет процедуру поиска по распределенной информационной системе – системе DNS.

Для анализа использования DNS-резолверов интернет APNIC разработал систему измерений на основе рекламных площадок. Она построена на базе двух протоколов – HTTP и DNS. На рекламной площадке, например, в Googlе, размещается скрипт, который загружается с HTTP-сервера APNIC. Он позволяет определять IP-адерес конечного пользователя. Скрипт обращается через DNS-резолвер к авторитетному серверу APNIC. Соответственно, этот авторитетный сервер может определить IP-адрес резолвера. Все это заносится в единую баз данных, где сопоставляется и анализируется.

«Но, если посмотреть на итоговую картину, то статистика по миру и внутри России, будет заметно отличаться. В феврале 2022 года количество российского трафика, который приходит на сенсоры APNIC, уменьшилось кратно», – отметил Павел Храмцов.

При этом фактически популярность того же Google среди российских пользователей не снизилась. Но сам Google перестал транслировать рекламу на РФ, что и отразилось на работе скрипта APNIC.

В связи с этим возникает справедливый вопрос, насколько же репрезентативны данные, которые собирает APNIC после 27 февраля 2022 года. Если ставить задачу – узнать, какими резолверами пользуются потребители из РФ, эти данные неполны.

«Когда мы анализируем какие-то данные, всегда необходимо задаваться вопросами: применимы ли здесь методики, которые мы используем; являются ли данные репрезентативными; достаточно ли у нас источников измерений, чтобы получить достоверные данные», – резюмировал Павел Храмцов.

dn dn