Приложение к приказу Генерального директора
ООО «Хэдхантер» № 12/03-ОД от 14.12.2023 г.
Правила применения рекомендательных технологий
1. ООО «Хэдхантер» (ИНН 7718620740) (далее — «Общество») является владельцем сайта www.hh.ru (далее — «Сайт»), сайта и приложения Сетка www.setka.ru (далее — «Сетка»), сайта www.career.ru (далее — «Карьера»), а также владельцем запатентованной в реестре изобретений Российской Федерации за № 2711717 рекомендательной системы подбора персонала с использованием машинного обучения и с понижением размерности многомерных данных (далее — «Рекомендательная система»), на которых применяются информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети «Интернет», находящихся на территории Российской Федерации (далее — «Владелец информационного ресурса, на котором применяются рекомендательные технологии»).
2. Настоящие Правила применения рекомендательных технологий (далее — «Правила») содержат описание процессов и методов сбора, систематизации, анализа сведений, относящихся к предпочтениям пользователей сети «Интернет», предоставления информации на основе этих сведений, способов осуществления таких процессов и методов, а также описание видов сведений, относящихся к предпочтениям пользователей сети «Интернет», которые используются для предоставления информации с применением рекомендательных технологий, и источников получения таких сведений.
3. Владелец информационного ресурса, на котором применяются рекомендательные технологии, не допускает применение рекомендательных технологий, которые нарушают права и законные интересы граждан и организаций, а также не допускает применение рекомендательных технологий в целях предоставления информации с нарушением законодательства Российской Федерации.
4. Под рекомендательными технологиями здесь и далее понимаются программные комплексы, которые с помощью алгоритмических вычислений и машинного обучения на основании данных о пользователе или характеристиках элементов в системе осуществляют индивидуализированный подбор, а также ранжирование контента для конечного пользователя.
5. Для алгоритмических вычислений и машинного обучения Общество использует полученные от пользователей Сайта данные, а именно:
- данные о любых действиях пользователя на Сайте;
- данные о любых запросах пользователя на Сайте;
- данные из текстов резюме и вакансий;
- IP адрес;
- файлы cookies;
- идентификатор пользователя, присваиваемый сайтом;
- посещенные страницы;
- количество посещений страниц;
- информация о перемещении по страницам сайта (в т.ч. запись движения мыши, нажатий на ссылки и элементы сайта);
- длительность пользовательской сессии;
- точки входа (сторонние сайты, с которых пользователь по ссылке переходит на сайт);
- точки выхода (ссылки на сайте, по которым пользователь переходит на сторонние сайты);
- страна пользователя;
- геопозицию;
- регион пользователя;
- часовой пояс, установленный на устройстве пользователя;
- провайдер пользователя;
- браузер пользователя;
- цифровой отпечаток браузера (canvas fingerprint);
- доступные шрифты браузера;
- установленные плагины браузера;
- параметры WebGL браузера;
- тип доступных медиа-устройств в браузере;
- наличие ActiveX;
- перечень поддерживаемых языков на устройстве пользователя;
- архитектура процессора устройства пользователя;
- ОС пользователя;
- параметры экрана (разрешение, глубина цветности, параметры размещения страницы на экране);
- информация об использовании средств автоматизации при доступе на сайт;
- дата и время посещения сайта;
- источник перехода (UTM метка);
- значение UTM меток от source до content;
- уникальный идентификатор, присваиваемый интернет-сторонним сервисом, обеспечивающим обработку статистических данных;
- данные, содержащиеся в личном кабинете пользователя, зарегистрированного на Сайте;
- метрические данные;
- данные сетевого трафика.
5.1. Помимо перечисленных в п.5. настоящих Правил данных, Общество использует полученные от пользователей Сетки данные, а именно:
- идентификатор пользователя, присваиваемый Сеткой;
- данные о карьерном пути пользователя, которые берутся из одного из источников:
• данные указываются и редактируются пользователем вручную при регистрации в Сетке и в процессе использования приложения;
• данные берутся из резюме пользователя на Сайте в случае, если аккаунты Сетки и Сайта связались между собой (произошла авторизация по номеру телефона или через сервис HH ID, номер телефона в Сетке и на Сайте совпал и пользователь смог подтвердить свой номер с помощью одноразового кода, и/или использовался одинаковый токен авторизации в двух мобильных приложениях). - данные о реакциях на элементы контента (посты, вопросы, ответы);
- данные о связях пользователя (наличие и состав коннектов и подписчиков, вхождение в круги и сообщества);
- данные о просмотрах контента пользователем;
- метаданные постов, которые читает и создает пользователь, в том числе их семантика;
- данные о поисковых запросах в Сетке;
- данные о переходах по экранам и других действиях внутри Сетки.
5.2. Помимо перечисленных в п.5. настоящих Правил данных, Общество использует полученные от пользователей Карьеры данные, а именно:
- данные о карьерном пути пользователя, которые берутся из одного из источников:
• данные берутся из резюме пользователя на Сайте в случае, если вход на Карьеру осуществлен через Сайт. - данные о реакциях на элементы контента (вопросы, ответы);
- данные о просмотрах контента пользователем;
- метаданные постов, которые читает пользователь, в том числе их семантика;
- данные о поисковых запросах в Карьере;
- данные о переходах по экранам и других действиях внутри Карьеры.
6. Для работы рекомендательных технологий Общество применяет алгоритмы фильтрации на основе контента (алгоритмы градиентного бустинга) и коллаборативной фильтрации.
Данные, указанные в п.5. настоящих Правил, Общество оцифровывает и представляет в векторном виде. При фильтрации на основе контента алгоритмы рекомендуют контент, похожий на тот, который пользователь Сайта выбирал в прошлом или которые он изучает в настоящее время. При коллаборативной фильтрации используется информация о поведении пользователей с похожими интересами. Система находит пользователей или элементы с историей оценок, аналогичной текущему пользователю или элементу, и генерирует рекомендации на основании этой схожести.
7. Общество использует рекомендательные технологии как для обработки запросов работодателей при поиске в базе резюме, так и для обработки запросов соискателей при поиске вакансий, в целях быстрого предварительного отбора вакансий и резюме, из которых пользователь Сайта может выбрать наиболее подходящие.
В Сетке Общество использует рекомендательные технологии для предложения релевантного контента в ленте рекомендаций и вариантов подписок на людей и сообщества внутри приложения, а также для ранжирования постов в лентах подписок и рекомендаций.
В Карьере Общество использует рекомендательные технологии для предложения релевантного контента в ленте или рекомендаций в соответствующих разделах Карьеры, а также для ранжирования постов и иных информационных сообщений.
8. В рекомендательных технологиях Общество использует обучающую и рабочую базы данных, при этом обучающие последовательности формируются путем сортировки и обработки матриц обучающей базы данных на основании отзывов пользователей о степени соответствия представленных им результатов тематике запросов.
9. Процесс работы рекомендательных технологий Общества заключается в следующем:
- формируется обучающая индексная матрица, в качестве строк которой используются индексные строки, соответствующие документам обучающей базы данных;
- с использованием заранее заданной процедуры сжатия матриц обучающая индексная матрица сжимается с частичной потерей данных с понижением размерности для формирования сжатой индексной матрицы;
- строки сжатой индексной матрицы группируются по заранее заданным формальным признакам сходства, где документы, соответствующие сгруппированным строкам в одной группе, составляют обучающую группу документов;
- формируется решающая система, для обучения которой в качестве исходных данных используются индексные строки документов соответствующей обучающей группы документов, а в качестве ожидаемых результатов — отзывы пользователей для документов из обучающей группы;
- для поискового выражения пользователя формируется индексная табличная строка, в которой отдельные ячейки соответствуют заранее заданному признаку, а значения, занесенные в ячейку, соответствуют наличию соответствующего признака в поисковом выражении;
- для индексной строки поискового выражения, определяется один из заранее заданных формальных признаков сходства, соответствующий поисковому выражению;
- из рабочей базы данных отбираются документы, индексным строкам которых соответствуют признаки сходства, соответствующие поисковому выражению;
- пользователю представляются документы, отобранные решающей системой из документов, предварительно отобранных из базы данных.