
В Москве появится собственная информационная система обезличенных персональных данных для обучения искусственного интеллекта, рассказал заместитель руководителя департамента информтехнологий (ДИТ) Москвы Владислав Шишмарев на First Russian Data Forum. По мнению экспертов, создание столичного «озера» данных может принести пользу бизнесу, но она будет зависеть от того, на каких условиях компании получат дата-сеты и смогут ли они воспользоваться результатами их обработки. Вслед за московской системой аналитики прогнозируют появление собственных «озер» данных и в других регионах страны
Обезличивая столицу
Москва планирует создание своего регионального «озера» данных, заявил заместитель руководителя департамента информтехнологий (ДИТ) Москвы Владислав Шишмарев, выступая на конференции First Russian Data Forum 17 апреля. Он отметил, что столичные власти интересует обмен данными государства и бизнеса.О том, что правительство Москвы разрабатывает информационную систему формирования региональных составов данных (ИС ФРСД), говорится в презентации Владислава Шишмарева (есть в распоряжении Forbes). Она предназначена для сбора и обезличивания личной информации жителей столицы, которая обрабатывается госорганами и подведомственными организациями правительства Москвы. Предполагается, что оператором системы будет ДИТ Москвы. «Обезличенные данные предполагается использовать для обучения алгоритмов искусственного интеллекта (ИИ), и их применение в других целях не предусмотрено», — отметили в ДИТ.
Сегодня в Москве реализуется около 100 проектов с использованием ИИ на разной стадии реализации,
Для просмотра ссылки необходимо нажать
Вход или Регистрация
на страницах столичного портала ai.mos.ru. Город располагает 25 наборами данных в таких сферах, как электронное правительство, строительство, экономика, культура и ЖКХ, которыми столица готова делиться с разработчиками ИИ-решений. Чтобы получить полный доступ к этим дата-сетам, достаточно отправить заявку, описав ИИ-проект, для развития которого планируется использовать данные, рассказали в ДИТ Москвы.Уже обезличенные данные будут передавать в «госозеро» данных, которое создает сейчас Минцифры, или же использовать внутри ИС ФРСД для дальнейшего применения в технологиях ИИ. Применять эти дата-сеты будут не только госорганы, но и бизнес для аналитических целей.
Напомним, в 2020 году был принят
Для просмотра ссылки необходимо нажать
Вход или Регистрация
, который ввел в Москве экспериментальный правовой режим (ЭПР) для стимулирования разработки и тестирования новых сервисов на базе ИИ. Компании-участники эксперимента получили широкие возможности по использованию ИИ, и среди прочего — доступ к данным граждан, включая изображения с камер распознавания лиц и обезличенные персональные данные, в том числе информацию о здоровье. При этом кто именно участвует в эксперименте, неясно.Спецпроект о технологиях ИИ власти Москвы
Для просмотра ссылки необходимо нажать
Вход или Регистрация
в апреле 2022 года. В рамках проекта разработчики ИИ могут получить дата-сеты для обучения своих алгоритмов. Среди таких
Для просмотра ссылки необходимо нажать
Вход или Регистрация
, например, количество жителей Москвы с привязкой к работе или проживанию в районе, находящихся на рассматриваемой территории в получасовом интервале, агрегированные данные о динамике перемещения населения по территории районов, информация о торговых объектах на территории Москвы и др.Закон о создании «госозера», принятый в августе 2024 года, предполагает разработку государственной информационной системы (ГИС), куда бизнес по запросу должен бесплатно передавать персональные данные своих клиентов и сотрудников, предварительно их обезличив. Согласие на передачу данных от пользователя в «госозеро» в законопроекте не предусмотрено. Доступ к этим данным в первый год после размещения получат только государственные пользователи, а потом — и все остальные, кого одобрит правительство. При этом для Москвы в законе сделано
Для просмотра ссылки необходимо нажать
Вход или Регистрация
в силу действующего в столице ЭПР.«Дата-центричное госуправление»
В Ассоциации больших данных (АБД, объединяет «Яндекс», VK, «Сбер», Газпромбанк, Т-Банк, Россельхозбанк, «Мегафон», «Ростелеком», билайн, МТС, ВТБ, Avito, HeadHunter и др.) создание информационной системы, объединяющей обезличенные данные государственных органов Москвы, поддерживают. Это создаст условия использования региональных данных для аналитики и формирования «дата-центричного государственного управления» в логистике, оказании социальных услуг и адресной поддержке, считают там. «Предоставление доступа к таким данным участникам рынка позволит привлечь их компетенции в области создания продуктов и сервисов на больших данных. Это будет способствовать повышению качества и доступности услуг для граждан, включая бытовые услуги малого и среднего бизнеса», — добавили в АБД.В отличие от федерального «озера» данных региональная система правительства Москвы предполагает сбор исключительно данных государственных органов и подведомственных организаций, подчеркнули в ассоциации. «Это, с одной стороны, позволяет ускорить формирование информационной системы, с другой — снижает риски раскрытия чувствительной информации, поскольку региональные данные, как правило, не содержат защищаемые законом тайны (например, тайну связи и банковскую тайну)», — заключили в АБД.
Москва пользуется большей свободой в обработке персональных данных, чем другие регионы, обращает внимание генеральный директор Института исследований интернета Карен Казарян. На текущий момент московский эксперимент — единственный успешный в сфере оборота данных, указывает он. «Похоже на то, что Москве интереснее поработать над обменом обезличенной информацией с бизнесом, в том числе получить данные, которые обычно не попадают в периметр московских сервисов. Какие именно это данные, можно только гадать: например, платежные данные, чеки, которые можно получить от банков, магазинов или маркетплейсов», — указывает Казарян.
Ролевая модель
Наиболее технологически развитые регионы хотели бы иметь собственную инфраструктуру, которая позволит им работать с большими объемами данных, рассуждает эксперт по защите персональных данных и соучредитель Regional Privacy Professionals Association (RPPA) Алексей Мунтян. «Федеральное «госозеро» данных для них может стать ролевой моделью для таких регионов. Свои подобные системы могут появится еще в нескольких регионах, например, в Санкт-Петербурге, Казани, Екатеринбурге и нескольких других крупных городах», — допускает он.Создание же столичного озера данных может принести пользу бизнесу, однако это будет зависеть от того, на каких условиях он получит дата-сеты и сможет ли воспользоваться результатами их обработки, считает Мунтян: «Это один из самых болезненных вопросов сейчас, когда мы говорим о «госозере» данных, потому что по закону выгрузить из него нельзя ничего, даже результатов анализа информации. Это сильно повлияет на эффективность всей этой затеи».
Кроме того, у экспертов сохраняются опасения, что даже обезличенные персональные данные все равно могут позволить идентифицировать их владельца. «Наибольшее количество рисков возникает при объединении и сопоставлении наборов данных. При тех или иных сценариях анализа данных они очень быстро свой идентифицирующий потенциал могут нарастить и стать уже сочетанием обезличенной и персональной информации», — добавил Алексей Мунтян.
Москва делает ставку на обезличивание персональных данных внутри своей системы — того самого регионального «озера» данных, считает технический директор IT-компании HFLabs Никита Назаров. По его мнению, в этом есть плюс — каждому столичному ведомству не придется заниматься обезличиванием своих данных и кого-то привлекать для этого. «Главный риск, который я вижу, — дублирование функций информационных систем: и московский ДИТ, и Минцифры будут хранить пересекающиеся объемы данных».
Для просмотра ссылки необходимо нажать
Вход или Регистрация