Деперсонализация

Модуль деперсонализации данных для обеспечения безопасности персональных данных при работе с LLM

Обзор

Модуль деперсонализации предназначен для защиты персональных данных при взаимодействии с большими языковыми моделями (LLM). Он работает на серверах в РФ (Яндекс Облако), заменяя персональные данные на вымышленные перед передачей в LLM, а затем восстанавливая оригиналы после получения ответа. Это гарантирует, что персональные данные не покидают пределы РФ и отсутствует трансграничная передача данных.

Принципы работы

Модуль автоматически распознает и заменяет следующие типы персональных данных:

ФИО (полное имя, имя, фамилия, отчество)
Адреса электронной почты
Номера телефонов
Данные паспорта (российского и заграничного)
ИНН
СНИЛС
Дата рождения
Водительские удостоверения
Номера домов и квартир

Ключевой особенностью модуля является возможность проведения обратной операции — персонализации ответа от LLM. Это позволяет давать персонализированные ответы, сохраняя конфиденциальность данных. Например:

Обращение к пользователю по имени-отчеству (например, "Иван Иванович")
Вызов функций агента с использованием персональных данных, таких как номер телефона или email

Персонализация производится с учетом формата, который использовался LLM для вымышленных данных. Для имен учитываются падежи, чтобы ответ был грамматически корректным и естественным.

Викибот управляет соответствием замен в рамках каждого тикета или чата, накапливая его. Это обеспечивает согласованность анонимизации на протяжении всего диалога. После закрытия тикета соответствие замен удаляется.

В журнале в Анализе сообщений есть блок "Деперсонализация", который содержит список произведенных замен.

В настройках бота в разделе "Чувствительные данные" можно указать список имен-исключений, который не будет заменяться на вымышленные имена.

Деперсонализация

Обзор

Принципы работы

На этой странице