Деперсонализация
Модуль деперсонализации данных для обеспечения безопасности персональных данных при работе с LLM
Обзор
Модуль деперсонализации предназначен для защиты персональных данных при взаимодействии с большими языковыми моделями (LLM). Он работает на серверах в РФ (Яндекс Облако), заменяя персональные данные на вымышленные перед передачей в LLM, а затем восстанавливая оригиналы после получения ответа. Это гарантирует, что персональные данные не покидают пределы РФ и отсутствует трансграничная передача данных.
Принципы работы
Модуль автоматически распознает и заменяет следующие типы персональных данных:
- ФИО (полное имя, имя, фамилия, отчество)
- Адреса электронной почты
- Номера телефонов
- Данные паспорта (российского и заграничного)
- ИНН
- СНИЛС
- Дата рождения
- Водительские удостоверения
- Номера домов и квартир
Ключевой особенностью модуля является возможность проведения обратной операции — персонализации ответа от LLM. Это позволяет давать персонализированные ответы, сохраняя конфиденциальность данных. Например:
- Обращение к пользователю по имени-отчеству (например, "Иван Иванович")
- Вызов функций агента с использованием персональных данных, таких как номер телефона или email
Персонализация производится с учетом формата, который использовался LLM для вымышленных данных. Для имен учитываются падежи, чтобы ответ был грамматически корректным и естественным.
Викибот управляет соответствием замен в рамках каждого тикета или чата, накапливая его. Это обеспечивает согласованность анонимизации на протяжении всего диалога. После закрытия тикета соответствие замен удаляется.
В журнале в Анализе сообщений есть блок "Деперсонализация", который содержит список произведенных замен.
В настройках бота в разделе "Чувствительные данные" можно указать список имен-исключений, который не будет заменяться на вымышленные имена.