Деперсонализация

Модуль деперсонализации данных для обеспечения безопасности персональных данных при работе с LLM

Обзор

Модуль деперсонализации предназначен для защиты персональных данных при взаимодействии с большими языковыми моделями (LLM). Он работает на серверах в РФ (Яндекс Облако), заменяя персональные данные на вымышленные перед передачей в LLM, а затем восстанавливая оригиналы после получения ответа. Это гарантирует, что персональные данные не покидают пределы РФ и отсутствует трансграничная передача данных.

Принципы работы

Модуль автоматически распознает и заменяет следующие типы персональных данных:

  • ФИО (полное имя, имя, фамилия, отчество)
  • Адреса электронной почты
  • Номера телефонов
  • Данные паспорта (российского и заграничного)
  • ИНН
  • СНИЛС
  • Дата рождения
  • Водительские удостоверения
  • Номера домов и квартир

Ключевой особенностью модуля является возможность проведения обратной операции — персонализации ответа от LLM. Это позволяет давать персонализированные ответы, сохраняя конфиденциальность данных. Например:

  • Обращение к пользователю по имени-отчеству (например, "Иван Иванович")
  • Вызов функций агента с использованием персональных данных, таких как номер телефона или email

Персонализация производится с учетом формата, который использовался LLM для вымышленных данных. Для имен учитываются падежи, чтобы ответ был грамматически корректным и естественным.

Викибот управляет соответствием замен в рамках каждого тикета или чата, накапливая его. Это обеспечивает согласованность анонимизации на протяжении всего диалога. После закрытия тикета соответствие замен удаляется.

В журнале в Анализе сообщений есть блок "Деперсонализация", который содержит список произведенных замен.

В настройках бота в разделе "Чувствительные данные" можно указать список имен-исключений, который не будет заменяться на вымышленные имена.

На этой странице