Перейти к содержимому
Назад
5 мин чтения

Shadow AI: 6 правил безопасного использования внешних моделей

Как использовать ChatGPT, Claude и Gemini для работы без утечки конфиденциальных данных — практические правила и чек-лист

AI Security Enterprise Shadow AI

Shadow AI: ТОП-6 правил безопасного использования внешних моделей

Давайте начистоту. Внутренние модели отстают от рынка — и вы это знаете. ChatGPT, Claude, Gemini выдают результат, который корпоративные решения пока не могут повторить. И люди уже используют их для работы — 77% сотрудников вставляют конфиденциальные данные во внешние AI-модели, причём 82% делают это через личные аккаунты, мимо всех корпоративных радаров.

Запрещать бессмысленно — запрет загоняет использование в тень, где контроля ноль. Помните Samsung? Инженеры скормили ChatGPT проприетарный код полупроводников для дебага — и данные утекли в OpenAI. Компания запретила ChatGPT, но поезд уже ушёл.

Поэтому мы идём другим путём: не запрещаем, а учим делать это безопасно. Вот 6 конкретных правил.


1. Вычищайте персональные данные перед отправкой

Это правило номер один. Прежде чем что-то отправить во внешнюю модель, уберите всё, что идентифицирует конкретного человека.

Что удалять: ФИО, номера телефонов, email, адреса, даты рождения, номера карт лояльности, любые ID клиентов.

Как делать на практике:

  • В Excel/таблицах — удалите или замените первые 2-3 столбца с персональными данными перед копированием
  • В тексте — замените: «Иванов Пётр Сергеевич, +7-916-XXX»«[Клиент А]»
  • Если данных много — прогоните через внутреннюю модель с промптом «замени все персональные данные на плейсхолдеры»

Риск: нарушение 152-ФЗ. Трансграничная передача персональных данных без правового основания — это штрафы и репутационный удар. Да и в целом “не круто”


2. Маскируйте названия компаний и партнёров

Модель не теряет полезности, если вместо «Наша компания» вы напишете «[Компания X]», а вместо «поставщик Рога и Копыта» — «[Поставщик А]».

Простая таблица подстановок:

Реальные данныеЗамена
Название вашей компании[Компания]
Названия конкурентов[Конкурент А], [Конкурент Б]
Партнёры и поставщики[Поставщик А], [Партнёр Б]
Названия внутренних проектов[Проект X]

Почему это важно: внешняя модель может запомнить контекст и воспроизвести его другим пользователям. Даже если вероятность мала — зачем рисковать?


3. Используйте «метод бутерброда»: внутренняя модель → внешняя → вы

Мощнейший приём для работы с большими массивами данных:

  1. Внутренняя модель — обезличивает и подготавливает данные (удаляет PII, маскирует названия)
  2. Внешняя модель (ChatGPT/Claude) — делает качественный анализ, генерацию, структурирование
  3. Вы — вручную возвращаете реальные данные в финальный результат

Это как гибридная архитектура, которую Microsoft рекомендует для enterprise: приватная обработка по умолчанию, облако — только для обезличенного.


4. Работайте через абстракции и гипотетические сценарии

Не спрашивайте: «Проанализируй этот отчёт о продажах нашей сети за Q4» — с приложенным реальным файлом.

Спрашивайте: «Какие метрики лучше всего показывают эффективность промо-кампаний в ритейле? Дай фреймворк анализа для сети с 15000+ точек».

Модель даст вам методологию и фреймворк — а данные вы подставите сами. 80% пользы, 0% риска.


5. Отключите обучение модели на ваших данных

Это занимает 30 секунд, но почти никто не делает:

  • ChatGPT: Settings → Data Controls → выключите «Improve the model for everyone» (инструкция OpenAI)
  • Claude: Settings → выключите «Help improve Claude»
  • Gemini: отключите Gemini Apps Activity в настройках аккаунта Google

Без этого всё, что вы пишете, может использоваться для обучения модели и теоретически всплыть в ответах другим пользователям. Но гарантий тут нет…


6. Применяйте чек-лист перед каждой отправкой

Перед тем как нажать Enter, пробегите глазами:

  • ☐ Нет имён (моих, коллег, клиентов, партнёров)
  • ☐ Нет названий компаний если это для вас “важно”
  • ☐ Нет финансовых показателей в абсолютных цифрах
  • ☐ Нет номеров телефонов, email, адресов
  • ☐ Нет паролей от учеток и баз данных, API-ключей, токенов авторизации в какие-то системы
  • ☐ Нет дат, которые идентифицируют конкретные события
  • ☐ Отключено обучение модели на моих данных

Звучит как паранойя? Возможно. Но это 7-10 минут и защищает от проблем, которые стоят миллионы.


Стоп-лист: что НЕ загружать во внешние модели

Есть данные, которые невозможно или крайне сложно обезличить. Для работы с ними — только внутренние инструменты, даже если качество ниже.

Тип данныхПочему нельзя
Клиентские базы и выгрузки из CRMСодержат десятки связанных полей — даже без ФИО можно восстановить личность по комбинации признаков
Код с credentials и API-ключамиОдин вставленный ключ = прямой доступ к системам. Samsung потерял так проприетарный код
Договоры и юридические документыСодержат коммерческую тайну, условия сделок и обязательства — утечка может лишить правовой защиты trade secrets
Полные финансовые отчётыИнсайдерская информация. Даже в Enterprise-версиях модели это зона повышенного риска
Персональные данные сотрудниковЗарплаты, оценки, медицинские данные — прямое нарушение 152-ФЗ при передаче третьим лицам
Стратегические документы и протоколы совещанийПланы развития, M&A, ценовые стратегии — core IP компании

Правило большого пальца: если в данных есть хотя бы одно поле, по которому можно идентифицировать конкретного человека или компанию, и вы не можете это поле убрать без потери смысла — используйте внутреннюю модель.


Внешние AI-модели — это мощнейший инструмент. Но как с любым мощным инструментом — нужна техника безопасности. Эти 6 правил не убивают продуктивность. Они позволяют получить 90% пользы от лучших моделей рынка при минимальном риске.