Shadow AI: 6 правил безопасного использования внешних моделей
Как использовать ChatGPT, Claude и Gemini для работы без утечки конфиденциальных данных — практические правила и чек-лист
Shadow AI: ТОП-6 правил безопасного использования внешних моделей
Давайте начистоту. Внутренние модели отстают от рынка — и вы это знаете. ChatGPT, Claude, Gemini выдают результат, который корпоративные решения пока не могут повторить. И люди уже используют их для работы — 77% сотрудников вставляют конфиденциальные данные во внешние AI-модели, причём 82% делают это через личные аккаунты, мимо всех корпоративных радаров.
Запрещать бессмысленно — запрет загоняет использование в тень, где контроля ноль. Помните Samsung? Инженеры скормили ChatGPT проприетарный код полупроводников для дебага — и данные утекли в OpenAI. Компания запретила ChatGPT, но поезд уже ушёл.
Поэтому мы идём другим путём: не запрещаем, а учим делать это безопасно. Вот 6 конкретных правил.
1. Вычищайте персональные данные перед отправкой
Это правило номер один. Прежде чем что-то отправить во внешнюю модель, уберите всё, что идентифицирует конкретного человека.
Что удалять: ФИО, номера телефонов, email, адреса, даты рождения, номера карт лояльности, любые ID клиентов.
Как делать на практике:
- В Excel/таблицах — удалите или замените первые 2-3 столбца с персональными данными перед копированием
- В тексте — замените: «Иванов Пётр Сергеевич, +7-916-XXX» → «[Клиент А]»
- Если данных много — прогоните через внутреннюю модель с промптом «замени все персональные данные на плейсхолдеры»
Риск: нарушение 152-ФЗ. Трансграничная передача персональных данных без правового основания — это штрафы и репутационный удар. Да и в целом “не круто”
2. Маскируйте названия компаний и партнёров
Модель не теряет полезности, если вместо «Наша компания» вы напишете «[Компания X]», а вместо «поставщик Рога и Копыта» — «[Поставщик А]».
Простая таблица подстановок:
| Реальные данные | Замена |
|---|---|
| Название вашей компании | [Компания] |
| Названия конкурентов | [Конкурент А], [Конкурент Б] |
| Партнёры и поставщики | [Поставщик А], [Партнёр Б] |
| Названия внутренних проектов | [Проект X] |
Почему это важно: внешняя модель может запомнить контекст и воспроизвести его другим пользователям. Даже если вероятность мала — зачем рисковать?
3. Используйте «метод бутерброда»: внутренняя модель → внешняя → вы
Мощнейший приём для работы с большими массивами данных:
- Внутренняя модель — обезличивает и подготавливает данные (удаляет PII, маскирует названия)
- Внешняя модель (ChatGPT/Claude) — делает качественный анализ, генерацию, структурирование
- Вы — вручную возвращаете реальные данные в финальный результат
Это как гибридная архитектура, которую Microsoft рекомендует для enterprise: приватная обработка по умолчанию, облако — только для обезличенного.
4. Работайте через абстракции и гипотетические сценарии
Не спрашивайте: «Проанализируй этот отчёт о продажах нашей сети за Q4» — с приложенным реальным файлом.
Спрашивайте: «Какие метрики лучше всего показывают эффективность промо-кампаний в ритейле? Дай фреймворк анализа для сети с 15000+ точек».
Модель даст вам методологию и фреймворк — а данные вы подставите сами. 80% пользы, 0% риска.
5. Отключите обучение модели на ваших данных
Это занимает 30 секунд, но почти никто не делает:
- ChatGPT: Settings → Data Controls → выключите «Improve the model for everyone» (инструкция OpenAI)
- Claude: Settings → выключите «Help improve Claude»
- Gemini: отключите Gemini Apps Activity в настройках аккаунта Google
Без этого всё, что вы пишете, может использоваться для обучения модели и теоретически всплыть в ответах другим пользователям. Но гарантий тут нет…
6. Применяйте чек-лист перед каждой отправкой
Перед тем как нажать Enter, пробегите глазами:
- ☐ Нет имён (моих, коллег, клиентов, партнёров)
- ☐ Нет названий компаний если это для вас “важно”
- ☐ Нет финансовых показателей в абсолютных цифрах
- ☐ Нет номеров телефонов, email, адресов
- ☐ Нет паролей от учеток и баз данных, API-ключей, токенов авторизации в какие-то системы
- ☐ Нет дат, которые идентифицируют конкретные события
- ☐ Отключено обучение модели на моих данных
Звучит как паранойя? Возможно. Но это 7-10 минут и защищает от проблем, которые стоят миллионы.
Стоп-лист: что НЕ загружать во внешние модели
Есть данные, которые невозможно или крайне сложно обезличить. Для работы с ними — только внутренние инструменты, даже если качество ниже.
| Тип данных | Почему нельзя |
|---|---|
| Клиентские базы и выгрузки из CRM | Содержат десятки связанных полей — даже без ФИО можно восстановить личность по комбинации признаков |
| Код с credentials и API-ключами | Один вставленный ключ = прямой доступ к системам. Samsung потерял так проприетарный код |
| Договоры и юридические документы | Содержат коммерческую тайну, условия сделок и обязательства — утечка может лишить правовой защиты trade secrets |
| Полные финансовые отчёты | Инсайдерская информация. Даже в Enterprise-версиях модели это зона повышенного риска |
| Персональные данные сотрудников | Зарплаты, оценки, медицинские данные — прямое нарушение 152-ФЗ при передаче третьим лицам |
| Стратегические документы и протоколы совещаний | Планы развития, M&A, ценовые стратегии — core IP компании |
Правило большого пальца: если в данных есть хотя бы одно поле, по которому можно идентифицировать конкретного человека или компанию, и вы не можете это поле убрать без потери смысла — используйте внутреннюю модель.
Внешние AI-модели — это мощнейший инструмент. Но как с любым мощным инструментом — нужна техника безопасности. Эти 6 правил не убивают продуктивность. Они позволяют получить 90% пользы от лучших моделей рынка при минимальном риске.