Shadow AI: ТОП-6 правил безопасного использования внешних моделей

Давайте начистоту. Внутренние модели отстают от рынка — и вы это знаете. ChatGPT, Claude, Gemini выдают результат, который корпоративные решения пока не могут повторить. И люди уже используют их для работы — 77% сотрудников вставляют конфиденциальные данные во внешние AI-модели, причём 82% делают это через личные аккаунты, мимо всех корпоративных радаров.

Запрещать бессмысленно — запрет загоняет использование в тень, где контроля ноль. Помните Samsung? Инженеры скормили ChatGPT проприетарный код полупроводников для дебага — и данные утекли в OpenAI. Компания запретила ChatGPT, но поезд уже ушёл.

Поэтому мы идём другим путём: не запрещаем, а учим делать это безопасно. Вот 6 конкретных правил.

1. Вычищайте персональные данные перед отправкой

Это правило номер один. Прежде чем что-то отправить во внешнюю модель, уберите всё, что идентифицирует конкретного человека.

Что удалять: ФИО, номера телефонов, email, адреса, даты рождения, номера карт лояльности, любые ID клиентов.

Как делать на практике:

В Excel/таблицах — удалите или замените первые 2-3 столбца с персональными данными перед копированием
В тексте — замените: «Иванов Пётр Сергеевич, +7-916-XXX» → «[Клиент А]»
Если данных много — прогоните через внутреннюю модель с промптом «замени все персональные данные на плейсхолдеры»

Риск: нарушение 152-ФЗ. Трансграничная передача персональных данных без правового основания — это штрафы и репутационный удар. Да и в целом “не круто”

2. Маскируйте названия компаний и партнёров

Модель не теряет полезности, если вместо «Наша компания» вы напишете «[Компания X]», а вместо «поставщик Рога и Копыта» — «[Поставщик А]».

Простая таблица подстановок:

Реальные данные	Замена
Название вашей компании	[Компания]
Названия конкурентов	[Конкурент А], [Конкурент Б]
Партнёры и поставщики	[Поставщик А], [Партнёр Б]
Названия внутренних проектов	[Проект X]

Почему это важно: внешняя модель может запомнить контекст и воспроизвести его другим пользователям. Даже если вероятность мала — зачем рисковать?

3. Используйте «метод бутерброда»: внутренняя модель → внешняя → вы

Мощнейший приём для работы с большими массивами данных:

Внутренняя модель — обезличивает и подготавливает данные (удаляет PII, маскирует названия)
Внешняя модель (ChatGPT/Claude) — делает качественный анализ, генерацию, структурирование
Вы — вручную возвращаете реальные данные в финальный результат

Это как гибридная архитектура, которую Microsoft рекомендует для enterprise: приватная обработка по умолчанию, облако — только для обезличенного.

4. Работайте через абстракции и гипотетические сценарии

Не спрашивайте: «Проанализируй этот отчёт о продажах нашей сети за Q4» — с приложенным реальным файлом.

Спрашивайте: «Какие метрики лучше всего показывают эффективность промо-кампаний в ритейле? Дай фреймворк анализа для сети с 15000+ точек».

Модель даст вам методологию и фреймворк — а данные вы подставите сами. 80% пользы, 0% риска.

5. Отключите обучение модели на ваших данных

Это занимает 30 секунд, но почти никто не делает:

ChatGPT: Settings → Data Controls → выключите «Improve the model for everyone» (инструкция OpenAI)
Claude: Settings → выключите «Help improve Claude»
Gemini: отключите Gemini Apps Activity в настройках аккаунта Google

Без этого всё, что вы пишете, может использоваться для обучения модели и теоретически всплыть в ответах другим пользователям. Но гарантий тут нет…

6. Применяйте чек-лист перед каждой отправкой

Перед тем как нажать Enter, пробегите глазами:

☐ Нет имён (моих, коллег, клиентов, партнёров)
☐ Нет названий компаний если это для вас “важно”
☐ Нет финансовых показателей в абсолютных цифрах
☐ Нет номеров телефонов, email, адресов
☐ Нет паролей от учеток и баз данных, API-ключей, токенов авторизации в какие-то системы
☐ Нет дат, которые идентифицируют конкретные события
☐ Отключено обучение модели на моих данных

Звучит как паранойя? Возможно. Но это 7-10 минут и защищает от проблем, которые стоят миллионы.

Стоп-лист: что НЕ загружать во внешние модели

Есть данные, которые невозможно или крайне сложно обезличить. Для работы с ними — только внутренние инструменты, даже если качество ниже.

Тип данных	Почему нельзя
Клиентские базы и выгрузки из CRM	Содержат десятки связанных полей — даже без ФИО можно восстановить личность по комбинации признаков
Код с credentials и API-ключами	Один вставленный ключ = прямой доступ к системам. Samsung потерял так проприетарный код
Договоры и юридические документы	Содержат коммерческую тайну, условия сделок и обязательства — утечка может лишить правовой защиты trade secrets
Полные финансовые отчёты	Инсайдерская информация. Даже в Enterprise-версиях модели это зона повышенного риска
Персональные данные сотрудников	Зарплаты, оценки, медицинские данные — прямое нарушение 152-ФЗ при передаче третьим лицам
Стратегические документы и протоколы совещаний	Планы развития, M&A, ценовые стратегии — core IP компании

Правило большого пальца: если в данных есть хотя бы одно поле, по которому можно идентифицировать конкретного человека или компанию, и вы не можете это поле убрать без потери смысла — используйте внутреннюю модель.

Внешние AI-модели — это мощнейший инструмент. Но как с любым мощным инструментом — нужна техника безопасности. Эти 6 правил не убивают продуктивность. Они позволяют получить 90% пользы от лучших моделей рынка при минимальном риске.