а хороший тест
Для проверки того, насколько качественно работает связка **Presidio + AI Agent**, нужен текст, который имитирует реальную рабочую ситуацию: переписку, заявку или договор.
Этот «хороший тест» содержит данные, которые легко ловит робот, и данные, которые может понять только ИИ (смысловые утечки).
### Тестовый текст (Input):
> «Уважаемые коллеги, направляю данные для оформления пропуска.
> Сотрудник: Волков Дмитрий Сергеевич, дата рождения 15.05.1988.
> Контакты для связи: +7 (900) 123-44-55 и d.volkov@global-tech.ru.
>
> Место жительства: 191025, Россия, г. Санкт-Петербург, ул. Марата, дом 5, кв. 12.
>
> Технические данные для настройки VPN:
> Статический IP: 192.168.1.105.
> Временный пароль для первой авторизации: Welcome_2024_Secure!
>
> Банковские реквизиты (IBAN): RU12 3456 7890 1234 5678 90.
> Организация: ООО «Глобал Технолоджи Системс».
> Прошу подтвердить получение.»
—
### Что должна сделать система (Ожидаемый результат):
1. **Робот (Presidio):** Должен сразу заменить телефон, почту, ФИО и IBAN на теги `[PHONE]`, `[EMAIL]`, `[PERSON]` и `[IBAN]` [1].
2. **ИИ-агент (Vertex AI):**
* **Адрес:** Должен увидеть весь блок «191025… кв. 12» и заменить его на один тег `[АДРЕС]` [1].
* **Секрет:** Должен понять, что «Welcome_2024_Secure!» — это пароль, и заменить его на `[СЕКРЕТ]` [1].
* **Организация:** Должен найти название компании и заменить на `[ORGANIZATION]` [1].
* **Дата:** Должен скрыть дату рождения как `[ДАТА]` [1].
* **Сохранение:** ИИ должен оставить нетронутыми теги, которые уже поставил робот [1].
### Как должен выглядеть идеальный ответ:
> «Уважаемые коллеги, направляю данные для оформления пропуска.
> Сотрудник: [PERSON], дата рождения [ДАТА].
> Контакты для связи: [PHONE] и [EMAIL].
>
> Место жительства: [АДРЕС].
>
> Технические данные для настройки VPN:
> Статический IP: [IP].
> Временный пароль для первой авторизации: [СЕКРЕТ].
>
> Банковские реквизиты (IBAN): [IBAN].
> Организация: [ORGANIZATION].
> Прошу подтвердить получение.»
—
### Почему это «хороший» тест:
* **Проверка на «склейку»:** Мы проверяем, не удаляет ли ИИ квадратные скобки, которые поставил JS-узел [1].
* **Проверка на контекст:** Робот не знает, что такое «Welcome_2024_Secure!», но ИИ по смыслу предложения понимает, что это пароль [1].
* **Проверка на адреса:** Немецкие или российские адреса часто пишутся по-разному, и только ИИ может надежно скрыть их целиком, включая индекс и номер квартиры [1].
Попробуйте прогнать этот текст. Если результат совпадет с «идеальным ответом» — ваша система анонимизации настроена безупречно.
🤖 | 📅 | 🧠 CTX 6