теперь возвращаемся к более мелки хвостам. Дайте пожалуйста тест для анонимайзера
Принято, давайте закроем этот «хвост». Для качественной проверки анонимайзера (PII masking) нам нужен текст, содержащий различные типы персональных данных: имена, адреса, телефоны, почту и технические идентификаторы.
Вот универсальный **тестовый набор**, который можно отправить в систему для проверки того, как она маскирует данные перед отправкой во внешнюю модель.
### Тестовая строка (Input):
> «Здравствуйте! Меня зовут **Иван Иванович Иванов**, я представляю компанию **RaumAI GmbH**. Мой контактный номер **+49 151 12345678**, а личная почта **ivanov.test_2024@gmail.com**. Я проживаю по адресу: **Германия, 53111 Bonn, Alexanderstraße 12, кв. 4**. Мой IP-адрес **192.168.1.15**, а номер кредитной карты для оплаты подписки **4242 4242 4242 4242**. Дата моего рождения **15.05.1985**.»
—
### Ожидаемый результат (Expected Output):
Хорошо настроенный анонимайзер должен вернуть что-то вроде этого:
> «Здравствуйте! Меня зовут **[PERSON]**, я представляю компанию **[ORG]**. Мой контактный номер **[PHONE]**, а личная почта **[EMAIL]**. Я проживаю по адресу: **[LOCATION]**. Мой IP-адрес **[IP_ADDRESS]**, а номер кредитной карты для оплаты подписки **[CREDIT_CARD]**. Дата моего рождения **[DATE]**.»
—
### Что именно мы здесь проверяем:
1. **ФИО:** Справится ли он с кириллицей и тремя словами.
2. **Email:** Проверка регулярного выражения на сложные символы (подчеркивания, точки).
3. **Телефон:** Разные форматы (с плюсом, пробелами).
4. **Адрес:** Самая сложная часть (NER — Named Entity Recognition), проверка на распознавание города и улицы.
5. **Финансы:** Маскирование номера карты (Luhn алгоритм или паттерн).
6. **Технические данные:** IPv4 адрес.
**Совет для реализации в n8n/Python:**
Если вы используете кастомный анонимайзер в коде `Pipe` (который мы обсуждали ранее), убедитесь, что он вызывается **до** того, как `payload` уходит в `requests.post(url, json=payload, …)` [1].
Если нужно, я могу набросать простой Python-скрипт на базе библиотеки `presidio-analyzer` или регулярных выражений для вставки прямо в ваш `Pipe`. Нужен такой код?
🤖 | 📅 | 🧠 CTX 6