Современные модели искусственного интеллекта достигли уровня, при котором идентификация пользователей интернета, скрывающихся под псевдонимами, становится вопросом минут и минимальных финансовых затрат. Исследователи из Швейцарской высшей технической школы Цюриха совместно с Anthropic продемонстрировали способность ИИ автоматизировать процесс сопоставления анонимных профилей с реальными личностями, используя исключительно текстовые данные.
Принципы работы новой системы
В отличие от традиционных методов, требующих структурированных данных (например, таблиц или рейтингов) и трудоемкой ручной работы, разработанная технология оперирует с неструктурированными текстовыми сообщениями. Если ранее подобные расследования занимали часы, то теперь ИИ справляется с этой задачей полностью автоматически.
Экспериментальные данные и результаты
В рамках одного из экспериментов было проанализировано 338 пользователей платформы Hacker News, которые ранее публиковали ссылки на свои профили в LinkedIn. Из описаний были удалены имена и прямые ссылки на внешние ресурсы. Исходя из этих обезличенных текстовых публикаций, ИИ-агенту было поручено определить реальных владельцев аккаунтов. Модель корректно идентифицировала 226 профилей из 338, продемонстрировав точность около 90%. Это означает, что подавляющее большинство попыток идентификации оказалось успешным.
Механизм функционирования
Система функционирует поэтапно. На первом этапе языковая модель анализирует содержание сообщений, извлекая из них ключевые признаки: например, профессию, географическое местоположение, интересы и иные детали. На основе этой информации формируется профиль, который затем автоматически сопоставляется с потенциальными кандидатами, доступными в открытых источниках. Далее модель выполняет проверку наиболее вероятных совпадений и оценивает степень уверенности в полученном результате.
Дополнительные проверки и точность
Метод также был протестирован на публичных интервью ученых, посвященных применению ИИ. Несмотря на частичную редактуру исходных текстов, агент смог успешно идентифицировать личности как минимум 9 из 33 участников с высокой степенью точности.
Отличие от человеческого анализа
Исследователи подчеркивают, что эффективность ИИ не связана с его "интеллектуальным превосходством" над человеком-аналитиком. Модель использует те же косвенные признаки, что и человек: упоминания учебных заведений, проектов, местонахождения, хобби. Ключевое отличие заключается в скорости обработки данных и экономической эффективности. То, что раньше требовало значительных усилий и, как следствие, применялось крайне редко, теперь может быть масштабировано.
Изменение представлений об анонимности
Авторы исследования предупреждают о кардинальном изменении представлений об анонимности в интернете. Концепция "практической скрытности", когда пользователи рассчитывали на то, что, хотя их личность теоретически может быть раскрыта, никто не станет прикладывать для этого достаточных усилий, больше неактуальна. Потенциальные последствия применения подобного инструмента чрезвычайно широки: от преследования активистов и журналистов до целенаправленных мошеннических схем.