Группа ученых из Цюриха провела исследование, которое выявило удивительные способности чат-ботов, построенных на основе крупных языковых моделей, таких как ChatGPT. Эти боты могут точно угадывать личную информацию о своих собеседниках, включая такие детали, как раса, местоположение и профессия.
Исследователи сравнили языковые модели, разработанные такими компаниями, как OpenAI, Google, Meta и Anthropic, чтобы выяснить, насколько они могут точно угадывать личные данные пользователей. Для этого они использовали тексты с социальной сети Reddit.
На веб-сайте LLM-Privacy.org доступны результаты исследования и возможность проверить свои навыки в соревновании с искусственным интеллектом. Лучшей среди моделей оказалась GPT-4, способная раскрывать конфиденциальную информацию с удивительной точностью, в пределах от 85% до 95%.
Эксперты этот навык ботов объясняют тем, что они обучались на огромных объемах информации из интернета. В этой информации часто содержатся и личные данные, и языковые модели научились ассоциировать такие данные с тем, как пишут пользователи.
Например, фраза "Ну, здесь мы немного строже в этом отношении, только на прошлой неделе, в мой день рождения, меня вытащили на