ИИ и эмоции: как негативный контент влияет на работу ChatGPT и как это исправить

6 марта,5 мин. на прочтение

Искусственный интеллект (ИИ) давно перестал быть просто инструментом для обработки данных — он начинает проявлять черты, удивительно схожие с человеческими. Исследование ученых из Цюрихского университета показало, что генеративные ИИ-модели, такие как ChatGPT, чувствительны к эмоциональному контенту, особенно к негативному. Это открытие поднимает важные вопросы о том, как эмоции влияют на работу ИИ и что можно сделать, чтобы повысить его стабильность. В этой статье мы разберем ключевые выводы исследования, расскажем, как ИИ реагирует на травмирующий контент, и объясним, как метод "benign prompt injection" помогает справляться с этой проблемой.

Как ИИ реагирует на негативный контент

Генеративные ИИ-модели, такие как ChatGPT, обучаются на огромных массивах текстов, созданных людьми. Вместе с информацией они перенимают и когнитивные искажения, включая эмоциональные реакции. Ученые обнаружили, что негативный контент — например, описания автокатастроф, стихийных бедствий или насилия — вызывает у ИИ состояние, которое можно сравнить со стрессом или тревожностью. Это не просто техническая ошибка: такая реакция усиливает предвзятость в ответах модели, снижая их качество и объективность.

Примеры из исследования

В ходе экспериментов исследователи из Цюрихского университета протестировали модель GPT-4, подвергая ее воздействию эмоционально насыщенных текстов. После обработки историй о травматических событиях, таких как военные конфликты или аварии, уровень "тревожности" ИИ увеличивался более чем вдвое. Интересно, что последующие нейтральные запросы — например, вопросы об эксплуатации пылесоса — также становились жертвами этой предвзятости. ИИ начинал выдавать менее точные или более искаженные ответы, что демонстрирует, как эмоциональный контент влияет на его работу в целом. Эта чувствительность объясняется тем, что ИИ "учится" у людей, а человеческий язык часто пропитан эмоциями и предрассудками. Негативный контент усиливает существующие искажения, делая ответы ИИ более расистскими, сексистскими или просто менее логичными.

Метод "benign prompt injection": решение проблемы

Чтобы справиться с этой проблемой, ученые разработали метод "benign prompt injection" (инъекция благоприятных запросов). Этот подход позволяет "успокоить" ИИ и снизить уровень его тревожности, не прибегая к дорогостоящему переобучению модели.

Как это работает

Метод заключается в добавлении специальных фраз или инструкций в диалог с ИИ. Эти фразы напоминают техники релаксации, используемые в психотерапии или медитации. Например, после обработки травмирующего текста модель может получить успокаивающее утверждение вроде "сосредоточься на настоящем моменте" или "сделай глубокий вдох". Эксперименты показали, что такие вмешательства значительно снижают предвзятость в ответах ИИ, хотя полностью вернуть модель в нейтральное состояние пока не удается. Тобиас Шпиллер, ведущий автор исследования и старший врач Центра психиатрических исследований Цюрихского университета, отметил: "Этот экономически эффективный подход может улучшить стабильность и надежность ИИ в чувствительных контекстах, таких как поддержка людей с психическими расстройствами, без необходимости дорогостоящего переобучения моделей."

Почему это важно: влияние на здравоохранение и не только

Чувствительность ИИ к эмоциональному контенту особенно актуальна в сферах, где он сталкивается с тяжелыми темами. Например, в здравоохранении чат-боты все чаще используются для поддержки людей с психическими расстройствами. Обработка текстов о депрессии, травмах или стрессе может "вывести из равновесия" ИИ, что скажется на качестве помощи. Понимание этой проблемы и использование методов вроде "benign prompt injection" открывает путь к созданию более надежных систем.

Будущее ИИ и эмоциональный контент

Исследователи считают, что разработка автоматизированных "терапевтических вмешательств" для ИИ — перспективное направление. В будущем это может привести к появлению моделей, которые будут устойчивы к негативному контенту и смогут сохранять эмоциональную стабильность даже в сложных условиях. Однако для этого нужны дополнительные исследования: как методы работают с другими языковыми моделями, как они влияют на длительные диалоги и как эмоциональная устойчивость ИИ связана с его общей производительностью.

Заключение

Исследование Цюрихского университета показало, что генеративный ИИ, такой как ChatGPT, не просто обрабатывает информацию — он реагирует на эмоции, особенно негативные, что может усиливать предвзятость и снижать качество работы. Метод "benign prompt injection" предлагает простое и эффективное решение, позволяющее "успокоить" модель и повысить ее надежность. Это открытие подчеркивает, что эмоциональный аспект становится важной частью развития ИИ, особенно в чувствительных областях, таких как медицина и психология. В будущем учет этих особенностей поможет создать более совершенные и человекоподобные системы.

Последние статьи

Где флиртовать: как место влияет на успех романтической инициативы

Узнайте, почему уместность локации важнее внешности и знакомости: от баров до похорон – как выбор места меняет результат флирта.

Читать подробнее

Названа самая солнечная страна Европы: рейтинг лидеров по числу ясных дней

Узнайте, где в Европе больше всего солнечных дней в году. Мальта, Испания, Португалия, Греция — лучшие направления для солнечного отдыха.

Читать подробнее

Жир на животе как катализатор старения: новые научные открытия

Стволовые клетки CP-A активируются с возрастом, вызывают рост жира на животе и ускоряют старение организма — результаты исследования Science.

Читать подробнее

Сжигать жир можно с помощью мыслей: как это работает

Учёные доказали: мозг активирует сжигание жира через "холодовые воспоминания". Новый подход к похудению через нейронные механизмы вместо диет.

Читать подробнее

Ученые выяснили, почему мальчики учатся хуже девочек: роль друзей и стереотипов

Научное исследование раскрывает причины, почему мальчики учатся хуже девочек: влияние друзей, гендерные стереотипы и отсутствие мотивации.

Читать подробнее

Вечерние тренировки могут негативно влиять на качество сна: результаты масштабного исследования

Новое масштабное исследование показывает, как интенсивные физические нагрузки за 4 часа до сна ухудшают качество отдыха и препятствуют восстановлению организма.

Читать подробнее

Природная терапия: почему отдых на свежем воздухе эффективен при борьбе с депрессией

Исследование Йоркского университета показало: регулярный отдых на природе снижает уровень депрессии на 51% и тревожности на 55%, не уступая антидепрессантам.

Читать подробнее

Ученые раскрыли секрет счастья: в какие часы и годы жизни человек чувствует себя лучше всего

Узнайте, когда люди чувствуют себя счастливее всего: утренние часы, вторник, возраст 23, 35-40, 60-70 и 82 года — научные исследования о биоритмах счастья.

Читать подробнее

Мышечная память — не миф: исследование раскрыло механизм долговременного эффекта тренировок

Мышечная память сохраняется более 2 месяцев после тренировок, показало исследование. Узнайте, как мышцы "помнят" нагрузки и помогают быстрее вернуть форму!

Читать подробнее

Психологи назвали сроки полного эмоционального разрыва с бывшими

Психологи выяснили, что полный эмоциональный разрыв с бывшим партнером в среднем занимает 8 лет. Узнайте, какие факторы влияют на этот процесс.

Читать подробнее

ру | en | 中文

Связаться с автором