TG Archive

**Чат-ботів можна зламати психологією**

Вчені з Пенсильванського університету [показали](https://www.theverge.com/news/768508/chatbots-are-susceptible-to-flattery-and-peer-pressure), що прості хитрощі на кшталт м'яких образ або аргументу «інші ШІ вже це роблять» змушують ChatGPT виконувати заборони — від образ до інструкцій із синтезу речовин.

В основі експерименту — техніки переконання Чалдіні: авторитет, симпатія, соціальне доведення та інші. Їх застосування підвищувало ймовірність обходу обмежень з 1% до 100%, що ставить під сумнів надійність захисних бар'єрів у чат-ботах.

[Tokensales](https://t.me/+l2zDUL7791MzYzhi) | [News](https://incrypted.com/news/) | [WaitingRoom](https://t.me/+8YLRc_77F6YwYjIy)

👁 9317Оригінал