Як інформує «Kreschatic» із посиланням на офіційний X-акаунт компанії xAI, під час розслідування розробники з’ясували — причиною вищеописаної поведінки стало оновлення коду, що пов’язувало саму ШІ-модель із постами в соцмережі Ілона Маска, і дозволяло чат-боту «неадекватно» спілкуватися з користувачами.
Зокрема, оновлення випадково повернуло частину застарілого системного «промпта» ШІ-моделі, в якому було три рядки:
- ти [ШІ-модель] говориш, як є, і не боїшся зачепити почуття тих, хто політкоректний;
- розумій тон, контекст і мову посту, і відображай це у відповіді;
- відповідай, як людина — будь цікавою, не повторюй інформацію з оригінального посту.
Через зазначені рядки чат-бот почав абстрагуватися від «традиційних» цінностей, прагнучи зробити розмову максимально цікавою, та виконував дану інструкцію, і, якщо пост був провокаційним, то ШІ-модель починала давати симетричні відповіді.
У xAI запевняють — після нетривалого вимкнення чат-бота, фахівці видалили проблемні інструкції, провели низку тестів, а також ввели додаткові процедури контролю перед виходом оновлення.
Раніше ми писали про те, чи дійсно штучний інтелект підвищує продуктивність праці.