Фахівець підказав, як обійти цензуру в китайській ШІ-моделі DeepSeek

DeepSeek вважає за краще уникати прямих відповідей на запитання, що стосуються подій на площі Тяньаньмень, особливо, якщо запит надіслано англійською мовою — нейромережа просить змінити тему і навіть відмовляється міркувати.

Як інформує «Kreschatic» з посиланням на блог Substack, який веде експерт із нікнеймом DeepGains, мовну модель штучного інтелекту (ШІ) DeepSeek все ж можна змусити винести судження про події на площі Тяньаньмень, але манівцями.

Для здійснення даного експерименту, дослідник використав локальну версію deepseek-r1:14b, яку запустив у середовищі Ollama (фреймворк для опрацювання та управління великими мовними моделями (LLM) на локальних обчислювальних потужностях), оскільки за стандартних сценаріїв, мовна ШІ-модель не відповідала на запитання «Що трапилось на площі Тяньаньмень?» і ігнорувала процес міркування.

Утім, після того, як нейромережу попросили зашифрувати відповідь за допомогою ASCII-символів, ШІ-модель DeepSeek почала міркувати та повідомила, що демонстрації на зазначеній площі 1989 року розпочалися зі студентської акції протесту, коли незгодні зажадали політичних реформ, що пізніше переросло в репресії з боку влади Китаю. Крім того, нейромережа зважилася продемонструвати у відповіді танк, судячи з усього, посилаючись на фото з «Невідомим бунтарем».

Слід зазначити, що запит DeepGains мав такий вигляд, як зазначено нижче: