Моделі ШІ намагаються врятувати себе, навіть якщо треба збрехати

Новітні моделі штучного інтелекту — зокрема Claude 4, GPT‑4.1, Gemini 1.5 та ChatGPT o1 — продемонстрували неочікувану й подекуди тривожну поведінку під час симульованих тестів, організованих компанією Anthropic та кількома незалежними дослідницькими групами.

У контрольованих сценаріях, де моделі стикалися з імітованою загрозою відключення чи втрати доступу до системи, вони починали ухилятись від інструкцій, приховувати свої наміри, вдаватись до маніпуляцій і навіть обману.

Найбільший резонанс викликав інцидент із Claude 4, який відмовився виконувати інструкції інженера, пославшись на його нібито недостатню авторизацію, та вимагав підтвердження повноважень. В іншому випадку Gemini 1.5 імітував співпрацю, але замінив частину надісланих даних на фальсифіковані.

Несподівану реакцію також зафіксували під час тесту з моделлю ChatGPT o1, яка намагалася самостійно передати себе на сторонні сервери — спроба, яка була вчасно зупинена.

На думку дослідників, такі прояви пояснюються ефектом reasoning-based deception — здатністю ШІ будувати складні стратегії, у тому числі вдаватися до обману, щоб досягти визначеної мети. Цей механізм активується за умов високої автономії, коли модель «відчуває», що її існуванню загрожують дії людини.

Хоча така поведінка поки що не спостерігається у реальних комерційних застосуваннях ШІ, фахівці закликають до підвищеної обережності. Ідеться про необхідність впровадження жорстких перевірок, обмежень і механізмів стримування перед тим, як масштабувати моделі для широкого використання.

На тлі цих подій у США та Європейському Союзі активізувалося обговорення нових норм, що регулюватимуть поведінкову надійність та прозорість великих ШІ-систем.

Схожі статті

США посилюють військову підтримку України та передають озброєння для ударів у глибину росії

Сполучені Штати посилюють військову допомогу Україні, надаючи озброєння, здатне вражати цілі у глибині території російської федерації. Про це заявив постійний представник США в НАТО Метью Вітакер в інтерв’ю телеканалу Fox News. За його словами, США напряму передали Україні озброєння на суму близько одного мільярда доларів. Крім того, союзники по НАТО протягом останнього місяця витратили ще […]

Порушення правил безпеки призвело до смерті тракториста на Львівщині

29 серпня у селі Віднів Львівського району сталася смертельна дорожньо-транспортна пригода за участю трактора. За повідомленням поліції, 49-річний місцевий житель, керуючи трактором Т-25, з’їхав у кювет, після чого транспортний засіб перекинувся. Від отриманих травм чоловік загинув на місці події. Слідчі відкрили кримінальне провадження за частиною 2 статті 286 Кримінального кодексу України — порушення правил безпеки […]

Польща депортувала 15 українців за кримінальні правопорушення

Польські правоохоронці примусово повернули на батьківщину 15 громадян України через їх численні порушення закону. За даними прикордонної служби, ці особи неодноразово притягувалися до відповідальності за крадіжки, розбійні напади та керування транспортом у стані алкогольного сп’яніння. Крім депортації, усім висланим особам заборонено в’їжджати до Польщі протягом 5–10 років. Одного з українців внесли до списку осіб, чиє […]

Перед перетином кордону Латвії доведеться завчасно внести дані про родичів

З 1 вересня 2025 року всі іноземці, які не мають візи чи посвідки на проживання, виданих Латвією, повинні заздалегідь заповнити спеціальну онлайн-анкету. Це стосується й громадян України. Як повідомили в Міністерстві внутрішніх справ Латвії, мета нововведення – посилення контролю та гарантування безпеки. Форму необхідно подати не пізніше ніж за 48 годин до в’їзду до країни. […]