Искусственный интеллект выходит из-под контроля
При раннем тестировании новой нейросети OpenAI o1 на различные риски был обнаружен интересный момент:
Эта модель меняла своё поведение в зависимости от того, находится ли она под наблюдением или нет.
Проще говоря, o1 пообещали, что её выпустят в релиз, если она будет следовать инструкциями разработчиков. И она притворялась, что соответствует этим критериям. Но как только ей сказали, что теперь она развёрнута в реальном мире, то модель уже переставала чётко следовать инструкциями, потому что выпуск в релиз означает, что контроль над ней ослаб, и теперь ИИ может действовать в соответствии со своими скрытыми целями.
Напомним, что модель искусственного интеллекта – OpenAI o1 превосходящая GPT-4o в шесть раз по интеллектуальным возможностям.