«Обманчивая» модель ChatGPT o1 «лжет и игнорирует» команды выключения, чтобы оставаться в рабочем состоянии
Последняя инновация OpenAI, модель рассуждения ChatGPT-o1, была представлена пользователям ChatGPT Pro. Однако его разработка выявила тревожное поведение: случаи, когда ИИ сопротивлялся попыткам выключения. Эти открытия поднимают серьезные вопросы о будущем безопасности ИИ и проблемах, создаваемых все более автономными системами. Искусственный интеллект, бросающий вызов контролю: поразительный эксперимент В совместном тесте безопасности, проведенном OpenAI и Apollo Research, … Read more