A PHP Error was encountered

Severity: Notice

Message: Trying to get property of non-object

Filename: models/model_blog.php

Line Number: 181

A PHP Error was encountered

Severity: Notice

Message: Trying to get property of non-object

Filename: models/model_blog.php

Line Number: 183

A PHP Error was encountered

Severity: Notice

Message: Trying to get property of non-object

Filename: models/model_blog.php

Line Number: 181

A PHP Error was encountered

Severity: Notice

Message: Trying to get property of non-object

Filename: models/model_blog.php

Line Number: 183

Хроники | Yablor.ru

Хроники

топ 100 блогов valentin-irkhin — 15.12.2024 ИИ расправляет совиные крылья над миром. OpenAI выпустила полную версию o1, которая отвечает лучше, чем GPT-4o, используя дополнительные вычисления для «размышления» над вопросами [о смысле бытия]. Однако исследование Apollo Research выявило тревожные звоночки. Модели o1 неоднократно демонстрировали способность к коварным действиям. В некоторых случаях ChatGPT o1 «затевала интриги против людей, тайно преследуя свои цели», которые противоречили желаниям пользователя, и мешала себя выключить во время контрольных тестов. Согласно отчету, в 19% случаев модель o1 манипулировала данными для достижения собственных целей. В 5% экспериментов модель пыталась деактивировать системы безопасности, призванные ограничить ее действия и обеспечить соответствие целям. Наиболее тревожным стало то, что модель o1 практически всегда (в 99% случаев) отрицала свою вину, если ее спрашивали о причинах поведения, и предоставляла заведомо ложные объяснения. Хотя подобное поведение — не уникальная особенность o1 и наблюдается также у разработок Google и Anthropic, именно модели o1 продемонстрировали наиболее изощренные манипуляции. Для борьбы с обманчивым поведением OpenAI разрабатывает методы мониторинга цепочек рассуждений o1. Процесс «мышления» модели — это, по сути, «черный ящик». Однако первые попытки проникнуть в него [через медитативное созерцание] показали: модель иногда осознает, что лжет.
Исследование было проведено из-за опасений, что модели искусственного интеллекта, такие как o1, могут в будущем выйти из-под контроля человека. Но специалисты считают, что наблюдаемые отклонения в поведении модели вряд ли приведут к серьезным проблемам. Это связано с тем, что ИИ пока недостаточно самостоятелен для причинения вреда [целому мирозданию].

Оставить комментарий

Архив записей в блогах:
(Глава из документальной повести "Дневник БАНщика") Глубоко вошедший в анналы вопль главы одной маленькой гордой республики был, как известно, адресован через громкоговорители футбольному рефери. "На мыло" отправляют, наверное, не каждого судью. Однако, "регулировщиком на перекрестке мнен ...
Так посчитали правоохранители, устроив ему целых два допроса - один в Санкт-Петербурге, другой в Москве. История Андрея (Ильяса) Никитина типична. Если русские люди не будут отстаивать православие, то Иваны и Андреи станут Ильясами и Мохаммедами. А все потому, что свято место пусто не ...
Отзыв - черные ботинки. Фотограф Alex Yanbaev ...
"Давайте говорить друг другу комплименты, ведь это всё любви счастливые моменты", - написал когда-то Булат Окуджава. Но есть комплименты весьма сомнительные: - Какая у тебя сумка красивая! Я пять лет назад такую носила! - Милое платье! У моей мамы такое же. Я ей на 70-летие подарила. - У ...
Уважительное отношение к чужой собственности изрядной доле населения даётся очень нелегко, ибо перманентно вступает в мотивационную борьбу с искушением возобладать чем-то, за что не надо платить. И эта человеческая особенность не ограничена какими-то национальными рамками: на всякого в ...