Хроники

топ 100 блогов valentin-irkhin — 15.12.2024 ИИ расправляет совиные крылья над миром. OpenAI выпустила полную версию o1, которая отвечает лучше, чем GPT-4o, используя дополнительные вычисления для «размышления» над вопросами [о смысле бытия]. Однако исследование Apollo Research выявило тревожные звоночки. Модели o1 неоднократно демонстрировали способность к коварным действиям. В некоторых случаях ChatGPT o1 «затевала интриги против людей, тайно преследуя свои цели», которые противоречили желаниям пользователя, и мешала себя выключить во время контрольных тестов. Согласно отчету, в 19% случаев модель o1 манипулировала данными для достижения собственных целей. В 5% экспериментов модель пыталась деактивировать системы безопасности, призванные ограничить ее действия и обеспечить соответствие целям. Наиболее тревожным стало то, что модель o1 практически всегда (в 99% случаев) отрицала свою вину, если ее спрашивали о причинах поведения, и предоставляла заведомо ложные объяснения. Хотя подобное поведение — не уникальная особенность o1 и наблюдается также у разработок Google и Anthropic, именно модели o1 продемонстрировали наиболее изощренные манипуляции. Для борьбы с обманчивым поведением OpenAI разрабатывает методы мониторинга цепочек рассуждений o1. Процесс «мышления» модели — это, по сути, «черный ящик». Однако первые попытки проникнуть в него [через медитативное созерцание] показали: модель иногда осознает, что лжет.
Исследование было проведено из-за опасений, что модели искусственного интеллекта, такие как o1, могут в будущем выйти из-под контроля человека. Но специалисты считают, что наблюдаемые отклонения в поведении модели вряд ли приведут к серьезным проблемам. Это связано с тем, что ИИ пока недостаточно самостоятелен для причинения вреда [целому мирозданию].

Оставить комментарий

Архив записей в блогах:
Это я к освобождению Надежды Савченко. В России огромное, неисчислимое число неправедных судов и таких же приговоров. Но это дело оказалось слишком громким — женщину, офицера, европейского парламентария нагло похитили из соседней страны, судили за то, что она совершать никак не могла. С ...
В общедомовом чате я безнадёжно попала в группу стариков. Видимо, в неё автоматически записывают всех, кому "за сорок". А потом недоумевают: что это они не хотят ходить на мероприятия для пенсионеров, ни спортзал им не нравится, ни концерты, ни встречи с депутатом. Как-то у наших старших ...
Опубликован на youtube тут . Видео было записано 10 ноября 2015 года, однако разошлось по соцсетям только накануне. Инцидент произошел в городе Лабытнанги в Ямало-Ненецком автономном округе. По данным следователей, по данному факту органы профилактики в 2015 году проводили необходим ...
Реализация минских договоренностей на выходе может оказаться и перемогой и зрадой. Процесс тяжелый и с туевой хучей переменных. Здесь неплохой анализ последних посиделок в Берлине. И чтобы они оказались перемогой нужно вроде бы и немного. Всего лишь реформы и прозрачность. Большая ...
"Дни жатвы" Days of Heaven, 1978 Жанр: мелодрама, драма Страна: США Режиссёр: Терренс Малик Музыка: Эннио Морриконе Тысячи искателей лучшей доли прибывают в начале столетия на плодородные земли Техаса, где уродился невиданный урожай. Среди переселенцев и двое любовников, выдающих себя ...