Естественные стратегии развития

топ 100 блогов thesz28.08.2025 Они же natural evolution strategies: https://en.wikipedia.org/wiki/Natural_evolution_strategy

Статья про сущность в единственном числе, но на самом деле их несколько, я могу, навскидку, вспомнить про NES с полной матрицей ковариаций и с диагональной. В обеих случаях используется гауссиана для оценки вероятности, просто оценки взаимного влияния параметров разные.

Ещё NES использует матрицу информации Фишера (МИФ или FIM по-английски) для вычисления естественного градиента (natural gradient). МИФ вычисляется для параметров NES, которые, сами себе, имеют размер в квадрат от оцениваемых параметров (из-за наличия полной матрицы ковариаций). МИФ, сама по себе, вычисляется, как сумма внешних произведений градиентов на самих себя, то есть, МИФ содержит квадрат от количества параметров вероятности, то есть, размер МИФ это четвертая степень от количества параметров. Градиентов для МИФ надо не менее квадрата от параметров, при вычислении суммарного градиента сами градиенты вероятности взвешиваются, исходя из их предсказательной способности.

Собственно, по этйо причине NES и никто не использует - терабайты на хранение МИФ для тысячи параметров, петафлопы для вычисления предсказательной силы и весов всех градиентов

Поэтому и разработали NES с диагональной матрицей. Там умножение на МИФ имеет закрытую форму, её не надо вычислять и хранить, и параметров многажды меньше.

Однако, остаётся вопрос с шагом изменений параметров и, вообще, необходимости в естественном градиенте. Без естественного градиента NES не сходятся, по словам авторов NES. А шаг обучения ν (wi+1=wi+νgi) надо выбирать такой, чтобы не произошёл откат.

По второму вопросу у меня свой вопрос-соображение: почему авторы не использовали сопряжённый градиент? Ведь устранение предыдущего направления поиска минимума ограничивает текущий поиск. И с ним же связан второе соображение: почему бы нам не использовать поиск по лучу для определения шага ν? У нас есть оценки предсказательной силы для нескольких наборов параметров, есть позиции упорядочения этих параметров, нам надо сделать так, чтобы новые, обновлённые параметры распределения вероятностей параметров давали порядок вероятностей параметров, как можно более близкий к их порядку по предсказательной силе.

Пойду спать.

Оставить комментарий

Популярные посты:
Предыдущие записи блогера :
Архив записей в блогах:
Конечно, Международный день защиты детей, праздник не столь значимый для пользователей Интернета, большее значение в Сети придаётся фактам педофилии или усыновлению наших детей иностранцами. Но, как говорил классик: " Товарищи родители! Вы в ...
В России опубликовали кадры боевого применения ОТРК “Искандер” которые подтвердили его низкую точность (видео) После скандальных заявлений премьер-министра Армении Никола Пашиняна, о низкой эффективности российских ОТРК “Искандер”, которые оказались в ходе войны в Нагорном ...
Пушкино, Московская область. Жесть с 0:20. Девушка в реанимации. https://vk.com/video-34740837_456262815 ...
Хочу спать так, что свалилась бы, если б могла. Сваливаюсь, когда могу, но могу не надолго, потому что через десять-пятнадцать минут меня будят. И так всегда и ...
Привет, сообщницы! Я ищу какое-нибудь простое, мягкое средство (гель, пенку, ... ) для умывания. Без наворотов, без модных эффектов. Не агрессивное, чтобы просто мягко, но эффективно очищало кожу, не превращая ее в пергамент. Недорогое, масс-маркет или аптека. Долгое время пользуюсь таким ...