О видеокартах

топ 100 блогов hardsign25.11.2024

Периодически возникает вопрос — а чем так хороши видеокарты, почему бы просто не купить побольше обычных процессоров?

Когда-то я на этот вопрос отвечал, поэтому теперь просто перепишу ответ сюда. Он не претендует на точность или полноту, скорее это «executive summary» или «для чайников».

Итак, Intel Xeon (и его аналоги AMD, а также процессоры других архитектур, в том числе ARM) — это процессоры общего назначения, то есть процессоры, рассчитанные на решение «обычных» задач.

У «обычных» задач обычно есть особенности, которые диктуют устройство процессора.

Во-первых, задача выполняется совершенно непредсказуемо в зависимости от внешних условий, а значит, процессору приходится прыгать по коду туда-сюда. Каждый такой прыжок — это удар по производительности. Ну примерно как телефонный звонок человеку, вошедшему в «состояние потока». Поэтому процессор обвешан хитрой электроникой, которая пытается угадать, куда именно придётся прыгнуть (предсказание переходов), а после предположения выполнить несколько команд заранее (спекулятивное выполнение).

Во-вторых, задаче может потребоваться совершенно случайные данные из памяти, а скорость памяти растёт не такими бешеными темпами, как скорость процессора. Отсюда необходимость «быстрой памяти» (кеша), который занимает бóльшую часть площади кристалла.

В-третьих, обычные задачи решаются последовательно, «в лоб», соответственно, единственный способ решить их быстро — просто быстрее перебирать инструкцию за инструкцией. Скорость «перебирания» называется тактовой частотой и составляет у современных процессоров от 1,5 ГГц (это совсем медленные, «лоховские») до 4,5 ГГц у «реально пацанских» моделей. Чем больше тактовая частота, тем сильнее разогревается процессор, поэтому у современных процессоров на одном кристалле помещается максимум три десятка ядер (на относительно невысокой частоте) или около десятка на высокой.

А теперь рассмотрим рисование картинки методом трассировки лучей.

Алгоритм прямолинеен. Как говорят наши потенциальные противники по несколько другому поводу, «straight as a rail». Алгоритм берёт относительно небольшой объём данных, компактно расположенных в памяти. Расчёт для разных точек относительно независим, поэтому можно считать их параллельно.

Какие же решения отсюда следуют?

Сокращаем кеш до минимально разумных размеров. Выкидываем хитрые предсказательные блоки, оставляя только вычислительное ядро. Обнаруживаем, что частоту можно снизить на порядок, и при этом каждая конкретная точка всё равно посчитается быстро, потому что количество ядер можно увеличить на два порядка. В результате получаем процессор с безумным (до нескольких тысяч) количеством относительно медленных и простых ядер почти без кеша, называем это «графическим ускорителем» и выходим на рынок. Profit.

А потом внезапно обнаружилось, что 3D-моделирование — далеко не единственная задача, которая хорошо решается при помощи массивно-параллельных вычислений, и всё заверте...

О видеокартах nvidia.png

Оставить комментарий

Архив записей в блогах:
Что в современной нам реальности может спровоцировать обмен ядерными ударами между Россией и США? Интересуют реалистичные варианты сценария. Вторжение русских танковых орд в Америку, как и захват американскими авианосцами Чукотки и Кубани - отметаем как излишне надуманные. ...
Я не собиралась об этом писать, но вынуждена. Наташа, Ленина одноклассница, а сейчас моя главная подруга, рассказала мне, что в интернете сейчас много пишут о Навальном. И вот те, кто ненавидит Навального и желает ему не выздоровления, а смерти, ссылаются на мои тексты о нем. Я стала ...
В комментах к предыдущему посту взволнованные юзеры вывели формулу успеха в грядущие неспокойные времена: надо кредиты брать в рублях, а доходы иметь в долларах. ТакЪ победим!! ...
Открытки с типами студентов и политическими течениями я уже выкладывал. А вот с типами курсисток вроде еще небыло :)(Read more ...
Предварительно планируется на весну 1. Обзоры фильмов: завершение 1903 года + 1904. Возможно, успеется что-то из 1905, но вряд ли 2. Кратко инфо по работавшим в тот период режиссёрам и студиям 3. Продолжение истории про Эдисона и "войну патентов" 4. Игровые и документально-игровые ...