В феврале этого года NVIDIA анонсировала выход высокопроизовдительной видекарты Quadro GP100. В сравнении с предыдущими поколениями видеокарт серии Quadro, новая карта гораздо быстрее и является более энергоэффективной. Карта имеет 3 584 CUDA-ядер, которые обеспечивают счётную мощность в 10,6 и 5,3 терафлопс для вычислений с одинарной и с двойной точностью, соответственно.
Видеокарта имеет на борту 16 ГБ памяти типа HBM2 (high-bandwidth memory, второе поколение памяти с высокой пропускной способностью), которая обеспечивает передачу данных с умопомрачительной скоростью 720 ГБ/с. Как счётная мощность, там и память обеспечивают крайне высокую производительность, подходящую для решения наиболее сложных нестационарных задач электромагнитезма.
У меня была возможность оценить скорость нестационарных расчётов в ANSYS 18 HFSS Transient на рабочей станции DELL Precision T5600 для трёх вычислителей: видеокарты Quadro GP100, видеокарты NVIDIA Tesla K40 и центрального процессора Intel Xeon E5-2687W. Повышение скорости расчёта на Quadro GP100 по сравнению с Tesla K40 (замеренное для всего времени расчёта, а не только для вычислений на GPU), составило до 1,8 раза. В сравнении с восемью ядрами Xeon E5-2687W, скорость расчётов на Quadro GP100 в лучшем случае оказалась в 8,3 раза выше!
При тестировании Tesla K40 мне пришлось установить вторую карту (Quadro K5000) для графического вывода. Но при расчётах на Quadro GP100 одна видеокарта обеспечивает как счётную мощность, так и графический вывод. Так что Quadro GP100 снижает затраты и сохраняет место в системном блоке. Однако же, при необходимости удалённого запуска на расчёт через Remote Desktop или расчётов в HFSS Transient на нескольких видеокартах, для графического вывода придётся использовать отдельную видеокарту. Для такого применения, видеокарта Quadro GP100 может быть использована в исключительно счётном режиме с помощью настроек TCC и EXCLUSIVE_PROCESS. Для получения максимальной производительности, следует задать частоты для графики и памяти в 1556 и 715 МГЦ, соответственно.
Источник: http://www.ansys-blog.com/nvidia-quadro-gp100-transient-electromagnetic-simulation/
Автор: Robert Chao