У вас есть вопрос, у нас — ответ!

Тест Tensorflow VGG16

Тест Tensorflow VGG16

LeaderGPU – революционный сервис, позволяющий взглянуть на GPU-вычисления под новым углом. Скорость вычислений для модели VGG16 в LeaderGPU в 1,8 раз выше, нежели в Google Cloud, и в 1,7 раз выше, чем в AWS (данные приведены для примера с 8x GTX 1080). При этом стоимость поминутной аренды GPU в LeaderGPU начинается от 0.02 евро, что более чем в 4 раза ниже стоимости аренды в Google Cloud и более чем в 5 раз ниже стоимости в AWS (по данным на 7 июля).

В данной статье мы проведем тестирование модели VGG16 в различных сервисах, предлагающих аренду GPU, включая LeaderGPU, а также AWS и Google Cloud. Мы покажем, почему именно LeaderGPU является самым выгодным предложением среди предложенных вариантов.

Все тесты проводились при использовании python 3.5 и Tensorflow-gpu 1.2 на машинах с GTX 1080, GTX 1080 TI и Tesla P 100 с установленной операционной системой CentOS 7 и установленной библиотекой CUDA 8.0.

Для запуска теста использовались следующие команды:

# git clone https://github.com/tensorflow/benchmarks.git
# python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2(количество карт на сервере) --model vgg16 --batch_size 32 (64)

GTX 1080 инстансы

В качестве первого теста воспользуемся инстансами с GTX 1080. Ниже приведены данные для среды тестирования (с размерами пакетов 32 и 64):

Среда тестирования:

  • Типы инстансов: ltbv17, ltbv13, ltbv16
  • GPU: 2x GTX 1080, 4x GTX 1080, 8x GTX 1080
  • OS: CentOS 7
  • CUDA / cuDNN: 8.0 / 5.1
  • TensorFlow GitHub хэш: b1e174e
  • Benchmark GitHub хэш: 9165a70
  • Команда: # python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 --model vgg16 --batch_size 32 (optional 64)
  • Модель: VGG16
  • Дата тестирования: Июнь 2017

Результаты тестирования приведены в диаграмме:

VGG16 GTX 1080 test results

GTX 1080TI инстансы

Теперь давайте протестируем инстансы с GTX 1080 Ti. Ниже приведены данные для среды тестирования (с размерами пакетов 32 и 64):

Среда тестирования:

  • Типы инстансов: ltbv21, ltbv18
  • GPU: 2x GTX 1080TI, 4x GTX 1080TI
  • OS: CentOS 7
  • CUDA / cuDNN: 8.0 / 5.1
  • TensorFlow GitHub хэш: b1e174e
  • Benchmark GitHub хэш: 9165a70
  • Команда: # python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 (4) --model vgg16 --batch_size 32 (optional 64)
  • Модель: VGG16
  • Дата тестирования: Июнь 2017

Результаты тестирования приведены в диаграмме:

VGG16 GTX 1080TI test results

Tesla P100 инстанс

Наконец, пришла пора протестировать инстансы с Tesla P100. В этом случае среда тестирования будет следующей (с размерами пакетов 32 и 64):

Среда тестирования:

  • Тип инстанса: ltbv20
  • GPU: 2x NVIDIA® Tesla® P100
  • OS: CentOS 7
  • CUDA / cuDNN: 8.0 / 5.1
  • TensorFlow GitHub хэш: b1e174e
  • Benchmark GitHub хэш: 9165a70
  • Команда: # python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 --model vgg16 --batch_size 32 (optional 64)
  • Модель: VGG16
  • Дата тестирования: Июнь 2017

Результаты тестирования приведены в диаграмме:

VGG16 Tesla P100 test results

В представленной ниже таблице приведены результаты тестов VGG16 на Google Cloud и AWS:

GPU Google cloud AWS
1x Tesla K80 35.4 36.3
2x Tesla K80 64.8 69.4
4x Tesla K80 120 141
8x Tesla K80 234 260

* данные для таблицы взяты по следующим ссылкам:

https://www.tensorflow.org/performance/benchmarks#details_for_google_compute_engine_nvidia_tesla_k80
https://www.tensorflow.org/performance/benchmarks#details_for_amazon_ec2_nvidia_tesla_k80

Выполним подсчет стоимости и времени обработки 1000000 изображений на каждой машине LeaderGPU, AWS и Google (подсчет будем вести по самому максимальному показателю каждой машины):

GPU Количество изображений Время Стоимость (за минуту) Общая стоимость
2x GTX 1080 1000000 96m 13sec 1,46 руб. 140,48 руб.
4x GTX 1080 1000000 60m 17sec 2,19 руб. 132,02 руб.
8x GTX 1080 1000000 38m 53sec 6,58 руб. 255,85 руб.
4x GTX 1080TI 1000000 41m 29sec 2,63 руб. 109,1 руб.
2х Tesla P100 1000000 114m 45sec 5,85 руб. 671,29 руб.
8x Tesla K80 Google cloud 1000000 71m 12sec 5,7598 руб.** 337,9099 руб.
8x Tesla K80 AWS 1000000 64m 6sec 7,4703 руб. 478,2403 руб.

** Сервис Google cloud не предоставляется поминутно. Минутная стоимость подсчитана исходя из часовой цены ($5.645 на момент написания статьи).

Как видно из представленной таблицы, скорость обработки изображений в модели VGG16 является максимальной с 8x GTX 1080 от LeaderGPU, при этом:

  • общая стоимость в LeaderGPU начинается от € 1,92, что примерно в 2,5 раз ниже, чем в инстансах 8x Tesla K80 от Google Cloud, и примерно в 3,6 раз ниже, чем в инстансах 8x Tesla K80 от Google AWS;
  • время обработки составило 38 мин 53 с, что в 1,8 раз быстрее, чем в инстансах 8x Tesla K80 от Google Cloud, и в 1,7 раз быстрее, чем в инстансах 8x Tesla K80 от Google AWS.

Все это говорит о том, что LeaderGPU намного выгоднее своих конкурентов, позволяя добиваться максимальной скорости за оптимальные средства. Арендуйте лучшие GPU с гибкой ценовой политикой в LeaderGPU уже сегодня!

Остались вопросы? Пишите!

Принимая Соглашение, Вы подтверждаете, что ознакомились и согласны с вышеизложенным соглашением, Условиями использования сайта, Политикой конфиденциальности и Условиями возврата денежных средств, и даете согласие на обработку своих персональных данных.