У вас есть вопрос, у нас — ответ!

Тест Tensorflow Inception v3

Тест Tensorflow Inception v3

LeaderGPU – амбициозный игрок на рынке GPU-вычислений, призванный изменить существующее положение дел. Как показывают тесты, скорость вычислений для модели Inception v3 в LeaderGPU в 3 раза выше, нежели в Google Cloud, и в 2,9 раз выше, чем в AWS (данные приведены для примера с 8x GTX 1080). При этом стоимость поминутной аренды GPU в LeaderGPU начинается от 0.02 евро, что более чем в 4 раза ниже стоимости аренды в Google Cloud и более чем в 5 раз ниже стоимости в AWS (по данным на 7 июля).

В данной статье мы проведем тестирование модели Inception v3 в таких сервисах, как LeaderGPU, AWS и Google Cloud. Мы покажем, почему LeaderGPU является лидирующим предложением среди рассмотренных нами вариантов.

Все тесты проводились при использовании python 3.5 и Tensorflow-gpu 1.2 на машинах с GTX 1080, GTX 1080 TI и Tesla P 100 с установленной операционной системой CentOS 7 и библиотекой CUDA 8.0.

Для запуска теста использовались следующие команды:

# git clone https://github.com/tensorflow/benchmarks.git
# python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2(количество карт на сервере) --model inception3 --batch_size 32 (64, 128)

GTX 1080 инстансы

Для первого теста воспользуемся инстансами с GTX 1080. Ниже приведены данные для среды тестирования (с размерами пакетов 32 и 64):

  • Типы инстансов: ltbv17, ltbv13, ltbv16
  • GPU: 2x GTX 1080, 4x GTX 1080, 8x GTX 1080
  • OS: CentOS 7
  • CUDA / cuDNN: 8.0 / 5.1
  • TensorFlow GitHub хэш: b1e174e
  • Benchmark GitHub хэш: 9165a70
  • Команда: # python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 --model inception3 –batch size 32 (optional 64)
  • Модель: Inception v3
  • Дата тестирования: Июнь 2017

Результаты тестирования приведены в диаграмме:

Inception v3 GTX 1080 test results

GTX 1080TI инстансы

Теперь давайте воспользуемся инстансами с GTX 1080 Ti. Ниже приведены данные для среды тестирования (с размерами пакетов 32 и 64):

  • Типы инстансов: ltbv21, ltbv18
  • GPU: 2x GTX 1080TI, 4x GTX 1080TI
  • OS: CentOS 7
  • CUDA / cuDNN: 8.0 / 5.1
  • TensorFlow GitHub хэш: b1e174e
  • Benchmark GitHub хэш: 9165a70
  • Команда: # python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 (4) --model inception3 --batch_size 32 (optional 64, 128)
  • Модель: Inception v3
  • Дата тестирования: Июнь 2017

Результаты тестирования приведены в диаграмме:

Inception v3 GTX 1080TI test results

Tesla P100 инстанс

Наконец, пришла пора протестировать модель с Tesla P100. Ниже приведены данные для среды тестирования (с размерами пакетов 32, 64 и 128):

  • Тип инстанса: ltbv20
  • GPU: 2x NVIDIA® Tesla® P100
  • OS: CentOS 7
  • CUDA / cuDNN: 8.0 / 5.1
  • TensorFlow GitHub хэш: b1e174e
  • Benchmark GitHub хэш: 9165a70
  • Команда: # python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 --model inception3 –batch size 32 (optional 64, 128)
  • Модель: Inception v3
  • Дата тестирования: Июнь 2017

Результаты тестирования приведены в диаграмме:

Inception v3 Tesla P100 test results

В приведенной ниже таблице мы собрали результаты тестов inception v3 на Google cloud и AWS (с размером пакета 64)

GPU Google cloud AWS
1x Tesla K80 30.5 30.8
2x Tesla K80 57.8 58.7
4x Tesla K80 116 117
8x Tesla K80 227 230

* данные для таблицы взяты по ссылкам:

https://www.tensorflow.org/performance/benchmarks#details_for_google_compute_engine_nvidia_tesla_k80
https://www.tensorflow.org/performance/benchmarks#details_for_amazon_ec2_nvidia_tesla_k80

Давайте сделаем подсчет стоимости и времени обработки 1000000 изображений на каждой машине LeaderGPU, AWS и Google. Подсчет выполним с размером пакета 64 для всех машин.

GPU Количество изображений Время Стоимость (за мин) Общая стоимость
2x GTX 1080 1000000 88m 41sec 1,46 руб. 129,48 руб.
4x GTX 1080 1000000 48m 18sec 2,19 руб. 105,78 руб.
8x GTX 1080 1000000 24m 18sec 6,58 руб. 159,89 руб.
4x GTX 1080TI 1000000 33m 47sec 2,63 руб. 88,85 руб.
2х Tesla P100 1000000 64m 18sec 5,85 руб. 376,16 руб.
8x Tesla K80 Google cloud 1000000 73m 25sec 5,7598 руб.** 422,3874 руб.
8x Tesla K80 AWS 1000000 72m 27sec 7,4703 руб. 541,0748 руб.

** Сервис Google cloud не предоставляется поминутно. Минутная стоимость подсчитана исходя из часовой цены ($5.645).

Как видно из представленной таблицы, скорость обработки изображений в модели Inception v3 является максимальной с 8x GTX 1080 от LeaderGPU, при этом:

  • общая стоимость в LeaderGPU начинается от € 1,77, что примерно в 3,42 раза ниже, чем в инстансах 8x Tesla K80 от Google Cloud, и примерно в 4,38 раз ниже, чем в инстансах 8x Tesla K80 от Google AWS;
  • время обработки составило 24 мин 18 с, что в 3,03 раз быстрее, чем в инстансах 8x Tesla K80 от Google Cloud, и в 2,99 раз быстрее, чем в инстансах 8x Tesla K80 от Google AWS.

Результаты говорят сами за себя. LeaderGPU – несомненный лидер в области GPU-вычислений, предлагающий эффективные решения по приемлемым ценам. Воспользуйтесь выгодным предложением GPU от LeaderGPU уже сегодня!

Остались вопросы? Пишите!

Принимая Соглашение, Вы подтверждаете, что ознакомились и согласны с вышеизложенным соглашением, Условиями использования сайта, Политикой конфиденциальности и Условиями возврата денежных средств, и даете согласие на обработку своих персональных данных.