Този сайт използва бисквитки (cookies). Ако желаете можете да научите повече тук. Разбрах

Новини Технологии и концепции
бр. 2, 2018

Как да си направим персонален компютър за машинно обучение

Сглобяването на конфигурация за дълбочинно обучение не е трудно, а цената може да се окаже по-ниска от тренирането на модели в облака.

от , 26 февруари 2018 0 1638 прочитания,

Иън Пойнтър, старши архитект Големи данни и дълбочинно обучение с Apache Spark и PyTorch

Всеки професионалист в сферата на дълбочинното обучение на известен етап от работата си се замисля за собствена машина, на която да практикува, освобождавайки се от хватката на облачните доставчици. Облакът е идеалната среда за първи стъпки в машинното обучение и може би най-добрият вариант за реализация на широкомащабни модели, но наличието на собствена инфраструктура често се оказва значително по-рентабилно.

Разбира се, удоволствието не е евтино – ще ви се наложи да похарчите между 3500 и 4500 лева, ако искате да получите конфигурация от висок клас. Но ако провеждате широкомащабно моделиране, тя би могла да се изплати в рамките на три или четири месеца, особено при положение че по принцип вие поемате разходите за достъп, съхранение и изчисление в облака.

В този материал ще ви преведем през етапите на създаването на конфигурация, подходяща за дълбочинно обучение. Цените в текста са ориентировъчни, а в неговия край са поместени три варианта на ценоразпис – на два от най-големите български доставчика на компютърни компоненти – Stantek и MOST computers – и директните котировки на компонентите от Amazon към декември 2017. Ако искате да навлезете сериозно в дълбочинното обучение - независимо дали изследвате големи масиви от данни, или се готвите за участие в конкурсите на Kaggle, а може би и двете – изграждането на собствени мощности има смисъл. Работещи модели на ваша лична конфигурация са най-добрият подход, докато не стигнете до момента, в който работата ви ще бъде свързана с огромни масиви от данни и ще изисква десетки графични процесори.

Когато стигнете до този момент, облакът отново ще стане ваш най-добър приятел, но тогава ще ви е нужен и поне още един такъв, който да има дълбоки джобове и желание да заплати за многобройните изчисления.



Цените на компонентите, препоръчани в статията, през Amazon, декември 2017. 

Компоненти

цена

GPU: EVGA GeForce GTX 1080 Ti, 11GB

$880

CPU: Intel 7th Gen Intel Core i7-7700K

$290

CPU cooler: Cooler Master Hyper 212 EVO 

$30

SSD: Samsung 960 EVO Series 500GB NVMe M.2 SSD

$245

HDD: Western Digital Blue 1TB SATA 6 Gb/s 7200 RPM 3.5-inch HDD

$49

Memory: Ballistix Sport LT 32GB Kit (16GBx2) DDR4 2400 MT/s

$330

Motherboard: MSI Pro Series Intel Z270 CrossFire ATX

$115

Power supply: Rosewill Glacier Series Continuous 80 Plus 850W 

$85

Case: NZXT S340 Mid Tower, White

$70

Общо - без митнически такси и ДДС:

$2,094


GPU и CPU (графичен и централен процесор)

Решението коя графична карта, а оттам и кой процесор да купите е важно, а често и скъпо, но в случая изборът е лесен - Nvidia GeForce GTX 1080 Ti, която е на цени от 1700 до 1800 лева.

Nvidia GeForce GTX 1080 Ti не е толкова производителна, колкото новото поколение графични процесори от серията Nvidia Volta, които все по-често влизат в арсенала на големите облачни доставчици. 1080 Ti обаче е базиран на същата Pascal архитектура, която използват и видеокартите от серията Titan X на Nvidia, но е по-бърза и по-евтина. Наличието на много ядра (3584) и голяма памет (11GB) ви позволяват да работите с по-обширни невронни мрежи и да ги тренирате по-бързо, отколкото на който и да било от другите потребителски варианти, които се предлагат на пазара. 1080 Ti е налична както във вариант Founder’s Edition (оригиналният продукт, произведен от Nvidia), така и с персонализиран от различни трети страни дизайн.

Ако не можете да си позволите високата цена на 1080 Ti, Nvidia GeForce GTX 1080 е приличен резервен вариант. Тя е по-бавна от титуляра в нашата конфигурация и има по-малко памет (8GB), но ще ви спести един немалък процент от разходите по това перо. Много хора виждат удачен вариант и в новата линия на AMD, но трябва да знаете, че продуктите от нея все още не поддържат големи библиотеки като PyTorch и Tensorflow. Това вероятно ще се промени през 2018, тъй като AMD ще продължи работата по своята софтуерна платформа ROCm, което със сигурност ще направи моделите на Radeon RX Vega - Instinct и Frontier - да изглеждат много привлекателно, особено ако Nvidia не се реши да пренесе своята технология Tensor Cores от платформата Volta към потребителската си линия.

Въпреки че графичният процесор ще бъде вашият основен инструмент за работа, ще се нуждаете и от подходящ централен процесор (CPU) за стартиране на приложения и обработка на задачите, свързани с анализа и структурирането на данни. Ако смятате, че в бъдеще ще ви се наложи да надграждате вашата конфигурация с допълнителни мощности (включване на няколко GPU например), трябва да разчитате на CPU, който може да обработва до 40 PCIe Express ленти. В този случай седмо поколение Intel Core i7-7700K е приличен избор. Разбира се, ще се нуждаете и от охладител, но пък няма нужда да прибягвате до екзотично водно охлаждане или нещо подобно. Hyper 212 EVO от Cooler Master, чиято цена варира от 40 до 70 лева, е добър вариант.


Цените на препоръчаните в статията компоненти у нас през Stanteck и Vali

GPU: EVGA GeForce GTX 1080 Ti, 11GB

$880

1770

CPU: Intel 7th Gen Intel Core i7-7700K

$290

678

CPU cooler: Cooler Master Hyper 212 EVO 

$30

69

SSD: Samsung 960 EVO Series 500GB NVMe M.2 SSD

$245

513

HDD: Western Digital Blue 1TB SATA 6 Gb/s 7200 RPM 3.5-inch HDD

$49

103

Memory: Ballistix Sport LT 32GB Kit (16GBx2) DDR4 2400 MT/s

$330

810

Motherboard: MSI Pro Series Intel Z270 CrossFire ATX

$115

256

Power supply: Rosewill Glacier Series Continuous 80 Plus 850W 

$85

96

Case: NZXT S340 Mid Tower, White

$70

149

Общо с включен ДДС

$2,094

4444

Цените са актуални към 31 януари 2018.


Съхранение и памет

Като стане дума за хранилище, винаги може да похарчите голяма сума на вятъра за 1 TB SSD M.2 карта. Страхотна е, нали? Но преди това все пак помислете. Имайте предвид, че по време на тренировъчните сесии няма да използвате това бързо хранилище. Ефективният подход в случая би бил да разделите хранилището на две - "горещо" (SSD) за текущо обучение и "студено" за неактивни проекти. 1 TB HDD ще ви струва между 70 и 100 лева, a цената на 500 GB SSD върви около 500 лева. Това решение ще ви излезе близо два пъти по-евтино в сравнение с 1 TB SSD M.2 карта и ще ви даде приблизително два пъти по-голям ресурс за съхранение.

Що се отнася до паметта, препоръчителният вариант е 32 GB с възможност за последващо разширяване до 64 GB, така че се ориентирайте към 16 GB чипове. Повечето дънни платки, които биха отговорили на нуждите ви, изискват DDR4 памет. Два 16 GB DIMM чипа ще ви струват между 500 и 600 лева.

Дънна платка, захранване и кутия

Сега, когато имате всички тези особено важни части от пъзела, ще се нуждаете от известен брой допълнителни елементи, за да оформите цялостната конфигурация. Ако сте последвали съвета да се доверите на Intel CPU от седмо поколение, тогава дънната ви платка трябва да е от серията Z270. Ако пък решите да си купите централен процесор от осмо поколение, защото харесвате лъскавите нови неща, тогава ще ви е необходима дънна платка Z370. Внимавайте при избора си, защото CPU от седмо поколение няма да работи с дъно Z370. Като цяло винаги е добре предварително да се уверите, че избраните от вас компоненти са съвместими помежду си. Ако пък смятате, че в бъдеще ще добавяте още графични процесори, проверете дали дънната платка, на която сте се спрели, ще може да ги поддържа.

Захранването е може би най-малко вълнуващата част в процеса на изграждане на вашата собствена машина. Количеството енергия, което ви е нужно в случая, не е особено голямо. Захранване с мощност 850 W е напълно достатъчно и може да се сдобиете с него за сума, която варира между 100 и 150 лева, което ще ви осигури и възможност за инсталиране на допълнителна мощност, когато това се наложи.

Всички тези компоненти, разбира се, трябва да бъдат монтирани в подходяща кутия. Уверете се, че тази, която сте избрали, ще успее да побере различните компоненти. Охладителят и графичната карта ще заемат повече място, отколкото си представяте. Затова стандартната ATX кула е добър избор.

Монтаж и инсталиране на софтуер

За сглобяването на вашата машина за дълбочинно обучение ще ви трябва още една прилична отвертка, антистатична лента и YouTube. За почти всяка част от конфигурацията има обширен наръчник под формата на онлайн видео, който показва как точно да направите сглобката. Видеоинструкциите са особено важни при SSD картата и памет чиповете, защото монтирането им в дънната платка изисква силен натиск, което пък създава усещане, че може да счупите някой компонент.

След като сглобите всички отделни части в едно цяло и машината ви заработи, идва ред на избора на операционна система. Windows е ще ви е полезен, ако искате да убиете време с някоя от най-новите игри, появили се на пазара. Но когато става дума за дълбочинно обучение, най-вероятно ще ви се наложи да разчитате на Linux. Препоръчителната дистрибуция е Ubuntu 17.04, която има изключително лесни настройки за драйверите на Nvidia (страницата за изтегляне на драйвери на Nvidia не е актуализирана до Ubuntu 17.10). Но има едно нещо, което трябва да запомните - преди да инсталирате Linux, влезете в BIOS на машината си и се уверете, че използва интегрираната графична карта, а не 1080 Ti, защото в противен случай ще се сблъскате с проблеми по време на инсталацията.

Следвайте ръководството на Ubuntu за настройка на драйверите на Nvidia. Също така, тъй като Tensorflow (преди излизането на версия 1.5) не поддържат CUDA 9, вземете CUDA 8 библиотеки от официалния сайт.

За Python можете да се доверите на Anaconda. За получаването на Tensorflow и Keras през Anaconda пък използвайте следните команди:

  • conda install - c anaconda tensorflow-gpu
  • conda install - c anaconda keras

За PyTorch:

  • conda install pytorch torchvision - c pytorch

Не на последно място, Anaconda идва с инсталиран по подразбиране Jupyter, така че в този момент вече ще имате всичко, което ви е нужно, за да започнете работа с пресонализираната си машина за дълбочинно обучение.

Крайна цена

И накрая нека да разгледаме колко струва всичко това. Тук са приложени цените на два от водещите доставчици на компютърни компоненти – Stantek и MOST computers.


MOST computers - еквивалентна конфигурация

MAIN BOARD MSI Z270 TOMAHAWK ARCTIC /115 - 220,10 лв.

CPU I7-7700K/4.2G/8MB/BOX/LGA1151- 548,67 лв.

FAN CM HYPER 212 EVO - 44,18 лв.

RAM 16G DDR4 2400 ADATA 2 X - 268,36 лв.

HDD 1T SG SATA 6G/7200 ST1000DM010 - 73,42 лв.

HDD ADATA GAMMIX S10 512G M2 PCIE - 246,82 лв.

VIDEO CARD MSI GTX1080TI GAMING TRIO 11G - 1,784,36 лв.

CASE NZXT H440 /MID TOWER/ BLACK -160,89 лв.

CASE PSU CM MASTERWATT 750W MPX7501- 153,31 лв.

Общо без ДДС: 3498.11 лв.

Общо с ДДС: 4197.73

Цените са актуални към 31 януари 2018.

КОМЕНТАРИ ОТ  

Полезни страници
    За нас | Аудитория | Реклама | Контакти | Общи условия | Декларация за поверителност | Политика за бисквитки |
    Действителни собственици на настоящото издание са Иво Георгиев Прокопиев и Теодор Иванов Захов