Софтуер

Най-добрите библиотеки за машинно и задълбочено обучение

CIO Media

Мартин Хелър, InfoWorld

Ако започвате нов проект в областта на машинното или задълбоченото обучение, може да се объркате коя рамка да изберете. Както ще обсъдим по-долу, има няколко добри опции и за двата вида проекти.

Има разлика между рамката за машинно и тази за задълбочено обучение. В общи линии рамката за машинно обучение покрива различни методи за обучение за класификация, регресия, клъстеринг, засичане на аномалии и подготовка на данни и може да включва или не методи на невронни мрежи. Рамката за задълбочено обучение или задълбочени невронни мрежи покрива различни топологии за невронни мрежи с много скрити пластове. Keras, MXNet, PyTorch и TensorFlow са рамки за задълбочено обучение. Scikit-learn и Spark MLlib са рамки за машинно обучение.

В общия случай изчисленията на задълбочените невронни мрежи се извършват много по-бързо на GPU (особено на Nvidia CUDA GPU с общо предназначение), TPU или FPGA, отколкото на CPU. Тоест по-прости методи за машинно обучение не могат да се възползват от предимствата на CPU.

Можете да обучавате задълбочени невронни мрежи на едно или повече CPU, но обучението ще е бавно и под бавно нямаме предвид секунди или минути. Колкото повече неврони и пластове трябва да се обучат и колкото повече налични данни има, толкова по-дълго време ще отнеме. Когато екипът на Google Brain обучава моделите за междуезични преводи за новата версия на Google Translate през 2016 г., те организират обучителните си сесии по една на седмица на множество GPU. Без GPU всяко обучение щеше да отнеме месеци.

За да прочетете цялата статия, е нужен абонамент.

X