Софтуер

Трансферното обучение и Интернет на нещата – комбинация на бъдещето

CIO Media

Ако знаете нещо за изкуствения интелект и Интернет на нещата, най-вероятно си давате сметка, че комбинацията между възможностите, които тези две технологични разклонения дават, би могла да се окаже изключително полезна в много отношения. С невероятен напредък в областта на компютърния хардуер, някои от съвременните теоритични постановки, които се въртя т в пространството от години, най-накрая могат да намерят практическа реализация. С непрекъснато разрастващия се пазар на Интернет на нещата, получаването на висококачествени данни никога не е било толкова лесно, а това дава възможност за разработването на все по-добри и ефективни модели, и по-специално на модели за дълбочинно обучение.

Но преди да продължим към анализа на пресечните точки между тези два технологични сегмента, нека първо обърнем внимание на това какво всъщност представлява дълбочинното обучение.

Дълбочинното обучение е съвкупност от техники за обучение на изкуствен интелект, които стоят в основата на безброй технологични постижения през последните години. Въпреки че дълбоките невронни мрежи, както е официалното наименование на технологията, съществува от 50-те години на миналия век, ключовите алгоритмични пробиви са направени чак три десетилетия по-късно. Едва наскоро напредъкът на компютърния хардуер, подпомогнал развитието на иновативни теории, огромната налична изчислителна мощност и възможностите за съхранение на данни създадоха основа, върху която може да се очаква невронните мрежи да достигнат своя пълен потенциал.

Алгоритмите за дълбочинно обучение се характеризират с уникална многослойна архитектура, в която знанието постепенно се “извлича” от суровите данни, които се въвеждат в системата. Когато една дълбока невронна мрежа е обучена да идентифицира изображенията на даден вид животно от набор от произволни изображения, тя започва първо като ги разглежда на пикселно ниво, след което пренася това знание на по-високо ниво. В следващия етап се идентифицират специфични особености и накрая се извежда цялостната визуализация на обекта.

Забележително е, че нито един изследовател на данни не е програмирал изрично определен компютър, който да изпълнява такива задачи. Вместо това, алгоритъмът за учене се подхранва със стотици хиляди изображения, докато не се ориентира и научи сам как да разпознава различните обекти.

Дълбочинно обучение в периферията: Защо това има значение

Успоредно с подобренията в хардуера, които помогнаха за напредъка в изследванията на дълбочинното обучение, бяха направени и някои важни открития, които позволиха бързото развитие на IoT-устройствата. По-специално, масовото разпространение на микроконтролерните единици (MCU) създава уникална възможност приложенията на изкуствения интелект, особено тези, идващи от дълбочинното обучение, да станат достъпни за потребителите в безпрецедентен мащаб и с невиждана досега скорост.

MCU предлагат забележителни предимства за внедряването на приложения, базирани на дълбочинно обучение, тъй като намаляват латентността, спестяват честотна лента и предлагат по-добри гаранции по отношение на неприкосновеността на личните данни. Когато такива приложения са инсталирани директно на IoT-устройство, това се нарича разгръщане на изкуствения интелект в периферията. Изборът дали приложението е най-добре да бъде разположено на сървър, в облак или в периферията се свежда до компромис между скоростта (заради латенцията) и точността (тъй като по-сложните и поради това по-големи модели не могат винаги да се съхраняват в устройства с ограничена памет).

Какво представлява трансферното обучение?

В контекста на психологията, трансферното обучение се определя като изследване на зависимостта на ученето или изпълнението на човека от предварителния опит. Хората не са научени как да изпълняват всяка възможна задача, за да я овладеят. По-скоро, когато се сблъскат с нови ситуации, те успяват да решават проблемите ад-хок, като екстраполират старото знание в нова среда. Когато едно дете се научи например да използва тенис ракета, то може лесно да модифицира това умение и да го пренесе в тениса на маса или бейзбола. При възрастните това важи и за концептуалното разбиране като прилагането на статистика или друга математическа дисциплина за изчисление на семейния бюджет например.


Трансферното обучение и Интернет на нещата – комбинация на бъдещето

© CIO Media, Cio.bg

В противовес на начина, по който функционират хората, повечето алгоритми за машинно обучение се специализират за даден набор от данни или за конкретна задача. Изследователите на машинното обучение отдават напоследък все по-голямо внимание на това как да се даде възможност на компютрите да използват повторно придобитите знания и да ги прилагат към нови задачи.

Докато дълбочинното обучение може да се използва в неконтролиран контекст, трансферното обикновено се упражнява в контролирана среда. Това означава, че алгоритъмът се учи от примерите, направени от входно-изходни двойки, които след това използва, за да идентифицира шаблони и извлича връзки, с цел да предскаже резултатите от все още непознати за него данни. Дълбчинното обучение има приложение в безбройни области, но страда от един голям недостатък – нужни са му изключително големи масиви от данни, за да се настроят хилядите параметри, които са част от архитектурата на невронната мрежа. Освен че са нужни големи банки с данни, за да се постигнат добри резултати те също така трябва да бъдат предварително етикетирани, което може да бъде скъпо и времеемко начинани. От друга страна, често достъпът до качествемни данни е ограничен, а и акуратното им етикетиране може да се окаже истинско предизвикателство.

Това е мястото, където трансферното обучение наистина може да помогне. Тo позволява моделът, разработен за конкретна задача, да бъде използван отново като отправна точка за реализацията на друга. Това е вълнуващо момент за изследователите на машинното обучение, защото имитира начина, по който хората прехвърлят знанието си от една специализирана задача в друга. Всъщност това е ключова стратегия, когато става въпрос за намаляване на необходимия размер на набора от данни, без това да се отразява на работоспособността на невронните мрежи.

Спомняте ли си примера, който дадохме в началото, за това, как един модел може да се научи да идентифицира обектите при дълбочинното обучение? Това са точните знания, които могат да бъдат трансферирани към друга задача, свързана с компютърното зрение. По този начин модел, който се научи да разпознава обикновени обекти като котки и кучета, може да прехвърли това разбиране към по-сложни мисии като идентифициране на ядра в изображения на ракови разсейки например.

 

 

 

 


X