Този сайт използва бисквитки (cookies). Ако желаете можете да научите повече тук. Разбрах

Новини Технологии и концепции
бр. 4, 2015

Всичко, което бихте искали да знаете за големите данни (част 3)

С какви особености, нови идеи и нови възможности са свързани Big Data? В предишните две статии от тази поредица пояснихме дефиницията на понятието “големи данни”, спряхме на множество разнообразни методи за анализ на масиви от данни, направихме с преглед на еволюцията на технологиите и на предизвикателствата, с които е свързано внедряването на решения от този клас. Още един много важен аспект на темата за Big Data технологиите е тяхното приложение

от , 21 април 2015 0 1978 прочитания,

Всичко, което бихте искали да знаете за големите данни

Както обещахме в миналия брой на CIO, третата статия от поредицата за “големите данни”, ще бъде посветена на тяхното приложение. В тази връзка особено важни са 2 въпроса: “Кой разполага с големи данни?” и “Какво може да се прави с тях?”. Ще се опитаме да отговорим, доколкото това е възможно в рамките на няколко страници.

Кой притежава “големи данни”?

Прочетете още: Всичко, което бихте искали да знаете за “големите данни” (част 1)

Известният експерт в сферата на управлението на данните и автор на няколко бестселъра по темата за повишаване на ефективността на бизнеса Бърнард Мар (Bernard Marr), съветва компаниите, които искат да използват Big Data технологиите за постигане на своите цели, като първа стъпка да проучат опита на лидерите в тази сфера.

Някои организации редовно се сблъскват с необходимостта да анализират структурирани и неструктурирани данни с огромен обем и значително многообразие. Те не само осъзнават, че мащабите имат значение, но и си дават сметка за много други условия, от които зависи успешното прилагане на Big Data технологии. В това отношение Бърнард Мар дава за пример General Electric, Amazon, Facebook и Google.

>> General Electric - готови да платят

Американската корпорация развива дейност в огромен брой направления – от финанси до електроенергетика и транспорт, включително авио-, морски и железопътен. Напоследък GE полага усилия да заеме оптимални позиции за извличането на бъдещи ползи от развитието на тенденцията “Интернет на нещата” (IoT). В компанията са убедени, че “Интернет на нещата” – концепцията за развитие на изчислителни мрежи, включващи технически устройства, снабдени с технологии за взаимодействие помежду им и с външната среда без участието на човека – е ключ към значителни икономии на средства за сметка на повишаване на ефективността, както и към потенциални революционни промени в бизнеса.

В светлината на тази визия, GE инвестират значителни средства в това, което те наричат промишлен интернет – т.е. в интернет на нещата, но не в бита, а в производството. Идеята е да се изгради мрежа от датчици и интелигентни системи, обединяваща различни агрегати, електростанции, локомотиви, самолети. Авиационните двигатели, снабдени с мрежи от датчици могат да проследяват и измерват и най-малките промени. Това означава, че фината настройка за повишаване на ефективността вече достига на такова високо ниво, за което доскоро не бихме могли и да мечтаем. Същата концепция следват разработките на медицинско оборудване и електростанции на холдинга. През 2012 г. General Electric обяви, че е инвестирала $1 млрд. в проекти за използване на Big Data технологии, които ще бъдат реализирани до 2016 г.

>> Amazon – личен пример

Може да се каже, че Amazon в известен смисъл въведе Вig Data в практиката. Компанията даде личен пример в това отношение, променяйки понятието за работа с клиентите. Един от недостатъците на онлайн пазаруването доскоро бе липсата на продавач консултант, който след като проучи предпочитанията на клиента да му помогне да намери това, което търси.

Освен лични препоръки и възможност да публикуваме отзиви и коментари, съвременният Amazon ни предостави и продавач консултант, който притежава суперсили – той съхранява в своята памет информация за всяка сделка с всеки купувач и е в състояние мигновено и безгрешно да определи и да предложи на клиента това, което му е необходимо. В това направление Amazon стигна толкова далеч, че според някои слухове (основание за които дава информацията за заявки за патенти), интернет магазинът планира да започне “предварителни доставки на стоки” – т.е. автоматично да изпраща пратки с книги, DVD, видео игри и устройства на основание на знанията за това, какво купуват клиентите и за какво с радост ще платят отново.

В Amazon осъзнават много добре ролята на “големите данни” – компанията инвестира в услуги, базирани на данни огромни суми придобити от търговската и дейност в интернет. Сега тя предоставя своята инфраструктура и дава възможност на други компании да извличат полза от събирането на данни и от техните анализи, като разбира се, това и носи нови приходи.

>> Facebook – колекция от лични данни

Facebook промени напълно представите за общуване. С помощта на този сайт хората могат да бъдат в постоянна връзка с близките си и с два клика на мишката да организират съвместното прекарване на време с приятели през почивните дни. Да, и преди да съществува Facebook ползвахме различни услуги за обмен на мигновени съобщения и изпращахме писма по електронна поща, но именно тази социална мрежа създаде най-крупния в света справочник за хора (1,32 млрд.), в който всеки може да получи достъп до всеки друг потребител (в зависимост от настройките за поверителност).

С голяма доза сигурност може да се каже, че Facebook разполага с най-голямата база данни с лична информация в световната история. Всеки ден потребителите на сайта внасят в него 30 млрд. единици съдържание, което се равнява на 300 петабайта (3 млн. гигабайта) информация.

Facebook използва тази информация за привличане на рекламодатели. По данни, обявени в края на януари, приходите на компанията за последното тримесечие са $3,85 млрд., а 69% от тях са от реклама, докато в предходното тримесечие рекламата е допринасяла за 66% от приходите.

>> Google – да търсиш и събираш

Както Facebook, така и Google е преобразувала събирането и анализа на данни в бизнес модел - компанията предоставя услуги безплатно, но в същото време печели от информацията, която събира, наблюдавайки как използваме тези услуги.

Търсенето все още ключовата услуга, която Google предоставя, като алгоритмите за тази цел продължават да се развиват. Дейността на компанията често привлича вниманието на обществеността по различни поводи – от високата скорост на търсене (Google преглежда милиони уеб страници, за да намери, това което търсим) до фантастичните мащаби на обхват на Google Earth.

Google предлага на бизнеса услуги, свързани с обработката на големи обеми от данни, сред които са аналитичната услуга BigQuery и облачната услуга Google Cloud Storage.

>> Kaggle – състезания по “големи данни”

Един много интересен пример за бизнес базиран на Big Data e компанията Kaggle, основана през 2010 г. На практика Kaggle предоставя едноименна платформа за прогнозно моделиране и състезания по анализи. Компании и изследователи публикуват своите данни в платформата, след което статистици и специалисти по data mining от цял свят се състезават, кой от тях ще предложи най-добър модел. Този краудсорсинг подход в случая е много подходящ, тъй като към една задача за прогнозно моделиране може да се подходи по безбройно много начини и е невъзможно да се знае от самото начало коя техника ще бъде най-ефективна.

След като се оцени точността на различните прогнози, извеждани от предложените в Kaggle модели, се излъчва победител, на който компанията възложила задачата изплаща възнаграждение.

Kaggle разполага с около 200 хил. учени по анализи на данни (data scientists) по целия свят, които са специалисти по компютърни науки, статистика, икономика и математика. Задачи за съревнованията на компанията са възлагали NASA, Wikipedia, Deloitte и др.

Една от най-мащабните инициативи на Kaggle е състезанието Heritage Health Prize с награда от $3 млн. То беше обявено през пролетта на 2011 г. Целта беше да се разработи алгоритъм, който на базата на предоставено множество от медицински данни да предсказва най-точно кой пациент ще трябва да постъпи в болница. Победителят беше излъчен след 2 години работа по проекта, като в състезанието участваха 1659 екипа, които предложиха 35 хил. модела.

Друга интересна задача за анализ на “големи данни” на Kaggle имаше за цел подобряването на разпознаването на жестове в Microsoft Kinect. CERN също е използвала Kaggle, публикувайки задача свързана с намирането на Хигс бозона.

Какви са възможните приложения на Big Data в различните индустрии?

Спектърът на приложение на “големите данни” е доста широк, затова ще се спрем на най-очевидните сфери за използване на тези технологии.

>> В търговията на дребно

Значителните обеми от данни, натрупани от крупните търговски вериги могат да дадат изключително полезна информация на топ мениджърите – какви стоки се търсят, осигурени ли са достатъчно от тях на склад, кои магазини са най-печеливши и т.н.

Системите прилагаща Big Data технологии дават възможност за автоматично прогнозиране на търсенето и предлагат решения за конкретни ситуации като планиране на промоционална кампания, преместване на стоки в други складове и магазини и т.н. С помощта на такива решения времето за реакция при откроени възможности за увеличаване на продажбите се съкращава от няколко месеца до няколко дни.

Подобна система е изградила например най-крупната ритейл компания в Швейцария Migros Group, която управлява мрежа от 37 универсални магазини. Решението дава възможност на Migros да променя гъвкаво своята ценова политика и маркетинговите си стратегии, реагирайки бързо и на най-малките колебания в пазара. Сега, компанията, предлагаща 800 хил. стоки с различни наименования от 3500 доставчици, получава справка за стоки, които не се търсят за 17 секунди. За сравнение преди въвеждане на Big Data технологии за генерирането на такава справка са били необходими 22 минути. Отчетите за продажбите се създават за 60 секунди вместо за 7 минути, както по-рано. В резултат, Migros Group е успяла кардинално да промени стратегията си за стимулиране на продажбите на стоки с намалено търсене.

>> В металургията

В разходите на металургичните предприятия дялът на енергийните ресурси напоследък нарасна до 30%. На този фон темата за спестяването на електроенергия става все по-актуална и днес с нея се занимават както инженери, така и изпълнителни директори. Често обаче те нямат пълна информация за изразходването на електроенергия.

По света вече има металургични предприятия, които въвеждат Big Data технологии за да осигурят дистанционна оперативна отчетност и мониторинг на електроенергията, консумирана за различни цели (отделни производства, цехове, видове продукция и т.н.). Практиката потвърждава, че с този подход компаниите успяват да намалят разходите си за електроенергия за сметка на идентифициране и отстраняване на фактори за неефективното и използване.

Наред с това в металургията Big Data технологиите са полезни и за изследване на различни стратегии за снабдяване и формиране на ценова политика.

>> В банките

Финансовите институции са сред лидерите в използването на “големи данни”. Според оценки на Gartner, 34% от банките по света са инвестирали в развитието на тези технологии.

Основните задачи, за които банките използват Big Data технологии са: оперативно получаване на справки, скоринг, недопускане на съмнителни операции, мошеничество и пране на пари, както и персонално предлагане на банкови продукти на клиентите.

За сега, “големите данни” се прилагат най-често за анализ на клиентската среда. Потребителите на банкови услуги постоянно осъществяват покупки, използвайки своите карти, което дава възможност на финансовите институции да намират закономерности в потребителското поведение и да предлагат услуги на съответния клиент в необходимото време, повишавайки по този начин продажбите си.

Използвайки алгоритми за анализи на информация от социалните мрежи, банките могат оперативно да оценяват настроенията на клиентите, да изследват тяхното отношение към нови продукти и услуги, да подобряват качеството на предоставяните услуги и т.н. Дори само един анализ на действията на потребителите на приложенията за мобилно банкиране може да замени дългите въпросници и скъпи проучвания, които доскоро се използваха за решаване на задачите, свързани с подобряване на обслужването.

И разбира се, Big Data технологиите могат да се използват за оценка на кредитоспособността. Колкото повече информация за потребителите е събрана (кредитна история, активност в социалните мрежи, начин на живот и т.н.), толкова по-лесно е да се избягват кредитните рискове.

>> В телекомите

В сферата на телекомуникациите “големите данни” се прилагат за управление на клиентската лоялност. Компаниите ги използват за сегментация на клиентската база, изследване на предпочитанията и оценка на доходността на различни групи потребители. Те провеждат анализи на записите за обажданията на клиентите по десетки и стотици настройваеми параметри и категоризират абонатите в различни групи. След това се провежда планиране и предварителна оценка на маркетингови кампании от гледна точка на качествено таргетиране. Всичко това помага да се предотврати загубата на абонати за сметка на открояване на факторите, които влияят на лоялността и оценка на тяхната значимост.

В началото на 2014 г. испанска телекомуникационна компания демонстрира аналитична система, базирана на обработка на големи данни в 3G и 4G мрежи. Системата предсказва поведението на множества от хора на базата на информация, предавана от техните смартфони. Системата може да се използва от правоохранителните органи по време на концерти, спортни мероприятия и т.н.

Друго приложение на Big Data в сферата на телекомуникациите е превантивната диагностика. С анализиране различни параметри за работата на оборудването могат да бъдат откроени шаблони за поведение на системите, които предшестват възникването на срив. Ранната диагностика улеснява планирането на профилактика, както и замяната и ремонта на оборудване, без проблеми за клиента.

Някои телекоми използват технологии за обработка на големи масиви от данни, не само за целите, описани дотук, но и за да анализират информация от социалните мрежи за да разберат, кой от техните клиенти е възприеман като авторитет в кръга на своите познати и какви са потребностите на такива хора. Защото ако авторитетен клиент заяви публично, че сменя своя оператор, това може да предизвика ефект на доминото. Разбира се, в интерес на компанията е да предотврати такива събития. Според съобщения, които се появиха преди време, използвайки технологии за прогнозни анализи и “големи данни” американската компания T-Mobile е намалила отлива на клиенти с 50% в рамките на едно тримесечие.

>> В транспорта

Всичко, което бихте искали да знаете за големите данниBig Data технологиите имат своето приложение и в транспорта - например в строителството на железопътни линии. Всяка година по света се изграждат нови и нови железни пътища и съответно техният ремонт и поддръжка изисква все повече разходи. В Холандия, агенцията за ж.п. транспорт използва мощно програмно осигуряване, с което анализира 56 хил. параметъра, включително за състояние на железните пътища и ниво на търсене от страна на пътниците. Благодарение на анализа на тези денни, превозвачът, който изпраща в движение над 5 хил. влакови композиции на ден, успява да постигне 6% по-висока оперативна ефективност и спестява около 20 млн. евро годишно.

Не по-малко интересни са примерите за използване на “големи данни” в авиацията. Bangkok Airways използва решение, което осигурява в реално време информация за най-натоварените маршрути, а това дава възможност оперативно да се организират допълнителни полети. Положителен опит с Big Data има и Fraport AG (летището във Франкфурт) – там с помощта на тези технологии са успели да намалят разходите за техническо обслужване и управление на оборудването със 70%.

>> В енергетиката

През последните години, интелигентните мрежи (Smart grid) са популярна тема. Разработваните в тази сфера Big Data приложения са с разнообразна функционалност - от мониторинг и адаптивно управление на мрежата в реално време, през анализ и промяна на технологични параметри, до осигуряване на комуникация между потребители и доставчици. Основната задача е оптимизиране на генерирането и потреблението на електроенергия.

Други задачи, за решаването на които Big Data се оказват полезни са прогнозиране на неизправности с цел увеличаване готовността на оборудването, както и оперативен мониторинг на консумираната електроенергия, даващ възможност да се откроят случаи на нерационалното и използване и да се осигури по-точно прогнозиране на потреблението й.

Източници:
[1] The 7 Most Data-Rich Companies In The World, Bernard Marr, публикация в LinkedIn
[2] The Amazing Big Data World of Kaggle and the Crowd-Sourced Data Scientist, smartdatacollective.com

В следващия брой на списание CIO очаквайте четвъртата част на тази статия, в която ще разгледаме предизвикателствата, свързани с възвръщаемостта на инвестициите в Big Data технологии.

КОМЕНТАРИ ОТ  

КОМЕНТАРИ

Трябва да сте регистриран потребител, за да коментирате статията
"Всичко, което бихте искали да знаете за големите данни (част 3)"



    

Полезни страници
    За нас | Аудитория | Реклама | Контакти | Общи условия |
    Действителни собственици на настоящото издание са Иво Георгиев Прокопиев и Теодор Иванов Захов