Анализи

Новата математика на ИТ директора

CIO Media

Вече всички свикнахме с това, че алгоритми ни препоръчват книги, филми, музика, web сайтове и какво ли още не. Алгоритми търгуват с ценни книжа, предсказват престъпления, идентифицират диабетици, намират с кой да излизаме на среща (както и детегледачки), изчисляват оптимални маршрути и оценяват шофирането ни, дори създават нови алгоритми. Очевидно, животът все повече попада под влиянието на математически уравнения, включващи стотици променливи и решавани чрез стотици редове програмен код, защото компаниите все повече използват тези средства за да развиват цифров бизнес и да постигат конкурентни предимства.

Несъмнено алгоритмите могат да ни помогнат да достигнем до нови клиенти и да получим нови приходи, но в някои случаи те могат да предизвикат неочаквани етични или юридически проблеми. Защитниците на правата на потребителите и различни регулаторни органи вече насочват вниманието си към “тъмни страни” на алгоритмичната революция, от типа на стряскащото пре-персонализиране и потенциалните възможности за незаконна ценова дискриминация.

Нови реалности, нови отговорности

В тази ситуация изпълнителните директори все повече разчитат с помощта на т.нар. “експерти по данните” (data scientists) да завладеят нови територии от пазара, а ИТ директорите често остават в страни от този процес. Като бизнес лидери обаче, ръководителите на ИТ отдели трябва да включат в програмата си срещите на които доктори на науките, корпоративни юристи и представители на бизнеса обсъждат управляваното от данни бъдеще на компанията. ИТ директорите трябва да се участват в тези разговори за да помогнат при формирането на корпоративната стратегия, а също така за да дадат своя принос за вземането на по-правилни решения относно това какви данни да предоставим на даден алгоритъм, кои да пазим извън неговия обхват и как да наблюдаваме това което алгоритъмът прави.

Сред задачите на ИТ ръководителя е и разработването на защитна политика за това как да се управлява информацията, която се генерира, казва Франк Паскуале, професор по право в Университета Мериленд. “Отговорността за алгоритмите вече става част от работата на ИТ лидера”, казва той.

Понякога осъзнаването на формулираната от професор Паскуале теза може да е болезнено. Athena Capital Research, компания търгуваща с ценни книжа, използваше собствен алгоритъм, наречен Gravy и замислен така че компанията да се включва в големи сделки за покупко продажба на акции, милисекунди преди фондовата борса NASDAQ да приключи работния ден, като по този начин Athena можеше да влияе на цените в своя полза. Манипулирането на цените от Athena с осъществяване на сделки 2 секунди преди часа за дневно приключване на NASDAQ е ставало редовно в продължение на 6 месеца през 2009 г. После Комисията по ценните книжа и борсите на САЩ установи тези незаконни действия и Athena бе глобена с $1 млн.

И така, никой не твърди, че ИТ директорът трябва непременно да има докторска степен по математика, но горният пример показва, че познаването на основните концепции на реализираните алгоритми в програмите използвани от компанията е необходимо, за да бъдат избегнати определен кръг от проблеми.

“Алгоритмите ни позволяват да се отървем от пристрастията при вземането на решения, които са присъщи на хората, но също така е важно да се мисли за неочакваните опасности, които те могат да създадат”, коментира Майкъл Лука, доцент в Harvard Business School.

Магията на математиката

Алгоритмите могат да бъдат използвани за да постигнем по-ефикасни операции, да си отговорим на въпроси от тип “какво ако …”, да направим възможни нови продукти и услуги. В United Parcel Service (UPS), алгоритъмът Orion, реализиран чрез 1000 страници код, прави точно това. През 2003 г., UPS започва разработката на Orion (On-Road Integrated Optimization and Navigation), поставяйки си за цел да оптимизира маршрутите за доставки. Може би имате дни, в които ви се налага да отидете на повече от три места? “Един шофьор на UPS дневно посещава над 100 обекта и разбира се, компанията си постви за цел да спести време и гориво за камионите, като направи така, че те да се движат по най-ефикасни маршрути и все пак да осъществяват доставките навреме”, казва Джак Левис, директор по управление на процесите в UPS. Левис отговаря за Orion и екипа от 700 инженери, математици и други специалисти, които поддържат програмата.


Новата математика на ИТ директора

© CIO Media, Cio.bg

Скъсяването на маршрутите само с една миля дневно на шофьор спестява на компанията $50 млн. годишно. В UPS очакват, че към 2017 г. с помощта на Orion ще постигнат икономии от гориво и други разходи на обща стойност $300 - $400 млн. годишно.

Според Джак Левис, най-важното което един мениджър трябва да направи заемайки се с проект за разработване на алгоритъм е да работи “отзад напред”. Това означава, че той трябва да определи внимателно кои бизнес решения затрудняват компанията, след това да идентифицира какви знания биха били от полза – каква информация е необходима за да са налице знанията, които липсват. След като са идентифицирани първичните данни, тяхното анализиране и интерпретиране ще осигури необходимата информация.

В UPS работата по Orion е продължила 9 години преди системата да бъде въведена в употреба. През това време са добавяни и премахвани данни, провеждани са тестове, после пак са добавяни и премахвани данни и т.н. Например, първоначално Orion използва карти, които са публично достъпни. Те обаче се оказват недостатъчно подробни, така че UPS създава свои собствени, отразяващи най-различни особености като наличието на дълга половин миля алея за коли към къщата на клиент или пък алея към заден вход, която скъсява времето за достигане до мястото за получаване на пратките. Данни от този вид бяха важни за да може Orion да планира най-ефективния начин, по който даден пакет да бъде доставен в срок.

Но алгоритъм, създаден от експертите по данни не може да предвиди всеки фактор, който има значение и всеки нюанс. Да предположим, че имаме корпоративен клиент, който обикновено получава по една пратка на ден. Ако Orion знае, че пратката не е обвързана с конкретно време за получаване, алгоритъмът може да предложи доставката да стане не днес сутринта, а чак утре следобед, в зависимост от другите задачи за деня. Това може да е най-ефикасно за UPS, но клиентите няма да знаят какво да очакват ако времето по което получават доставките си се сменя често. Хората не са склонни да се примиряват с несигурност, надхвърляща определено ниво и това, може да има неблагоприятно отражение върху бизнеса на UPS.

Всъщност компаниите често приемат доставки сутрин, след това се заемат с работата си и по-късно се обаждат на UPS със заявки за изпращане на техни пратки в късния следобед. Ако UPS измести доставките в края на деня с цел да подобри ефективността си, заявките за поръчки в края на деня може и да не бъдат направени, казва Левис. “В един момент започнахме да осъзнаваме, че правилата, които сме задали в алгоритъма не са толкова добри, колкото би трябвало. Стигнахме до извода, че трябва да осигурим балансиране между оптималност от една страна и последователност и съгласуваност от друга”, пояснява директорът по управление на процесите в UPS.

Екипът на Orion не е част от ИТ екипа на компанията, но Левис казва, че ИТ отделът е създал работещата версия на Orion, а Дайв Барнес, който е CIO на UPS разбира отлично, какво умее да прави програмата и какво не, което му дава възможност да е изключително полезен при разработването на бизнес стратегията на компанията. Така например, идея на ИТ директора е разработването на услугата My Choice, която уведомява клиентите за предстоящи доставки и им дава възможност да променят времето и мястото за получаване на пратката. Левис подчертава, че тази услуга е базирана на Orion и не би могла да се реализира без системата, както и, че ползите от My Choice са съществени. Благодарение на тази услуга не само се редуцират многобройните опити за доставяне на една и съща пратка, но и се генерират нови приходи. За услугата са се абонирали 7 млн. клиенти плащат по $5 за еднократна промяна на време или място на доставката или по $40 на година за правото да правят такива промени неограничен брой пъти. И това не е всичко, защото UPS тепърва ще разпространи услугата и в други страни извън САЩ.

Да знаем повече

За да развият нов бизнес на базата на прозренията, до които достигат с помощта на алгоритмите, компаниите трябва да търсят взаимовръзки, които техните конкуренти не са забелязали.


Новата математика на ИТ директора

© CIO Media, Cio.bg

Пример в това отношение е H&R Block – компания, основана през 1955 г. и предлагаща услуги във връзка с отчитането на данъчни задължения, както и специализиран софтуер за тази цел. H&R Block оперира чрез 12 хил. собствени или франчайз офиси на територията на 50 щата и само през 2013 г. е помогнала на клиентите си да получат $50 млрд. чрез връщане на данъци, кредити и други инструменти предоставяни от правителството на САЩ при определени условия.

През декември 2014 г. компанията започна тестове на своя нов алгоритъм, предназначен да категоризира поведението на 8700 данъкоплатци и да изведе прогноза за потребностите на своите клиенти. Така например, ако вие сте клиент на H&R Block, на базата на предишното ви поведение компанията ще знае, че обикновено подавате данъчната си декларация през февруари и ако до 10 февруари не сте потърсили съдействието на експертите, ще получите по email напомняне и информация за отстъпка от стандартната цена. Други клиенти ще получат подобно напомняне в друг момент, оценен от алгоритъма като най-подходящ за тях, разказва маркетинг мениджърът на компанията Кати Колинс.

В H&R Block се надяват с времето да усъвършенстват своя алгоритъм, така че той да анализира не само съдържанието на информацията за данъчните задължения, но и всеки клик, който данъкоплатеца прави докато ползва техния софтуер. “С персонализацията, която ще постигнем по този начин, клиентите не само ще чувстват, че нашия софтуер е създаден за тях, но и че е винаги стъпка напред”.

Разбира се и по отношение на персонализацията трябва да се внимава и да се търси баланс. “Някои клиенти ще харесат това, други не” – така коментира плановете на H&R Block професор Паскуале, който е автор на книгата “Обществото на черната кутия: Тайните алгоритми, които контролират парите и информацията” (“Black Box Society: The Secret Algorithms That Control Money and Information”).

“За да знаят повече компаниите оказват твърде много натиск. Страхувам се, че това е нещо като надпревара във въоръжаването”, коментира професор Паскуале.

Но идеята да се знае колкото е възможно повече за хората е движеща сила в много компании - например в eHarmony, която предлага онлайн платформа за запознанства. Услугата съпоставя регистрираните потребители на базата на характеристики, които те сами са посочили за себе си – от типа на любими занимания и сексуална ориентация. В допълнение обаче eHarmony прилага метода на екстраполацията за да изведе неспоменати от потребителите “дълбоки психологически черти”, като например любопитство, което се извежда чрез специални формули, получаващи като параметри отговорите на някои от въпросите в анкетната карта за регистрация. С помощта на невронна мрежа се извежда оценка за удовлетвореност, на базата на която различните потенциални двойки се класират. При това, системата се “учи” с времето от обратната връзка с потребителите, които съобщават доколко са били удовлетворени от срещите си с хора, предложени от платформата.

В eHarmony няма CIO. Функциите на тази позиция изпълнява оперативният директор Армен Аведисян. Решенията за евентуални промени в алгоритъма се вземат от Аведисян, главният технологичен директор Тод Нгуиен, вицепрезидентът на компанията Стив Картер и юристите на компанията. “Тук не става дума само за хардуер и софтуер, но за стратегия и тактика на управлението на данните”, коментира Аведисян.

Компанията взема предвид 29 измерения на съвместимост, като “емоционална енергия”, “любопитство” и т.н., всяко от които се изчислява чрез няколко променливи, чиито стойности се извеждат от подробния въпросник попълван от потребителите на eHarmony. В платформата са натрупани повече от 125TB данни. Алгоритъмът се “обучава” оценявайки какво предприема потребителят, когато eHarmony му предложи лице, с което да се свърже (веднага осъществява контакт? игнорира предложението? И т.н.) както и от обратна връзка с потребителите, която те предоставят. “Тези данни се включват обратно в уравнението и цикълът се завърта отново, вече на по-високо ниво на информираност”, обяснява Аведисян.

Колкото по-релевантни предложения за контакти дава платформата, толкова на по-високо ниво комуникират нейните потребители. А колкото по-ангажирани са потребителите, толкова по-вероятно е те да си купят годишен абонамент. Важна цел на алгоритмите, разработвани в eHarmony е регистрираните потребители да се превърнат в абонати. За да постигне тази цел компанията изпробва различни идеи като прилага леко различаващи се алгоритми за различни групи потребители и после измерва в коя от групите най-много регистрирани са станали абонати.

Едно от откритията, направени по този начин е следното – дали някой пуши и пие е много по-важно за потребителите на услугите на eHarmony в Европа, отколкото в САЩ. “След като алгоритъмът бе настроен така че да дава на тези два параметъра по-високо тегло, във Великобритания бизнесът просто полетя”, казва Аведисян.

Но … не всички резултати от действието на алгоритмите са очаквани.

Непредвидени последствия

Uber преобърна бизнеса на таксиметровите услуги с приложение което свързва пътници и водачи на моторни превозни средства и собствен алгоритъм, който отчасти прилага т.нар. политика “surge pricing”, при която в период на повишено търсене на услугата цената и се вдига (например в Новогодишната нощ). Асоциации на таксиметровите шофьори от Ню Йорк до Париж протестираха срещу това, че Uber отнема техния бизнес, а правителствените регулаторни органи поставиха въпроси във връзка със справедливото ценообразуване и безопасността. Но въпреки това, Uber привлече финансиране от инвеститори на стойност $4.9 млрд.

През миналия декември, студената и безпристрастна математика се сблъска с горещите емоции – в Сидни (Австралия) алгоритъмът на Uber вдигна автоматично цените в момент когато много хора се опитваха да се отдалечат от кафене в центъра на града, където въоръжен престъпник държеше 17 заложници. Двама от заложниците и похитителят загинаха.

По-късно Uber се извини за вдигането на цените, които според някои източници са били достигнали 4 пъти по-високи от нормалните нива, а също така върна парите. “Нещастно стечение на обстоятелствата създаде убеждението, че Uber прави нещо, което не в интерес на обществото. Ние, разбира се, не сме имали никакви подобни намерения”, заяви мениджър от Uber Австралия.

Най-голяма вероятност за възникване на проблеми е налице, когато алгоритмите действат автоматично, без човешка намеса или наблюдение. Контролът е критично важен, казва Алистър Крол, консултант и автор на книгата “Lean Analytics: Use Data to Build a Better Startup Faster”.

“Ако алгоритми са в основата на бизнеса ви и вие не сте предвидили как да регулирате вашите алгоритми, тогава, по дефиниция, вие губите контрол върху вашия бизнес”.

Според изявления на представители на Uber, компанията разработва глобална политика за задържане на цените под определени нива по време на бедствия и извънредни ситуации.

Непредвидени последствия възникват и заради стремежа на компаниите да “знаят” прекалено много.

Например да предположим, че една болница използва данни за пациентите си за да провежда анализи с помощта на които да идентифицира хора, предразположени към някакви заболявания, а след това се свързва с тях за да ги покани на профилактичен преглед. Ако заложеният алгоритъм е несъвършен, болницата може да пропусне някой, който по-късно да заболее или да умре. Възможно е и цели групи хора да бъдат пропуснати. “В такава ситуация е доста сложно да се прецени кой печели и кой губи и дали компанията ще издържи, когато станат известни подробностите”, казва професор Паскуале.

При друг сценарий, компанията може да се окаже обект на съдебни искове например ако поддържа прекалено много информация за своите служители. Възможно е някой от тях да докаже, че компанията го е уволнила, защото знае, че здравословното му състояние е проблематично, казва авторът на книгата “Тайните алгоритми, които контролират парите и информацията”.


Новата математика на ИТ директора

© CIO Media, Cio.bg

Или пък нека допуснем, че компания за автомобилно застраховане, анализирайки данните открие, че вероятността неин клиент да катастрофира е по-висока, след като той е шофирал повече от Х километри. Тогава компанията може да се окаже в ситуация “задължена да извести”. Днес такава ситуация може да възникне в сравнително редки случаи – например специалисти по психичното здраве би трябвало да съобщават за пациенти, които са опасни за обществото. Но тъй като разпространението на “алгоритмите за разкрития” става все по-масово, хората в много други сектори ще се окажат “задължени да известят” – ако не по юридически, то по етични норми, счита Паскуале.

“В какъв момент, това че знаете прекалено много за вашите клиенти ще ви обвърже с прекалено много отговорност?”, пита професорът по право.

А при наличието на всевиждащи алгоритми, компаниите все по-често ще се натъкват на неудобни истини, без да са си поставили за цел да ги откриват.

Консултантът Алистър Крол споделя това мнение. Той счита, че нетърсени открития могат да бъдат изведени дори ако алгоритъмът работи с мета данни (описания на данните за клиентите), а не със самите данни. Например аналитичната система в една застрахователна компания може да открие, че през годините клиентите, които са променяли първото си име най-често се оказват такива, които предприемат самоубийство, допуска Крол. А какво ще предприемете ако на следваща стъпка анализът покаже, че промяната на първото име в повечето случаи е свързана с промяна на пола и че всъщност тези клиенти не са могли да се справят с промяната в своя живот? От една страна разполагате с някакъв шаблон, от който могат да бъдат извлечени финансови ползи. Но ако компанията увеличи застрахователните вноски за клиенти, които са променяли първите си имена, тя може да бъде обвинена в дискриминация, изтъква Алистър Крол.

Алгоритми в действие

Компаниите все по-активно ползват алгоритми за да генерират приходи или оптимизират операции. Ето няколко примера

Оптимално вкусно
Подразделението Minute Maid на Coca-Cola оптимизира смесите, изграждащи произвежданите от него сокове (особено портокаловия сок) като анализира предпочитанията на потребителите относно фактори като вкус на напитката, съдържание на целулоза и т.н. Наред с това се отчитат и фактори като транспортни разходи в производствения процес, както и разходи за работна сила. Целта на Coca-Cola е да създава сокове, които хората харесват, но същевременно са в съответствие с реалностите във веригата за доставки.

Кой е пред екрана?
В Netflix си дават сметка, че в едно домакинство няколко човека ползват един и същ абонамент за техните видео услуги. Компанията иска да може да разпознава кой ползва услугата и в даден момент за да предложи подходящо съдържание без да се налага потребителят да се идентифицира всеки път. За целта в Netflix са разработили алгоритъм който анализира шаблони за потребителско поведение и дава предложения за гледане на филми в зависимост от няколко критерия. Първият от тях е време от деня. Следобед е по-вероятно зрителят да е дете, а късно вечер възрастен. В бъдеще системата може би ще познава дали зрителят е мъж или жена и на каква възраст е, анализирайки силата, с която той или тя натиска бутоните на устройството за дистанционно управление.

Откъде пазаруваме?
Известният производител на джинси и спортни облекла American Eagle Outfitters ползва алгоритъм, който помага направените онлайн поръчки да бъдат изпълнени по оптимален начин. Програмата взема решение от кой физически магазин да се изпрати стоката отчитайки няколко фактора. Например ако сте си поръчали модела X, се вземат магазините, от които доставката ще стигне до вас най-много за 2 дни, после от тях се избират магазините в който моделът X се продава най-слабо, а от тях се избира магазина с най-нисък обем на продажбите изобщо.

Затегнете коланите
Компаниите от сферата на автомобилното застраховане отдавна изчисляват цените на своите услуги на базата на параметри като километри шофиране, възраст на клиента, пол, семейно положение, тип на автомобила, пътно-транспортни произшествия и т.н. Сега компанията Allstate усъвършенства този процес чрез алгоритъм, който дава различна тежест на всеки рисков фактор. Например относителния риск за 16-годишен водач на МПС е тройно по-висок отколкото за някой на възраст 30-50 години. Също така километрите които 16-годишният водач изминава в началото на първата си година, се оценяват като по-рискови от тези в края на годината.

Ролята на ИТ директора

Най-добрият начин по който ИТ директорът може да подкрепя експертите по данните е като избира технологии и процеси, които пазят данните чисти, актуални и достъпни, казва Крис Полиот, вицепрезидент Data science в компанията Lyft, която е конкурент на Uber. Преди да се присъедини към Lyft през 2013 г., Полиот е работил в продължение на 5 години като директор по алгоритми и анализи в Netflix, а преди това е бил експерт по статистика в Google.

ИТ директорите трябва също така да създадат системи с помощта на които да следят промените и това как управлението или дефинирането на данните би могло да заблуди алгоритъма. Още една ключова задача за ИТ ръководителите е да разбират как да използва алгоритмите по най-добрия начин, дори ако нямат възможност да изградят собствени алгоритми, допълва Полиот.

Например, ако една платежна система трябва да реши дали дадена трансакция е всъщност измама, за целта би могъл да се вгради алгоритъм в софтуера обслужващ плащанията. Или алгоритъмът може да се изпълнява офлайн, като резултатите от изчисленията се приложат след трансакцията, евентуално за предотвратяване на следващи трансакции. Във всички случаи, за да вземе решение, ИТ директорът трябва да разбира достатъчно добре каква е услугата и как работи алгоритъмът, убеден е Полиот.

Разбира се, ИТ ръководителите трябва да осигурят технологична инфраструктура, върху която да се изпълняват корпоративните алгоритми, както и да осигурят необходимите данни, коментира Марк Катц, CIO на Американското общество на композиторите, писателите и издателите (ASCAP) – организация, която лицензира, следи и разпределя постъпления от авторски права между творците в музикалната индустрия.

Катц редовно се консултира с юристите на ASCAP за да бъде сигурен, че резултатите от алгоритмите, които се прилага в работата на организацията са в съответствие с хартата на общността и с действащите регулации.

ИТ ръководителите със сигурност могат да очакват, че аналитичните програми ще контролират все повече аспекти на бизнеса. В частност Федералната търговска комисия на САЩ следи дали банки, търговски вериги и други компании не използват алгоритми, които макар и непреднамерено дискриминират някои хора. Например възможно е някакъв алгоритъм използван в подкрепа на вземането на решения за отпускане на заеми, да причисли несправедливо даден човек в групата на неплатежоспособните. Също така може онлайн магазин да показва различни цени на различните си клиенти на базата на това какво устройство за достъп до сайта използват те – такава практика демонстрираха преди време Home Depot, Orbitz и Travelocity. “Компаниите може да наричат този подход персонализация, но от гледна точка на потребителите това е несправедливост”, казва Майкъл Лука от Harvard Business School.

Наскоро Федерацията на потребителите в САЩ изрази загриженост, че в индустрията на автомобилното застраховане алгоритмите за оптимизация на ценообразуването може да станат причина за нарушаване на регулациите, които изискват застрахователните премии да са базирани само на фактори свързани с риска, а не със съображения във връзка с печалбите.

И така, клиенти, регулаторни органи и представители на съдебната власт може да ви попитат какво точно прави вашият алгоритъм. В САЩ, през януари тази година президентът Обама внесе в Конгреса искане за приемане на закон за защита на потребителите наречен Consumer Privacy Bill of Rights, който дава на хората повече възможности да контролират това, което компаниите правят с техните лични данни. Всъщност президентът предложи тази идея за първи път през 2012 г. Законът все още не е приет, но хората все повече се замислят и тревожат за своите данни. “На потребителите никак не им харесва усещането че са заключени в нещо като игра от тип стратегия, в която техен противник са магазините”, коментира професор Паскуале. Затова, според него, ИТ директорите трябва да вземат незабавни мерки, когато даден алгоритъм извежда модели и информация, нарушаващи нормите.

“Почти всеки тип алгоритъм, реализиран за някакви цели на днешния цифров бизнес има и етично измерение. Всеки CIO трябва да осъзнава това”, обобщава Майкъл Лука от Harvard Business School.

* Оригиналът на статията е публикуван в списание CIO US през февруари 2015 г. под заглавие “CIOs Have to Learn the New Math of Analytics”.


X