Този сайт използва бисквитки (cookies). Ако желаете можете да научите повече тук. Разбрах

Новини ИТ мениджмънт

Не, не трябва всички данни да се пазят вечно

Повечето от старите данни на компаниите са безполезни. Затова те трябва да се изтрият, а не да се пропиляват средства и време с надеждата, че изкуственият интелект някой ден ще измисли нещо за тях.

от , 08 декември 2017 0 1753 прочитания,

Не, не трябва всички данни да се пазят вечно

Днес е популярно да се приема, че всички данни са ценни и трябва да се пазят завинаги, а машинното обучение някой ден магически ще открие за какво могат да се използват. Може би обаче организациите не трябва да слушат съветите на сторидж компаниите, да спрат да пазят всички данни и да започнат да трият.

В ранните години на мрежата често се казваше, че хората я посещават, за да разглеждат снимки на котки. Ако се свалят всички тези образи и бъдат пуснати през алгоритъм за машинно обучение, вероятно ще може да се установи кои са най-предпочитаните цветове котки, кои са най-популярните породи, както и че стопаните наистина харесват домашните си любимци. Но не е необходимо компаниите да правят това, тъй като то вече е известно. Ако тези въпроси бъдат написани в Google, то отговорът бързо ще бъде открит.

Прочетете още: Анализът на данни в реално време – основа за дигитална трансформация

Предполага се, че организациите трябва да пазят всичко до деня, в който машинното обучение и изкуственият интелект намери нещо полезно. Но машинното обучение не е магическо. По-скоро машинното обучение се отнася за класифицирането, регресията и групирането. При последното основно се събират данни, които изглеждат „подобно” - но едва ли от 2006 г. има нещо полезно, което да може да бъде намерено чрез групиране. Другите два алгоритъма изискват човек да има идея и „да подготви” машинното обучение. Това означава, че е необходима теория за това какво може да бъде полезно и то да бъде намерено, а след това компютърът да бъде обучен сам да го открива. Нима организациите нямат и по-важни неща за вършене.

Данните не трябва да се пазят вечно

В допълнение най-вероятно не съществува информация, която да бъде събрана само от старите данни. Същите изводи могат да бъдат извлечени и от по-скорошна информация. Същевременно старите файлове могат да бъдат от типа „тъмни данни”. Тогава инструментът за търсене ще нареди всичко останало над тях и данните от 1999 г. няма да излязат.

Съхранението на данни е евтино, но организирането им не е. Трябва да се вземат под внимание разходите за служителите, които се занимават с организацията, поддръжката и съхраняването на всичката информация. Освен това макар че модерната технология за търсене е добра при отделянето на релевантните от нерелевантните въпроси, то това не излиза безплатно.

Компаниите наистина трябва да преосмислят позицията си и да изтрият ненужната им информация.

КОМЕНТАРИ ОТ  

Полезни страници
    За нас | Аудитория | Реклама | Контакти | Общи условия | Декларация за поверителност | Политика за бисквитки |
    Действителни собственици на настоящото издание са Иво Георгиев Прокопиев и Теодор Иванов Захов