Интернет съществува само от три десетилетия, но за това сравнително кратко време мрежата се превърна в един от най-важните инструменти на нашето колективно разположение. Като собственик на малък бизнес можете да използвате интернет, за да събирате данни, които ви помагат да вземате информирани бизнес решения, да провеждате анализи за бъдещи продажби и да подобрявате клиентското изживяване.
Всички тези функции са резултат от големите данни. Като се научите как да ги използвате, вашият малък бизнес може да превърне ценната информация в полезен актив, пише онлайн изданието business.com.
Какво представляват големите данни?
Благодарение на технологичния напредък можем да събираме и разбираме масивни и сложни набори от данни. Тъй като тези големи масиви от данни могат да идват от широк кръг източници в обем, който хората не могат да разберат, ние разчитаме на усъвършенстван софтуер за обработка на данни, за да ги направим използваеми.
Сайтове като Internet Live Stats улесняват визуализирането на големи данни и скоростта, с която безумно количество информация преминава през интернет. Например ILS изчислява, че за една секунда се изпращат 100.5TB интернет трафик, 85 836 търсения в Google и 9 139 туитове.
Големите данни обаче идват от повече източници, не само от интернет. Бордовият компютър на вашия автомобил събира хиляди точки с данни за вашите навици на шофиране, които производителят може да използва, за да определи бъдещи промени в автомобилите си, докато доставчиците на застраховки могат да използват същите тези данни, за да коригират цените.
Съвременните инструменти за големи данни ни позволяват бързо да анализираме резултатите, за да решим кое действие би било най-ефективно в конкретна ситуация.
Как работят големите данни
Това може да помогне за разбирането на големите данни. Ако сте единственият рибар с въдица, стоящ до потока, няма да уловите много риба. Ако обаче имате флот от лодки, която разполага с мрежи, ще хванете много и различна риба. Софтуерът за големи данни е като този флот от лодки, а рибите са различните видове данни, които генерираме всеки ден.
След като бъдат събрани, данните се анализират от бизнеса, използвайки техники за големи данни. Този анализ позволява разбирането на начините, по които една компания може да бъде по-ефективна и да увеличи печалбите.
Големите данни работят не само за нуждите на потребителите - медицинската област също използва такива данни, за да прогнозира по-добре разпространението на болести.
Бизнесът използва големи данни, за да получи прозрения за редица неща, включително модели на поведение на клиентите. Причината, поради която големите данни са толкова жизненоважни за бизнеса, е, че те могат да помогнат за идентифициране на нови възможности за растеж и дори нови индустрии чрез проучване на информация за клиентите.
Четири ключови елемента на големите данни
Обем: Благодарение на огромното количество данни, налични ежедневно, големите данни са склонни да заемат и огромно място. Хиляди байтове могат да пресичат интернет, особено при широкото използване на широколентов интернет. Всъщност, според проучване на IBM, тази година ще бъдат създадени приблизително 40 зетабайта данни, отбелязвайки 300% увеличение спрямо 2005 г. Такива огромни количества изискват технология за големи данни, която може да обработва големи масиви от данни.
Скорост: Данните преминават през интернет с такава скорост, че ако се опитате да ги анализирате сами, би било подобно на опитите да пиете от най-големия и най-мощен маркуч за вода. Скоростта се увеличава експоненциално в зависимост от броя на връзките, които хората имат помежду си, тъй като вероятно ще изпращате текстови съобщения, харесвате публикации в социалните медии и правите бизнес едновременно. Скоростта, с която трябва да бъдат обработени входящите данни, е отличителен белег на големите данни.
Разнообразие: Данните могат да се събират от много различни източници, като различни социални мрежи, бизнес и потребителски транзакции и интелигентни устройства, които събират данни от (често неволни) потребители. По същия начин тези данни могат да се предлагат в различни файлови формати и структури, от строго категоризирана информация за база данни до трансфери и комуникации на файлове в реално време.
Достоверност: Неточните данни са безполезни данни. Освен това неточните данни струват на американската икономика приблизително 3,1 трилиона долара всяка година, според проучването на IBM. Много бизнес лидери смятат, че големите данни са хазарт, като всеки трети от респондентите казва, че „не вярва на информацията“, която големите данни предоставят. Независимо от това, технологията за големи данни се опитва да смекчи този проблем доколкото е възможно.
Примери за големи данни
Големите данни може да изглеждат като мъглява концепция, която е трудно да се визуализира, но се използва толкова широко в днешния силно свързан свят.
Netflix използва големи данни и спестява 1 милиард долара всяка година, като ги използва ефективно. Netflix може да определи колко минути е гледал човек преди да спре да гледа, гледал ли е повече от един епизод, какъв тип съдържание предпочита. Всички тези фактори движат бъдещите производствени решения, както и персонализираните приложения за потребителите.
Нюйоркската фондова борса използва някои от най-модерните изчислителни техники, за да обработва над 1,4 милиарда акции, търгувани всеки ден. Това количество транзакционни данни изисква решение за големи данни, което може да получава, анализира и след това предава огромния обем данни, който влиза и излиза за кратко време.
Страниците ви в социалните медии също са част от големи данни. Въпреки че вашият профил в Twitter и емисията във Facebook могат да се разглеждат като единични точки с данни, по-подробните елементи, покриващи данните, като вашите харесвания, публикации, снимки и лични данни, са количествено измерими данни, които големите данни могат да използват, за да разберат какво е вероятно ще купите, какви са вашите хобита и дори за кого най-вероятно ще гласувате на предстоящите избори.
Как се съхраняват и регулират големите данни?
Като се има предвид колко големи са големите данни, съхранението на такава информация трябва да бъде също толкова масивно. Някои от най-големите центрове за данни в света се простират на милиони квадратни метра и разполагат със сървърно оборудване за милиарди долари. За вашия малък бизнес обаче сървърната поставка с терабайти памет може да е достатъчна.
Въпреки че вероятно ще намерите много компании, които разчитат на физически решения за поместване на своите файлови системи, като голям склад за данни или мащабен сървър, други компании се насочват към облачни решения за съхранение, като тези, хоствани от Google и Amazon Web Services. И в двата случая данните могат да се съхраняват, докато има място.
Що се отнася до регулирането на големи данни, федералното правителство в САЩ е възприело до голяма степен практичен подход по въпроса. Законите за поверителност в Америка обикновено се фокусират върху специфични индустрии, които се занимават с чувствителна информация, като например финансови институции, които използват непублична лична информация. По същия начин доставчиците на здравни услуги, които използват големи данни, трябва да гарантират, че данните са защитени в съответствие със съответния регламент.
Компаниите често променят данните, за да премахнат всякаква чувствителна идентификационна информация. Тази стъпка обикновено се предприема преди изследователите на данни да анализират данните или преди да бъдат изпратени на трета страна.