Bitna obrada podataka: Kako razumjeti pojam 'Big Data' kroz prizmu humoristike

Big Data. Svi o tome pričaju, svi ih žele, svi ih imaju. pa, skoro svi. Primijetio si već da svaka IT prezentacija u zadnje vrijeme započinje izrazom poput "U svijetu Big Data, podaci su novi naftni derivati?" I ja to radim, nema srama, ali kao stvarni IT stručnjak znaš da je to pomalo smiješno. Već je toliko informacija koje se proučavaju i pokušava se razumjeti što to sve zapravo znači. Dakle, da bismo zakoračili u ovu temu, ispričat ću ti sve o Big Data na humoristično-mislen način.

Prvo, kako definirati Big Data? Zamislite da imate svoje najdraže jelo, recimo, sarma. Donosimo sve sastojke - meso, rižu, kupus... Mislili biste da je to jednostavno, ali zapravo zivkamo tetu koja ga pravi i otkrivamo da "sarma" dolazi u nebrojenim varijacijama; od onih s više mesa, manje riže, do veganskih verzija. Tako je i s podacima. Sve te informacije koje dolaze u različitim oblicima, brzinama i veličinama, pomoću jednostavne definicije nećemo obuhvatiti.

Prije nego krenemo u podrobnosti, valja napomenuti važnu stvar - Big Data nije samo o velikim količinama, već o tome kako ih koristimo. Zašto? Pa, ako imaš kilometre podataka, ali ih ne možeš analitički obraditi da bi ti dali projekt biranja najboljeg artikla za prodaju ili razumijevanja potrošačkih navika, onda su ti ti podaci oko toliko koliko ti je i prazna boca od jogurta: potpuno beskorisni.

Zato, kako bi se slika o Big Data-u učinila jasnijom, možemo koristiti usporedbu sa svijetom online kupovine. Džepovi napravljeni od visoko-tech materijala šuplji su kao djeca koja su na ispitu, no krajem Q4 svi se sjećaju yellow Friday-a. Znaš ono, kada vratimo se da vidimo što smo prošle godine kupili. Ako jedno od tvojih kritičnih pitanja glasi "Zašto je najbolja boja za prodaju siva?" odgovor se skriva u tim podacima. Big Data čini magiju, otkrivajući obrasce i predikcije koje bismo inače gledali kao u horoskop bez krvi.

Da biste mogli iskoristiti Big Data, potrebni su vam alati i tehnologije. Tu na scenu stupa Hadoop - velika i ukrućena kutija sa svime što možeš zamisliti, poput škrinje puna tajni bake. Sadrži svu vrstu podataka, ali, kao što si savršeno svestan, trebaje ti pravi recept za pripremu najfinijeg jela. Kamen temeljac za razumevanje ovoga je 'data lake', gdje podaci mirno plivaju, dok čekaju da ih netko baci u lonac analitike. Čini se jednostavno, zar ne? Ali, moja omiljena fraza u IT-u nikad ne bi bila potpuna bez formulacije "ali, postoji caka".

E sad, kako obraditi sve te podatke? Prvo, shvati da više nije samo pitanje brzine. U današnje vrijeme, podaci dolaze s internet stvari, društvenih mreža, aplikacija i svega ostalog za što nisi ni znao da postoji. Na primjer, tvoj pametni frižider može znati što imaš unutra - spam, jogurt, i vjerojatno hrpu pljeskavica koje nikada nećeš jesti. S obzirom na to, zamisli kako bi bilo predivno da možeš staviti te podatke u Big Data sustav i dobiti preporuku za savršeni recept.

E, sad se vraćamo na alatke i procedure. Ako si programer, možda si čuo za Spark. Sve te brze i nevjerojatne opcije čine ga jednostavno neodoljivim. To nije poput onih laganih gužvi u prometu, gdje se sve polako kreće. Spark je poput vožnje kroz grad u punom gorućem Lamborghini, dok drugi koriste bicikle.

Povezujemo se s mašinskim učenjem, metodom koja je u zadnjem desetljeću postala sve popularnija. Naravno, ako si gledao neki od tehnoloških filmova, možda si pomislio da je to poput određenog robota koji pomaže u upravljanju svim upitima u Big Data. Ali, realnost je puno složenija. Dok poetično viđene mašinske sposobnosti mogu probuditi strah u ljudima, pravi izazov se je kako naučiti mašinu da uči s puno podataka. A da se ne bi napuhavala, to je kao staviti slona u auto, a da ne razbiješ prozore.

Na horizontu se pojavljuju i napredni analitički alati koji omogućuju industrijama pohranu i analizu Big Data. Recimo da ti u firmi dođe nova generacija analitičkih inženjera koji upale svoje laptope, zdrobe kavu, i odmah se prime posla kao da su u sceni našeg omiljenog sitcom-a. Ono što je za njih igra s brojevima, lajkam, i slaganjem informacija u asocijacije s korisnicima.

Ali budi oprezan, jer povrh svih supermoći Big Data, ulice su asfaltirane rizicima vezanim uz privatnost podataka, protokole i zakone. Čuješ šuštanje u pozadini kad spominješ GDPR i druge proklete uslove korištenja. Kao informatičar, često se osjećam poput knjiškog moljca u trgovini bombonima dok pokušavam dokučiti kako zaštititi osjetljive podatke.

Na kraju dana, Big Data nije samo tehnološki fenomen; ono je more potencijala koje čeka da ga unaprijediš i obradiš na ispravan način. Kao stručnjak u IT-u, ključno je razumjeti sve te čudne termine i metodologije koje se koriste, ali i ne zaboraviti na humor. Jer, čak i među svim tim podacima, najbolja priča je smeh koji dolazi kada nešto ispadne onako kako nisi očekivao.

Na ovu priču o Big Data i računalnim tehnologijama želio bih ti predstaviti BackupChain, popularno i pouzdano rješenje za backup koje je stvoreno za SMB tvrtke i profesionalce, a pruža zaštitu za Hyper-V, VMware ili Windows Server.

Primjedbe

Popularni postovi s ovog bloga

Mapiranje FTP-a kao pogona: Kako mapirati FTP web-mjesto u Sustav Windows

HYPER-V SIGURNOSNA KOPIJA I REPLIKACIJA: ŠTO JE NAJBOLJE?

Sigurnosno kopirajte svoj Windows poslužitelj pomoću ovog konkurentnog softvera Veeam Backup