Več o masovnih podatkih

Splošna praksa shranjevanja vseh vrst podatkov se imenuje masovni podatki (ang. Big data). To je smiselno, saj je shranjevanje podatkov postalo zelo poceni, zmogljivi procesorji in algoritmi (zlasti obdelava naravnega jezika in strojno učenje) pa olajšajo analizo masovnih podatkov.

Kot je opisano v videoposnetku »Podatki vseh oblik in velikosti«, je za masovne podatke značilna velika količina (volume), hitro nastajanje (velocity), raznolikost (variety) podatkov, ki se ustvarjajo iz več virov. Tako pridobljeni podatki so običajno nepopolni in nenatančni (verodostojnost), njihova pomembnost pa se s časom spreminja (nestanovitnost). Za združevanje, obdelavo in vizualizacijo tovrstnih podatkov so potrebni zapleteni algoritmi. Vendar pa so lahko sklepi, ki izhajajo iz njih, zlasti v kombinaciji s tradicionalnimi podatki, zelo močni in zato vredni truda.


Nekateri strokovnjaki presegajo 3V (oziroma 4V, 5V, 7V, 9V ali najnovejšo 10V) in poudarjajo tri osi, ki sestavljajo velike podatke:

  1. Tehnologija, ki omogoča zbiranje, analiziranje, povezovanje in primerjanje velikih podatkovnih baz.
  2. Analiza, ki v velikih podatkovnih nizih prepoznava vzorce za podajanje gospodarskih, družbenih, tehničnih in pravnih zahtev.
  3. Prepričanje, da veliki podatkovni nizi ponujajo višjo obliko inteligence in znanja, ki lahko ustvarja vpoglede, ki so bili prej nemogoči, z auro resnice, objektivnosti in natančnosti.

Zakonodaja, ki jo moraš poznati

Zaradi bistveno nižjih stroškov shranjevanja podatkov se danes shranjuje vse več podatkov in metapodatkov, ki se tudi hranijo veliko dlje. To lahko privede do kršitev zasebnosti in pravic. Zakoni, kot je Splošna uredba o varstvu podatkov (GDPR), odvračajo od takšnih praks in državljanom EU omogočajo večji nadzor nad njihovimi osebnimi podatki. Zagotavljajo pravno izvršljive predpise o varstvu podatkov v vseh državah članicah EU.

V skladu z omenjeno uredbo so osebni podatki vse informacije v zvezi z določeno ali določljivo osebo (osebo, na katero se podatki nanašajo).

Pravice, določene s Splošno uredbo o varstvu podatkov, vključujejo:

  • pravico do dostopa, na podlagi katere morajo biti posamezniki obvezno seznanjeni s tem, kateri podatki se zbirajo o njih;
  • pravico do obveščenosti o načinih uporabe njihovih podatkov;
  • pravico do izbrisa podatkov, ki posamezniku, katerega podatke je zbrala določena platforma, omogoča, da zahteva odstranitev teh podatkov iz nabora podatkov te platforme (ki so lahko predmet prodje tretjim osebam);
  • pravico do pojasnila, pri čemer je treba zagotoviti pojasnilo, kadarkoli je to potrebno, v zvezi z avtomatiziranimi postopki odločanja, ki vplivajo na posameznika.

Uredba sicer dovoljuje zbiranje nekaterih podatkov v okviru zakonitega interesa in uporabo izpeljanih, združenih ali anonimiziranih podatkov za nedoločen čas in brez privolitve. Novi Akt o digitalnih storitvah omejuje uporabo osebnih podatkov za namene ciljnega oglaševanja. Omenimo še Zasebnostni ščit EU-ZDA, ki krepi pravice do varstva podatkov za državljane EU v primeru, ko so bili njihovi podatki preneseni zunaj EU.