Par datu demokratizāciju

 

29

.

06

.

2022

Par datu demokratizācijuPar datu demokratizāciju

Neraugoties uz tehnoloģisko progresu, darbs ar datiem joprojām ir sarežģīts. Datu kļūst arvien vairāk, jo teju visi organizāciju aspekti tiek pakļauti digitalizācijai. Kaut gan mums jau ir vairāku desmitu gadu pieredze datu pārvaldē un visam vajadzētu kļūt arvien labāk, realitāte rāda tieši pretējo.

Augot datu avotu skaitam, to ievākšanas ātrumam un pielietojamības spektram, arī infrastruktūra kļūst neticami sarežģīta, smagnēja un dārga. Cilvēkiem, kas strādā ar datiem ir jābūt ne tikai zinošiem savā tiešajā jomā, bet arī jārūpējas, lai dzīve būtu vieglāka arī rezultātu gala lietotājiem, tādējādi veicinot, ka dati patiešām tiks izmantoti biznesa lēmumu pieņemšanā. Cenšoties orientēties pieaugošajā sarežģītībā, aktuāla kļūst datu demokratizācijas ideja.

Pīteram Drukeram tiek piedēvēts teiciens, ka nav iespējams pārvaldīt to, ko nevar nomērīt. Lai arī atziņa ir svarīga, tomēr dzīvē tā ne vienmēr izpildās. Organizācijas spēj vadīt procesus, kas nav izmērāmi, tomēr daudz vieglāk, paredzamāk un mazāk riskanti tas notiek izmantojot no datiem gūto ieskatu. Piemēram, dažādām apdrošināšanas kompānijām, kas darbojas vienā tirgū, visticamāk būs pieeja ļoti līdzīgiem pircēju datiem, tomēr secinājumi, kas ietekmē lēmumu pieņemšanu var atšķirties.

Kas datu kontekstā ir demokrātija?

Tā vienmēr nozīmē līdzdalību. Tāpat tā nozīmē apzināšanos un atbildību. Līdzdalība šajā gadījumā nozīmē dažādu uzņēmuma darbinieku iesaisti. Savukārt, apzināšanās ietver atbildības uzņemšanos par savu rīcību, jo, lai pārējās organizācijas personas uzticētos ieskatam, kas tiek iegūts apstrādājot datus, tām ir jāuzticās tam, kurš datus ir analizējis. Tādēļ datu demokratizācija nozīmē īpašas kultūras iedzīvināšanu organizācijā, kā arī rīku piešķiršanu cilvēkiem, lai tie spētu ar datiem jēgpilni darboties. Svarīgi, lai šie rīki būtu pieejami cilvēkiem, kam nav īpaši plašu tehnisko zināšanu. Tāpēc ir svarīgi izveidot komfortablu vidi, kur gala lietotājiem spēlēties ar datiem pēc saviem ieskatiem. Tas noved pie labākiem biznesa lēmumiem, jo palīdz pārvarētu vairākus tipiskus organizāciju izaicinājumus darbā ar datiem - to pieejamību, pieejas ātrumu un datu uzticamību.

Viena no būtiskām tehnoloģijām datu demokratizācijā ir datu katalogs.

Datu katalogs ir salīdzināms ar katalogu bibliotēkā, kur bibliotekāre var palīdzēt ikkatram sameklēt sev interesējošo grāmatu. Datu katalogs “zina” visu par datiem, kas atrodami sistēmā. Galvenie jautājumi, ko risina katalogs ir:

  1. Kā identificēt nozīmīgos datus?
  2. Kā saprast datus biznesa valodā?
  3. Kurš ir par šiem datiem atbildīgs?
  4. Vai dati ir kvalitatīvi?
  5. Kā dati ir apstrādāti?
  6. Kā sadarboties ar citiem darbiniekiem?
  7. Kurš var sagatavot vajadzīgos datus?

Tas, ko mūsdienās saprotam ar datu katalogu, tirgū nonāca pirms aptuveni astoņiem gadiem. Kā galvenais zinību centrs datu pārvaldības sistēmā, datu katalogs sastāv no trim daļām:

  • datu pārvaldības,
  • datu kvalitātes,
  • datu patēriņa.


Datu kvalitātes daļā iespējams uzzināt par to, kā dati iegūti, izmantojot profilēšanu tos apkopot un apzināt to kvalitāti, kā arī pievienot tiem biznesa terminus, lai nespeciālistiem būtu vieglāk saprast, par ko tie ir. Lai datu kvalitātes daļa veiksmīgi strādātu, atslēga ir datu zinātnieku sastrādāšanās ar biznesa nodaļu. Pārējās kataloga daļas līdzīgi atbild par pārvaldību un patēriņu.

No tirgū esošiem risinājumiem kā lielisku palīgu datu demokratizācijas ieviešanai dzīvē var minēt IBM Cloud Pak for Data jeb CP4D. Tas ir datu analītikas risinājums uz hibrīdmākoņa bāzes, kas atbild uz tādiem izaicinājumiem kā datu sarežģītība, datu pieejamība, lietotāju sadarbība un citiem. CP4D sevī iekļauj dažādus datu analītikas un pārvaldes pakalpojumus, kas pieejami attālināti no jebkuras vietas pasaulē. Šo sistēmu iespējams darbināt uz IBM Cloud un pat publiskajos mākoņos.

CP4D piedāvā vienu saskarni visiem organizācijas darbiniekiem - datu speciālistiem, biznesa analītiķiem, datu pārvaldniekiem un kvalitātes analītiķiem. Katram lietotāja tipam tiek piedāvātas pielāgotas iespējas, lai maksimāli atbildētu uz galvenajām vajadzībām, bet tai pat laikā procesu nepadarītu lieki sarežģītu.

Shēma: Arek Wiśniewski DataOps_&_Data_Science_Leader_IBM_CEE ppt_data_democratization.


Ja pēc raksta izlasīšanasir radusies vēlme vairāk uzzināt par IBM CP4D, droši sazinieties ar mums šeit: https://www.datigroup.com/lv/kontakti