Merania odhaľujú kvalitu dát

890 Videní

Aktuálne merania kvality dát priniesli viacero dôležitých zistení. Odhalili početnosť a závažnosť chybných záznamov, ich vzťah s legislatívou, históriou vývoja informačných systémov či procesmi v orgánoch verejnej moci. Meranie ukázalo, ktoré záznamy sa musia prečistiť, opraviť, ktorým sa treba venovať ďalej. Táto mravčia práca je však nevyhnutná, aby sa kvalita dát zvyšovala.

Po prvých meraniach sa cyklus riadenia dátovej kvality u viacerých orgánoch verejnej moci (OVM) pomaly uzatvára opravami zistených nedostatkov. Predchádzalo im vypracovanie hodnotiacich správ, ktoré sú zavŕšením konkrétnych meraní.

Výsledky merania biznis pravidiel na kľúčových atribútoch vrátane početnosti a podielu chybných záznamov pomáhajú dátovým kurátorom nielen odhaliť mieru závažnosti dátovej nekvality vo vybraných objektoch evidencie, ale aj identifikovať konkrétne záznamy, ktoré treba opraviť, doplniť alebo posunúť na riešenie vecnému gestorovi danej agendy. Rovnako ako pri tvorbe biznis pravidiel, aj pri vyhodnotení merania dátoví kurátori spolupracujú s kolegami, ktorí dobre poznajú vecnú „biznis“ problematiku a súvislosti medzi legislatívou, históriou vývoja informačných systémov (IS) a procesmi v OVM.

Mnohé skutočnosti sa objavia až po výsledkoch meraní. Napríklad to, že pri modernizácii IS sa zmenili požiadavky / biznis pravidlá pre hodnoty v niektorých atribútoch. Najjednoduchšie je, ak chybných záznamov nie je veľa, nesprávne hodnoty sú spôsobené preklepmi a manuálnej zmene hodnôt nebráni žiadna procesná, respektíve legislatívna prekážka.

Ak to nie je možné, napríklad, ak hodnota záznamu nie je zistiteľná, treba zvážiť dopad na využitie údajov v praxi. Žiadny alebo nízky dopad je akceptovateľný stav. V prípade starších záznamov, ktoré porušujú súčasné biznis pravidlá, je tiež potrebné zvážiť, či náklady na opravu neprevyšujú zisk – hodnotu údaja využiteľnú pre prax.

Niekedy sa u určitého atribútu nachádzajú rozmanité hodnoty (napr. textové polia v niektorých záznamoch a číselné hodnoty v ďalších). To spôsobuje nejednoznačnosť dátovej štruktúry a tento nesúlad je potrebné odstrániť. Často preto treba doplniť biznis pravidlo, prečistiť údaje alebo premenovať názov atribútu.

Dátová kancelária na svojom webovom portáli postupne zverejňuje hodnotiace správy z jednotlivých meraní ako aj všetky dostupné informácie, ktoré umožnia odbornej verejnosti vytvoriť si komplexný obraz o  dátovej kvalite vybraných objektov merania. Súčasťou odporúčaní na zlepšenie dátovej kvality je aj predpokladaný termín opätovného merania totožného datasetu. Dúfame, že opatrenia budú efektívne a opätovné merania potvrdia zlepšenie dátovej kvality.

Zdroj: Newsletter Dátovej kancelárie – február

Autor: Andrej Fukas