PRAKTIKUM 1 | INFO KVALITEET
— Miks on info kvaliteet oluline?— Mis on info juures tähtsam—kogus või kvaliteet?
— Info kvaliteet ja selle elemendid
— Info kvaliteet on keerukas, paljutahuline mõiste
— Kvaliteediandmed on meta-andmete üks liik
— Kuidas tähistada info kvaliteeti?
— Mis saab info kvaliteedist info töötlemisel?
— Info kvaliteedi parendamise operatsioonid
— Info ja selle töötlemise kvaliteedimärgistus
— Info elutsükkel
— Info kvaliteet kui tegevusala
- Riigi infosüsteemide olevik ja tulevik Harku valla vaates. Ene Veges, vallasekretär. Ettekanne 21.02.2012 teabepäeval "Riigi infosüsteemide arengud". Hea ülevaade infosüsteemide kasutamise eesmärkidest, ulatusest, laadist ja probleemidest ühe kohaliku omavalitsuse näitel.
- Õppeinfosüsteemi näide. Rahulolu süsteemiga ja info kvaliteet on ajas muutuv.
- Probleemiks võib olla ka see, et infot on liiga palju.
- Digiallkirjastamise tööriista uus kujundus. Võrdle ID-kaardiga allkirjastamise tööriista DigiDoc (arendanud AS IT Grupp ja SEB IT Partner OÜ, tellija AS Sertifitseerimiskeskus) versiooni 2 ja uue, 2010-2011 väljatöötatud versiooni (arendanud AS Sertifitseerimiskeskus Riigi Infosüsteemi Ameti tellimusel) kujundust.
— Millist kasutajale olulist probleemi (või probleeme) uus kujundus lahendab?
Vana versioon:

Uus versioon:
Miks on info kvaliteet oluline?
“Üldsust häirib ametlikes teadaannetes, kutsetes ja muudes avalikes dokumentides valitsev ebakorrektsus isikunimede kirjutuses. Sageli ei ole võimalik aru saada, mis on ees-, mis perekonnanimi või kas üldse on tegemist inimese nimega.” Allikas: Justiitsministeerium (2003) Isikunime kirjutamise juhis. Märkus. Ei ole enam kättesaadav. 03.09.2007.Miks on info kvaliteet oluline? Sest kui otsida mõnest andmebaasist nime 'A. Mets' järgi, siis ei tarvitse olemasolevat infot leida —sest andmebaasis on nimi teisel kujul.
“Nime võib kirjutada pärijärjestuses või pöördjärjestuses. Pärijärjestuse puhul kirjutatakse kõigepealt ees-, seejärel perekonnanimi (Arvo Mets). Pöördjärjestuse puhul kirjutatakse enne perekonna-, seejärel eesnimi (Mets, Arvo). Et eesnime käsitatakse sel juhul kui täpsustavat lisandit, tuleb panna perekonnanime järele koma. Kui koma ära jätta, võib tekkida probleeme selliste nimedega, kus mõlemaid nimeosiseid võib käsitada eesnimena (nt Markus Martin – Markus ees-, Martin perekonnanimi; pöördjärjestuse korral Martin, Markus). Üldiselt tuleks eelistada eesti nimekirjutustraditsioonile omast pärijärjestust. Pöördjärjestus on asjakohane pikemas nimeloendis, kui soovitakse perekonnanimesid tähestikuliselt järjestada.“ Allikas: Justiitsministeerium (2003) Isikunime kirjutamise juhis.
Välismaalane tuli Eestisse. Mõne aja pärast tekkis ootamatult tõsine astmahoog. Inimene kontrollis internetist, et ravim, mida kohalik arst talle teise terviseprobleemi vastu soovitas, on Ühendriikides müügilt kõrvaldatud — astmaatiliste kõrvalnähtude tõttu.
Mis on info juures tähtsam—kogus või kvaliteet?
Kas rohkem infot on ikka parem? Madalakvaliteedilist infot on küllaga. Probleem on selles, et info kasufunktsioon (utility function) sõltub väga palju konkreetsetest asjaoludest.Kasulikke üldistusi selle kohta, kuidas muutub infost saadav tulu, kui info kogus kasvab, on raske, peaaegu võimatu teha. Allikas: David Kirsh. A Few Thoughts on Cognitive Overload.
Võib küll kergesti leida rea tüüpkäitumisi ja -efekte, näiteks:
a) küllastumine—teatud kogusest alates lisanduv info ei lisa enam väärtust
Info kasufunktsioonil on mitmeid kujusid:
b) juba vähene info on kasulik; täiendav info ei lisa suurt midagi
c) ebatäielik, seetõttu eksitav info toob kasu asemel kahju
d) info muutub väärtuslikuks alates teatud lävest
e) info üleküllus—info koormab infotöötlussüsteemi üle ning kasulikkus langeb.
Info kvaliteet ja selle elemendid
Info vastavus kasutuseesmärkidele ja -vajadustele. Kvaliteedi mõiste on rakendatav ka andmetele ja infole.Info ei ole ainult homogeenne mass. Ka infol on kvaliteet. Võib rääkida kvaliteedist tervikuna, üldmõistena. Võib rääkida elementidest või tahkudest (öeldakse ka—atribuutidest, dimensioonidest), millest kvaliteet moodustub. Tavaliselt kasutatakse info kvaliteedi elementidena mõisteid nagu olulisus, õigsus, täpsus, värskus jpt. Info kvaliteedi elementide liigitusi on välja töötatud mitmeid. Näiteks võiks tuua1:
- Olulisus Relevance
- Täpsus Accuracy
- Õigeaegsus Timeliness
- Täielikkus Completeness
- Kooskõlalisus Coherence
- Formaat Format
- Ligipääsetavus Accessibility
- Ühilduvus Compatibility
- Turvalisus Security
- Tõendatus Validity
Miller H. (1996) The Multiple Dimensions of Information Quality. Information Systems Management, 79-82. Artikliga võib tutvuda TLÜ Akadeemilise Raamatukogu veebilehe kaudu ligipääsetavas täistekstteabesüsteemis EBSCO. Artikkel võib olla leitav ka veebist otsimootori abil.
Info kvaliteet on keerukas, paljutahuline mõiste
Info kvaliteet on kasulik mõiste. Vähemalt tasub seda teadvustada. Paljudes valdkondades on info kvaliteedi küsimused väga olulised. Ei tasu siiski loota, et probleemile mõeldes, või isegi midagi ümber korraldades—info kvaliteedi peaks kohe paranema ning probleemid kaduma. Ei ole isegi erilist lootust, et info kvaliteedi mõistest kõik ühte moodi aru hakkavad saama.Massatchusettsi Tehnoloogiaülikooli uurijad leidsid, et andmete kasutajad nägid andmetes 179 erinevat andmekvaliteedi atribuuti ehk dimensiooni:
Accuracy, completeness, believability, interpretability, documentation, pedigree, availability, expense, verifiable, definability, age, auditable, ease of exchange, origin, integrity, portability, redundancy, security, correctness, conciseness, … convenience, friendliness, usable, ease of retrieval, partitionability, ergonomic, meets requirements, creativity, interesting, …
Kas info kvaliteet ja väärtus on üksikute "infopalade" omadused või on need pigem infokogumite omadused? Info kvaliteet ja väärtus sõltuvad suurel määral sellest, millisesse süsteemi (struktuuri) tekkiv info satub. Siit ka tõdemus, et info kvaliteeti saab tõsta kahel viisil: 1) käsitledes infopalasid suhteliselt üksikult, hinnates ja parandades nende kvaliteeti; 2) luues infokogumite töötlemist korraldavaid ja suunavaid (info)süsteeme, mille mõju üksiku infopala kvaliteedile ei tarvitse olla vahetu ja ilmne.
Allikas: Wang R., Strong D. (1996) Beyond Accuracy: What Data Quality means to Data Consumers, J. of Management Inf. Systems, 1996. Leitav ka veebist otsimootori abil.
Kvaliteediandmed on meta-andmete üks liik
Meta-andmed ehk "andmed andmete kohta" kirjeldavad andmete mitmesuguseid omadusi, nagu näiteks sisu, kvaliteeti, seisundit. Metaandmete näiteid:Identification
Title? Area covered? Themes? Currentness? Restrictions?
Data Quality
Accuracy? Completeness? Logical Consistency? Lineage?
Data Organization
Indirect? Vector? Raster? Type of elements? Number?
Spatial Reference
Projection? Grid system? Datum? Coordinate system?
Entity and Attribute Information
Features? Attributes? Attribute values?
Distribution
Distributor? Formats? Media? Online? Price?
Metadata Reference
Metadata currentness? Responsible party?
Allikas: Federal Geographic Data Committee (2000) Content Standard for Digital Geospatial Metadata Workbook. http://www.fgdc.gov.
Kuidas tähistada info kvaliteeti?
Tähistagu X andmeid, siis DQ(X) on andmete X kvaliteet.Kui soovime analüüsida kvaliteedi dimensioone eraldi, siis võib kasutada sobivaid tähistusi:
Rel(X) Olulisus Relevance
Acc(X) Täpsus Accuracy
Tim(X) Õigeaegsus Timeliness
Com(X) Täielikkus Completeness
Coh(X) Kooskõlalisus Coherence
Frm(X) Formaat Format
Acs(X) Ligipääsetavus Accessibility
Cmp(X) Ühilduvus Compatibility
Sec(X) Turvalisus Security
Val(X) Tõendatus Validity
Mis saab info kvaliteedist info töötlemisel?
On mõtet eristada: a) töötlust, mille tulemusena tekib sisuliselt uus informatsioon ning b) töötlust, mis ainult muudab sisendiks oleva info kvaliteeti, jättes info olemuselt samaks.Esimest tüüpi infotöötlusoperatsiooni võib nimetada infoloomisoperatsiooniks. Teist võib nimetada kvaliteediparendamisoperatsiooniks.
Info kvaliteedi parendamise operatsioonid
Infotootmissüsteemis on kasulik välja tuua need tegevused, mis olemuslikult uut infot ei tooda, vaid parendavad olemasoleva info kvaliteeti.Info ja selle töötlemise kvaliteedimärgistus
Infotootmissüsteemi mudel, milles on markeeritud info kvaliteedi parendamise tegevused ning info kvaliteet.Ballou D. et al. (1998) Modeling Information Manufacturing Systems to Determine Information Product Quality. Management Science, 44, 4, 462-484.
Sattler K-U. (2003) Metadata & Modeling. Dagstuhl-Seminar "Data Quality on the Web". http://sirius.cs.ucdavis.edu/Dagstuhl03/pres.html.
Info elutsükkel
"Understanding what happens to data throughout its lifetime is becoming an increasingly important aspect of effective data management." Allikas: Horison Information Strategies (2003) Information Lifecycle Management.Info kvaliteet kui tegevusala
“Data cleansing is a big business..” Allikas: Gertz M. (2003) Data Quality on the Web. http://sirius.cs.ucdavis.edu/Dagstuhl03/pres.html.Info kvaliteeti on juba väga hästi teadvustatud suurtes ettevõtetes, kes omavad suuri andmekogusid. Kuid kindlasti ei piirdu info kvaliteedi probleemid ja võimalused ainult suurte andmemassiividega.
Liigitus:
a) Info kvaliteet suurte firmade/suurte andmebaaside kontekstis
b) Info kvaliteet väiksemate infomahtude kontekstis?
c) Info kvaliteet kui üks kasulik alusmõiste informaatika õpetamisel?
GIGO
Programmeerijad on alati öelnud:Garbage In, Garbage Out (GIGO),
mis tähendab seda, et vigaste sisendandmetega ei saa programm anda õigeid tulemusi.
Kas see on paratamatu?
RIIGI MÕNEDE PEAMISTE INFOOBJEKTIDE KVALITEEDIST
Vaatlesime üldjoonetes olukorda nelja olulise, väga laialt kasutatava infoobjekti (ehk teabeliigi) osas:
1) isik - füüsilise isikuga seotud teave. Füüsilise isiku identifitseerimiseks kasutatakse traditsiooniliselt nime (isikunime). Eesti keeles: ees- ja perekonnanime; vene keeles aga lisaks nendele ka vanema nime. Isikunimede kasutamisel aga tekivad infotöötluses mitmed probleemid. Võib öelda, et isikunimed ei ole elektrooniliseks, tänapäevaseks infotöötluseks eriti sobivad. See on põhjus, mis on kasutusele võetud isikukood. Eesti Vabariigis on isikukoodi kasutuselevõtmine toimunud juba u 15 aasta jooksul ja ära teha on jõutud palju. Siiski on veel päris viimasel ajal tehtud lisandusi ja neid võib tulla edaspidigi (nt isikukoodide andmine ajutuselt Eestis elavatele välismaalastele). Olukorda isikuandmete kvaliteedi osas võib lugeda HEAKS - isikukood on laialt kasutusel, koodid on täpsed jne.
2) firma ehk juriidiline isik - juriidiliste isikute kohta peetakse arvestust riiklikus registris (registerinfosüsteemis) - Äriregistris (Äriregistri infosüsteemis). Igale ettevõttele (täpsemalt - äriühingule) on antud kood (Äriregistri kood). Olukorda võib lugeda HEAKS.
3) aadress - aadressi kirjutamise kohta on tõenäoliselt riiklik standard olemas, kuid ei saa öelda, et aadresside kirjutamine praktikas oleks piisavalt ühtne. On teateid erinevates infosüsteemides olevate aadresside ühitamise raskuste kohta.
4) kuupäev - kuupäevavormingu probleemidega puutume sageli kokku Excelis. Eestis on kehtestatud standardne viis kuupäeva ja kellaaja kirjutamiseks. Praktikas on kuupäevadega siiski vahel raskusi, eriti siis, kui välismaistest infosüsteemidest või teabeallikatest võib ajateave saabuda erinevates vormingutes.
50 most usable RIAs
Nn rikastest internetirakendustest.
BBDO direktor loovast lähenemisest infosüsteemide disainile: kooli süsteemi sisselogimisel esimese teabena kasutaja individuaalne kalender ( üldise kalendri asemel) (YouTube)
Isiku nime, aadressi (jm põhiliste) isikuandmete kontrollimise teenus (AS Andmevara)
Infoportaal eraisikutele ja firmadele päringute tegemiseks Rahvastikuregistrisse (AS Andmevara)
Statistiliste andmete kvaliteet (artikkel 12) | Euroopa Liidu statistikamäärus
Keskse infosüsteemi kasutamine rahvusvahelises ettevõttes. Keskne süsteem ei suuda kõiki lokaalseid vajadusi täita. Seetõttu peab ka Eesti allüksuses oma vajaduseks väiksemaid infosüsteeme tegema.
Heaks näiteks andmekvaliteedi probleemide lahendamisest andmeaitade loomisel on Tööpoliitika infosüsteem.
Riik astub registriga mustalt töötamise vastu (ERR).
Maksukorralduse seaduse muutmise seaduse eelnõu (Eelnõude infosüsteem).
Lisa kommentaar