Sažetak | Open data are an extremely valuable information technology resource for economic, social, and human development, adding new values to the development of society. More and more countries around the world are establishing open data portals at national, regional, and local levels, and the amount of available open data is growing. The usability of open data depends on the quality of their metadata, the evaluation of which is an open research question. The main objective of the research is to develop a theoretical framework of open metadata quality and to operationalise it through a new composite indicator that enables the comparison of open datasets metadata. The research approach is based on the Methodological framework for design science research and the Methodology for constructing composite indicators, involving predominantly quantitative and, to a minor extent, qualitative research methods. The combina tion of these two methodologies helped meetthe requirements forensuring scientific contribution in the construction of the composite indicator and for achieving greater practical relevance of the scientific results within the area of information technology and information systems. The scientific contributions are achieved through the development of a framework and com posite indicator, a better understanding of the concept of open (meta)data quality, and empirical research of the public sector metadata quality. This research also contributes to practise. One of the most important practical contributions is that the developed composite indicator for the metadata quality of open datasets can be used for benchmarking purposes. |
Sažetak (hrvatski) | Otvoreni podaci izrazito su vrijedan resurs informacijske tehnologije za ekonomski, socijalni i ljudski razvoj koji dodaje nove vrijednosti razvoju društva. Sve više država u svijetu uspostavlja portale otvorenih podataka na nacionalnoj, regionalnoj i lokalnoj razini, ˇ cime raste koliˇ cina dostupnih otvorenih podataka. Iskoristivost otvorenih podataka ovisi o kvaliteti njihovih metapo dataka, ˇ cije je vrednovanje otvoreno istraživaˇ cko pitanje. Stoga je glavni cilj istraživanja razviti teorijski okvir kvalitete otvorenih metapodataka i operacionalizirati ga kroz novi kompozitni indikator koji ´ ce omogu´ citi usporedbu metapodataka otvorenih skupova podataka. Uprvom dijelu prvog poglavlja predstavljeno je podruˇ cje istraživanja. Istaknuta je uloga i znaˇ caj otvorenih podataka za napredak društva, dan je kratak povijesni pregled kljuˇ cnih doga¯ daja s naglaskom na podruˇ cje Sjeverne Amerike i Europe te su izdvojeni izazovi i prepreke koji utjeˇ cu na razvoj otvorenih podataka. Kao jedna od prepreka koje mogu negativno utjecati na uspjeh otvorenih podatka navodi se kvaliteta otvorenih (meta)podataka. Stoga je napravljen pregled postoje´ cih istraživanja koja se bave kvalitetom otvorenih (meta)podataka te su uoˇ ceni nedostaci, tako¯ der istaknuti u sklopu ovog poglavlja. U drugom dijelu prvog poglavlja, u vezi s identificiranim istraživaˇ ckim problemom koji se odnosi na upitnu kvalitetu otvorenih (meta)podataka), definirano je pet ciljeva istraživanja: sintetizirati rezultate prethodnih istraživanja na temu kvalitete otvorenih (meta)podataka i di menzija identificiranih u svrhu mjerenja istih (C1), definirati teorijski okvir kvalitete metapo dataka otvorenih skupova podataka (C2), prikupiti i organizirati podatke o metapodacima s por tala otvorenih podataka (C3), definirati kompozitni indikator kvalitete metapodataka otvorenih skupova podataka (C4) te izraˇ cunati vrijednosti kompozitnog indikatora na prikupljenim po dacima (C5). Uz ciljeve definirana su tri istraživaˇ cka pitanja: „Koje su kljuˇ cne dimenzije kvalitete metapodataka otvorenih podataka?”, „Kako mjeriti identificirane dimenzije kvalitete metapodataka?” i „Kako procijeniti kvalitetu metapodataka?”. Tako¯ der, postavljena je hipoteza vezana uz operacionalizaciju teorijskog okvira kvalitete metapodataka otvorenih skupova po dataka koja glasi: Razvijeni kompozitni indikator kvalitete metapodataka otvorenih skupova podataka robustan je. U tre´ cem dijelu prvog poglavlja predstavljen je teorijski i konceptualni okvir istraživanja. Navedene su teorije na kojima se temelji istraživanje, ukljuˇ cuju´ ci i metodološke teorije. Istraži vanje se temelji na kombinaciji dviju metodologija: metodološkog okvira znanosti o dizajniranju i metodologije za konstruiranje kompozitnih indikatora. Sinergija tih dviju metodologija može pomo´ ci u ispunjavanju zahtjeva za osiguravanjem znanstvenog doprinosa u izradi kompozit nih indikatora, kao i u ispunjavanju zahtjeva za ve´ com praktiˇ cnom relevantnoš´ cu znanstvenih rezultata u podruˇ cju informacijskih tehnologija i informacijskih sustava. Stoga su aktivnosti metodološkog okvira znanosti o dizajniranju povezane s koracima metodologije za konstruiranje VI kompozitnih indikatora. Prošireni sažetak Udrugompoglavlju prikazani su sustavi za upravljanje podacima koji se koriste za otvorene podatke javnih uprava te je predstavljen povijesni razvoj metapodataka, njihove osnovne kom ponente, me¯ dunarodne norme relevantne za metapodatke te rezultati prethodnih istraživanja kvalitete metapodataka. Tako¯ der, napravljena je harmonizacija metapodatkovnih polja dvaju relevantnih metapodatkovnih standarda koji definiraju strukturu i semantiku podataka te istovre menoomogu´ cuju bilježenje informacija o skupovima podataka. Rezultati harmonizacije metapo datkovnih polja relevantnih metapodatkovnih standarda (ISO/IEC 11179 i DCAT 2) dostupni su u otvorenom pristupu u repozitoriju otvorenih znanstvenih podataka Harvard Dataverse. Utre´ cem poglavlju opisana je metodologija rada koja objedinjuje dva metodološka pristupa: metodološki okvir znanosti o dizajniranju i metodologiju za konstruiranje kompozitnih indika tora. Istraživanje je provedeno slijede´ ci aktivnosti metodološkog okvira znanosti o dizajniranju i odgovaraju´ ce korake metodologije za konstruiranje kompozitnih indikatora. Nadalje, u ovom istraživanju korištene su pretežno kvantitativne, a u manjoj mjeri i kvalitativne istraživaˇ cke metode. U ˇcetvrtom poglavlju prikazani su rezultati istraživanja. U prvom dijelu ovog poglavlja prikazani su rezultati istraživanja teorijskog okvira kvalitete metapodataka koji se oslanja na sustavni pregled literature, analizu i mapiranje metapodatkovnih polja razliˇ citih me¯ dunarodnih standarda i specifikacija sustava za upravljanje otvorenim podacima te istraživanje mišljenja struˇ cnjaka s ciljem provjere sadržajne valjanosti. Inicijalno razvijen teorijski okvir kvalitete metapodataka otvorenih skupova podataka sadrži 71 individualni indikator, od kojih svaki pri pada jednoj od osam dimenzija s obzirom na svojstva metapodataka i jednoj od pet dimenzija s obzirom na svojstva skupova podataka (dostupan je u otvorenom pristupu na repozitoriju Har vard Dataverse). Provjerom sadržajne valjanosti razvijenoga teorijskog okvira relevantnima su se pokazala 32 individualna indikatora. Relevantni indikatori raspore¯ deni su u šest dimenzija s obzirom na svojstva metapodataka te u pet dimenzija s obzirom na svojstva skupova podataka. U drugom dijelu poglavlja prikazani su koraci u razvoju i validaciji kompozitnog indika tora te rezultati empirijskog istraživanja na uzorku otvorenih podataka preuzetih s dvaju portala otvorenih skupova podataka, koji su bazirani na razliˇ citim sustavima za upravljanje metapo dacima. Izgradnja kompozitnog indikatora kvalitete metapodataka otvorenih skupova podataka temeljila se na teorijskom okviru, a ukljuˇ civala je: dohva´ canje metapodataka otvorenih skupova podataka s odabranih portala otvorenih podataka (sluˇ cajno odabranih 4820 skupova otvorenih podataka s dvaju portala otvorenih podataka, portala otvorenih podataka EU-a i australskog portala otvorenih vladinih podataka), mapiranje metapodatkovnih polja odabranih portala na metapodatkovna polja navedena u relevantnim metapodatkovnim standardima (pojedina metapo datkovna polja nisu prona¯ dena ni na jednom ododabranihportala), izraˇ cunavanje vrijednosti/sko rova relevantnih individualnih indikatora, analiziranje izraˇ cunatih vrijednosti multivarijatnom analizom, odre¯ divanje relativne važnosti odnosno pondera individualnih indikatora i dimenz ija analitiˇ ckim hijerarhijskim procesom te agregiranje vrijednosti u jednu vrijednost, tzv. skor VII Prošireni sažetak kompozitnog indikatora, primjenom linearne agregacije. Ponderi individualnih indikatora i di menzija, izraˇ cunati skorovi individualnih indikatora te skorovi (pod)dimenzija i kompozitnog indikatora dostupni su kao otvoreni znanstveni podaci na repozitoriju Harvard Dataverse. Kom pozitni indikator validiran je evaluacijom robusnosti razvijenoga kompozitnog indikatora, što je ukljuˇ civalo primjenu analize osjetljivosti i analize nesigurnosti. Upetom poglavlju najprije su predstavljeni rezultati istraživanja u kontekstu postavljenih ciljeva, istraživaˇ ckih pitanja i hipoteza. Tako je u sklopu prve aktivnosti Objašnjenje problema dobiven odgovor na prva dva istraživaˇ cka pitanja. Odgovor na istraživaˇ cko pitanje „Koje su kljuˇ cne dimenzije kvalitete metapodataka otvorenih podataka?” glasi: Pet je dimenzija kvalitete metapodataka otvorenih skupova podataka s obzirom na svojstva skupova podataka, a to su pronalažljivost, dohvatljivost, interoperabilnost, ponovna upotrebljivost i kontekstualnost. Osam je dimenzija kvalitete s obzirom na svojstva samih metapodataka, a to su potpunost, uskla¯ denost, koherentnost, toˇ cnost, otvorenost, dohvatljivost, razumljivost i pravovremenost. Odgovor na istraživaˇ cko pitanja „Kako mjeriti identificirane dimenzije kvalitete metapodataka?” glasi: Iden tificirane dimenzije kvalitete metapodataka mjerimo pomo´ cu indikatora kvalitete za metapodatke otvorenih skupova podataka, tj. primjenom metrika nad svojstvima/atributima. U sklopu prve aktivnosti ostvaren je i prvi cilj istraživanja (C1). Drugi cilj istraživanja (C2) ostvaren je u aktivnosti Definiranje zahtjeva. Dva cilja (C3 i C4) ostvarena su u sklopu aktivnosti Dizajn i razvoj artefakta. Peti cilj istraživanja (C5) te tre´ ce istraživaˇ cko pitanje pokriveni su aktivnoš´ cu Demonstracija artefakta. Odgovor na istraživaˇ cko pitanje „Kako procijeniti kvalitetu metapo dataka?” glasi: Kvaliteta metapodataka otvorenih skupova podataka procjenjuje se primjenom kompozitnog indikatora, koji je razvijen na temelju teorijskog okvira kvalitete metapodataka otvorenih skupova podataka, na podacima. Rezultatima aktivnosti Evaluacija artefakta potvr¯ dena je postavljena hipoteza da je razvijeni kompozitni indikator kvalitete metapodataka otvorenih skupova podataka robustan. Drugi dio petog poglavlja sadrži sažetu usporedbu rezultata provedenog istraživanja s prethod nima, usko povezanima s fokusom i naporima ovog istraživanja, da bi se naglasila važnost i doprinos provedenog istraživanja za podruˇ cje otvorenih podataka. Tako¯ der, peto poglavlje sadrži opis ograniˇ cenja provedenog istraživanja, od kojih su neka is taknuta u nastavku. Jedno je od ograniˇ cenja da su i procesi i rezultati aktivnosti Objašnjenje prob lema do odre¯ dene mjere subjektivni te ovise o znanju i vještinama autorice. Primjerice, proces uskla¯ divanja atributa metapodataka razliˇ citih metapodatkovnih standarda podložan je mogu´ cim pogrešnim tumaˇ cenjima jer se uskla¯ divanje provodi mapiranjem atributa na temelju njihovog semantiˇ ckog znaˇ cenja. Nadalje, budu´ ci da su skripte u programskom jeziku R razvijene za analizu podataka uz primjenu odgovaraju´ cih istraživaˇ ckih metoda unutar gotovo svih aktivnosti metodološkog okvira, postoji mogu´ cnost da je došlo do defekata tijekom implementacije. Ušestom, završnom poglavlju navedeni su znanstveni doprinosi istraživanja, a to su: sistem atizacija i sinteza dosadašnjeg znanja u domeni kvalitete otvorenih (meta)podataka i dimenzija identificiranih u svrhu mjerenja istih, razvoj teorijskog okvira kvalitete metapodataka otvorenih VIII Prošireni sažetak skupova podataka, razvoj kompozitnog indikatora kvalitete metapodataka otvorenih skupova podataka, rezultati empirijskog istraživanja kvalitete metapodataka otvorenih podataka. Ujedno je detaljnije opisano kako je svaki od prethodno navedenih doprinosa postignut. Osim znanstvenih doprinosa istraživanja, u završnom poglavlju istaknuti su i praktiˇ cni do prinosi, a neki od njih navedeni su u nastavku. Razvijen i validiran teorijski okvir obuhva´ ca dva pogleda na procjenu kvalitete metapodataka otvorenih skupova podataka: prvi, koji više preferira akademska zajednica, usmjeren je na svojstva metapodataka, dok je drugi, koji više preferira praktiˇ cna zajednica, usmjeren je na svojstva skupova podataka. Nadalje, ustanovljeno je da na vrlo velikom sluˇ cajnom uzorku otvorenih skupova podataka nedostaju metapodatkovna polja za pojedine indikatore kvalitete koje struˇ cnjaci smatraju relevantnima. Tako¯ der, samo manji dio promatranih skupova podataka postigao je višu vrijednost kompozitnog indikatora. Me¯ du ostalim doprinosima, razvijeni kompozitni indikator pokazao se kao korisno sredstvo za usporedbu razliˇ citih skupova otvorenih podataka i portala koji ih nude. Poglavlje završava prijedlogom smjernica za budu´ ca istraživanja s ciljem rasta i razvoja otvorenih podataka. To ukljuˇ cuje, me¯ du ostalim, implementaciju razvijenoga kompozitnog in dikatora kao interaktivne web aplikacije koriste´ ci paket Shiny programskog jezika R te ispitivanje povezanosti razvijenoga kompozitnog indikatora s drugim pokazateljima razliˇ citih karakteristika javne uprave (transparentnost i otvorenost, razvijenost e-uprave, ukljuˇ cenost gra¯ dana, inovaci jska sposobnost) i dr. |