Mali rječnik – vodič za razumijevanje otvorenih podataka
Objavio Suzana u 14:10
Internetska terminologija mnogim je samorazumljiva, neki su pak njome zbunjeni. Zato donosimo mali englesko – hrvatski rječnik termina koji se koriste u raspravama o otvorenim i slobodnim podacima.
Bulk data – Veliki paket podataka
Podaci su dostupni kao „bulk“ (na veliko), ako su dostupni jednim ili pomoću samo nekoliko strojnih automatskih zahtjeva. Na primjer u jednoj ili samo nekoliko fileova. Nasuprot tome, podaci nisu „bulk“ ako ne postoji jednostavan i automatski način da im se pristupi. Na primjer, kada se do podataka može doći zahtjevom preko formulara na internetskoj stranici, ali samo jednom podatku po zahtjevu. U tom slučaju potrebni su nekada i milijuni zahtjeva za velike registre da bi se dobila cijela baza podataka. U tom slučaju govori se o „non-bulk“ podacima.
Licensing – Dozvola (koja je ponekad i ograničenje)
Kada su neki podaci ili sadržaji dostupni, u osnovi je njihova upotreba ograničena zakonima o intelektualnom vlasništvu. Dakle, ako želite koristiti neki materijal, posebno ako ga želite legalno koristiti ili dalje distribuirati, nužno je provjeriti što je pod dozvolom za korištenje dopušteno, a što zabranjeno. U mnogim slučajevima ne postoji jasno naznačen i definiran uvjet pod kojim se podaci smiju koristi i u tom slučaju uglavnom se primjenjuju odredbe Zakona o intelektualnom valsništvu.
Machine readable – strojno čitljivo
Sadržaj ili podaci su strojno čitljivi samo kada su dostupni u formatu koji računala mogu jednostavno obraditi. Naglasak je na jednostavno. Ne digitalni materijali, primjerice tiskani ili rukom pisani, po samoj svojoj prirodi nisu strojno čitljivi. No, čak i neki digitalni materijali nisu nužno strojno čitljivi. Na primjer to su PDF dokumenti s tablicama podataka. Oni su zasigurno digitalni, ali nisu strojno čitljivi jer računalo iz njih ne može „izvući“ tablice s podacima za razliku od čovjeka koji ih može pročitati bez problema. Strojno čitljive tablice su one u nekom od formata tabličnih kalkulatora. Ni skenirani tekstualni dokumenti ili fotografije tekstualnih dokumenata nisu strojno čitljivi, no tekstualni dokumenti skenirani nekim od OCR programa (optical character recognition – optičko prepoznavanje znakova) i spremljeni kao tekstualna datoteka nekog od programa za obradu teksta kvalificiraju se kao strojno čitljivi.
Open data – Otvoreni podaci
Otvoreni su podaci koji su dostupni u skladu s Otvorenom definicijom: svatko im može slobodno pristupiti, koristiti ih i dalje ih slobodno distribuirati, dostupni su u strojno čitljivom obliku, na veliko (bulk). Podaci koji nisu strojno čitljivi ne smatraju se otvorenima, kao ni oni koji nisu dostupni u cjelini.
Open Data License – Dozvola za korištenje otvorenih podataka
Dozvola koja je u skladu s Otvorenom definicijom koja dopušta svakome da podatke koristi i dalje ih distribuira. Jedino ograničenje je navođenje izvora.