Vi ste ovdje: Vjetrenjača »

Tag : baza podataka

Enigma

Enigma.io izabrana je između 30 kompanija kao najbolji startup za nagradu TechCrunch Disrupta. Bravo za njih, no to je itekako dobra vijest za sve one koje zanimaju otvoreni podaci. Tvrtka je nazvana po stroju iz 2. Svjetskog rata, ali i zbog uvjerenja da se oko javnih podataka stvara daleko više misterije nego što bi trebalo. Enigma.io ih namjerava demistificirati.

Enigma-edited„Ideja cijelog projekta je kreirati nešto poput interneta za javne podatke, učiniti ih lako dostupnima i probavljivima“, kaže predsjednik uprave Jeremy Bronfman. Kompanijina strategija je preuzeti vrijedne javne podatke, za početak one koji mogu koristiti korporacijama i od njih stvoriti korisne informacije. Provodeći taj plan našli su se pred izazovom. Prvi je dostupnost – problem s kojim se svi susreću kada znaju što traže, a li to ne mogu dobiti u iskoristivom obliku. Drugi je bio otkrivanje podataka – sposobnost da se pretraži neki pojam koji vas interesira i pronađu podaci za koje niste ni znali da vam trebaju.
„Recimo da ste analitičar koji prati McDonald’s. Svaki put kad se otvori novi restoran mora zatražiti sanitarne dozvole. To znači da možete pratiti poslovanje kompanije po tim dozvolama. Međutim, vi to ne morate znati. Svi smo mi, barem mlađe generacije, verzirani u Googleu pa je naš pristup „Želim znati sve o McDonald’su“, a ne „Želim pretražiti sanitarne dozvole“. Enigmin je posao da spoji podatke koji trebate i da vam ukaže da Sanitarna inspekcija ima podatke koji vam trebaju. Želimo da ljudi mogu koristiti podatke samo pretražujući područja koji ih zanimaju, a ne da moraju razmišljati gdje se ti podaci mogu naći“, rekao je Bronfman. Enigma zasad barata sa 100 tisuća baza podataka, odnosno s 20 milijardi jedinstvenih informacija. Iako je tvrtka trenutno okrenuta pružanju usluga korporacijama, namjera im je što više podataka učiniti besplatno dostupnima. Tako su objavili bazu podataka o letovima zrakoplova.
„Pročitali smo u nekom članku da je neki čovjek na temelju te baze podataka shvatio da će Sarah Palin pokušati osvojiti potpredsjedničku nominaciju nekoliko dana prije nego što je to i službeno objavljeno. Uzeo je listu aviona, njihovih vlasnika i letova i usporedio je s listom donatora Republikanske stranke. Shvatio je da većina tih aviona nikada ili rijetko leti sjevernije od Chicaga. Odjednom su svi letjeli u Wasillu na Aljasci“, objasnio je Bronfman.
Tvrtka je još u ranoj fazi razvoja, ali već sada je izgradila impresivan set alata. Tako se kod njih može:
– „zamiješati“ vlastite podatke, na primjer listu kupaca, s Enigminim javnim podacima iza sigurnog firewalla,
– kreirati upozorenja o pristizanju novih podataka,
– izvoditi geografski bazirana pretraživanja,
– proučavati podatke kompanija i vidjeti s kojim državnim agencijama sklapaju ugovore i na temelju toga izračunati kako će na nju utjecati rezanje proračuna.
„Na koncu“, tvrdi Bornfmann, „baš kao što postoji jedan internet tako će postojati i jedan središnji ekosistem na koji će biti vezani svi ti podaci. Mi želimo biti taj sustav“.
Između ostalih u Enigmu je značajan novac investirao i New York Times.

Obama izdao Izvršnu naredbu o objavi podataka

634780309914819695_obama-exec-order-2Bijela kuća izdala je, proteklog 24. svibnja 2013., izvršnu naredbu predsjednika Baracka Obame prema kojoj svi podaci u informacijskim sustavima vladinih agencija od sada moraju biti svima dostupni za preuzimanje i korištenje.

Dužnosnici kažu da će to stvoriti nove mogućnosti za poduzetnike u cijeloj zemlji.

“Vlada sjedi na pravom blagu podataka” izjavio je glasnogovornik Bijele kuće Steven Van Roekel na konferencijskom pozivu s izvjestiteljima.

“Većina naših podataka sada je zaključana u papirima, kontroliranim sustavima i slično. Na tragu ovog propisa vladine agencije će, u sklopu modernizacije postojećih sustava, morati sve svoje podatke kreirati tako da budu otvoreni i strojno čitljivi”.

Proteklih godina, tvrdi Van Roekel, pokrenute su stotine tvrtki i otvoreno tisuće radnih mjesta baziranih samo na vladinim podacima. Ova nova direktiva će, također, dati poticaj transparentnosti, rekao je Van Roekel.

“Vjerujemo da će ovo biti prilika za veću transparentnost i učinkovitost vlade kao i poticaj gospodarstvu”, rekao je novinarima.

Izvršna naredba određuje da će “po defaultu” vladini informacijski kapaciteti koji će od ovog trenutka biti objavljivani ili modernizirani morati biti “otvoreni i strojno čitljivi” s izuzetkom onih koji sadrže “osobne, povjerljive i podatke koji se tiču nacionalne sigurnosti”. Uz ovu naredbu priložen je i memorandum Ureda za upravljanje i proračun koji od državnih agencija zahtijeva da održavaju “inventar podataka” – listu svih baza podataka – i na temelju njega – objave sve podatke koje smiju.

Odluka je objavljena na Git Hubu, mreži za projekte otvorenog koda, i svi zainteresirani iz tehnološkog svijeta, kao i iz vlade, već predlažu promjene.

Citirajući novu bazu podataka naplata u zdravstvu, Van Roekel je ustvrdio da će ove baze podataka stvoriti nove mogućnosti za sve tvrtke koje znaju i mogu pretvoriti velike količine podataka u vrijedne tržišne informacije. Kupci nekretnina, na primjer, mogli bi profitirati jer će im biti dostupni podaci o stopi kriminala u susjedstvu, dostupnosti širokopojasnog interneta, prosječnoj cijeni i količini utrošene energije…

Savezni dužnosnici još uvijek nisu komentirali Van Roekelovu tvrdnju o stotinama tvrtki i tisućama radnih mjesta stvorenih uz pomoć oslobođenih vladinih podataka ali su obećali to učiniti u najkraćem roku. Iako Bijela kuća nije objavila za koje dijelove tržišta smatra da će najviše profitirati, dužnosnici se nadaju da će podaci biti korisni u što većem broju djelatnosti. U memorandumu stoji da će “agencije postati otvorenije u okvirima zakona, ali da će i poštivati sva pravila o zaštiti privatnosti, povjerljivosti i sigurnosti”.

Kao pomoć u ostvarenju ove naredbe Ured za upravu i proračun te Ured za znanost i tehnologiju pokrenuli su Projekt slobodnih podataka mrežnu riznicu i naputaka.  Projekt uključuje više alata poput softvera za uspoređivanje podataka u uobičajenim bazama podataka ili u CSV formatu.

Agencijama je zadan rok od šest mjeseci u kojima će morati revidirati svoje protokole i stvoriti javne liste svih dostupnih baza podataka. Po isteku tog roka svi novi podaci u njima morat će biti javno dostupni.

Aktivisti zainteresirani za transparentnost i otvorenu upravu još uvijek diskutiraju koliko će im ovaj projekt biti koristan.

Josh Tauber, tvorac GovTracka još uvijek najboljeg mjesta za praćenje rada Kongresa, je na svom blogu ustvrdio da je zabrinut jer Bijela kuća u dokumentu upotrebljava pojam “open license” koji ima različito značenjopen datae od “public domain”. Pod pojmom “open license” mogla bi se kriti mogućnost daljnjeg onemogućavanja i korištenja podataka.

“Po definiciji “public domain” se odriče autorskih i drugih prava dok po “open licensu” ta prava i ograničenja po njima i dalje postoje.”, napisao je. “Proglas CCO(o intelektualnom vlasništvu stvoren u Creative Commonsu) već je uspješno iskorišten u Distriktu Columbija za odricanje  od autorskih prava nad podacima koji sadrže njihov kod.” Štoviše, dodaje citirajući Dereka Willisa iz New York Timesa, vlada je zadužila agencije da stvore mozaik od podataka, tj. onemoguće da preklopljene baze otriju osobne podatke ili ugroze nacionalnu sigurnost. To je potencijalno preširoko tumačenje koje bi upravi moglo otvoriti mogućnost da pod krinkom nacionalne sigurnosti  prikriju sigurnost svojih vlastitih poslova odnosno blokiraju uvid u ono što zaista rade.

Iako je Obama potvrdio da mu je Zakon o slobodnom pristupu informacijama jedan od prioriteta aktivisti još uvijek kritiziraju savezne dužnosnike jer odgovorajaju samo 55 do 60 posto zahtjeva za pristup informacijama. Smatraju da još uvijek nije jasno hoće li ova izvršna naredba zaista potaknuti transparentnost vlade. Na njihove tvrdnje dužnosnici još uvijek nisu odgovorili.

John Wonderlich iz Fundacije Sunlight oduševljen je što je Bijela kuća prihvatila otvorenost kao princip, ali ipak ima neke primjedbe:

Prisiljavanje agencija da objave popise svih svojih podataka bit će velik izazov iako je u pitanju Izvršna naredba. Koristit će primjedbe poput troškova, privatnosti i sigurnosti  da opravdaju ne objavljivanje ne samo baza podataka nego čak i samih njihovih opisa. Bit će to velika borba i jedva čekamo da se uključimo u nju. Bez ove Izvršne naredbe i civilnog nadzora preveliki broj agencija i dalje bi zadržavao kontrolu nad podacima. Zbog toga i nadalje novinari, ali i oni koji donose odluke, ne bi imali dovoljan uvid u sve ono što agencije imaju i što bi mogle objaviti.

“Široki pregled svih baza podataka je značajan i prilično agresivan potez”, ustvrdio je Wonderlich.

Na koncu jedan od većih aktivističkih prigovora je da dosad nisu mogli ni zatražiti podatke dok nisu znali što se u njima zaista nalazi. To bi se uskoro trebalo promijeniti.