09/13/12 04:55
(http://socialevo.net/)

Боян Юруков за crowdsourcing-а, отворените данни и катастрофите в София

Боян Юруков за crowdsourcing-а, отворените данни и катастрофите в София

Боян Юруков е привърженик на отворените данни и с много от проектите си на практика демонстрира ползите от тях. Един от тези проекти е Crime.bg, в който върху картата на България лесно можеш да отбележиш престъпление, на което си станал свидетел, като подадеш сигнал. С новия си проект Боян насочва вниманието ни към катастрофите, като събира и обработва информация за тях. И там от особено значение е участието на ентусиасти, които помагат с обработката на суровата информация и по-точно поставянето на маркера на дадена катастрофа върху точното място на картата. Вижте какво е мнението му за отворените данни, събирането на информация и crowdsourcing-а.

Колко лесно е да се използват единни стандарти и подходи в предоставянето на данни, за да са възможни проекти като твоите – Crime.bgFairElections.eu, а сега и за катастрофите? Какво трябва да се направи?

Използването на отворени стандарти и предоставянето на данните е лесна задача от техническа гледна точка. Повечето компютърни системи имат такава възможност. Проблемът е административен и организационен. Трябва да има разбиране къде какви данни има, каква част от данните трябва да остане защитена, какви данни трябва да се виждат, кой отговаря за администрацията и качеството им и кой ще отговаря за публикуването им в мрежата. Всички тези въпроси са сложни в която и да е организация и държавната не прави изключение. Затова е най-лесно просто да не се направи. Парадоксът е, че често служители на институциите разбират ползите и искат да предоставят отворени данни, но системата на вземане на решения им пречи. 

За да се оправят нещата, според мен трябва да се тръгне от две места. От една страна, трябва да се натиска за по-голяма свобода на решения на чиновниците, контролиращи данните, ясни изисквания за стандарти и отвореност във всички нови системи, по-ясна и прозрачна структура на информационната система в държавната администрация и механизъм за изискване на бази данни по подобие на Закона за достъп до обществени данни. От друга страна, трябва да се обучат администраторите и самите чиновници какво са отворени данни, как могат да извличат полза от тях в работата си, как да предоставят данни и да ги изчистват от защитена информация.

 

Кои са най-големите партньори в случая?

Аз съм на мнение, че независимо от темата или размера на организацията всяко решение се взема от един или няколко души. Затова е важно да се идентифицират и подкрепят тези няколко човека, които водят процесите. Подобен е случаят и с отворените данни и държавната администрация – има няколко души, които разбират и бутат нещата напред, и други, които са в позиция да направят нещо и имат нужда от убеждаване. 

Също толкова важен партньор са журналистите и неправителствените организации. Правителствената прозрачност не е крушка, която се включва, за да освети стая – тя е процес и оползотворяването на публичната информация го подхранва. Дори да успеем да осигурим отваряне на големи масиви от данни, единствено проверката и използването им от журналисти може да подсигури качество и надеждност. Това става, като се правят справки, сравняват се бази данни, търсят се несъответствия или финансови машинации и пр. Обратното виждаме в много държави – тръгват проекти за прозрачност, но дали заради лош формат на данните, дали заради липса на интерес и техническа грамостност у журналисти и НПО-та, но те остават неизползвани. Тогава администрациите спират да пускат информация с извинението, че не се използва. 

 

Кога точно е моментът на ентусиастите, които са готови да отделят по няколко минути, за да помогнат? Изобщо приложим ли е Crowdsourcing-ът и в каква степен?

Crowdsourcing-ът се използва по цял свят в най-различни теми – следене на корупция, природни бедствия, обработване на данни и съобщаване на престъпления. Макар препоръчването на ресторанти и гласуването за снимки с котенца да е пак събиране на данни от широката публика, тук разглеждаме употребата му в дигиталния активизъм. Човек отделя по няколко минути за такъв проект тогава, когато изпитва вътрешна нужда да направи нещо по даден въпрос. Преди последните избори това бяха сигнали за измами във Fairelections.eu. Това може да са и престъпления в Crime.bg. Други сайтове събират информация за дупки по пътищата, незаконна дейност в защитени природни зони и пр. 

Идеи има много и техническото им осъществяване не е трудно. Има достатъчно безплатни платформи както за събиране на данни, така и за анализа им. Проблемите обаче са същите, каквито среща и бизнесът в работата си с интернет потребители – как да се предостави удобен интерфейс за общуване и да се създаде ангажираност у посетителите. Има различни начини за изпращане на информация – приложения, sms-и, през интернет страница, през социалните мрежи. Трябва да се избере добра комбинация между въвеждане, модерация и представяне на данните, за да виждат хората смисъл да споделят знанието си.

 

По пътя от Бургас до Петолъчката в неделя например имаше поне 5 катастрофи. С удоволствие бих пускал сигнал за катастрофи на място. И без това съм в задръстването, поне ще помогна на другите хора. Дали ще е възможно след време?

Едно такова приложение въобще няма да е трудно. Проблемът обаче ще е модерацията. Как да филтрираме истинските катастрофи и нарушения от шегите и умишлените злоупотеби? Решение би било да комбинираме два вида crowdsourcing – при събиране и обработване на сигналите. Така потребители ще могат да гласуват колко достоверни са сигналите на други потребители. Дори тогава обаче качеството и надеждността на данните пада доста.
 
В сегашния си проект не събирам сигнали от граждани, а само използвам помощта им за обработване на информацията от КАТ. Целта е да покажем, че този вид информация ще е полезна, а това можем да направим само с възможно най-надеждна информация. Това не означава, че в процеса няма място за сигнали от хора, но това ще са различни проекти. Когато убедим МВР да пусне данни в отворен формат за всички инциденти по пътищата – с описание, категории, географски координати, пострадали и пр., – ще можем да комбинираме тези данни със сигналите, за които говориш. Тогава ще имаме двоен ефект – от една страна, ще получаваме снимки и допълнителна информация за потвърдените инциденти, както и данни за такива, които не са или обявени пред полицията, или тя е пропуснала в бюлетина си, а от друга, след много съвпадащи сигнали за катастрофи ще можем да изчисляваме автоматично достоверността на сигналите от определени граждани и при висока такова, да ги обявяваме за потвърдени още преди полицията да ги обяви.
Данните сами по себе си са нещо интересно за малки справки. Когато обаче ги комбинираме с други данни и ги поставим в друг контекст, тогава виждаме истинската им стойност. Това е и основната цел на отворените данни – да могат да се използват по неочаквани от първоизточника начини. 

 

Какви са най-интересните приложения на информацията, която обработваш и ще предоставяш?

В случая с катастрофите все още не знам напълно. Знам с какви справки ще започна – карта на тежките катастрофи, графики на разпределението на инциденти и пострадали, статистика за причините и типа пострадали. Преди малко открих ежедневна статистика за същото в национален мащаб и ще използвам и нея. Когато се заровиш в масив от данни, било фирмена или публична инфорамация, не можеш да очакваш нещо конкретно. Най-лошите анализи са когато имаш теза и правиш всичко възможно да я докажеш с наличните данни. Затова искам да видя какво ще изскочи и него ще представя. Разбира се, ще публикувам първо самите данни в достъпен вид, за да могат и други да ги смесват и разглеждат.
 

Подобни статии:

  1. Боян Юруков: Особеността на интернет е, че се развива ужасно бързо
  2. Foursquare прегръщат идеята за „отворените карти“
Facebook TwitThis Google del.icio.us Digg Svejo Edno23 Email

Свързани новини:

новини от България
graphic
спортни новини
graphic

Бързи връзки


Търсене


Архив

RSS Абонамент

Новини от Грамофон

"Новини от Грамофон" - Следете последните новини от България и чужбина обединени на едно място. Обновяват се през 1 минута.

 

  •  

Ново: Публикуване