За послушните депутати и заспалата опозиция »

Публикувано на: 19.07.2010 06:10, източник: Блогът на Юруков, етикети: българия политика Технологии и Интернет open data греб ДПС закони Народно събрание отворени данни отсъствия парламент послушание Статистика

народно събрание, парламент, послушание, греб, дпс, статистика, отсъствия, закони, отворени данни, open dataСнимка: Sofia Photo Agency

Често казваме, че депутатите на ГЕРБ гласуват чинно закони според решенията на партията и кабинета. Друго клише, което се споменава и е вече синоним на депутат, е мързелът и неучастието в заседания. Тук обаче няма да обсъждаме причините и последствията от това ежедневие в Народното Събрание. Нещо, което аз се питам, е колко чинно гласуват депутатите в действителност, колко въобще гласуват и колко от тях са реално в залата.

Спомняте ли си, че миналата седмица споменах за разпечатките от гласуванията в парламента? А спомняте ли си, че дадох идеи, за няколко интереси неща, които можем да правим с тях? Ето една от тях – събрах всички разпечатки в една голяма Excel таблица и започнах да ги анализирам. Ето някои резултати:

По партии

Реално присъствие Партия Средно послушание
86.6%
ГЕРБ
92.6%
87.7%
КБ
80.3%
78.6%
ДПС
77.4%
83.3%
АТАКА
86%
85.2%
СК
88.1%
Положително гласуване Активност при гласуване
78.2%
ГЕРБ
70.8%
59%
КБ
28.2%
65.5%
ДПС
19.6%
74.9%
АТАКА
37%
71.9%
СК
29%

Кой е по-по-най

Най-“непослушни“ от всяка партия
ТАНЧЕВ За послушните депутати и заспалата опозиция ТАНЧЕВ
ГЕРБ
86.3%
Участие 43%
ВЕЛИКОВ За послушните депутати и заспалата опозиция ВЕЛИКОВ
КБ
56.1%
Участие 24%
ДАЛ За послушните депутати и заспалата опозиция ДАЛ
ДПС
49.1%
Участие 14%
martinov За послушните депутати и заспалата опозиция ПЕТКОВ
АТАКА
55%
Участие 30%
АГОВ За послушните депутати и заспалата опозиция АГОВ
СК
77.5%
Участие 21%
ВАСИЛЕВ За послушните депутати и заспалата опозиция ВАСИЛЕВ
НЕЗ
43.7%
Участие 12%
Реално присъствие
dogan За послушните депутати и заспалата опозиция ДОГАН
ДПС
0%
metin За послушните депутати и заспалата опозиция МЕТИН
ДПС
0%
emilivanov За послушните депутати и заспалата опозиция ИВАНОВ
ДПС
14.3%
sefer За послушните депутати и заспалата опозиция СЕФЕР
ДПС
28.6%
martinov За послушните депутати и заспалата опозиция ПЕТКОВ
АТАКА
28.6%
petrov За послушните депутати и заспалата опозиция ПЕТКОВ
ГЕРБ
28.6%
Активност при гласуване
peevski За послушните депутати и заспалата опозиция ПЕЕВСКИ
ДПС
5.6%
liutfi За послушните депутати и заспалата опозиция ЛЮТФИ
ДПС
9.2%
pantev За послушните депутати и заспалата опозиция ПАНТЕВ
КБ
9.4%
kardjaliev За послушните депутати и заспалата опозиция МЕХМЕДОВ
ДПС
9.8%
qnev За послушните депутати и заспалата опозиция ЯНЕВ
НЕЗ
9.8%
kostadinov За послушните депутати и заспалата опозиция КОСТОВ
ГЕРБ
10%

Интересен факт е, че всички от ГЕРБ гласуват в поне 86% от случаите в унисон с партията. При БСП и ДПС „послушността“ започва от 50-те процента, но там данните са по-неточни, заради страшно ниското им участие.

Методология

Данните, които виждате са на базата на 15 заседания между 9 юни и 9 юли. Това са тези, за които са изведени разпечатки откакто промяната в правилника на НС влезе в сила. През това време са гласувани 663 закона. Крайните резултати по партии и депутати може да свалите като spreadsheet За послушните депутати и заспалата опозиция таблица от тук.

Послушание

Това мерило е най-трудно за изчисление. То определя колко често даден депутат е гласувал по същият начин, както средното за партията. Много размишлявах как да сметна това и накрая се спрях на следния подход:

Първо смятам как би гласувала партията, ако беше един депутат. Това става като се изчислява вероятността за всяка възможност (Да, Не, Въздържал се) за всеки закон и се избира най-често срещаното гласуване. Ако така обаче са гласували по-малко от 60% от депутатите от тази партия законът се пренебрегва в изчисленията (т.е. все едно не са гласували). Това възприемам за линия на партията поради единомислие или просто заповед отгоре. След това, за всеки депутат се преброяват колко съвпадения има между неговото гласуване и средното за партията (освен тези, за които не е гласувал и тези под 60% на партията). Така се пресмята колко пъти се е съобразил с мнозинството от групата си.

Реално присъствие

Тук не се осланям само на списъка с неизвинени отсъствия, а на реално подадените гласове. Ако някой депутат е маркиран като присъстващ, но на практика не е гласувал нито един закон през деня, го маркирам като реално отсъстващ. Има случаи, в които някой е отбелязан с неизвинено отсъствие, но е гласувал по-късно през деня. Тези случаи не ги маркирам като отсъствия, защото вероятно депутатът е дошъл по-късно. Най-много такива отсъствия имат Доган и Метин – 15 от 15.

Активност при гласуване

Тук измервам колко закона е гласувал депутатът докато е бил в залата. Това включва дните, в които е дал поне един глас. Поради това, че някои депутати са идвали само няколко дни и са гласували по много, се получава така, че имат по-голяма активност от други, които са седели постоянно в парламента. Така депутатите на ДПС, БСП и СК имат най-ниска средна активност. Случаят с ДПС е най-фрапиращ, защото средно са гласували за по-малко от 2 закона от всеки 10.

Възможности за подобрение

На първо място, това въобще не е представителна извадка, защото от хилядите гласувани закони и десетките заседания, аз взимам само тези от последния месец. За жалост имаме данни само за тях. За щастие обаче, от тук нататък с всяка стенограма ще получаваме такива разпечатки и ще си вадим по-точни изводи.

Формулата за послушанието определено може да се подобри. Примерно може да се сметне средното на партията с вероятности, а не направо с Да/Не. Също така може да се даде тежест на гласовете – за Въздържал се х0.5, а за глас срещу този на партията – х2. Това е защото с обратен глас депутатът реално се противопоставя, а с Въздържал се – просто не им пречи. Накрая, може да се използва векторен анализ за изчисляване на разстоянието между всеки депутат, да се изчисли векторният център на партията и да е види кои депутати гласуват еднакво. В този случай елементите от векторите ще са законите. Може също така да се сметнат разликите между самите партии, за да се види коя срещу коя е гласувала. За целта обаче ще е най-добре да се напише директно скрипт – било то в Excel или направо на PHP. Това ще е доста по-лесно като излязат разпечатките на XML.

Реалното присъствие и активността може да се подобрят с включване на статистика за изказванията на всеки депутат и участието му/й в комисиите. Това обаче също ще трябва да почака докато стане новият сайт. И сега може да се анализира стенограмата, но ще е твърде трудоемко.

Направих всички изчисления с MS Excell 2010. Започнах с OpenOffice Math но се оказа, че няма функции като SUMIFS, която ми трябваха. Все пак, сега формулите са прекалено големи (десетки милиони събирания на страница) и затова в един момент така или иначе ще трябва да се пренапишат на VBasic или нещо за OpenOffice. Този път просто не ми се занимаваше. Също така може всичко това горе да се покаже с иконография, която стана доста популярен метод за изобразяване на сложна информация. Може да го направя към края на годината, когато имам достатъчно точно данни.

Изводи

rdf open data Макар и непълна, надявам се, че тази статистика да събуди интереса ви към възможностите на отворените данни. С публикуваните разпечатки на гласуването на депутатите може да следим подробно всяко тяхно решение, да го свържем с естеството на гласуваният закон и да изградим профил на всеки политик. Макар че изграждането на такъв сайт би отнело време, самото изчисление и събиране на информация става автоматично. А представете си, че имахме достъп и до други такива масиви от данни, като например средната бройка болни, операции и конкретни заболявания по региони; списък с престъпленията разделени по тип и местоположение; подробна информация за харчовете на общините; напредъкът по различни европроекти и т.н.

Ако си мислите, че това е твърде много информация – не е, защото други европейски държави вече ги публикуват. Ако си мислите, че никога в България няма да получим тези данни свободно, пак ще сгрешите. Може да не е утре или вдругиден, но явно е възможно – от НС се съпротивляваха за разпечатките, но пак ги пуснаха. За статистиката от институциите обаче трябва централно решение (т.е. не на отделни чиновници действащи на добра воля) и принципна политика, която да установява реда, формата и отговорните лица за публикуването на отворени данни. Такива решения винаги се взимат от 2-3-ма човека на възлови позиции и затова трябва да ги намерим и убедим, че си струва. Това все пак е крайната степен на прозрачност, за която толкова много се говори.