Sobre los datos
Toda la información que publicamos proviene de portales de open data oficiales, transformada con una metodología documentada y sin capa editorial.
Fuentes
Estas son las fuentes oficiales que alimentan la plataforma:
- Open data del Congrés dels Diputats — congreso.es/es/opendata. Diputats, iniciatives, votacions del ple. Llicència CC-BY 4.0.
- Cercador d'iniciatives del Congrés — busqueda-de-iniciativas. Sèries 162 (Proposicions no de Llei), 173 (Mocions), via AJAX del Liferay. Mateixa llicència.
- Hemicicle — mapa de seients oficial publicat a congreso.es/ca/hemiciclo. Imatge i coordenades són del Congrés; només mostrem on seu cada diputat.
- Fitxes de diputats — pàgines públiques del Congrés. D'allà extreim fotografia oficial, codi parlamentari i any de naixement. Mai dades privades (telèfon personal, adreça, família).
Metodología
Pipeline de procesamiento documentado:
- Descàrrega periòdica dels datasets oficials. Una tasca programada baixa cada 4 hores les votacions noves i una vegada al dia els diputats i iniciatives.
- Normalització a la nostra base de dades amb esquema documentat. Cap dada calculada s'inventa: tot prové d'una columna identificable de la font.
- Classificació temàtica per LLM. Cada iniciativa es classifica per tema (17 temes editorials + 17 ODS de l'Agenda 2030) amb un model de llenguatge (Mistral, europeu). La taxonomia és tancada — el model assigna entre els temes definits, no n'inventa. La precisió varia; iniciatives sense classificació són explícites.
- Resums planers per LLM. Quan el text original és jurídic-procedimental, generem un resum «planer» en català i castellà. El model té instruccions estrictes contra emetre opinions: si detecta llenguatge editorial el resum es marca com a null en lloc d'arriscar-se a publicar valoració.
- Mètriques agregades (cohesió, assistència, coincidència entre grups, índex d'aprovació per tema). Totes calculades amb fórmules documentades al codi font, sense ponderacions opaques.
Frecuencia de actualización
- Votacions del ple: revisem cada 4 hores. El Congrés publica el resultat ~24-48h després de la sessió, així que la cobertura sol arribar al cap d'1-2 dies.
- Iniciatives: cada nit. La majoria es publiquen el mateix dia o l'endemà del registre.
- Diputats actius: cada nit. Capturen substitucions, canvis de grup.
- Hemicicle (mapa de seients): manual, quan sabem que hi ha hagut reassignacions.
- Classificació LLM: automàtica en cada ingest. Costos a càrrec del projecte.
Principio de neutralidad
Hola Política es infraestructura cívica, no plataforma de opinión. Estos son los límites que nos fijamos:
- Cap llista «el millor/pitjor diputat».
- Cap valoració automàtica de qualitat d'una llei.
- Si publiquem cohesió alta d'un grup, també publiquem la baixa, costat per costat.
- Si publiquem «qui aprova més» d'un tema, també publiquem «qui rebutja més», al mateix widget.
- No tenim secció de comentaris, reaccions ni vots paral·lels: l'eina és un mirall, no un megàfon.
Si en algún momento ves contenido que parezca editorial o unilateral, es un bug. Avísanos.
Limitaciones conocidas
- Vincle vot↔iniciativa: el Congrés assigna codis d'expedient diferents als documents procedimentals (162 PNL, 173 Moció...) i a les lleis subjacents (121, 122...). El vincle es manté quan el codi és el mateix; per a la resta, sense classificació de tema. Treballem en una capa de matching per text.
- Senat: no hi és encara. El Senat no publica votacions individuals en format obert estructurat. Quan ho faci, l'incorporem.
- Història: cobertura XV legislatura (des d'agost 2023). Legislatures anteriors planejades per a fase 2.
- Llenguatge: el contingut original és castellà. Traduccions al català per IA estan en desenvolupament per a títols i resums.
Correcciones y contacto
Si detectas un error de datos (voto mal etiquetado, diputado mal clasificado, ficha con información desactualizada) o un problema de privacidad, escríbenos. Resolvemos cada caso con trazabilidad: identificamos la fuente, hacemos la corrección y, si el error venía de la fuente oficial, le enviamos el feedback.
Correu de contacte: dades@holapolitica.org
Licencias
- Codi font: EUPL-1.2 (European Union Public Licence). Disponible a github.com/Pardo24/holapolitica.
- Dades: CC-BY 4.0. Pots reutilitzar-les citant Hola Política i la font original (Congrés dels Diputats).
- Fotografies oficials: propietat del Congrés dels Diputats. Les redistribuim sota la mateixa autorització que ells publiquen al seu portal.
RGPD y protección de datos
Tratamos datos de personas que ejercen funciones públicas en régimen de interés público para fines de transparencia e información periodística (Art. 85 RGPD, Art. 28 LO 3/2018, Ley 19/2013 de Transparencia). Nunca mostramos datos privados, solo la información relativa al mandato parlamentario.
Para cualquier persona que crea que el tratamiento de un dato público suyo sobre su actividad parlamentaria es inadecuado a nuestro contexto, puede escribirnos y evaluamos cada caso individualmente.
El proyecto es open source. Si quieres colaborar, reportar errores o sugerir mejoras, empieza por la página del proyecto.
Lee más sobre el proyecto