Académique Documents
Professionnel Documents
Culture Documents
EN COLOMBIA
Direccin de Gobierno en lnea
Formato:
Documento
Dependencia:
Cdigo:
Lenguaje:
Versin:
Categora:
1.0
Espaol
Estado:
Final
Gua
Autor (es):
Firmas:
Aprob:
Informacin
Adicional:
Ubicacin:
CONTROL DE CAMBIOS
VERSI
N
1.0
FECHA
RESPONSABLE
DESCRIPCIN
2014-06-15
TABLA DE CONTENIDO
1
2
3
INTRODUCCION ...................................................................................................................... 5
OBJETIVOS DE LA GUIA ........................................................................................................ 6
APERTURA DE DATOS ........................................................................................................... 7
Qu es el Indice de informacin?..................................................................................... 15
Objetivo .................................................................................Error! Marcador no definido.
Beneficios .......................................................................................................................... 15
Cmo realizo el anlisis y el ndice de informacin de acuerdo a los criterios jurdicos? 16
Cmo identifico la informacin publicable? ...................................................................... 17
6.1.1
6.1.2
6.1.3
6.1.4
6.1.5
6.1.6
6.1.7
7
ANEXOS ................................................................................................................................. 41
7.1.1
7.1.2
7.1.3
7.1.4
7.1.5
7.1.6
8
TERMINOLOGA .................................................................................................................... 52
1 INTRODUCCION
La apertura de datos por parte del Gobierno es uno de los facilitadores ms potentes para el
desarrollo del denominado Open Government (Gobierno Abierto)1 en un pas. En Colombia, la
Direccin de Gobierno en lnea del Ministerio de Tecnologas de la Informacin y las
Comunicaciones ha promovido desde diferentes mbitos el acceso a la informacin y la apertura
de datos enfocado a tres objetivos principales:
1) Transparencia: Abrir datos de calidad supone:
3) Innovacin y crecimiento econmico: La reutilizacin de los datos por parte del Sector
Pblico impulsa:
Podemos entender el Open Government como un Gobierno basado en los principios de transparencia, colaboracin y participacin.
2 OBJETIVOS DE LA GUIA
La presente gua tiene como objetivo ofrecer herramientas prcticas que permitan a las entidades
3 APERTURA DE DATOS
3.1 QUE SON DATOS ABIERTOS?
Son todos aquellos datos primarios, sin procesar, en formatos estndar, estructurados e
interoperables que facilitan su acceso y permiten su reutilizacin, los cuales estn bajo la custodia
de las entidades pblicas y que pueden ser obtenidos y ofrecidos sin reserva alguna, de forma
libre y sin restricciones, con el fin de que terceros puedan reutilizarlos y crear servicios derivados
de los mismos. Es necesario que los datos que se abren se presenten en formatos (XLS, ODF,
CSV, XML, ATOM, JSON, TXT, RDF-XML, KML-KMZ, SHP, TMX, ZIP) y que sus contenidos
sean estructurados mediante lenguajes procesables por aplicaciones informticas.
Para que un Dato sea considerado abierto es necesario que cumpla con las siguientes principios2:
Completos: Todos los datos pblicos deben estar disponibles. Los datos pblicos son datos no
sujetos a limitaciones de privacidad, seguridad o privilegios.
Primarios: Los datos deben ser recolectados en la fuente de origen, con el nivel de granularidad
ms alto posible, no en forma agregada ni modificada.
Oportunos: Los datos se pondrn a disposicin tan rpido como sea necesario para garantizar el
valor de los mismos.
Accesibles: Los datos deben estar disponibles para el rango ms amplio de usuarios y para el
rango ms amplio de propsitos.
Procesables por mquinas: Los datos deben estar estructurados razonablemente para permitir
un procesamiento automtico.
No discriminatorios: Los datos deben estar disponibles para cualquiera persona, sin requerir un
registro.
No propietarios: Los datos deben estar disponibles en un formato sobre el cual ninguna entidad
tiene un control exclusivo.
Libres de licencias: Los datos no deben estar sujetos a ningn derecho de autor, patente, marca
registrada o regulaciones de acuerdo de secreto. Se podrn permitir restricciones razonables de
privacidad, seguridad o privilegios.
4PREPARACION DE LA ENTIDAD
Previo al abordaje de las etapas que permitirn avanzar en la adopcin de la iniciativa de
Apertura de Datos, se recomienda ejecutar las siguientes actividades de preparacin:
ROL
OBJETIVO
ACTIVIDADES
PERFIL
Funcional
Facilitar el acceso a la
informacin de la entidad y
analizar los mejores usos de la
misma, de manera que se
convierta en un activo para la
organizacin.
Identificacin
de
la
informacin.
Anlisis de informacin
publicable.
Priorizacin
de
la
informacin.
Tcnico
Priorizacin
de
informacin.
Documentacin
estructuracin.
Cargue y publicacin.
Personal
tcnico,
preferiblemente ingenieros de
sistemas con conocimientos
en
estndares
abiertos,
identificacin de informacin,
extraccin y manejo de bases
de datos. Conocimiento en
los requerimientos para la
publicacin y manejo del
portal web de la entidad.
Seguridad
Garantizar
un
manejo
adecuado de los riesgos y las
polticas de seguridad de la
entidad para la proteccin de la
informacin.
Anlisis de la informacin
publicable.
Documentacin
y
estructuracin.
Cargue y publicacin.
Personal
tcnico,
preferiblemente ingenieros de
sistemas con conocimientos
en aseguramiento de la
calidad en la informacin e
identificacin de riesgos de
seguridad.
Jurdico
Analizar,
asesorar,
conceptualizar y orientar sobre
los datos que son susceptibles
de poner a disposicin de
cualquier persona, sin que esto
implique la vulneracin de los
derechos fundamentales de los
individuos y el incumplimiento
de la normatividad, en cuanto a
respetar la reserva legal que
tienen algunos datos.
Anlisis de la normatividad
jurdica
en
cuanto
informacin secreta, de
reservada y confidencial
para garantizar que los
datos se pueden publicar.
GEL
Identificacin
de
la
informacin.
Anlisis de informacin
publicable.
Priorizacin
de
la
informacin.
Documentacin
y
estructuracin.
Cargue y publicacin.
la
y
Este proceso proporciona una visin clara de las tareas que han de realizarse durante la
ejecucin del desarrollo del proceso y los recursos necesarios.
11
Categoras de informacin
Concepto
Nombre de la informacin que tiene valor para la entidad.
Describe en qu consiste o cul es el alcance de la informacin
El propietario se refiere a un proceso o rea de la entidad que tiene la
responsabilidad de controlar la produccin, desarrollo, mantenimiento,
uso y seguridad del activo de informacin.
Identificar a cul categora hace referencia principalmente la
informacin:
Industria y manufactura
Idioma o lengua
Fuente primaria
Frecuencia de
actualizacin
generacin
Soporte de informacin
5.2.2 Beneficios
Realizar el anlisis de informacin trae consigo los siguientes beneficios:
15
16
El Rol Jurdico debe Identificar junto con su equipo jurdico la normativa de la entidad que
regula el Registro de Activos de Informacin para calificarlos como clasificados o
reservados.
Para el correcto diligenciamiento de la plantilla de ndice de Informacin se deben
responder a los diferentes criterios para calificar la informacin como clasificada o
reservada. Para ello responda SI, en el caso que la informacin corresponda a una de las
categoras de informacin clasificada o reservada, NO en el caso que no corresponda y se
pueda ser publicada totalmente y Parcialmente en el caso que la informacin sea
calificada como clasificada o reservada, pero un subconjunto de esta informacin puede
publicarse totalmente. Luego, diligencie la columna de acto o soporte jurdico teniendo en
cuenta el ejercicio de calificacin realizado. Adicionalmente, considerar indicar si la
informacin clasificada o reservada se puede generalizar o anonimizar4 o resumir para
reutilizarlos y publicarlos como datos abiertos.
Eliminar o sustituir datos relativos a una persona jurdica o natural para eliminar su identidad, o eliminar o resumir
datos del evento al cual se refiere la informacin de tal manera que sea publicable
18
En este ejemplo se cuenta con un Inventario de Informacin donde se parte del hecho que la
informacin Inversin tecnolgica ao 2012 y Estados financieros, son sujetas de publicacin
de acuerdo al anlisis jurdico realizado por la entidad.
Acto seguido la entidad identificar como puede estar segmentada esta informacin, para lo cual
se evidencia que:
20
Impacto: Mide la incidencia y los beneficios agregados de cada uno de los elementos del
inventario de informacin, sobre el ciudadano, sector privado, el Estado, entre
otros. Ejemplo: La necesidad demandada de informacin a travs de un nmero mayor de
ciudadanos, puede generar mayor impacto; de manera similar, los datos que muestran
situaciones a nivel de todo el territorio nacional pueden tener mayor impacto ya que
abarca un mayor foco de inters.
21
Escala Peso
Calificacin
uye al Sector
en su crecimiento.
que
al
Informacin que
puede
generar
negocio
de
inmediato.
Descripcin
1-4
1-4
0,25
Aumentar la productividad de
los
diferentes
sectores
productivos del pas.
0,25
ampliamente al sector en su
crecimiento.
el valor agregado.
tor
Privado.
rea de impacto.
1-4
0,25
Demanda de los
datos.
1-4
0,25
Consultas
entidad.
propias
de
la
Parmetros de Dificultad
Criterio
Esfuerzo
requerido para
publicar.
1-4
Fuente de datos.
1-4
Calidad de la
informacin.
1-4
0,33
0,33
0,33
Calificacin
desarrollo, se tienen las
herramientas para extraer la
informacin de las bases de
datos.
uiere desarrollo
(Construccin de ETL, BI, entre
otros).
servidor con una base de datos
de reportes e histricos.
servidor con una base de datos
de transacciones diaria.
certificada.
a calidad.
procesos de calidad de la
informacin.
23
Extensibilidad: El diseo de conjuntos de metadatos debe ser capaz de incluir un ncleo central
con conceptos bsicos comunes al que se puedan sumar posteriormente (sin destruir la lgica del
conjunto) elementos que cumplan necesidades descriptivas ms especficas. La idea es que una
aplicacin que reconozca los metadatos bsicos sea capaz de utilizarlos sin perder demasiada
interoperabilidad.
Modularidad: Permite combinaciones sintcticas (a nivel de lo que se busca literalmente) y
semnticas (a nivel del significado de lo que se busca) con otros metadatos.
Principio de utilidad: Se han identificado tres aspectos claves desde el punto de vista de la
utilidad de las descripciones. La descripcin de un activo de informacin cualquiera debe cumplir
con tres requisitos:
Permitir el descubrimiento de activos de informacin: Esto implica la capacidad de utilizar
mecanismos de bsqueda de activos de informacin, as como estructuras de navegacin
categorizada (directorios y listados).
Permitir la identificacin y en menor medida la localizacin directa, de los activos de
informacin.
Valoracin de los recursos. Desde el punto de vista de la puesta a disposicin de los
recursos informativos, proporcionar al responsable de reutilizar la informacin la capacidad
de valorar la pertinencia de un determinado activo es clave si se persigue hacerlo de
manera adecuada.
Principio de simplicidad: La simplicidad debe perseguirse tanto de cara al proceso de
descripcin de activos de informacin que tendr lugar en el mbito de los generadores de
informacin publicable, como en el proceso de recuperacin e interaccin con las descripciones
que deber afrontar el ciudadano.
Desde el punto de vista de la descripcin de la informacin es fundamental no establecer la
obligatoriedad de campos descriptivos para los que frecuentemente no se posee una informacin
completa. En el mismo sentido, el establecimiento de varios niveles descriptivos ayuda a la
interoperabilidad con el resto de los datos cuando una descripcin muy detallada no sea posible.
Estructura de metadatos
Cada metadato est compuesto por una serie de elementos que buscan dar respuesta clara a los
siguientes interrogantes:
Quin?: Descripcin de los protagonistas objeto de los conjuntos de datos.
Qu?: La descripcin del contenido de los conjuntos de datos.
Cundo?: La descripcin de las variables de tiempo asociadas a los conjuntos de datos.
Dnde?: Las referencias de localizacin de los datos.
Por que?: La motivacin para abrir dichos datos.
Cmo?: El procedimiento para la descarga de los datos.
27
Para la iniciativa de Apertura de Datos estos elementos se agrupan en dos tipos de metadatos:
Metadatos comunes: Aquellos que tienen todos los contenidos, independientemente de su
naturaleza. Por ejemplo, todas los documentos, eventos, informaciones, ayudas, etc. tienen
asociado un nombre, una descripcin, una tipologa y en general una serie de metadatos
comunes.
Metadatos especficos: Aquellos propios del contenido en funcin de su naturaleza (tipologa de
contenido). Ejemplo: Las publicaciones tienen unos metadatos particulares como la fecha de la
publicacin del titular. Los procedimientos administrativos, a su vez, tienen unos metadatos
particulares como el objeto, el estado de vigencia o el lugar de presentacin.
A continuacin se define la estructura y descripcin de los Metadatos comunes y especficos:
Tipologa
Metadatos
comnes.
Metadatos
Metadato
Descripcin
Tipos de datos
Ttulo
Texto.
Identificador
Descripcin
Texto.
Categora
Texto/lista de texto.
Autor
Texto.
Idioma
Texto.
Audiencia
Texto.
Palabras clave
mbito Geogrfico
Texto/lista de texto.
Fecha Publicacin
Fecha (AAAA-
28
especificos.
en el catlogo de datos.
MM_DD)
Fecha ltima
Actualizacin
Fecha (AAAAMM_DD).
Frecuencia
Actualizacin
Texto.
Fecha Inicio
Fecha (AAAAMM_DD)
Fecha Fin
Fecha (AAAAMM_DD).
Nmero de
Versin
Texto/numrico.
URL Descarga
Texto.
Formato Descarga
Texto/lista de texto.
Tamao Descarga
Numrico.
URL Esquema
Texto
URL
Documentacin
Numrico.
URL Programa
Texto
Etiquetas
Lista de texto
Licencia
Tipo de licencia.
Texto
URL Licencia
Texto
Nombre
Responsable
Texto
Email
Responsable
Texto
Cobertura de
conjunto de datos*
Numrico
Metadatos
adicionales*
Texto
29
5.5.3Beneficios
31
32
35
37
40
7ANEXOS
7.1.1ANEXO 1 - Instrumento de la Gua para la Apertura de Datos en Colombia
levantamiento del inventario de activos de informacin, y evidencia que No se cuenta con este,
por tanto procede identificar las fuentes de informacin de acuerdo a los procesos que maneja la
entidad, resultado de esta labor el Rol Funcional identifica el inventario de informacin de la
entidad en el cual se define que se trabajar con la informacin de Tradicin y libertad del bien
inmueble, paso seguido se realiza la descripcin del inventario en la Planilla para la
identificacin del inventario de informacin donde se describe el detalle de la informacin a
trabajar como se muestra en la siguiente grfica.
42
43
44
45
Predios Embargados
Titulares de derecho real de dominio
Compraventas de bien inmueble de los ltimos 5 aos
Predios Hipotecados
Lo cual permite definir que el inventario de datos estar conformado por la segmentacin de la
informacin que ser equivalente a los conjuntos de datos. El inventario de datos se documenta
en la Plantilla para la identificacin del inventario de datos de la entidad, como se muestra en
la siguiente grfica.
46
47
48
49
50
51
8 Terminologa
API (Application Programming Interface): Es una interfaz de comunicacin entre componentes
de software, que ofrece un conjunto de llamadas a ciertas libreras de programacin que dan
acceso a ciertos servicios desde los procesos, consiguiendo la abstraccin en la programacin
entre niveles inferiores y superiores del software.
Centro de Contacto Ciudadano -CCC: Es el punto integrado de contacto donde, a travs de
diferentes canales como telfono, correo electrnico, charlas interactivas y fax, se brinda
atencin, respuestas inmediatas y seguimiento a las solicitudes de los ciudadanos, empresas y
servidores pblicos.
Centro de Datos: Es la infraestructura donde se concentran todos los recursos tcnicos y
humanos necesarios para el ptimo procesamiento, almacenamiento y publicacin de la
informacin de las entidades del Estado Colombiano.
Conjunto de datos (Dataset): Unidad mnima de informacin sujeta a carga, publicacin,
transformacin y descarga en la plataforma
CSV (Valores separados por coma): Tipos de documentos en formato abierto sencillo para
representar datos en formato de tabla, en columnas separadas por comas (o punto y coma,
donde la coma es el separador decimal) y las filas son saltos de lnea. Los campos que tienen
una coma, un salto de lnea o una comilla doble deben cerrarse entre comillas dobles. No indica
un juego concreto de caracteres, ni cmo van situados los bytes, ni el formato para el salto de
lnea. Las extensiones que se utilizan son .csv y .txt.
DOC (Microsoft Office Word): Formato cerrado para transferir textos formateados o sin formato.
Puede contener textos, imgenes, grficos y enlaces. Desde la versin 2007 se trabaja con un
nuevo formato, docx, que es ms avanzado y comprime ms el documento.
Entidad: Organismos establecidos por la legislacin Colombiana, los cuales tendr la facultad de
definir inventarios de datos y conjuntos de datos a publicar.
Formatos libres: Son formatos de archivo que se pueden crear y manipular para cualquier
software, libre de restricciones legales.
Formatos propietarios: Son formatos de archivo que requieren herramientas que no son
pblicas.
Interoperabilidad: Propiedad o capacidad de dos o ms sistemas o componentes para
intercambiar informacin y utilizar la informacin intercambiada.
Infomediario/a: Trmino con el que se hace referencia a una empresa que reutiliza la
informacin de las Administraciones para producir un servicio o una obra con valor aadido.
Suele utilizarse en referencia a la Industria Infomediaria. Existen mltiples ejemplos de industrias
infomediarias, como aquellas que editan bases de datos de legislacin y jurisprudencia a partir de
las sentencias y normas publicadas en los boletines oficiales, o las que trabajan con informacin
de mbito Meteorolgico para realizar informes ms especficos para las Administraciones con el
fin de, por ejemplo, detectar riesgos de incendios forestales a travs de datos de previsiones e
histricos de situacin meteorolgica en un determinado territorio (por poner solo un par de
casos).
Inventario de datos: Hace referencia a un listado de conjunto de datos que expone una entidad y
que podran llegar a ser publicados en el catlogo de datos.
JSON (Notacin de Objetos de JavaScript): Formato ligero de intercambio de datos, fcil de
entender para las personas, y ofrece sencillez a las mquinas en la generacin e interpretacin.
52
RAVEC: Es una red privada de ltima tecnologa que interconecta a las instituciones pblicas a
altas velocidades, con altos niveles de disponibilidad y seguridad, proporcionndoles servicios
convergentes y colaborativos, para permitir una transferencia eficiente de informacin entre
organismos gubernamentales y para optimizar los servicios que se entregan a los ciudadanos.
RDF-XML (Infraestructura para Descripcin de Recursos): Modelo para la representacin de
los recursos de la web en expresiones con la forma sujeto-predicado-objeto. El sujeto es el
recurso que se describe, el predicado es la propiedad sobre la que se quiere establecer el recurso
y el objeto es el valor de la propiedad con el que se establece la relacin. La combinacin de RDF
con otras herramientas permite aadir significado a las pginas y es una de las tecnologas
esenciales para la web semntica. Para que sea interpretable, se representa en formato XML.
REST (RepresentationalState Transfer): Cualquier interfaz web simple que utiliza XML y HTTP,
sin las abstracciones adicionales de los protocolos basados en patrones de intercambio de
mensajes como el protocolo de servicios web SOAP.
RISP (Acrnimo de Reutilizacin de la Informacin del Sector Pblico):Se trata de un
esfuerzo Jurdico y de las Administraciones para dar acceso a los documentos, informacin y
datos de carcter pblico (es decir no sujetos a ninguna restriccin legal) a ciudadanos y
empresas para que stos puedan usarlas como mejor les convenga, pero muy especialmente con
la intencin de que generen nuevos servicios y productos de valor aadido. Esta iniciativa se
impuls sobre todo a partir del ao 2003 con una Directiva europea que todos los Estados
Miembros de la Unin estn transponiendo.
Sistemas de acceso: Lenguajes para consultar archivos.
SHP (ESRI): Shapefile es un formato propietario de datos espaciales que es el estndar para el
intercambio de informacin geogrfica entre Sistemas de Informacin Geogrfica (GIS). Es un
formato vectorial de almacenamiento digital donde se guarda la localizacin de elementos
geogrficos y los atributos asociados a ellos, pero sin capacidad para almacenar informacin
topolgica. Lo generan varios archivos, mnimo tres y tiene tres tipos de extensiones: .shp, .shx y
.dbf
SPARQL (SPARQLProtocol and RDF QueryLanguage): Es un conjunto de especificaciones
que proporcionan lenguajes y protocolos para consultar y manipular el contenido grfico de RDF
en la Web o en una tienda de RDF
Tienda de Aplicaciones de Datos Abiertos: Solucin en la que se publican las aplicaciones
construidas por desarrolladores (colaboradores) que reutilizan los datos cargados y expuestos en
el plataforma de de datos abiertos en la web.
TMX (Translation Memory eXchange): Estndar de XML, que es un DTD que sirve para el
intercambio de memorias de traduccin. Creado por el comit OSCAR (Open Standards for
Container/Content Allowing Re-use).
Web services - API (Interfaz de programacin de aplicaciones): Son interfaces de
programacin de aplicaciones (API) o la API de la web que se accede a travs de HTTP y se
ejecuta en un sistema remoto de alojamiento de los servicios solicitados. Los servicios web son
sistemas de software diseados para apoyar la interaccin interoperable mquina a mquina
sobre una red. Tiene una interfaz descrita en un formato procesable por una mquina y otros
sistemas interactan con el servicio web de una manera prescrita por su descripcin utilizando
mensajes SOAP, transmitido a travs de HTTP con una serializacin XML en conjunto con otras
normas relacionadas con la web.
WMS (Servicio de Mapas Web): Formato que produce mapas de datos referenciados
espacialmente, de forma dinmica, a partir de informacin geogrfica. Es estndar internacional.
54
Los mapas WMS se generan normalmente en un formato de imagen como PNG, GIF o JPG, y
opcionalmente como grficos vectoriales en formato SVD o WebCGM.
W3C (World Wide Web Consortium): Es un consorcio internacional de reconocido prestigio
donde las organizaciones miembro, el personal a tiempo completo y el pblico en general,
trabajan conjuntamente para desarrollar estndares Web.
XLS (Microsoft Office Excel): Contiene filas y columnas de celdas y cada una puede incluir
datos, que pueden ser palabras, nmeros o frmulas que tengan datos y resolver ecuaciones
dinmicamente. Las hojas de clculo XLS tambin pueden contener tablas y grficos que
muestran todas las secciones o de los datos seleccionados.
XML (Lenguaje de Etiquetado Extensible): Es un metalenguaje simple pero estricto,
desarrollado por W3C. Desarrolla un papel fundamental en el intercambio de una gran variedad
de datos. XML es un formato que permite la interpretacin de datos a travs de varias
aplicaciones. Es una simplificacin y adaptacin del SGML y permite definir la gramtica de
lenguajes especficos. En realidad, XML es una manera de definir lenguajes para diferentes
necesidades.
55