Vous êtes sur la page 1sur 55

GUA PARA LA APERTURA DE DATOS

EN COLOMBIA
Direccin de Gobierno en lnea

@Repblica de Colombia Derechos Reservados

Bogot DC, Octubre de 2014

FORMATO PRELIMINAR AL DOCUMENTO


Ttulo:
Gua de implementacin Datos Abiertos
Fecha elaboracin
2014-10-15
aaaa-mm-dd:
Sumario:
Palabras Claves:

Open Data, Datos Abiertos, guas, normas, estndares.

Formato:

Documento

Dependencia:

Direccin de Gobierno en Lnea

Cdigo:

Lenguaje:

Versin:

Categora:

1.0

Espaol

Estado:

Final

Gua

Autor (es):
Firmas:
Aprob:
Informacin
Adicional:
Ubicacin:

CONTROL DE CAMBIOS
VERSI
N
1.0

FECHA

RESPONSABLE

DESCRIPCIN

2014-06-15

Creacin del documento

TABLA DE CONTENIDO
1
2
3

INTRODUCCION ...................................................................................................................... 5
OBJETIVOS DE LA GUIA ........................................................................................................ 6
APERTURA DE DATOS ........................................................................................................... 7

3.1 Que son Datos Abiertos? ................................................................................................... 7


4
5

PREPARACION DE LA ENTIDAD ........................................................................................... 8


PASOS PARA LA APERTURA DE DATOS .......................................................................... 10

5.1 Paso 1: Registro de informacin ....................................................................................... 12


5.1.1
5.1.2
5.1.3
5.1.4
5.1.5

Qu se busca con el Registro de Informacin? ............................................................... 12


Objetivo .............................................................................................................................. 12
Beneficios .......................................................................................................................... 12
Cmo se realiza el Registro de Informacin? .................................................................. 13
Cmo se realiza la identificacin del inventario de informacin? ..................................... 14

5.2 Paso 2: ndice de Informacin ........................................................................................... 15


5.2.1
5.2.2
5.2.3
5.2.4
5.2.5

Qu es el Indice de informacin?..................................................................................... 15
Objetivo .................................................................................Error! Marcador no definido.
Beneficios .......................................................................................................................... 15
Cmo realizo el anlisis y el ndice de informacin de acuerdo a los criterios jurdicos? 16
Cmo identifico la informacin publicable? ...................................................................... 17

5.3 Paso 3: Identificacin y priorizacin de los conjuntos de datos .................................... 19


5.3.1
5.3.2
5.3.3
5.3.4
5.3.5
5.3.6
5.3.7

Qu se busca con la identificacin y priorizacin de los conjuntos de datos? ................. 19


Objetivos ............................................................................................................................ 19
Beneficios .......................................................................................................................... 19
Cmo identifico el inventario de conjuntos de datos? ...................................................... 20
Cul es el parmetro de priorizacin de los conjuntos de datos? .................................... 21
Cmo defino los criterios de evaluacin y su valoracin? ................................................ 21
Cmo priorizar los conjuntos de datos a publicar? .......................................................... 23

5.4 Paso 4: Documentacin de los conjuntos de datos ........................................................ 25


5.4.1
5.4.2
5.4.3
5.4.4
5.4.5

Qu se busca con la documentacin de los datos? ......................................................... 25


Objetivo .............................................................................................................................. 25
Beneficios .......................................................................................................................... 25
Cmo se identifican los metadatos comunes y especficos de los conjuntos de datos? .. 26
Cmo se aplica la licencia abierta a los datos? ............................................................... 30
3

5.5 Paso 5: Estructuracin, cargue y publicacin de los conjuntos de datos .................... 31


5.5.1
5.5.2
5.5.3
5.5.4
5.5.5
5.5.6
6

REUTILIZACION, PROMOCION Y USO DE DATOS ABIERTOS ......................................... 38

6.1.1
6.1.2
6.1.3
6.1.4
6.1.5
6.1.6
6.1.7
7

DATA JAM ......................................................................................................................... 39


DATAPALOOZA................................................................................................................. 39
MARATN DE DESARROLLO .............................................Error! Marcador no definido.
COMUNIDADES EN LINEA ............................................................................................... 39
BARCAMP ......................................................................................................................... 40
DESCONFERENCIAS ....................................................................................................... 40
MASHUP CAMP ................................................................................................................ 40

ANEXOS ................................................................................................................................. 41

7.1.1
7.1.2
7.1.3
7.1.4
7.1.5
7.1.6
8

Qu se busca con la estructuracin, cargue y publicacin de los conjuntos de datos? ... 31


Objetivos ............................................................................................................................ 31
Beneficios .......................................................................................................................... 31
Cmo identifico la estructura de los conjuntos de datos a cargar? .................................. 32
Cules son los mecanismos de cargue y publicacin de los conjuntos de datos? .......... 34
Otros medios de publicacin en lnea ................................................................................ 38

ANEXO 1 - Instrumento de la Gua para la Apertura de Datos en Colombia ..................... 41


ANEXO 2 - Ejemplo Paso 1 ............................................................................................... 41
ANEXO 3 - Ejemplo Paso 2 ............................................................................................... 43
ANEXO 4 - Ejemplo Paso 3 ............................................................................................... 45
ANEXO 5 - Ejemplo Paso 4 ............................................................................................... 48
ANEXO 6 - Ejemplo Paso 5 ............................................................................................... 50

TERMINOLOGA .................................................................................................................... 52

1 INTRODUCCION
La apertura de datos por parte del Gobierno es uno de los facilitadores ms potentes para el
desarrollo del denominado Open Government (Gobierno Abierto)1 en un pas. En Colombia, la
Direccin de Gobierno en lnea del Ministerio de Tecnologas de la Informacin y las
Comunicaciones ha promovido desde diferentes mbitos el acceso a la informacin y la apertura
de datos enfocado a tres objetivos principales:
1) Transparencia: Abrir datos de calidad supone:

Ejercicios de democracia permanente por parte del gobierno


Instrumentos efectivos para el control social

2) Eficiencia: La apertura metodolgica de datos de calidad puede conducir a:

La racionalizacin de los procesos administrativos


La automatizacin de la colaboracin interadministrativa

3) Innovacin y crecimiento econmico: La reutilizacin de los datos por parte del Sector
Pblico impulsa:

La creacin de nuevos servicios y productos de valor agregado


Nuevos negocios y puestos de trabajo

El propsito de esta gua, es contribuir al entendimiento, la apropiacin y la ejecucin de acciones


concretas que permitan a las entidades hacer un mejor aprovechamiento de la informacin
pblica y de los datos, a su vez, facilitar la colaboracin de terceros que apoyen el desarrollo y
provisin de servicios para el beneficio de todos los ciudadanos y el logro de los objetivos
mencionados.
Se ha estructurado en torno a una serie de etapas y pasos que permiten desarrollar un proceso
progresivo y guiado hasta conseguir la publicacin de datos en formato abierto.

Podemos entender el Open Government como un Gobierno basado en los principios de transparencia, colaboracin y participacin.

Un gobierno abierto se caracteriza por:


Promover la rendicin de cuentas y facilitando el control social
Establecer relaciones de cooperacin con los ciudadanos y con todas las organizaciones de la sociedad.
Generar mecanismos para captar las opiniones e ideas de los ciudadanos, implicndolos en la identificacin y solucin de los problemas
sociales y en la construccin colectiva de las polticas.

2 OBJETIVOS DE LA GUIA
La presente gua tiene como objetivo ofrecer herramientas prcticas que permitan a las entidades

del Estado implementar procesos de apertura de datos en concordancia con la Ley de


Transparencia 1712 de 2014, de forma que se logre promover la confianza de los ciudadanos y el
desarrollo de servicios de valor agregado por parte de terceros.
Para lograr el objetivo la gua establece una serie de etapas que buscan garantizar tres aspectos
principales:
Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos
administrados por la Entidad, estos datos estarn disponibles para todo tipo de audiencia, no
tienen ninguna restriccin, y se encuentran en formatos de fcil acceso, con el fin de generar
nuevos servicios.
Transparencia: Facilitar la alineacin de la Entidad con iniciativas de gobierno abierto, en donde
la transparencia, colaboracin y participacin constituyen mecanismos reales para su
mejoramiento.
Imagen de la Entidad: Mejorar la percepcin administrativa y tecnolgica de la Entidad a la
ciudadana, a travs de los diferentes datos publicados en el portal Web de la Entidad o en la
plataforma definida por el Estado Colombiano.

3 APERTURA DE DATOS
3.1 QUE SON DATOS ABIERTOS?
Son todos aquellos datos primarios, sin procesar, en formatos estndar, estructurados e
interoperables que facilitan su acceso y permiten su reutilizacin, los cuales estn bajo la custodia
de las entidades pblicas y que pueden ser obtenidos y ofrecidos sin reserva alguna, de forma
libre y sin restricciones, con el fin de que terceros puedan reutilizarlos y crear servicios derivados
de los mismos. Es necesario que los datos que se abren se presenten en formatos (XLS, ODF,
CSV, XML, ATOM, JSON, TXT, RDF-XML, KML-KMZ, SHP, TMX, ZIP) y que sus contenidos
sean estructurados mediante lenguajes procesables por aplicaciones informticas.
Para que un Dato sea considerado abierto es necesario que cumpla con las siguientes principios2:
Completos: Todos los datos pblicos deben estar disponibles. Los datos pblicos son datos no
sujetos a limitaciones de privacidad, seguridad o privilegios.
Primarios: Los datos deben ser recolectados en la fuente de origen, con el nivel de granularidad
ms alto posible, no en forma agregada ni modificada.
Oportunos: Los datos se pondrn a disposicin tan rpido como sea necesario para garantizar el
valor de los mismos.
Accesibles: Los datos deben estar disponibles para el rango ms amplio de usuarios y para el
rango ms amplio de propsitos.
Procesables por mquinas: Los datos deben estar estructurados razonablemente para permitir
un procesamiento automtico.
No discriminatorios: Los datos deben estar disponibles para cualquiera persona, sin requerir un
registro.
No propietarios: Los datos deben estar disponibles en un formato sobre el cual ninguna entidad
tiene un control exclusivo.
Libres de licencias: Los datos no deben estar sujetos a ningn derecho de autor, patente, marca
registrada o regulaciones de acuerdo de secreto. Se podrn permitir restricciones razonables de
privacidad, seguridad o privilegios.

Op.cit. The 8 principles of Open Government Data: http//www.opengovdata.org/home/8principles


7

4PREPARACION DE LA ENTIDAD
Previo al abordaje de las etapas que permitirn avanzar en la adopcin de la iniciativa de
Apertura de Datos, se recomienda ejecutar las siguientes actividades de preparacin:

Identificar el equipo de trabajo.


Identificar Herramientas de seguimiento y control
Elaborar un plan de trabajo.

Cmo puedo identificar mi equipo de trabajo?


El abordar la iniciativa de Apertura de Datos implica una serie de acciones de anlisis que
incluyen aspectos tecnolgicos, jurdicos y funcionales. Para adelantar este anlisis es
indispensable que su entidad conforme y cuente con el apoyo de un grupo de trabajo que lidere y
soporte las acciones requeridas para avanzar en la adopcin de la temtica.
En la siguiente grfica se relacionan los roles que se recomiendan para la conformacin del
equipo de trabajo y se referencia en qu paso podr intervenir cada uno.

Ilustracin 1 - Equipo de trabajo y actividades necesarias para implementar la apertura de datos


NOTA: Los pasos que se describen en la grfica se detallan en la seccin Pasos para la
Apertura de Datos
Cabe notar que un actor de acuerdo a su perfil, puede desempear ms de un rol en la apertura
de datos. A continuacin se describen los aspectos a tener en cuenta para la seleccin de equipo
de trabajo.

ROL

OBJETIVO

ACTIVIDADES

PERFIL

Funcional

Facilitar el acceso a la
informacin de la entidad y
analizar los mejores usos de la
misma, de manera que se
convierta en un activo para la
organizacin.

Identificacin
de
la
informacin.
Anlisis de informacin
publicable.
Priorizacin
de
la
informacin.

Personal a cargo de procesos


de negocio de la entidad que
tiene el conocimiento de los
mismos y de la informacin
que se produce.

Tcnico

Facilitar y orientar el acceso a


los sistemas y repositorios de
informacin de la entidad y
liderar la publicacin de los
datos en formatos abiertos.

Priorizacin
de
informacin.
Documentacin
estructuracin.
Cargue y publicacin.

Personal
tcnico,
preferiblemente ingenieros de
sistemas con conocimientos
en
estndares
abiertos,
identificacin de informacin,
extraccin y manejo de bases
de datos. Conocimiento en
los requerimientos para la
publicacin y manejo del
portal web de la entidad.

Seguridad

Garantizar
un
manejo
adecuado de los riesgos y las
polticas de seguridad de la
entidad para la proteccin de la
informacin.

Anlisis de la informacin
publicable.
Documentacin
y
estructuracin.
Cargue y publicacin.

Personal
tcnico,
preferiblemente ingenieros de
sistemas con conocimientos
en aseguramiento de la
calidad en la informacin e
identificacin de riesgos de
seguridad.

Jurdico

Analizar,
asesorar,
conceptualizar y orientar sobre
los datos que son susceptibles
de poner a disposicin de
cualquier persona, sin que esto
implique la vulneracin de los
derechos fundamentales de los
individuos y el incumplimiento
de la normatividad, en cuanto a
respetar la reserva legal que
tienen algunos datos.

Anlisis de la normatividad
jurdica
en
cuanto
informacin secreta, de
reservada y confidencial
para garantizar que los
datos se pueden publicar.

Abogado o profesional con


conocimientos en el marco
jurdico de los proceso de la
entidad
y
en
temas
relacionados
con
la
transparencia y el acceso a la
informacin pblica, y con
conocimiento en la reserva
legal y proteccin que tienen
algunos datos e informacin,
en virtud de la Ley.

GEL

Debe estar presente en la toma


de las decisiones en cada uno
de los procesos de la apertura
de datos en lo concerniente a
la entidad con el fin de articular
los resultados con la estrategia
de Gobierno en lnea.El rol
tambin
tiene
la
responsabilidad de coordinar
acciones al interior de la
entidad.

Identificacin
de
la
informacin.
Anlisis de informacin
publicable.
Priorizacin
de
la
informacin.
Documentacin
y
estructuracin.
Cargue y publicacin.

CIO o servidor pblico


delegado por la entidad con
habilidades en coordinacin y
dinamizacin de equipos de
trabajo.

la
y

Qu herramientas puedo utilizar para hacer seguimiento y control?


Con el fin de garantizar la implementacin exitosa de la iniciativa y realizar los ajustes necesarios
durante el curso del proyecto, se debe disponer de mecanismos de monitoreo, presentacin y
evaluacin de reportes. Estas medidas deben registrar el uso de los recursos, el desempeo
basado en indicadores, y los resultados deseados y no deseados de la implementacin.

Se podr utilizar la siguiente documentacin que permitir un mayor control y orden en la


ejecucin de las actividades para la apertura de datos:

Planifique las actividades dirigidas a la apertura de datos a travs de un Plan de Trabajo.


Realice un Informes de seguimiento.

Cmo elaboro el plan de trabajo?


El plan de trabajo cubre las actividades organizacionales necesarias para la implementacin
exitosa de la iniciativa. Esto implica establecer de la forma ms precisa estimaciones de las
tareas de la apertura de datos y determinar los recursos necesarios.
Los objetivos del plan de trabajo son los siguientes:

Planificar y documentar estimaciones de tiempo y actividades necesarias para la


identificacin del inventario de datos.
Acordar compromisos para el desarrollo de la fase inicial con todas las personas y reas
involucradas de la entidad.
Organizar todos los recursos que sean necesarios para la apertura de los primeros
conjuntos de datos.

Este proceso proporciona una visin clara de las tareas que han de realizarse durante la
ejecucin del desarrollo del proceso y los recursos necesarios.

5PASOS PARA LA APERTURA DE DATOS


Los siguientes pasos presentan un proceso ordenado para avanzar en la iniciativa de Apertura de
Datos el cual puede ser desarrollado por cualquier entidad. Se presenta con consejos prcticos
sobre la manera de abrir datos de gobierno siguiendo las recomendaciones de mejores prcticas
establecidas por la comunidad internacional OGD. Este proceso incluye a su vez una cadena de
valor, cuyos componentes se desarrollarn a lo largo del documento, con miras a facilitar un
mejor entendimiento de la gua.
Los datos estn abiertos si cumplen las siguientes dos condiciones:
Abiertos legalmente: Ya sea en el dominio pblico y marcado como tal o licenciado
explcitamente de una manera que se permita el uso y reuso comercial y no comercial sin
restricciones.
Abiertos tcnicamente: Disponible en formatos estndares abiertos legibles por mquina, que
significa que pueden ser recuperados y procesados por una aplicacin informtica.
El proceso de apertura de datos contempla los siguientes cinco pasos:
10

Ilustracin 2 - Pasos para avanzar en la implementacin de la apertura de datos


Paso 1: Registro de Informacin: En esta fase se busca identificar y caracterizar la informacin
y las bases de datos sistematizadas con que cuenta su entidad.
Paso 2: Anlisis jurdico la informacin (ndice de Informacin): En esta fase se clasificar la
informacin y los conjuntos de datos publicables y los que no, de acuerdo con el marco Jurdico
establecido.
Paso 3: Priorizacin de los conjuntos de datos: En esta fase se definen aquellos datos con los
cuales se implementar el proceso de apertura, de acuerdo con un anlisis estratgico y al mapa
de ruta definido por Gobierno en lnea para la apertura de datos. Al finalizar se obtienen los
conjuntos de datos a publicar.
Paso 4: Documentacin de los conjuntos de datos: En esta fase se describen los datos a
publicar, con el fin de hacerlos comprensibles y facilitar su bsqueda y uso.
Paso 5: Estructuracin, cargue y publicacin de los conjuntos de datos: En esta fase se
identifican los diferentes procesos de cargue y publicacin de los datos en la plataforma
tecnolgica que permitir el posterior acceso a los datos abiertos a los ciudadanos y a la sociedad
en general.

11

5.1 PASO 1: REGISTRO DE INFORMACIN

5.1.1 Qu se busca con el Registro de Informacin?


Este paso le permite realizar el levantamiento de la informacin que administra la entidad y que
puede llegar a convertirse en informacin publicable y en caso que est estructurada puede
iniciar el proceso para su apertura.
Para efectos de realizar la identificacin de la informacin que conformar el Registro de
Informacin y de conformidad con lo establecido en la normatividad, se tendr en cuenta la
siguiente definicin:
Informacin pblica: toda informacin que un sujeto obligado genere, obtenga, adquiera, o
controle en su calidad de tal3.
5.1.2 Objetivo
Reunir toda la informacin sobre la cual se basan las fases siguientes del proceso de apertura de
datos.
5.1.3 Beneficios
Realizar una identificacin del inventario de informacin trae consigo los siguientes beneficios:

Ley de Transparencia 1712 de 2014 Artculo 6.


12

Aumenta el conocimiento que la entidad tiene de sus activos de informacin.


Ofrece elementos que permiten mejorar la comunicacin entre la entidad y sus usuarios
consumidores de informacin.
Ayuda a determinar las necesidades de los usuarios eficientemente para que puedan ser
satisfechas cuando soliciten algn tipo de informacin.
Permite aumentar la percepcin de confianza que los usuarios pueden tener de la entidad
y del Estado en general.
Genera transparencia administrativa que conlleva adems la no discriminacin entre
empresas y particulares a la hora del acceso a la informacin.

5.1.4Cmo se realiza el Registro de Informacin?


La entidad debe verificar si dentro del marco de su poltica de seguridad de la informacin, ha
hecho un trabajo de levantamiento del inventario de activos de informacin el cual puede ser
mapeado con la informacin susceptible de ser abierta. En el caso en que no se haya realizado
dicho inventario, se debe consultar con el Rol de Seguridad propuesto para conocer el estado de
avance de la entidad.
En todo caso la entidad debe establecer las fuentes de informacin y el contexto que desea
levantar teniendo en cuenta los procesos de la entidad, los cuales pueden ser clasificados de la
siguiente manera:

Ilustracin 3 - Clasificacin de Procesos al interior de la entidad


Para cada tipo de proceso, la entidad debe tener en cuenta la informacin que est siendo
generada:
Procesos Misionales: En los procesos misionales la entidad debe verificar la informacin
relacionada con los trmites, servicios y procesos que soportan el da a da de su trabajo, de
acuerdo con sus funciones y competencias. La entidad debe incluir ac la informacin particular
relacionada con los actores involucrados en dichos trmites y servicios as como los sujetos y
dominios de negocio soportados.
13

Procesos Estratgicos: La entidad deber revisar dentro de su esquema de procesos, aquellos


encaminados en la mejora continua y en el cumplimiento de sus objetivos estratgicos, que
incluya informacin por ejemplo relacionada con la prestacin de los servicios de la entidad, la
atencin a los usuarios, etc.
Procesos de Apoyo: La entidad debe revisar la informacin que es generada y que soporta los
procesos de apoyo relacionados con la contratacin, el recurso humano, la informacin financiera
y contable.
Procesos de Evaluacin: Se debe revisar la informacin que soporte la toma de decisiones y los
procesos de monitoreo y evaluacin dentro de la entidad.
Las actividades relacionadas con el levantamiento de informacin a partir de los procesos, deben
ser realizadas por el responsable y conocedor de los mismos dentro de la entidad (Ver Rol
Funcional). Para el caso de nuevos procesos, el lder del proceso deber entregar al grupo de
apertura de datos toda la informacin necesaria para que esta sea integrada al inventario de la
entidad y para que se realice el posterior anlisis de la misma.
5.1.5Cmo se realiza la identificacin del inventario o Registro de informacin?
Para realizar el Registro de Informacin es necesario que se detallen los siguientes aspectos
Elemento
Nombre del activo de informacin
Descripcin del activo
Propietario del activo

Categoras de informacin

Concepto
Nombre de la informacin que tiene valor para la entidad.
Describe en qu consiste o cul es el alcance de la informacin
El propietario se refiere a un proceso o rea de la entidad que tiene la
responsabilidad de controlar la produccin, desarrollo, mantenimiento,
uso y seguridad del activo de informacin.
Identificar a cul categora hace referencia principalmente la
informacin:

Agricultura: cosechas, explotaciones, utilizacin de recursos,


produccin, precios, insumos.
Ambiente: datos meteorolgicos, datos hidrogrficos, uso de
tierras.
Desarrollo Global: informacin relacionada con el avance en
relacin objetivos de desarrollo en pobreza, salud, educacin y
otros aspectos de alcance global.
Ciencia e Investigacin: informacin de ciencia, innovacin y
tecnologa.
Desarrollo econmico: estadsticas econmicas, tales como
las referidas a inflacin, desempleo; comercio internacional e
interno.
Educacin
Energa: informacin relacionada con la produccin y consumo
de energa y el desarrollo minero energtico.
Finanzas: servicios financieros, prestamos, pensiones,
inversiones, seguros.
Geografa: mapas, direcciones, fotografas del territorio, datos
geolgicos e hidrogrficos, datos topogrficos.
14

Gobierno: comunicados de prensa, actas de las


administraciones centrales y territoriales.

Industria y manufactura

Infraestructura y transporte; vas, congestin vehicular, obras,


desvos, cmaras en carretera, accidentes.

Legal: decisiones legales o administrativas, normas y leyes.

Salud: informacin relacionada a salud.

Seguridad y defensa: seguridad ciudadana, criminalidad.

Social: demografa, actitudes, salud, enfermedades, datos


censales.

Territorial: informacin especfica sobre ciudades y


departamentos.

Trabajo y mercado laboral: informacin relacionada a la fuerza


de trabajo y el mercado laboral.
Establece el idioma o lengua en el que se encuentra la informacin.
Identifica si la informacin es el resultado de procesos de consolidacin,
anlisis o transformaciones; o si por el contrario esta no ha sido
procesada y puede ser considerada informacin de fuente primaria.

Idioma o lengua
Fuente primaria

Frecuencia de
actualizacin

generacin

Soporte de informacin

La informacin est estructurada?


Susceptible de estructurar?

Identifica la frecuencia con que se genera la informacin en la entidad, o


la frecuencia con que la informacin cambia y es actualizada.
Establece si la informacin est soportada por un documento fsico, por
un medio digital o un sistema, o por algn otro tipo de formato audio
visual.
La informacin es estructurada, semiestructurada, o no estructurada
Si la informacin est semiestructurada o no estructurada, se identifica
si se puede estructurar y por lo tanto quedar disponible para publicar
como datos abiertos.

Culminada la descripcin de los anteriores aspectos la entidad contar con el Registro de


Activos de Informacin que le permitir identificar las bases de datos sistematizadas con las
que cuenta la entidad, para dar inicio a la apertura de datos.
Ver ANEXO 2 Ejemplo Paso 1
5.2 PASO 2: NDICE DE INFORMACIN
5.2.1Qu es el ndice de informacin?
Con base en la Ley de Transparencia se establece que el ndice de Informacin es el anlisis de
la informacin publicable o no de acuerdo con su carcter reservado o clasificado

5.2.2 Beneficios
Realizar el anlisis de informacin trae consigo los siguientes beneficios:
15

Ofrece una clasificacin que ayuda a la identificacin de niveles de seguridad de la


informacin.
Aumenta el conocimiento de la normatividad que apoya a la administracin de la
informacin.
Garantiza la publicacin bajo un anlisis legal para su libre uso pblico sin repercusin en
la publicacin sobre la entidad.
Permite tener la certeza legal sobre la informacin que se puede publicar.

5.2.3Cmo realizo el anlisis y el ndice de informacin de acuerdo a los criterios


jurdicos?
Con base en la Ley de Transparencia 1712 de 2014 se consideran las siguientes definiciones
para calificar la informacin como clasificada o reservada:
(ver Ilustracin 4):

Informacin pblica clasificada: informacin cuyo acceso podr ser rechazado o


denegado de manera motivada y por escrito, siempre que el acceso pudiere causar un
dao a derechos de personas naturales o jurdicas. Tales derechos son: el derecho a la
intimidad; el derecho a la vida, salud o seguridad; secretos comerciales, industriales y
profesionales y los secretos estipulados en el pargrafo del artculo 77 de la ley 1474 de
2011 (en relacin a proyectos de inversin de empresas industriales y comerciales del
Estado y Sociedades de Economa Mixta). La informacin es pblica si la persona natural
o jurdica ha consentido en la revelacin de sus datos.

Informacin pblica reservada: informacin cuyo acceso podr ser rechazado o


denegado, siempre que dicho acceso sea prohibido por una norma legal o constitucional.
Esta informacin hace referencia a intereses pblicos: defensa y seguridad nacional;
seguridad pblica; relaciones internacionales; prevencin, investigacin y persecucin de
delitos y las faltas disciplinarias; debido proceso y la igualdad de las partes en los
procesos judiciales; administracin efectiva de la justicia; derechos de la infancia y la
adolescencia; estabilidad macroeconmica y financiera del pas; salud pblica.

16

Ilustracin 4 ndice de informacin


5.2.4 Cmo identifico la informacin publicable?
Para calificar la informacin como clasificada o reservada se recomienda a la entidad revisar la
Ley de Transparencia del 2014 en sus artculos 18, 19, 20, 21 y 22, lo cual corresponde a las
definiciones indicadas anteriormente y otras disposiciones. Adems, como criterios jurdicos la
entidad debe tomar presente en cuenta normas legales, constitucionales y la Ley de Proteccin
de Datos Personales (Ley 1581 de 2012).
Nota: Para este segundo paso se tendr como insumo el archivo adjunto en formato Excel para
la apertura de datos que acompaa esta gua, en la pestaa ndice de Informacin.
17

En este sentido, los aspectos a tener en cuenta son los siguientes:

El Rol Jurdico debe Identificar junto con su equipo jurdico la normativa de la entidad que
regula el Registro de Activos de Informacin para calificarlos como clasificados o
reservados.
Para el correcto diligenciamiento de la plantilla de ndice de Informacin se deben
responder a los diferentes criterios para calificar la informacin como clasificada o
reservada. Para ello responda SI, en el caso que la informacin corresponda a una de las
categoras de informacin clasificada o reservada, NO en el caso que no corresponda y se
pueda ser publicada totalmente y Parcialmente en el caso que la informacin sea
calificada como clasificada o reservada, pero un subconjunto de esta informacin puede
publicarse totalmente. Luego, diligencie la columna de acto o soporte jurdico teniendo en
cuenta el ejercicio de calificacin realizado. Adicionalmente, considerar indicar si la
informacin clasificada o reservada se puede generalizar o anonimizar4 o resumir para
reutilizarlos y publicarlos como datos abiertos.

Tanto la informacin publicable, como la que no es posible publicar, obedecen a la proteccin


legal que se le da a los datos y a la informacin. En todos los casos, es necesario que la entidad,
antes de entregar o publicar los datos o la informacin, efecte la calificacin y anlisis de la
misma, para verificar qu informacin pueden publicar, y cul no, conforme a la normatividad
vigente.
Tenga en cuenta que este ndice debe estar publicado en el sitio web que la Entidad con su
respectiva descripcin.
Nota: Las Entidades podrn realizar la publicacin del inventario de informacin, en formatos
como: HTML, Excel, Flash o cualquier tipologa que utilice la poltica de diseo grfico de su
portal. Se debe resaltar en esta seccin un vnculo de enlace hacia el portal definido por el Estado
Colombiano:

Eliminar o sustituir datos relativos a una persona jurdica o natural para eliminar su identidad, o eliminar o resumir
datos del evento al cual se refiere la informacin de tal manera que sea publicable
18

5.3 PASO 3: IDENTIFICACIN Y PRIORIZACIN DE LOS CONJUNTOS DE DATOS

5.3.1Qu se busca con la identificacin y priorizacin de los conjuntos de datos?


La identificacin y priorizacin de los conjuntos de datos, permite a la entidad definir los primeros
conjuntos de datos que de acuerdo a su impacto y dificultad de implementacin pueden llegar a
ser publicados.
5.3.2 Objetivos
Identificar los conjuntos de datos de acuerdo al resultado del anlisis jurdico del inventario de
informacin.
Definir los parmetros que van a permitir priorizar los datos a publicar en formato abierto, al igual
que establecer el cronograma a corto, mediano y largo plazo, para la publicacin.
5.3.3 Beneficios
Realizar la identificacin y priorizacin de los conjuntos de datos trae consigo los siguientes
beneficios:
Ofrece elementos que permiten tomar decisin sobre cules son los conjuntos de datos
que debo enfocar primero mis esfuerzos en el proceso de apertura.
Permite a la entidad definir su cronograma a corto mediano y largo plazo en la apertura de
datos.
19

Identifica el impacto de la apertura de datos sobre el esfuerzo a realizar a nivel de la


entidad.

5.3.4 Cmo identifico el inventario de conjuntos de datos?


Para identificar el inventario de conjuntos de datos es necesario que la entidad ejecute las
siguientes actividades:
Identifique la informacin Publicable resultado del anlisis jurdico al inventario de
informacin.
Una vez se cuente con el listado de informacin publicable del (inventario) Registro de
informacin, es necesario que identifique como est estructurada, compuesta o
segmentada.
Finalmente culminada la actividad anterior, la entidad podr tomar esta informacin como
su inventario de conjuntos de datos.
Para orientar la identificacin del inventario de conjuntos de datos contaremos con el siguiente
ejemplo ilustrativo.

Ilustracin 5 - Ejemplo Inventario de conjuntos de datos

En este ejemplo se cuenta con un Inventario de Informacin donde se parte del hecho que la
informacin Inversin tecnolgica ao 2012 y Estados financieros, son sujetas de publicacin
de acuerdo al anlisis jurdico realizado por la entidad.
Acto seguido la entidad identificar como puede estar segmentada esta informacin, para lo cual
se evidencia que:

20

Inversin ao 2012, se encuentra segmentada por Desarrollo de software, compra de


infraestructura y, soporte y Mantenimiento
Estados financieros, se encuentra segmentada por primer trimestre 2012, segundo
semestre 2012, tercer trimestre 2012 y cuarto trimestre 2012.

Una vez se identifique la segmentacin de la informacin se procede a conformar el inventario de


conjuntos de datos, que no es ms que la informacin segmentada como se evidencia en la
grfica de ejemplo.

5.3.5 Cul es el parmetro de priorizacin de los conjuntos de datos?


En el paso de priorizacin de los datos se puede usar el siguiente parmetro con el fin de
identificar los primeros conjuntos de datos a publicar.
Parmetro a priori: Esta categora de parmetros son aplicados a todo el inventario de
informacin y permite definir el cronograma de publicacin de los conjuntos de datos. Incluye dos
tipos de parmetros a evaluar que deben estar relacionados con el roadmap que define Gobierno
en lnea:

Impacto: Mide la incidencia y los beneficios agregados de cada uno de los elementos del
inventario de informacin, sobre el ciudadano, sector privado, el Estado, entre
otros. Ejemplo: La necesidad demandada de informacin a travs de un nmero mayor de
ciudadanos, puede generar mayor impacto; de manera similar, los datos que muestran
situaciones a nivel de todo el territorio nacional pueden tener mayor impacto ya que
abarca un mayor foco de inters.

Dificultad de implantacin: Permite evaluar el grado de facilidad para el proceso de


apertura de datos. Ejemplo: Si no se requiere hacer desarrollos para la extraccin de los
datos, no tiene dificultad o es mnima, mientras que si se requiere disear y estructurar
nuevos procesos de extraccin y depuracin de la informacin habr mayor dificultad.

5.3.6Cmo defino los criterios de evaluacin y su valoracin?


Los criterios de evaluacin se definen de acuerdo a los parmetros a priori, cada parmetro
puede tener varios criterios y a cada uno de ellos se les debe asignar una puntuacin,
dependiendo del nmero de criterios. Por ejemplo, si se identifican 4 criterios de impacto,
entonces al criterio ms importante se le asigna 4 puntos y al menos importante 1 punto.
A continuacin se presentan los criterios a evaluar para cada uno de los parmetros:

21

Ilustracin 6 - Criterios de Evaluacin


Siguiendo con este ejemplo y con base en la grfica anterior, a continuacin se detalla el ejercicio
de priorizacin:
Parmetros de Impacto
Criterio
Informacin
contribuye
crecimiento
econmico.

Escala Peso

Calificacin
uye al Sector
en su crecimiento.

que
al

Informacin que
puede
generar
negocio
de
inmediato.

Descripcin

1-4

1-4

0,25

Aumentar la productividad de
los
diferentes
sectores
productivos del pas.

0,25

Genera nuevos modelos de


negocio que pueden surgir a
partir de la publicacin del
catlogo de datos generados.

ampliamente al sector en su
crecimiento.

el valor agregado.

tor
Privado.
rea de impacto.

1-4

0,25

Destino del beneficio de la


apertura de datos.
demanda de informacin.
la ciudadana a travs de la
solicitud de peticiones o
servicios.
desarrolladores.

Demanda de los
datos.

1-4

0,25

Impacta en calidad de vida de


los ciudadanos.
22

Consultas
entidad.

propias

de

la

Parmetros de Dificultad
Criterio

Escala Peso Descripcin

Esfuerzo
requerido para
publicar.

1-4

Fuente de datos.

1-4

Calidad de la
informacin.

1-4

0,33

0,33

0,33

Dificultad a nivel de los


procesos internos de la
entidad para desarrollar la
publicacin por el equipo de
sistemas.

Dificultad en los sistemas de


informacin para la
extraccin de la informacin,
debido a su funcionalidad
operativa.
Estado de la informacin
para la publicacin de los
datos.

Calificacin
desarrollo, se tienen las
herramientas para extraer la
informacin de las bases de
datos.
uiere desarrollo
(Construccin de ETL, BI, entre
otros).
servidor con una base de datos
de reportes e histricos.
servidor con una base de datos
de transacciones diaria.
certificada.
a calidad.

procesos de calidad de la
informacin.

5.3.7Cmo priorizar los conjuntos de datos a publicar?


Para definir los conjuntos de datos a publicar se sugiere hacer uso del ANEXO 1 - Priorizacin
de los datos, la cual es una herramienta que permite realizar el clculo total de los criterios de
evaluacin para cada parmetro a priori (Impacto y Dificultad de implantacin) y de esta forma
obtener una valoracin de cada conjunto de datos. As mismo, una vez establecido la hoja de ruta
de Gobierno en lnea debe incorporarse sus especificaciones en la priorizacin de la informacin
a abrir y publicar.
A continuacin se muestra un ejemplo del clculo total de los criterios de evaluacin:

23

Ilustracin 7 - Clculo total de los criterios de evaluacin


Una vez obtenida la valoracin de los conjuntos de datos estos son representados en la Matriz
de Priorizacin, la cual toma como insumos el roadmap de gobierno en lnea y muestra los
parmetros de impacto y de dificultad de implementacin, se debe agrupar dentro de los
siguientes cuadrantes:
Victoria Temprana (VT): En l se ubican aquellos datos cuya publicacin tenga un gran impacto
y una dificultad de implantacin relativamente baja, con lo que la publicacin se podrn
implementar en el corto plazo.
Medio Plazo (MP): Este cuadrante representa los datos que, debido a su alta dificultad de
implantacin y su alto o medio impacto, se deben implementar en el mediano plazo.
Largo plazo (LP): En este cuadrante se ubican aquellos datos que tengan un bajo impacto y baja
dificultad de implantacin.
No aporta valor (NV): En este cuadrante se ubican aquellos datos que por su escaso impacto y
su elevada dificultad de implementacin, se considera que no aportaran gran valor.
A continuacin se ejemplifica el resultado de valoracin de los conjuntos de datos en la Matriz de
Priorizacin.

Ilustracin 8 - Matriz de priorizacin


Una vez priorizados todos los datos y definidos cules de ellos quedan agrupados dentro de los
cuadrantes Victoria Temprana, Medio Plazo, Largo Plazo o No aporta Valor, el siguiente paso
debe reflejar dicha priorizacin en un cronograma de publicacin que determine en qu momento
se debe realizar la publicacin de los datos. Para ello identifique el orden de los conjuntos de
datos empezando por los cuadrantes VT, seguido por MP, LP y finalmente NV.
24

Ver ANEXO 4 Ejemplo Paso 3

5.4PASO 4: DOCUMENTACIN DE LOS CONJUNTOS DE DATOS

5.4.1Qu se busca con la documentacin de los datos?


La documentacin de los datos permite a la entidad detallar los metadatos (comn y especfica) y
los formatos en los cuales se publicarn los conjuntos de datos priorizados.
5.4.2Objetivo
Describir los datos identificados en la priorizacin de manera que sea comprensible para todos
los usuarios.
5.4.3Beneficios
Realizar una documentacin de los conjuntos de datos trae consigo los siguientes beneficios:

Permite entender a cualquier lector el contenido de los datos.


Permite a la entidad saber las caractersticas y la ubicacin de sus datos.
25

Identifica al conjunto de datos para que pueda destacarse ms fcilmente en las


bsquedas en el Catlogo de datos del Estado Colombiano.

5.4.4Cmo se identifican los metadatos comunes y especficos de los conjuntos de


datos?
Un metadato no es ms que un dato estructurado sobre la informacin, o sea, informacin sobre
informacin, o de forma ms simple, datos sobre datos. Otras definiciones los establecen como
descripciones estructuradas y opcionales que estn disponibles de forma pblica para ayudar a
localizar objetos, o como datos estructurados y codificados que describen caractersticas de
instancias conteniendo informaciones para ayudar a identificar, descubrir, valorar y administrar las
instancias descritas.
El objetivo bsico de las etiquetas de documentacin es aportar al catlogo de datos los
metadatos asociados al propietario de los datos (entidad) y que posiblemente no se encuentra en
el contenido de los datos; todo en beneficio de las bsquedas en el Catlogo de Datos.
Ejemplo: Un contenido puede estar destinado a ciudadanos, siendo este un criterio que aporta la
entidad (subjetivo) ya que puede que no se mencione la palabra ciudadano en dicho contenido.
En este caso, el autor catalogar el contenido con la etiqueta ciudadano del eje destinatarios.
Bajo estas condiciones, la funcin que caracteriza a los metadatos es la de localizar, identificar y
describir recursos, legibles e interpretables por mquina.
A continuacin se describen los objetivos de la catalogacin de los metadatos para la publicacin
de informacin del sector pblico.

Ilustracin 9 - Objetivos de la catalogacin los metadatos


Interoperabilidad con otros conjuntos de metadatos: Permite la interaccin entre los mismos y
permite las bsquedas indexadas de los mismos.
26

Extensibilidad: El diseo de conjuntos de metadatos debe ser capaz de incluir un ncleo central
con conceptos bsicos comunes al que se puedan sumar posteriormente (sin destruir la lgica del
conjunto) elementos que cumplan necesidades descriptivas ms especficas. La idea es que una
aplicacin que reconozca los metadatos bsicos sea capaz de utilizarlos sin perder demasiada
interoperabilidad.
Modularidad: Permite combinaciones sintcticas (a nivel de lo que se busca literalmente) y
semnticas (a nivel del significado de lo que se busca) con otros metadatos.
Principio de utilidad: Se han identificado tres aspectos claves desde el punto de vista de la
utilidad de las descripciones. La descripcin de un activo de informacin cualquiera debe cumplir
con tres requisitos:
Permitir el descubrimiento de activos de informacin: Esto implica la capacidad de utilizar
mecanismos de bsqueda de activos de informacin, as como estructuras de navegacin
categorizada (directorios y listados).
Permitir la identificacin y en menor medida la localizacin directa, de los activos de
informacin.
Valoracin de los recursos. Desde el punto de vista de la puesta a disposicin de los
recursos informativos, proporcionar al responsable de reutilizar la informacin la capacidad
de valorar la pertinencia de un determinado activo es clave si se persigue hacerlo de
manera adecuada.
Principio de simplicidad: La simplicidad debe perseguirse tanto de cara al proceso de
descripcin de activos de informacin que tendr lugar en el mbito de los generadores de
informacin publicable, como en el proceso de recuperacin e interaccin con las descripciones
que deber afrontar el ciudadano.
Desde el punto de vista de la descripcin de la informacin es fundamental no establecer la
obligatoriedad de campos descriptivos para los que frecuentemente no se posee una informacin
completa. En el mismo sentido, el establecimiento de varios niveles descriptivos ayuda a la
interoperabilidad con el resto de los datos cuando una descripcin muy detallada no sea posible.
Estructura de metadatos
Cada metadato est compuesto por una serie de elementos que buscan dar respuesta clara a los
siguientes interrogantes:
Quin?: Descripcin de los protagonistas objeto de los conjuntos de datos.
Qu?: La descripcin del contenido de los conjuntos de datos.
Cundo?: La descripcin de las variables de tiempo asociadas a los conjuntos de datos.
Dnde?: Las referencias de localizacin de los datos.
Por que?: La motivacin para abrir dichos datos.
Cmo?: El procedimiento para la descarga de los datos.

27

Adicionalmente se deben tener en cuenta elementos en el contexto de la Administracin Pblica


como los siguientes:

Referencias Institucionales: Referencias de autores o de las instituciones objeto o


protagonistas de los datos.
Organismos productores: Entidades que suministran los datos.
Localizacin: El lugar y modo de acceso a los datos, vnculos, protocolos de acceso
(FTP, SFTP) entre otros.
Accesibilidad: La durabilidad y conservacin temporal de los datos.
Referencias Normativas: Las referencias de tipo legal que puedan desprenderse o sobre
las que estn basada

Para la iniciativa de Apertura de Datos estos elementos se agrupan en dos tipos de metadatos:
Metadatos comunes: Aquellos que tienen todos los contenidos, independientemente de su
naturaleza. Por ejemplo, todas los documentos, eventos, informaciones, ayudas, etc. tienen
asociado un nombre, una descripcin, una tipologa y en general una serie de metadatos
comunes.
Metadatos especficos: Aquellos propios del contenido en funcin de su naturaleza (tipologa de
contenido). Ejemplo: Las publicaciones tienen unos metadatos particulares como la fecha de la
publicacin del titular. Los procedimientos administrativos, a su vez, tienen unos metadatos
particulares como el objeto, el estado de vigencia o el lugar de presentacin.
A continuacin se define la estructura y descripcin de los Metadatos comunes y especficos:
Tipologa
Metadatos
comnes.

Metadatos

Metadato

Descripcin

Tipos de datos

Ttulo

Nombre concreto del conjunto de datos.

Texto.

Identificador

Identificador nico del conjunto de datos


en la base de datos.

Texto (URI), numrico


(ISBN, DOI, nmero
local).

Descripcin

Descripcin/resumen del conjunto de


datos.

Texto.

Categora

Nombre(s) de categora(s) o grupo(s) al


cual pertenece el conjunto de datos.

Texto/lista de texto.

Autor

Entidad y dependencia que origina el


conjunto de datos.

Texto.

Idioma

Idioma de los datos del conjunto de datos.

Texto.

Audiencia

Audiencia objetivo del conjunto de datos.

Texto.

Palabras clave

Palabras clave para la ser identificados en


la bsqueda.

Texto separado por


comas.

mbito Geogrfico

Identifica la catalogacin de la informacin


a nivel: Nacional, Departamental,
Municipal, Distrital.

Texto/lista de texto.

Fecha Publicacin

Fecha de la carga del conjunto de datos

Fecha (AAAA-

28

especificos.

en el catlogo de datos.

MM_DD)

Fecha ltima
Actualizacin

Fecha de ltima actualizacin del conjunto


de datos en el catlogo de datos.

Fecha (AAAAMM_DD).

Frecuencia
Actualizacin

Frecuencia con la que se actualizan los


datos del conjunto de datos en el catlogo
de datos.

Texto.

Fecha Inicio

Fecha desde la cual se tienen en cuenta


datos para el conjunto de datos.

Fecha (AAAAMM_DD)

Fecha Fin

Fecha hasta la cual se tienen en cuenta


datos para el conjunto de datos.

Fecha (AAAAMM_DD).

Nmero de
Versin

Nmero de la ltima versin del conjunto


de datos en el catlogo de datos.

Texto/numrico.

URL Descarga

URL en el que el conjunto de datos puede


ser descargado.

Texto.

Formato Descarga

Formatos en los que se encuentra


disponible el conjunto de datos.

Texto/lista de texto.

Tamao Descarga

Tamao del conjunto de datos en Kb.

Numrico.

URL Esquema

URL de acceso al esquema, diccionario


de datos o descripcin de los datos y la
estructura del conjunto de datos.

Texto

URL
Documentacin

URL a documentacin adicional sobre el


conjunto de datos.

Numrico.

URL Programa

URL a sitio web de la entidad que


describe los programas o aplicaciones
(hechos o por hacer) relacionados con el
conjunto de datos.

Texto

Etiquetas

Palabras clave del contenido del conjunto


de datos.

Lista de texto

Licencia

Tipo de licencia.

Texto

URL Licencia

URL de enlace a la descripcin y detalles


de la licencia.

Texto

Nombre
Responsable

Nombre de la persona que administra el


conjunto de datos.

Texto

Email
Responsable

Email de la persona que administra el


conjunto de datos.

Texto

Cobertura de
conjunto de datos*

Delimitador de coordenadas segn la NTC


4611.

Numrico

Metadatos
adicionales*

Describir metadatos adicionales segn la


NTC 4611.

Texto

* Estos metadatos se deben adicionar a los Metadatos especficos si es un inventario geogrfico.


Sugerencia: Para la documentacin de los conjuntos de datos se recomienda a la entidad hacer
uso del Anexo 1: Instrumento de la Gua para la Apertura de Datos en Colombia y diligenciar
la seccin Descripcin de metadatos.

29

5.4.5Cmo se aplica la licencia abierta a los datos?


En Colombia existen los derechos de propiedad intelectual en la publicacin de los datos,
protegiendo que terceros los usen o reutilicen sin permiso manifiesto. La entidad debe declarar
explcitamente, para renunciar a esta proteccin, que se acoge a un tipo de licencia.
El procedimiento a seguir para disponibilizar o liberar los datos es aplicar una licencia abierta a
los mismos. Las licencias a utilizar deben estar orientadas y adecuadas al uso y reuso de los
datos abiertos si se desea que los datos sean de dominio pblico.
Open Data Commons http://opendatacommons.org/ rene un conjunto de instrumentos legales
que ayudan a proporcionar y utilizar los datos abiertos. Los tipos de licencia que se pueden
aplicar a los datos abiertos incluyen:
-Public Domain Dedication and License (PDDL) Public Domain for data/databases
-Attribution License (ODC-By) Attribution for data/databases
-Open Database License (ODC-ODbL) Attribution Share-Alike for data/databases
Open Data Commons promueve la aplicacin dos tipos de licencias personalizadas para datos
abiertos:
Dominio Pblico: Aplicar la Public Domain Dedication and License
Exponer material en Dominio Pblico
Share-Alike (plus Attribution): Aplicar la Open Database License
Como GPL (o CC Attribution Share-Alike) requiere reuso pblico de datos para compartir
cambios de fondo (y atributos).
Para aplicar la licencia se debe aadir una sentencia a los datos como la siguiente (o colocarlo en
la pgina donde est disponible):
Public Domain Dedication and License
This {DATA(BASE)-NAME} is made available under the Public Domain Dedication and License
version v1.0 whose full text can be found at http://opendatacommons.org/licenses/pddl/
Open Database License
This {DATA(BASE)-NAME} is made available under Open Database License whose full text can
be found at http://opendatacommons.org/licenses/odbl/. Any rights in individual contents of the
database are licensed under the Database Contents License whose text can be
found http://opendatacommons.org/licenses/dbcl/
30

Ver ANEXO 5 Ejemplo Paso 4


5.5PASO 5: ESTRUCTURACIN, CARGUE Y PUBLICACIN DE LOS CONJUNTOS DE
DATOS

5.5.1Qu se busca con la estructuracin, cargue y publicacin de los conjuntos de datos?


Las Entidades sern las encargadas de organizar la estructura de los conjuntos de datos abiertos,
con los formatos y lineamientos recomendados.
5.5.2Objetivos

Establecer la estructura de los conjuntos de datos.


Definir los lineamientos para el cargue y publicacin de los conjuntos de datos
identificados en la etapa de priorizacin.

5.5.3Beneficios

Ofrece mecanismos fciles para la publicacin de los conjuntos de datos.


Permite identificar los conjuntos de datos generados por la Entidad.
Permite tener la certeza legal sobre la informacin que se puede publicar.

31

5.5.4Cmo identifico la estructura de los conjuntos de datos a cargar?


Esta actividad consiste en la preparacin del archivo con el conjunto de datos a cargar en un
formato estructurado. Para realizar dicha estructuracin la entidad deber tener en cuenta las
siguientes actividades:
Elegir el formato para la publicacin de los datos: La entidad tendr la autonoma para elegir
el formato ms adecuado para la publicacin de sus datos. Lo anterior bajo criterios de menor
esfuerzo y costo pero sin afectar la calidad de la informacin.
Los formatos para la publicacin de los conjuntos de datos se agrupan en tres tipos [1]:
Formatos propietarios: Son formatos de archivo que requieren herramientas licenciadas
para acceder, visualizar o editar los datos que no son pblicas.
Formatos libres: Son formatos de archivo que se pueden crear y manipular para cualquier
software, libre de restricciones legales.
Sistemas de acceso: Lenguajes para consultar archivos.

Ilustracin 10 - Formatos de apertura de datos


A continuacin se presentan ejemplos de cada uno de los tipos de formatos para la publicacin
de la informacin:

32

Ilustracin 11 - Ejemplos de formatos de conjuntos de datos


La definicin de cada uno de los formatos de la anterior grfica se puede encontrar en la seccin
de Terminologa.
Estructuracin del conjunto de datos:
Para la estructuracin es necesario que la entidad ejecute las siguientes actividades:
Diligenciar el encabezado para cada uno de los conjunto de datos y adems se
recomienda haber diligenciado la seccin Descripcin de Metadatos para su
categorizacin y perfilamiento descrita en el Anexo 1: Instrumento de la Gua para la
Apertura de Datos en Colombia
A continuacin se describen lo campos del Encabezado del conjunto de datos:
Nombre del campo: Este campo se debe diligenciar en maysculas y no se deben utilizar
caracteres especiales, en caso de ser requerido un concatenador se debe utilizar el
carcter lnea baja (_) y su longitud es de mximo 20 caracteres.
Tipo de dato: Comprende los tipos Alfanumrico, Fecha y Numrico.
Alfanumrico: Los datos debern cumplir el estndar unicode UTF-16 [2].
Fecha: Se debern diligenciar con el formato DD-MM-AAAA. Si incluye hora, sta deber ser
HH:mm:ss.
Numrico: Los valores de campos numricos con fracciones debern diligenciarse con .
(punto) como separador de decimales.
Longitud: Esto es definido por la Entidad.
Acepta nulo: Si el campo pude ir vaco.
Formato: Es necesario que se defina el formato en que se expondr el conjunto de datos,
para esto se recomienda tener en cuenta lo descrito en el numeral 1 Elegir el formato para
la publicacin de los datos de esta seccin.
33

Descripcin del campo: Breve descripcin del contenido del campo.


Generacin de archivo estructurado:
Luego del diligenciamiento del encabezado de los datos, la entidad identifica y ejecuta el
mecanismo ms adecuado para la generacin del archivo con los datos estructurados.
NOTA: Este archivo debe estar estructurado con el mismo orden definido en el numeral 2
(Diligenciamiento del encabezado del archivo a cargar.). Los campos deben ir separados por comas
y el contenido delimitado con comillas dobles: Ej."VALOR1","VALOR2","VALOR3","VALOR4".
A continuacin se plantean unas posibles alternativas para esta actividad:
Utilizar el administrador de la base de datos: Los datos almacenados en una base de datos
son consultados a travs de una funcionalidad de bsqueda (o consultas) y la generacin
de reportes.
Programacin de un script para la extraccin de datos: Consiste en el desarrollo de un
programa para la extraccin de la informacin requerida, la entidad podr utilizar los
frameworks y lenguajes de programacin que considere (teniendo en cuenta la plataforma
tecnolgica que tenga).
Exportar a partir de un sistema de informacin: Generacin de reportes estructurados sobre
algn sistema de informacin existente en la Entidad.
Nota: Si dentro de la estructuracin de los campos a cargar no se encuentra alguno relacionado
con el Lenguaje Comn de Intercambio de Informacin, se deber seguir con el proceso de
carga de la informacin e iniciar el procedimiento de estandarizacin e incorporacin de campos
al Lenguaje Comn de Intercambio de Informacin, descrito en la Gua de uso del Lenguaje
comn de intercambio de informacin.
5.5.5Cules son los mecanismos de cargue y publicacin de los conjuntos de datos?
Para el cargue y publicacin de conjuntos de datos abiertos se han definido cuatro mecanismos.
Dichos mecanismos podrn ser utilizados segn el criterio de la Entidad, de acuerdo con la
madurez tecnolgica de la misma y las caractersticas de los datos a publicar.
La herramienta principal para la oferta de datos abiertos ser el portal Web (www.datos.gov.co),
que contar con un catlogo de datos y centralizar el registro y bsqueda de todos los datos
abiertos de las Entidades pblicas del pas, en la cual se encuentran definidos unos Trminos de
uso, que incorpora los principales aspectos legales a tener en cuenta al realizar la publicacin de
los conjuntos de datos, este contiene las condiciones generales que regulan el acceso y el uso
del sitio Web, del que es titular el Ministerio de Tecnologas de la Informacin y las
Comunicaciones -MINTIC.
34

Ilustracin 12 - Mecanismos de publicacin de datos


A continuacin se detallan los cuatro mecanismos de cargue y publicacin de los conjuntos de
datos:
Carga de archivo de conjunto de datos

Ilustracin 13 - Mecanismo - Carga de archivo de conjunto de datos

Descripcin: La entidad carga el conjunto de datos al Catlogo de Datos


(www.datos.gov.co) y realiza la documentacin del mismo manualmente.
Criterios de utilizacin: Informacin con frecuencia de actualizacin anual o semestral.
La Entidad asume la responsabilidad de la actualizacin de los conjuntos de datos.
Criterios tecnolgicos: La entidad podr utilizar este mecanismo cuando considere que
no cuenta con un servidor Web que soporte y aloje los datos a cargar. As mismo la
Entidad debe contar como mnimo con conexin a internet que permita el acceso a
www.datos.gov.co o al portal de datos abiertos que la entidad desee.

35

Referencia de archivo de conjuntos de datos

Ilustracin 14 - Mecanismo Referencia de archivo de conjuntos de datos


Descripcin: La entidad carga el conjunto de datos en una URL pblica, manual o
automticamente. Se crea una referencia a la URL en el Catlogo de Datos
(www.datos.gov.co).
Criterios de utilizacin: Informacin con frecuencia de actualizacin anual o semestral. Si la
carga es automtica puede tener una mayor frecuencia. La Entidad asume la
responsabilidad del alojamiento y la actualizacin del conjunto de datos.
Criterios tecnolgicos: La entidad puede utilizar este mecanismo cuando cuenta con un
servidor Web que soporte y aloje los datos a cargar. En este caso la entidad debe contar
como mnimo con conexin a internet que permita el acceso a www.datos.gov.co o al
portal de datos abiertos que la entidad desee y el servidor Web mencionado con salida a
internet.
Transferencia de datos

Ilustracin 15 - Mecanismo Transferencia de datos


36

Descripcin: Se realiza una transferencia automtica del archivo de conjunto de datos a un


repositorio central para su publicacin.
Criterios de utilizacin: Informacin con frecuencia de actualizacin semanal o diaria. Se
cuenta con el conocimiento y la tecnologa para realizar desarrollos a medida que permitan
la transferencia de los mismos. La Entidad asume la responsabilidad del alojamiento y la
actualizacin del conjunto de datos.
Criterios tecnolgicos: La entidad puede utilizar este mecanismo cuando cuenta con el
conocimiento para realizar desarrollo de software que permita la transferencia automtica
de los conjuntos de datos. En este caso la entidad debe contar como mnimo con conexin
a internet que permita el acceso a www.datos.gov.co o al portal de datos abiertos que la
entidad desee, y adems debe disponer de las herramientas automticas para la
generacin de los archivos de los conjuntos de datos y la transferencia automtica de los
mismos.
Servicio de informacin en lnea

Ilustracin 16 - Mecanismo Servicio de informacin en lnea


Descripcin: La entidad realiza el desarrollo de un servicio de consulta de la informacin en
lnea y referencia el mismo por medio de una URL en el Catlogo de Datos
(www.datos.gov.co).
Criterios de utilizacin: Informacin con frecuencia de actualizacin diaria o menor. La
entidad asume la responsabilidad de la disponibilidad del servicio publicado.
Criterios tecnolgicos: La entidad puede utilizar este mecanismo cuando considera que la
transferencia de archivos puede ser muy lenta y adems cuenta con un servidor Web que
garantice la disponibilidad del servicio publicado. En este caso la entidad debe contar
como mnimo con conexin a internet que permita el acceso a www.datos.gov.co o al
portal de datos abiertos que la entidad desee y el servidor Web mencionado con salida a
internet.

37

5.5.6Otros medios de publicacin en lnea


Portales institucionales
A travs de los sitios web de las entidades pblicas se cargan y disponibilizan los conjuntos de
datos para que sean descargados por los usuarios.
Uno de los retos asumidos con este enfoque es la dificultad para que un tercero pueda encontrar
informacin actualizada, sobre todo cuando existe un gran volumen de datos para su descarga.
Sitios de terceros
Muchos repositorios se han convertido en centros de datos especializados en temticas
particulares. Por ejemplo, www.datamarket.com permite a las entidades pblicas y privadas
almacenar grandes cantidades de conjuntos de datos.
Los sitios de terceros pueden ser muy tiles. La razn principal es la creacin de comunidades
con personas interesadas en varios conjuntos de datos.
El uso de un servicio en lnea de un tercero podra ser la mejor solucin para que las entidades
pequeas que carecen de recursos e infraestructura puedan configurar y ejecutar sus propios
sistemas.
Via FTP
Un mtodo menos favorable para proporcionar el acceso a los archivos es a travs del Protocolo
de Transferencia de Archivos (FTP). Esto puede ser conveniente para una audiencia tcnica,
como desarrolladores de software y cientficos.
El sistema FTP funciona en lugar de HTTP, pero est diseado especficamente para soportar la
transferencia de archivos.
Como API
Los datos pueden ser publicados a travs de una Interfaz de Programacin de Aplicaciones (API).
Estas interfaces permiten a los programadores seleccionar conjuntos especficos de datos, en vez
del archivo de datos completos. Las APIs suelen estar conectadas a bases de datos que se
actualizan en tiempo real. Esto significa que la informacin disponible a travs de una API este
actualizada.
Ver ANEXO 6 Ejemplo Paso 5

6REUTILIZACION, PROMOCION Y USO DE DATOS ABIERTOS


38

En esta seccin se presentan las actividades comnmente desarrolladas como parte de la


iniciativa de datos abiertos para promover su uso, estas incluyen: conferencias de Datos Abiertos
de Gobierno, cursos virtuales, desconferencias, talleres y hackatones.
Estas actividades suelen ser organizadas por las entidades pblicas o comunidades interesadas
a partir de datos que han sido publicados proactivamente por las entidades o hayan sido
obtenidos mediante solicitudes o peticiones de informacin.
6.1.1DATA JAM
Es un evento de ideacin por un da con desarrolladores, diseadores y expertos temticos
concentrados en una temtica con los conjuntos de datos abiertos relacionados.
Objetivo: Conectar comunidades de tecnologas y de poltica y generar compromisos para
desarrollar soluciones con datos abiertos, con el apoyo de la misin y las prioridades de la
entidad.
6.1.2DATAPALOOZA
Una celebracin abierta, demo day, y una plataforma para anunciar la exposicin o las mejoras
de datos abiertos del gobierno.
Objetivo: Celebrar la implementacin de herramientas de datos abiertos, entidades y
compromisos y construir ideas para proyectos.
6.1.3 MARATON DE DESARROLLO

Un evento donde desarrolladores, diseadores y colaboradores trabajan en equipos para resolver


problemas con software para soluciones web y mviles y presentan un prototipo al final de la
jornada. Ejemplo: Agrotn, Colombia APPcesible, APPuesta Social.
Objetivo: Establecer relaciones con la comunidad de desarrolladores y ensear herramientas y
prototipos en corto tiempo.
6.1.4COMUNIDADES EN LINEA
Un sitio web, grupo de redes sociales y/o listas de distribucin de correo electrnico donde los
interesados en el uso de datos abiertos convergen para ofrecer retroalimentacin, consejos,
nuevos usos o reutilizaciones, peticiones de datos o estudios de caso. Ejemplos: Comunidades
de datos.
39

Objetivo: Construir y mantener relaciones permanentes con los medios de comunicacin,


organizaciones no lucrativas, buenos defensores del gobierno y tecnlogos cvicos.
6.1.5BARCAMP
Es una red internacional de "desconferencias" (eventos abiertos y participativos), cuyo contenido
es provisto por los participantes. Se enfocan en aplicaciones web en estadios tempranos,
tecnologas de cdigo abierto y protocolos sociales. Sin embargo, este tipo de encuentros han
ampliado su temtica y actualmente incluyen eventos participativos y abiertos alrededor de temas
sociales, artsticos, educativos... con fuertes componentes creativos e innovadores en los
respectivos mbitos.
6.1.6DESCONFERENCIAS
Una desconferencia, tambin llamado No-Congreso, es una conferencia en la que los propios
participantes y asistentes toman un papel ms participativo y activo. El trmino ha sido aplicado,
ya sea total o parcialmente, a un amplio rango de tipos de reuniones en las que se intenta evitar
uno o ms aspectos de una conferencia convencional, como pueden ser las charlas de larga
duracin, los precios de entrada desproporcionados o las presentaciones comerciales.
6.1.7MASHUP CAMP
Campamento donde un grupo de desarrolladores, habilitadores de mashup, y observadores se
renen para compartir ideas y mostrar demos de aplicaciones web que se mezclan juntos desde
sitios y servicios web.

40

7ANEXOS
7.1.1ANEXO 1 - Instrumento de la Gua para la Apertura de Datos en Colombia

7.1.2ANEXO 2 - Ejemplo Paso 1


NOTA: Se recomienda que para una mayor comprensin e interpretacin del presente ejemplo
los usuarios deben haber realizado la lectura de:
Gua de apertura de datos
Caso prctico
Teniendo en cuenta la contextualizacin del Caso prctico, se procede a llevar a cabo la
ejemplificacin detallada para la temtica de Apertura de Datos.

Ilustracin 17 - Identificacin del inventario de informacin


La Oficina de Registro de Instrumentos Pblicos por medio de su Rol Funcional indaga si
dentro del marco de su poltica de seguridad de la informacin, se ha realizado un trabajo de
41

levantamiento del inventario de activos de informacin, y evidencia que No se cuenta con este,
por tanto procede identificar las fuentes de informacin de acuerdo a los procesos que maneja la
entidad, resultado de esta labor el Rol Funcional identifica el inventario de informacin de la
entidad en el cual se define que se trabajar con la informacin de Tradicin y libertad del bien
inmueble, paso seguido se realiza la descripcin del inventario en la Planilla para la
identificacin del inventario de informacin donde se describe el detalle de la informacin a
trabajar como se muestra en la siguiente grfica.

Ilustracin 18 - Planilla para la identificacin del inventario de informacin

42

7.1.3ANEXO 3 - Ejemplo Paso 2

Ilustracin 19 - Anlisis jurdico del inventario de informacin


Con el inventario de informacin identificado en el Ejemplo del PASO 1, los roles jurdico y de
seguridad proceden a identificar la normatividad interna que regula la informacin de Tradicin y
libertad del bien inmueble, posteriormente se diligencia la Plantilla para el anlisis jurdico
del inventario de informacin respondiendo los diferentes criterios de informacin Secreta,
Restringida o confidencial del Mtodo de separacin, para que finalmente la plantilla clasifique
la informacin en Publicable y No publicable como se muestra en la siguiente grfica.

43

Ilustracin 20 - Plantilla para el anlisis jurdico del inventario de informacin


Con la informacin publicable identificada se procede a realizar la publicacin del inventario de
informacin en su sitio Web, en la seccin denominada Atencin a la ciudadana.

44

7.1.4ANEXO 4 - Ejemplo Paso 3

Ilustracin 21 - Identificacin del inventario de datos de la entidad


Teniendo la informacin Tradicin y libertad del bien inmueble clasificada como Publicable del
Ejemplo del PASO 2, los roles Funcional y Tcnico realizan el anlisis de informacin e
identifican que la informacin se encuentra segmentada por:

45

Predios Embargados
Titulares de derecho real de dominio
Compraventas de bien inmueble de los ltimos 5 aos
Predios Hipotecados
Lo cual permite definir que el inventario de datos estar conformado por la segmentacin de la
informacin que ser equivalente a los conjuntos de datos. El inventario de datos se documenta
en la Plantilla para la identificacin del inventario de datos de la entidad, como se muestra en
la siguiente grfica.

Ilustracin 22 - Plantilla para la identificacin del inventario de datos de la entidad


Paso seguido los roles Funcional y Tcnico realizan el ejercicio de priorizacin de los
conjuntos de datos de acuerdo a los criterios de Impacto y Dificultad de implementacin,
para esto es necesario diligenciar la Plantilla para la priorizacin de los conjuntos de datos la
cual realiza automticamente la ponderacin de los anteriores criterios que servirn de insumo a
la Matriz de priorizacin, como se muestra a continuacin:

46

Ilustracin 23 - Plantilla para la priorizacin de los conjuntos de datos


Finalmente se genera la Matriz de priorizacin, la cual grfica y agrupa los conjuntos de datos
dentro de los cuadrantes de Victoria Temprana (VT), Medio Plazo (MP), Largo plazo (LP) y No
aporta valor (NV), indicando a los roles Funcional y Tcnico que los primeros conjuntos de datos
a publicar deben ser los que se encuentran en el cuadrante de Victoria Temprana (VT), para
nuestro caso, Compraventas de bien inmueble de los ltimos 5 aos y Predios Hipotecados,
como se muestra a continuacin.

Ilustracin 24 - Matriz de priorizacin

47

7.1.5ANEXO 5 - Ejemplo Paso 4

Ilustracin 25 - Descripcin de metadatos de los conjuntos de datos


Los roles Tcnico y de Seguridad toman los conjuntos de datos Compraventas de bienes
inmuebles de los ltimos 5 aos y Predios Hipotecados clasificados en el Ejemplo del PASO
3 como Victoria Temprana (VT), y realizan el diligenciamiento de la Plantilla para la descripcin
de metadatos de los conjuntos de datos, en la cual para cada conjunto de datos se describen
los metadatos comunes y especficos como se como se muestra a continuacin.

48

Ilustracin 26 - Plantilla para la descripcin de metadatos de los conjuntos de datos

49

7.1.6ANEXO 6 - Ejemplo Paso 5

Ilustracin 27 - Estructuracin cargue y publicacin de los conjuntos de datos


Los roles Tcnico y de Seguridad estructuran los conjuntos de datos (Compraventas de bienes
inmuebles de los ltimos 5 aos y Predios Hipotecados) diligenciando Plantilla para la
estructuracin de los datos como se muestra a continuacin.

50

Ilustracin 28 - Plantilla para la estructuracin de los datos


Acto seguido generan los archivos de los conjuntos de datos a cargar en formato (CSV) y
proceden a realizar el cargue en el portal Web www.datos.gov.co de los archivos utilizando el
mecanismo de Carga de archivo de conjunto de datos.

51

8 Terminologa
API (Application Programming Interface): Es una interfaz de comunicacin entre componentes
de software, que ofrece un conjunto de llamadas a ciertas libreras de programacin que dan
acceso a ciertos servicios desde los procesos, consiguiendo la abstraccin en la programacin
entre niveles inferiores y superiores del software.
Centro de Contacto Ciudadano -CCC: Es el punto integrado de contacto donde, a travs de
diferentes canales como telfono, correo electrnico, charlas interactivas y fax, se brinda
atencin, respuestas inmediatas y seguimiento a las solicitudes de los ciudadanos, empresas y
servidores pblicos.
Centro de Datos: Es la infraestructura donde se concentran todos los recursos tcnicos y
humanos necesarios para el ptimo procesamiento, almacenamiento y publicacin de la
informacin de las entidades del Estado Colombiano.
Conjunto de datos (Dataset): Unidad mnima de informacin sujeta a carga, publicacin,
transformacin y descarga en la plataforma
CSV (Valores separados por coma): Tipos de documentos en formato abierto sencillo para
representar datos en formato de tabla, en columnas separadas por comas (o punto y coma,
donde la coma es el separador decimal) y las filas son saltos de lnea. Los campos que tienen
una coma, un salto de lnea o una comilla doble deben cerrarse entre comillas dobles. No indica
un juego concreto de caracteres, ni cmo van situados los bytes, ni el formato para el salto de
lnea. Las extensiones que se utilizan son .csv y .txt.
DOC (Microsoft Office Word): Formato cerrado para transferir textos formateados o sin formato.
Puede contener textos, imgenes, grficos y enlaces. Desde la versin 2007 se trabaja con un
nuevo formato, docx, que es ms avanzado y comprime ms el documento.
Entidad: Organismos establecidos por la legislacin Colombiana, los cuales tendr la facultad de
definir inventarios de datos y conjuntos de datos a publicar.
Formatos libres: Son formatos de archivo que se pueden crear y manipular para cualquier
software, libre de restricciones legales.
Formatos propietarios: Son formatos de archivo que requieren herramientas que no son
pblicas.
Interoperabilidad: Propiedad o capacidad de dos o ms sistemas o componentes para
intercambiar informacin y utilizar la informacin intercambiada.
Infomediario/a: Trmino con el que se hace referencia a una empresa que reutiliza la
informacin de las Administraciones para producir un servicio o una obra con valor aadido.
Suele utilizarse en referencia a la Industria Infomediaria. Existen mltiples ejemplos de industrias
infomediarias, como aquellas que editan bases de datos de legislacin y jurisprudencia a partir de
las sentencias y normas publicadas en los boletines oficiales, o las que trabajan con informacin
de mbito Meteorolgico para realizar informes ms especficos para las Administraciones con el
fin de, por ejemplo, detectar riesgos de incendios forestales a travs de datos de previsiones e
histricos de situacin meteorolgica en un determinado territorio (por poner solo un par de
casos).
Inventario de datos: Hace referencia a un listado de conjunto de datos que expone una entidad y
que podran llegar a ser publicados en el catlogo de datos.
JSON (Notacin de Objetos de JavaScript): Formato ligero de intercambio de datos, fcil de
entender para las personas, y ofrece sencillez a las mquinas en la generacin e interpretacin.
52

Est basado en un subconjunto del lenguaje de programacin JavaScript, adecuado para la


programacin por parte del cliente.
KML-KMZ (Lenguaje de Etiquetado de Ojo de Cerradura): Gramtica XML y formato de
archivo para la creacin de modelos y almacenamiento de funciones geogrficas como puntos,
lneas, imgenes, polgonos y modelos que se mostrarn principalmente en aplicaciones de
mapas. Se utiliza para compartir lugares e informacin entre aplicaciones. Es el estndar del
Open Geospatial Consortium y se puede utilizar a travs de Google Earth. Los archivos KML se
distribuyen comprimidos como archivos KMZ.
Licencia de informacin (licencia tipo): Contrato mediante el cual una persona recibe de otra el
derecho de uso de varios de sus bienes, normalmente de carcter no tangible o intelectual, a
cambio del pago o no de una cantidad determinada por el uso de los mismos. Este tipo de
contratos, con carcter general, recogen una serie de clusulas que atienden a cuatro aspectos
especficos: derechos sobre la obra, limitaciones y prohibiciones, garantas y responsabilidades,
jurisdiccin competente y derecho aplicable.
La licencia de informacin es la modalidad que tienen los organismos del Sector Pblico para
autorizar la publicacin de documentos pblicos de forma no exclusiva y no discriminatoria
respecto a otros usuarios.
Mediacin: Expresin general utilizada para referirse a cualquier tratamiento de los datos o de la
informacin como paso previo a su apertura. Casos concretos de mediacin son "el podado", "un
injerto" o "la anonimizacin".
Metadato: Es informacin que describe otro dato y puede ser entendida por humanos y
mquinas.
Microformato: (A veces abreviado con F o uF) Forma simple de agregar significado semntico
a un contenido legible por un humano mientras que para una mquina puede ser slo texto plano.
Segn el W3C, son conjuntos de formatos de datos abiertos y simples, desarrollados sobre
estndares ya existentes, ampliamente adoptados, incluyendo XHTML (HTML y XML) y CSS.
ODF (Formato de Documento Abierto para Aplicaciones Ofimticas OASIS): Open Document
es un formato de fichero estndar para el almacenamiento de contenidos ofimticos como hojas
de clculo, grficos y presentaciones. Es el estndar para el intercambio de texto con formato.
Las extensiones son:
Texto: .odt
Hoja de clculo: .ods
Dibujo: .odg
Grfico: .odc
Frmula matemtica: .odf
Base de datos: .odb
Imagen: .odi
Documento maestro: .odm
PDF (Formato de Documento Porttil): Documento de formato portable universal que mantiene
la apariencia del documento independientemente del sistema operativo que se utilice
(multiplataforma). Incluye cualquier combinacin de texto, multimedia e hipertexto y adems se
puede cifrar el contenido y firmarlo digitalmente. Es el estndar ISO, desde 2008, para ficheros
contenedores de documentos electrnicos de cara a la conservacin de larga duracin. Es una
especificacin que se puede crear, visualizar o modificar con herramientas de software libre. Este
formato originalmente era propietario (hasta 2008).
53

RAVEC: Es una red privada de ltima tecnologa que interconecta a las instituciones pblicas a
altas velocidades, con altos niveles de disponibilidad y seguridad, proporcionndoles servicios
convergentes y colaborativos, para permitir una transferencia eficiente de informacin entre
organismos gubernamentales y para optimizar los servicios que se entregan a los ciudadanos.
RDF-XML (Infraestructura para Descripcin de Recursos): Modelo para la representacin de
los recursos de la web en expresiones con la forma sujeto-predicado-objeto. El sujeto es el
recurso que se describe, el predicado es la propiedad sobre la que se quiere establecer el recurso
y el objeto es el valor de la propiedad con el que se establece la relacin. La combinacin de RDF
con otras herramientas permite aadir significado a las pginas y es una de las tecnologas
esenciales para la web semntica. Para que sea interpretable, se representa en formato XML.
REST (RepresentationalState Transfer): Cualquier interfaz web simple que utiliza XML y HTTP,
sin las abstracciones adicionales de los protocolos basados en patrones de intercambio de
mensajes como el protocolo de servicios web SOAP.
RISP (Acrnimo de Reutilizacin de la Informacin del Sector Pblico):Se trata de un
esfuerzo Jurdico y de las Administraciones para dar acceso a los documentos, informacin y
datos de carcter pblico (es decir no sujetos a ninguna restriccin legal) a ciudadanos y
empresas para que stos puedan usarlas como mejor les convenga, pero muy especialmente con
la intencin de que generen nuevos servicios y productos de valor aadido. Esta iniciativa se
impuls sobre todo a partir del ao 2003 con una Directiva europea que todos los Estados
Miembros de la Unin estn transponiendo.
Sistemas de acceso: Lenguajes para consultar archivos.
SHP (ESRI): Shapefile es un formato propietario de datos espaciales que es el estndar para el
intercambio de informacin geogrfica entre Sistemas de Informacin Geogrfica (GIS). Es un
formato vectorial de almacenamiento digital donde se guarda la localizacin de elementos
geogrficos y los atributos asociados a ellos, pero sin capacidad para almacenar informacin
topolgica. Lo generan varios archivos, mnimo tres y tiene tres tipos de extensiones: .shp, .shx y
.dbf
SPARQL (SPARQLProtocol and RDF QueryLanguage): Es un conjunto de especificaciones
que proporcionan lenguajes y protocolos para consultar y manipular el contenido grfico de RDF
en la Web o en una tienda de RDF
Tienda de Aplicaciones de Datos Abiertos: Solucin en la que se publican las aplicaciones
construidas por desarrolladores (colaboradores) que reutilizan los datos cargados y expuestos en
el plataforma de de datos abiertos en la web.
TMX (Translation Memory eXchange): Estndar de XML, que es un DTD que sirve para el
intercambio de memorias de traduccin. Creado por el comit OSCAR (Open Standards for
Container/Content Allowing Re-use).
Web services - API (Interfaz de programacin de aplicaciones): Son interfaces de
programacin de aplicaciones (API) o la API de la web que se accede a travs de HTTP y se
ejecuta en un sistema remoto de alojamiento de los servicios solicitados. Los servicios web son
sistemas de software diseados para apoyar la interaccin interoperable mquina a mquina
sobre una red. Tiene una interfaz descrita en un formato procesable por una mquina y otros
sistemas interactan con el servicio web de una manera prescrita por su descripcin utilizando
mensajes SOAP, transmitido a travs de HTTP con una serializacin XML en conjunto con otras
normas relacionadas con la web.
WMS (Servicio de Mapas Web): Formato que produce mapas de datos referenciados
espacialmente, de forma dinmica, a partir de informacin geogrfica. Es estndar internacional.
54

Los mapas WMS se generan normalmente en un formato de imagen como PNG, GIF o JPG, y
opcionalmente como grficos vectoriales en formato SVD o WebCGM.
W3C (World Wide Web Consortium): Es un consorcio internacional de reconocido prestigio
donde las organizaciones miembro, el personal a tiempo completo y el pblico en general,
trabajan conjuntamente para desarrollar estndares Web.
XLS (Microsoft Office Excel): Contiene filas y columnas de celdas y cada una puede incluir
datos, que pueden ser palabras, nmeros o frmulas que tengan datos y resolver ecuaciones
dinmicamente. Las hojas de clculo XLS tambin pueden contener tablas y grficos que
muestran todas las secciones o de los datos seleccionados.
XML (Lenguaje de Etiquetado Extensible): Es un metalenguaje simple pero estricto,
desarrollado por W3C. Desarrolla un papel fundamental en el intercambio de una gran variedad
de datos. XML es un formato que permite la interpretacin de datos a travs de varias
aplicaciones. Es una simplificacin y adaptacin del SGML y permite definir la gramtica de
lenguajes especficos. En realidad, XML es una manera de definir lenguajes para diferentes
necesidades.

55

Vous aimerez peut-être aussi