Icono
Gestión Administrativa
Contador
3
Color
azul
Gestión Administrativa

ABC de Datos Abiertos, qué son y por qué usarlos

Creación: 16/01/2023

ABC de Datos Abiertos, qué son y por qué usarlos
ABC de Datos Abiertos, qué son y por qué usarlos

Una guía para saber qué son los datos abiertos, por qué las entidades públicas los liberan y sus posibles aplicaciones.

**Con el uso de los datos abiertos se puede crear, intercambiar y difundir conocimiento, desarrollar innovaciones, ayudar a mejorar el desarrollo de modelos de negocio de las empresas, crear emprendimientos y ejercer control político sobre las instituciones públicas.**
 
Aunque con el uso de las Tecnologías de la Información y las Comunicaciones (TIC) constantemente estamos produciendo y compartiendo datos, no tenemos mucho conocimiento sobre los mismos y su uso; lo mismo sucede con los datos que generan las entidades públicas. Por esto a continuación respondemos a algunas preguntas básicas sobre los datos, específicamente de los datos abiertos.
 
## ¿Qué son los datos?
Se asocian generalmente con cifras, letras o palabras que proporcionan información cualitativa o cuantitativa sobre hechos, sucesos, personas u objetos. Para estudiarlos, analizarlos o conocerlos se deben asociar con otros datos o interpretarse para responder preguntas o comprobar hipótesis.
 
Para que los datos sean útiles en la toma de decisiones y para la realización de cálculos pronósticos, deben organizarseen grupos y estructurarse para facilitar su análisis e interpretación.
 
Los datos constituyen la unidad mínima de la información.
 
## ¿Qué son los datos abiertos?
Se trata de “datos digitales que son puestos a disposición con las características técnicas y jurídicas necesarias para que puedan ser usados, reutilizados y redistribuidos libremente por cualquier persona, en cualquier momento y en cualquier lugar”.
Fuente: <a href="https://opendatacharter.net/principles-es/" target="_blank">*Carta Internacional de Datos Abiertos*</a>

“Datos publicados en formatos legibles por máquinas, que están disponibles públicamente bajo una licencia abierta que asegura que pueden ser utilizados, reutilizados o distribuidos libremente por cualquier persona, para cualquier propósito legal”.
Fuente: Open Data Readiness Assessment (ODRA). Estudio realizado en mayo – septiembre de 2015. World Bank Group.
 
“Son todos aquellos datos primarios o sin procesar, que se encuentran en formatos estándar e interoperables que facilitan su acceso y reutilización, los cuales están bajo la custodia de las entidades públicas o privadas que cumplen con funciones públicas y que son puestos a disposición de cualquier ciudadano, de forma libre y sin restricciones, con el fin de que terceros puedan reutilizarlos y crear servicios derivados de los mismos”
Fuente: <a href="http://www.secretariasenado.gov.co/senado/basedoc/ley_1712_2014.html" target="_blank">Ley 1712 de 2014</a>, Artículo 6, literal J.

## ¿Por qué es importante liberar los datos de las entidades públicas?
Porque promueve y facilita la transparencia, la eficiencia y eficacia de los servicios, la toma de decisiones, la medición predictiva del impacto de políticas o proyectos y la generación de conocimiento, al interior de las entidades públicas.
 
Con los datos abiertos los ciudadanos pueden mejorar o crear productos, servicios o modelos de negocios, entender ciertos fenómenos sociales y ejercer control sobre las entidades públicas. Los datos abiertos pueden ser reutilizados para crear servicios para la comunidad como aplicaciones para dispositivos móviles o servicios web.
 
Liberar los datos es una práctica basada en la premisa de que los datos o la información generada por las entidades públicas pertenece a los ciudadanos.
 
## ¿Cuáles son las características de los datos abiertos?
Los datos abiertos deben ser

*   **Primarios**: se obtienen directamente desde la fuente.
*   **Accesibles**: disponibles para el mayor número de usuarios y usos.
*   **No discriminatorios**: disponibles para todos los ciudadanos sin obligación de iniciar sesión o registrarse.
*   **Completos**: contienen el mayor detalle posible y la información suministrada es suficiente y consistente y sin datos nulos.
*   **Oportunos**:  disponibles y actualizados para garantizar su valor y utilidad.
*   **Licenciados en formato abierto**: términos de uso y licenciamiento abiertos.
*   **En formatos no propietarios**: disponibles en formatos abiertos.
*   **Procesables por máquinas**: disponibles en formatos que permiten el procesamiento automático.

## ¿Cómo se regulan los datos abiertos en Colombia?
La definición de datos abiertos está contemplada en la <a href="http://www.secretariasenado.gov.co/senado/basedoc/ley_1712_2014.html" target="_blank">Ley 1712 de 2014</a> de Transparencia y del Derecho de Acceso a la Información Pública Nacional, en la <a href="http://estrategia.gobiernoenlinea.gov.co/623/w3-propertyvalue-7650.html" target="_blank">Política de Gobierno Digital</a> y su aplicación en la <a href="http://gobiernodigital.gov.co/623/articles-9407_guia_datos.pdf " target="_blank">Guía para el uso y aprovechamiento de Datos Abiertos en Colombia</a>.

## ¿Cómo se accede a datos abiertos de Colombia?
Los datos abiertos son publicados en Internet por las entidades públicas. El Área Metropolitana del Valle de Aburrá ha dispuesto para esto el [portal de Datos Abiertos](https://datosabiertos.metropol.gov.co). El Gobierno Nacional reúne en un catálogo, datos abiertos del país en el portal <a href="https://www.datos.gov.co/" target="_blank">datos.gov.co</a>.

## ¿Qué información del Área Metropolitana del Valle de Aburrá se publica como datos abiertos?
Toda la información que se considere relevante para la comunidad y que no tenga restricciones jurídicas para su difusión, se puede publicar en el portal de Datos Abiertos.
 
## ¿Por qué publica el Área Metropolitana del Valle de Aburrá datos abiertos?
- Para facilitar el acceso a los datos y así disminuir el número de peticiones de información que recibe la entidad.
- Para dar a conocer a los ciudadanos la información producida por los proyectos que desarrolla la entidad.
- Para promover el desarrollo de servicios que beneficien al ciudadano con el uso inteligente de la información como aplicaciones de transporte, de uso o estado de los  recursos naturales, de conocimiento de la región u otros temas que inspiren los datos abiertos publicados.
 
## ¿Qué portales de datos abiertos existen en Colombia?
Los siguientes son algunos de los portales de datos abiertos disponibles en el país:

*   <a href="https://www.datos.gov.co/" target="_blank">Portal de Datos Abiertos de Colombia </a>
*   <a href="https://sitios.dane.gov.co/anda-index/" target="_blank">Archivo Nacional de Datos (ANDA) </a>
*   <a href="https://datosabiertos.metropol.gov.co/" target="_blank">Portal de Datos Abiertos del Área Metropolitana del Valle de Aburrá </a>
*   <a href="http://medata.gov.co/" target="_blank">Portal de Datos Abiertos de la Alcaldía de Medellin - Medata </a>
*   <a href="http://datosabiertos.bogota.gov.co/" target="_blank">Portal de Datos Abiertos de Bogotá</a>
*   <a href="http://datos.cali.gov.co/" target="_blank">Portal de Datos Abiertos de Cali </a>

 
## Ejemplos de proyectos en el mundo desarrollados a partir de datos abiertos
 
- <a href="https://herramientas.datos.gov.co/es/usos" target="_blank">datos.gov.co</a>: aplicaciones desarrolladas para Colombia con conjuntos de datos disponibles en datos.gov.co.
- <a href="http://app.wheredoesmymoneygo.org/" target="_blank">¿Where does my money go?</a>: *¿A dónde va mi dinero?* Iniciativa del Reino Unido para comunicar cómo invierte el gobierno los impuestos.
- <a href="https://www.yelp.com/" target="_blank">Yelp</a>: aplicación desarrollada en San Francisco, Estados Unidos con información sobre los resultados de las inspecciones sanitarias en los restaurantes del país. La aplicación se alimenta también con comentarios de los usuarios.
- <a href="https://www.mapnificent.net/" target="_blank">Mapnificent</a>: información de transporte público. Muestra el área a la que puede llegar en transporte público desde cualquier punto en un momento dado. Está disponible para las principales ciudades en los Estados Unidos y algunas capitales del mundo.
- <a href="https://www.mybus.com.ar/" target="_blank">MYBUS</a>: permite realizar consultas inteligentes para conocer las alternativas de transporte público que se pueden utilizar para realizar viajes en la ciudad de Mar de Plata.
 
## Recursos para conocer más sobre los datos abiertos
- <a href="http://estrategia.gobiernoenlinea.gov.co/623/articles-9407_Guia_Apertura.pdf" target="_blank">Guía de Datos Abiertos en Colombia</a>
- <a href="http://opendatahandbook.org/guide/es/ " target="_blank">El manual Open Data de Open Knowledge International</a>

Gestión Administrativa

Formatos de publicación de datos abiertos

Creación: 16/01/2023

Formatos de publicación de datos abiertos
Formatos de publicación de datos abiertos

Conoce los formatos disponibles para consultar y descargar datos abiertos del portal del Área Metropolitana del Valle de Aburrá.

**Para que un dato se considere como dato abierto debe cumplir con ciertas características, una de ellas es que los datos deben estar disponibles en formatos de software no propietarios, en formatos abiertos.**

<a href="https://www.w3.org/People/Berners-Lee/" target="_blank">Tim Berners-Lee</a>, creador de la *World Wide Web*, sugirió un esquema de desarrollo de cinco estrellas para clasificar los datos en Internet, en relación a su nivel de apertura y el esfuerzo que supone extraer, procesar y vincular los datos publicados. De acuerdo con esto, archivos .PDF o .TXT con licencia abierta tienen una estrella, dado que extraer y estructurar los datos requiere procesos adicionales; los archivos .XLSX tienen dos estrellas pues requieren de un software propietario para su procesamiento; los archivos .CSV tienen tres estrellas ya que pueden procesarse con software libre. Los datos con cuatro estrellas son los integrados a la web (RDF) y con cinco estrellas los que se encuentran enlazados a otros datos (LOD).

<center><img src="https://datosabiertos.metropol.gov.co/sites/default/files/styles/panopoly_image_original/public/cinco-estrellas-formatos.png?itok=ELFsYkiI"/></center><center><a href="https://5stardata.info/es/" target="_blank">Fuente: sitio web de Las Cinco Estrellas de los Datos Abiertos</a></center>

**Cuando se consulta el portal de Datos Abiertos del Área Metropolitana del Valle de Aburrá, es posible descargar los datos en los siguientes formatos:**

###.TXT
Extensión de archivo para documentos de texto plano, se conoce también como archivo de texto simple, texto sencillo o texto sin formato. Estos archivos se pueden crear, editar y leer por editores de texto en todos los sistemas operativos, lo que lo hace un formato universal y de uso frecuente para almacenar datos.   

Los documentos de texto plano se componen de caracteres como letras, números y signos de puntuación, espacios, tabulaciones y saltos de línea, pero no incluyen información de texto enriquecido. Los caracteres se pueden codificar de distintos modos, dependiendo de la lengua usada. Algunos de los sistemas de codificación más utilizados son: ASCII, ISO-8859-1 o Latín-1 y UTF-8.

###.CSV
Sigla de *Comma Separated Values*, en español Valores Separados por Comas, es un formato de texto compacto, adecuado para transferir grandes conjuntos de datos que tienen la misma estructura y se usan, generalmente, para importar o exportar bases de datos entre programas o aplicaciones. Los datos se representan en tablas, las columnas se separan por comas o punto y coma, y las filas por saltos de línea.

Los archivos .CSV pueden estructurarse en una hoja de cálculo usando la función de separar los datos en columnas y seleccionando como delimitadores los caracteres de separación de columnas (coma y punto y coma).

**Aprende más sobre los archivos .CSV en el sitio web <a href="http://www.nongnu.org/cvs/" target="_blank">.CSV</a>**

Generar archivos con extensión .TXT o .CSV  en un software propietario como Excel, es sencillo. Para ello se debe seleccionar la opción “guardar como” y en el tipo de archivo, elegir la extensión .TXT o .CSV para compartir la información en un formato libre. Es importante que el archivo sólo contenga la información necesaria, los datos organizados en filas y columnas, sin celdas agrupadas o de título.

###.HTML
Siglas de *HyperText Markup Language*, en español Lenguaje de Marcas de Hipertexto, es el estándar para la elaboración de páginas web. La W3C, *World Wide Web Consortium*, organización que estandariza tecnologías web, definió la estructura básica y el código .HTML para la escritura e interpretación de contenidos de páginas en Internet (texto, imágenes, video, etc) que ha sido implementado en la mayoría de navegadores para visualizar la información en la red.

Es un formato abierto, evolución del «Estándar de Lenguaje de Marcado Generalizado» (SGML) desarrollado en IBM a finales de los años 60's. Su escritura se basa en etiquetas con las que se da estructura y formato al contenido. HTML soporta *scripts* que brindan instrucciones específicas a los navegadores, los más conocidos y utilizados son *JavaScript* y *PHP*.

**Aprende más sobre los archivos .HTML en el sitio web <a href="https://www.w3.org/html/" target="_blank">W3C HTML </a>**

###.XML
Del inglés *Extensible Markup Language*, se ha sido traducido como "Lenguaje de Marcado Extensible" o "Lenguaje de Marcas Extensible".

Es un metalenguaje extensible de etiquetas desarrollado por el W3C para almacenar datos en formato legible. Se trata de un metalenguaje porque define la estructura y la semántica de un documento digital, y es extensible porque no tiene un límite para la creación de etiquetas.

Se usa para conectar aplicaciones, es el estándar para el intercambio de información estructurada entre diferentes plataformas. Además, permite definir lenguajes específicos para un dominio y se puede utilizar en bases de datos, editores de texto y hojas de cálculo.

**Aprende más sobre los archivos .XML en el sitio web <a href="https://www.w3.org/XML/" target="_blank">W3C XML </a>**

###.JSON
Sigla de *JavaScript Object Notation* en español Notación de Objetos de JavaScript, es un formato de datos ligero basado en texto estándar. Se utiliza frecuentemente para el intercambio de grandes volúmenes de datos estructurados y para visualizar información en páginas web.

Servicios de cartografía como Google Maps, redes sociales como Twitter, portales de Datos Abiertos como datos.gov.co, entre otros, entregan a sus usuarios los datos en este formato.

Aunque JSON es un formato de texto independiente, utiliza convenciones conocidas de las familias de lenguajes de programación C, C++, C #, Java, JavaScript, Perl, Python entre otros.

**Aprende más sobre los archivos .JSON en el sitio web <a href="https://www.json.org" target="_blank">json.org</a>**

###RDF
De *Resource Description Framework*, que se traduce como Marco de Descripción de Recursos. Se refiere a las especificaciones de la W3C para el modelado de información y la descripción de recursos que se implementa en Internet. Utiliza notaciones de sintaxis y formatos de serialización de datos en diferente formatos y facilita la utilización de vocabulario estándar reconocido sobre dominios de conocimiento concretos. Se expresa según la tripleta sujeto, predicado, objeto.

Hace parte de la web semántica y permite que el software automatizado almacene, intercambie y utilice información en máquinas distribuidas a través de la Web, lo que a su vez, permite a los usuarios manejar la información con mayor eficiencia y seguridad.

**Aprende más sobre RDF en el sitio web <a href="https://www.w3.org/RDF/" target="_blank">W3C RDF</a>**

##Otros formatos

###.XLSX
Desde 2007 es la extensión de archivo de las hojas de cálculo de la aplicación *Excel* de *Microsoft Office*. Los datos almacenados en un archivo .XLSX generalmente se organizan en celdas, pueden contener caracteres alfanuméricos, a los cuales se les puede dar formato o usar en fórmulas, funciones y macros para la automatización de cálculos matemáticos.

Aunque *Microsoft Excel* es un software  propietario o privativo, se utiliza en muchos sitios web para transferir datos porque su uso es muy común en universidades, entidades públicas y empresas privadas.

Los archivos .XLSX se pueden abrir con versiones anteriores de *Microsoft Excel*, con la ayuda de una extensión y son compatibles con otros software de hojas de cálculo como *Numbers* de *Apple* o hojas de cálculo de *Google Drive*, *Apache OpenOffice* y *Free Office*.

**Aprende más sobre los archivos .XLSX en el sitio web <a href="https://support.office.com/es-es/article/aprendizaje-de-excel-para-windows-9bc05390-e94c-46af-a5b3-d7c22f6990bb?wt.mc_id=otc_home&ui=es-ES&rs=es-ES&ad=ES" target="_blank">*Excel* de *Microsoft Office* </a>**

###.SHP
*Shapefile* es un formato de archivo para el intercambio de datos geográficos. Fue creado para *ArcGIS*, un software propietario para Sistemas de Información Geográfica que permite recopilar, organizar, administrar, analizar, compartir y distribuir este tipo de información. Su uso es muy expandido por entidades gubernamentales, investigadores, el sector educativo, los medios de comunicación y la empresa privada.

Los archivos .SHP almacenan la localización y los atributos de la información geográfica pero no permite guardar información topológica.  

*ArcGIS* posibilita el acceso a la información desde diferentes dispositivos móviles, de escritorio y la integración con servicios web. La información geográfica disponible en *ArcGIS* pueda ser compartida y aprovechada fácilmente pues la infraestructura del software está basada en la nube para facilitar el trabajo colaborativo.

**Aprende más sobre Sistemas de Información Geográfica en el sitio web <a href="https://www.arcgis.com/index.html" target="_blank">*ArcGIS*</a>**

Los archivos de los datos que se van a hacer públicos, sin importar su formato, deben estar acompañados de documentación con información sobre los metadatos que contienen para facilitar el trabajo de quienes van a usar esta información.