Datos abiertos para Desarrollo en América Latina y el Caribe » Glosario

Cómo Participar

Glosario


 CONCEPTOS Y DEFINICIONES

 

Dato: Representación simbólica (numérica, alfabética, algorítmica etc.), atributo o característica  de una entidad. Un dato es una expresión mínima de contenido sobre un tema.

Formato (de datos): Conjunto de características técnicas y de presentación que corresponden a la estructura física y lógica usada para almacenar datos en un archivo. Usualmente se indica por un sufijo al final del nombre del archivo. Ejemplo: miArticulo.pdf, publicaciones.xml.

Conjunto de datos (Dataset): Datos relacionados, convenientemente organizados y estructurados con unidad temática y física, de forma que puedan ser tratados (procesados) apropiadamente para obtener información. No está necesariamente dirigido a un usuario específico.

Base de Datos (Database): Conjunto de datos con significados inherentes construido con algún propósito específico y dirigido a un grupo de usuarios específicos.

Cátalogo: Un catálogo es la entrada organizada dirigida al usuario de los datasets (o conjuntos de datos) publicados por un organismo. El catálogo puede considerarse como la relación ordenada de términos y conceptos que describen los metadatos de un conjunto de datos, más metadatos y enlaces a otros datos relacionados relevantes para los usuarios. Generalmente, se usa para ordenar y localizar la información por parte de los usuarios del repositorio de datos.

Repositorio (de datos): Unidad virtual de los conjuntos de datos físicos publicados por una  organización.

Datos personales: Toda información numérica, alfabética, gráfica, fotográfica, acústica o de  cualquier otro tipo sobre una persona física identificada o identificable, cuya identidad pueda  determinarse, directa o indirectamente mediante un número de identificación o uno o varios  elementos específicos, característicos de su identidad física, fisiológica, psíquica, económica,  cultural o social.

Derechos de autor: Derecho moral, irrenunciable e inalienable, y derecho exclusivo de  explotación que tiene y ejerce sobre su obra literaria, artística o científica la persona creadora de  la misma.

Derechos de propiedad intelectual: Derechos de autor y derechos afines, incluídas las formas de  protección sui géneris.

Licencia: Información sobre los derechos de propiedad y de uso del dataset. La utilización de licencias es esencial para dar claridad y certeza a los usuarios acerca los posibles usos de la información contenida en los conjuntos de datos. Para efectos de la liberación de éstos y para facilitar su reutilización, deben respetarse al menos las siguientes condiciones básicas: a) mantener el sentido original de la información; b) citar la fuente de la información; c) explicitar la fecha de la última actualización de la información.

Datos Abiertos (Open data): Datos que no tienen restricciones de acceso de ningún tipo, con particular énfasis en la ausencia de las restricciones de tipo administrativo y tecnológico. Existen varios requerimientos técnicos mínimos que los datos deben de cumplir para poder ser considerados abiertos (Ejemplo: Los 8 Principios de los Datos Abiertos), lo que implica que puedan darse diferentes “intensidades” de apertura de datos (Ejemplo: las 5-estrellas de los datos abiertos de la Web Foundation).

Datos Abiertos Gubernamentales (Open Government Data): Datos que: a) son recogidos, producidos y/o recibidos por las instituciones públicas – y en particular en las distintas instituciones de la Administración del Estado y los Gobiernos – durante el ejercicio de sus actividades o de acuerdo a funciones encomendadas; b) son mantenidos, organizados y conservados como objeto de antecedente o consulta para la propia institución, la Administración Pública y la ciudadanía en general; c) son puestos a disposición de los ciudadanos e instituciones públicas o privadas, con el fin de que éstos sean divulgados y potencialmente utilizados por la sociedad en general y en particular por entidades que puedan agregar valor a dichos datos; d) caen en la definición “técnica y administrativa” de datos abiertos. Existe una gran variedad de datos que califican para estos fines: geográficos, meteorológicos, de tráfico, de la gestión del gobierno, el uso de los recursos fiscales, entre otros.

Apertura de datos: Acción y resultado de hacer accesibles públicamente datos ocultos o restringidos en una organización, presentándolos de forma que puedan ser aprovechados por cualquier agente reutilizador.

Publicación: Modelo de intercambio de datos abiertos que no requiere acuerdos  bilaterales previos entre el publicador del dato y el consumidor del datos. Corresponde al proceso de exponer de manera pública y permanente los datos de una institución, así como sus correspondientes metadatos. Los datos están disponibles bajo formatos y patrones de proceso conocidos y estándares. El objetivo es permitir el uso abierto de cualquier contraparte, ya sea por medio de interfaces humanas o procedimientos automatizados. El publicador es la entidad o individuo que se hace responsable por la publicación de datos.

Consumidor (de datos): Cualquier persona u organización que accede a los datos publicados y  obtiene una copia total o parcial de ellos para fines propios.

Reutilizar: Utilizar algo, ya sea para la misma función que desempeñaba anteriormente o con otros fines.

Reutilización pública: Uso de documentos que obran en poder del sector público, por personas físicas o jurídicas, con fines comerciales o no comerciales, siempre que dicho uso no constituya una actividad administrativa pública.

Infomediario/a: Empresa o negocio cuyo modelo se basa en administrar información en favor de  terceros, por medio de la recopilación de datos de diversas fuentes, su estudio y selección, para  organizarlos y distribuirlos de manera relevante para su clientela.

Infoactivista: Persona que teniendo acceso a la tecnología apropiada y que, siendo capaz de usar la misma para recopilar, combinar, crear y distribuir información de una forma democrática y participativa, emplea Internet como plataforma global para intentar provocar cambios sociales,  políticos, económicos, medioambientales, entre otros.

Interoperabilidad: Propiedad o capacidad de dos o más sistemas o componentes para intercambiar información y utilizar la información intercambiada.

Visualización: Representación gráfica de datos y modelos, que ayuda al usuario a comprender la estructura y significado de la información contenida en dichos datos.

 

GLOSARIO TÉCNICO DE DATOS ABIERTOS

 

Metadatos. Datos y/o documentos que describen otros datos en términos de contexto, contenido  o, en general, cualquier aspecto que se considere necesario para ampliar la conceptualización del  dato descrito – o sea, son el conjunto de características que todo conjunto de datos lleva asociado. Los metadatos son una herramienta fundamental para organizar, clasificar, relacionar y razonar sobre los datos. Ejemplos de metadatos de un dataset: título, descripción, publicador, fecha de publicación, etc.

Raw data: Expresión que refiere a datos en estado “original”, no derivados de otro conjunto de  datos, es decir, previo a su procesamiento o agregación. Se definen también como “primarios”.

URI (Uniform Resource Identifier): En español “identificador uniforme de recurso”, es una cadena de caracteres corta que identifica inequívocamente un recurso (servicio, página,  documento, dirección de correo electrónico, enciclopedia, etc.). Normalmente estos recursos son accesibles en una red o sistema. Los URI pueden ser localizadores uniformes de recursos (URL),  Uniform Resource Name (URN), o ambos (URL + URN).

URL (Uniform Resource Locator): Nombre/Identificador. Secuencia compacta de caracteres  que permite localizar un recurso describiendo su modo primario de acceso. Las URL son un  subconjunto de las URI.

RDF (Resource Description Framework): Infraestructura para describir semánticamente  recursos, es decir, dotar de sentido a lo que representamos para que las máquinas lo comprendan. RDF se puede representar en distintos formatos: XML, N3, Turtle, etc.

RDFa (Resource Description Framework-in-attributes): Forma de representar los datos  estructurados visibles en las páginas Web mediante unas anotaciones semánticas, incluidas en el  código e invisibles para el usuario, que permiten a las aplicaciones interpretar esta información y  utilizarla de forma eficaz.

DCAT (Data Catalog Vocabulary): Vocabulario RDF para la interoperabilidad de catálogos  de datos. Su objetivo principal es la expresión de los catálogos de datos de gobiernos en un  formato estándar usando RDF.

REST (Representational State Transfer): Cualquier interfaz web simple que utiliza XML y HTTP, sin las abstracciones adicionales de los protocolos basados en patrones de intercambio de  mensajes como el protocolo de servicios web SOAP.

SKOS (Simple Knowledge Organization System): Vocabulario RDF para la representación de  sistemas de conocimiento semi-formales, tales como tesauros, taxonomías y esquemas de  clasificación. SKOS se ha diseñado para facilitar la migración de los sistemas organizacionales  existentes ala Web Semántica.

SPARQL (SPARQL Protocol and RDF Query Language): Tecnología de consulta de  información desde bases de datos y otros orígenes de datos en sus estados primitivos a través de  la Web. Se compone de un lenguaje de consulta estandarizado y de un protocolo con el que ofrece un servicio Web estándar (HTTP / SOAP), el que permite realizar consultas a diversas  fuentes de datos que almacenan los mismos nativamente en RDF o los presentan como tal.

Linked data (Datos Enlazados): Objetos de información que están enlazados por protocolos  informáticos: empleando el modelo RDF para describir los datos, y URIs – o enlaces href (Web) – para nombrar a los objetos de datos y exponerlos para su acceso vía protocolo HTTP, facilitan la interconexión y relación útil entre los datos de una forma interpretable tanto por personas como por máquinas.

API (Application Programming Interface): Es una interfaz de comunicación entre componentes de software, que ofrece un conjunto de llamadas a ciertas librerías de programación que dan acceso a ciertos servicios desde los procesos, consiguiendo la abstracción en la  programación entre niveles inferiores y superiores del software.

MIME (Multipurpose Internet Mail Extensions): Una serie de convenciones o especificaciones dirigidas al intercambio a través de Internet de todo tipo de archivos (texto, audio, vídeo, etc.) de forma inadvertida para el usuario.

Minería de datos: Conjunto de técnicas avanzadas empleadas para el descubrimiento y la obtención de información existente de forma implícita en los datos y que resulta útil para determinado ámbito de estudio o negocio.

Ontología: Descripción formal de los conceptos y relaciones que pueden existir sobre agentes o una comunidad. Especificación consensuada que describe un dominio de información.

Semántica: modo particular de inferir realidades o ideas a partir de una palabra o frase.

 

 

ABREVIACIONES

CSV: Comma separated Values.

DCMI: Dublin Core Metadata Initiative.

GML: Geography Markup Language.

HTML: Hyper Text Markup Language.

JPEG: Join Photographic Expert Group.

KML: Keyhole Markup Language.

MIME (Multipurpose Internet Mail Extensions): una serie de convenciones o especificaciones dirigidas al intercambio a través de Internet de todo tipo de archivos (texto, audio, vídeo, etc.) de forma transparente para el usuario.

MPEG-7: Moving Picture Expert Group.

PNG: Portable Network Graphics.

SDMX: Statistical Data and Metadata eXchange.

SPSS: Statistical Package for Social Science.

SSL/TLS: Secure Socket Layer/Transport Layer Security.

STATA: Data Analysis and Statistical Software.

SVG: Scalable Vector Graphics.

TAR: Tape Archiv.

URI: Uniform Resource Identifier.

WGS84: World Geodetic System 1984.

XHTML:  Extensible Hyper Text Markup Language.

XML:  Extensible Markup Language.