miércoles, 20 de octubre de 2021

SISTEMAS GESTORES DE BASES DE DATOS (SGBD) Y BASES DE DATOS (BD)

 

 TALLER PARA TRABAJAR SISTEMAS GESTORES DE BASES DE DATOS (SGBD)

En esta guía encontrará consejos útiles que le ayudarán a familiarizarse con la aplicación.

Recuerde que las versiones actuales tienen un aspecto distinto al que tenía en versiones anteriores, así que se creó esta guía para que el proceso de aprendizaje sea más rápido.

  

SGBD:  Es una herramienta para recopilar y organizar información. Las bases de datos pueden almacenar información sobre personas, productos, pedidos u otras cosas. Muchas bases de datos comienzan como una lista en una hoja de cálculo o en un programa de procesamiento de texto.

 es una recopilación organizada de información o datos estructurados, que normalmente se almacena de forma electrónica en un sistema informático. Normalmente, una base de datos está controlada por un sistema de gestión de bases de datos (DBMS). En conjunto, los datos y el DBMS, junto con las aplicaciones asociadas a ellos, reciben el nombre de sistema de bases de datos, abreviado normalmente a simplemente base de datos.

Los datos de los tipos más comunes de bases de datos en funcionamiento actualmente se suelen utilizar como estructuras de filas y columnas en una serie de tablas para aumentar la eficacia del procesamiento y la consulta de datos. Así, se puede acceder, gestionar, modificar, actualizar, controlar y organizar fácilmente los datos. La mayoría de las bases de datos utilizan un lenguaje de consulta estructurada (SQL) para escribir y consultar datos..

 


Capacidades a fortalecer

·         Conocimientos y habilidades para la operación de un sistema de información, manual o computarizado.

 

·   Sapiencias y pericias técnicas que le permiten preparar Información basándose en Practicas Generales, Principios, Normas y Reglas.

 

 

 

Objetivos

  • ·      Manejar las herramientas de un procesador de texto correctamente para crear y editar documentos y trabajos escritos.
  • ·         Fomentar la resolución de problemas complejos en sistemas de información.
  • ·         Mejorar la estructuración y redacción de escritos personales.


 


Un programa de base de datos almacena la información que introducimos a través de los formularios en forma de tablas como las que podemos ver, por ejemplo, en un listado telefónico:

Listado telefónico

Nombre

Dirección

Teléfono

Botero Forero, Eduardo

Bogotá, Colombia

3013719171

Gates, Bill

California, USA

(9562) 233384562

Bergoglio, Jorge

Roma, Italia

(8762) 577512340

En este listado nos interesa tener almacenados de modo ordenado los datos de una serie de personas. Para que aparezcan de modo claro los hemos desglosado en tres apartados: Nombre, Dirección y Teléfono, haciendo que aparezca cada uno en una columna diferente. Así es mucho más sencillo encontrar la dirección de una persona buscando a partir de su nombre.

Aquí podemos ver cómo la información referida a una persona, "un dato", aparece en una fila de la tabla: a esto es a lo que se denomina Registro. A cada una de las partes en las que hemos desglosado la información se le denomina Campo, y al conjunto formado por todos los registros, Tabla.

Por lo tanto podemos decir que:

Registro: es el concepto básico en el almacenamiento de datos. El registro agrupa la información asociada a un elemento de un conjunto y está compuesto por campos.

Tabla: es el conjunto de registros homogéneos con la misma estructura.

Los campos

Para crear los campos de una manera más completa es necesario profundizar en cada una de las características de un campo.

Nombre del campo

En esta columna se introduce el nombre de los campos. La columna tiene un máximo de 64 caracteres. Se pueden utilizar espacios, pero no se puede empezar con un espacio. No se pueden utilizar: los puntos, los signos de admiración, los acentos graves ni los corchetes.

Dentro de una misma tabla no puede haber dos campos con el mismo nombre.

 

El nombre del campo debe ser descriptivo de la información que el campo va a contener para no crear confusión a la hora de trabajar con los datos.

Propiedades generales de los campos

PROPIEDAD

DESCRIPCIÓN

TIPO DE CAMPO

Tamaño del campo

Permite establecer la longitud máxima de un campo de texto numérico.

Texto, numérico, contador

Formato

Permite determinar la apariencia de presentación de los datos, utilizando los formatos predefinidos o nuestros propios formatos

Todos, excepto OLE y Memo

Lugares decimales

Permite especificar el número de cifras decimales para mostrar los números.

Numérico y moneda

Máscara de entrada

Permite controlar y filtrar los caracteres o valores que los usuarios introducen en un control de cuadro de texto, evitando errores y facilitando su escritura.

Texto, numérico, fecha/hora, moneda

Título

Permite definir una etiqueta de campo predeterminada para un formularios o informe

Todos

Valor predeterminado

Introduce en el campo un valor cuando se agregan nuevos registros (long. Máx. 255 caracteres)

Todos, excepto OLE y contador

Regla de validación

Permite escribir la condición que deben satisfacer los datos introducidos para ser aceptados

Todos, excepto OLE y contador

Texto de validación

Define el texto del mensaje que se visualiza cuando los datos no cumplen las condiciones enumerdas en la regla de validación

Todos excepto OLE y contador

Requerido

Permite especificar si es necesario que exista un valor en un campo.

Todos excepto contador

Permitir longitud cero

Permite especificar si una cadena de longitud cero ("") es una entrada válida para el campo

Texto, memo

Indexado

Define un campo como índice o campo clave.

Texto, numérico, contador, fecha/hora.

Las propiedades de un campo, se establecen seleccionando el campo y haciendo clic en la propiedad deseada del cuadro PROPIEDADES DEL CAMPO situado en la parte inferior de la ventana DISEÑO DE TABLA.

 

Desarrollo histórico de los SGBD

 


¿Qué es un sistema de gestión de bases de datos (DBMS) o (SGBD) en español?

Normalmente, una base de datos requiere un programa de software de bases de datos completo, conocido como sistema de gestión de bases de datos (DBMS). Un DBMS sirve como interfaz entre la base de datos y sus programas o usuarios finales, lo que permite a los usuarios recuperar, actualizar y gestionar cómo se organiza y se optimiza la información. Un DBMS también facilita la supervisión y el control de las bases de datos, lo que permite una variedad de operaciones administrativas como la supervisión del rendimiento, el ajuste, la copia de seguridad y la recuperación.

Algunos ejemplos de software de bases de datos o DBMS populares incluyen MySQL, Microsoft Access, Microsoft SQL Server, FileMaker Pro, Oracle Database y dBASE.

 

 

¿Qué es una base de datos MySQL?

MySQL es un sistema de gestión de bases de datos relacionales de código abierto basado en SQL. Se diseñó y se optimizó para las aplicaciones web y puede utilizarse en cualquier plataforma. A medida que surgían nuevos y diferentes requisitos con Internet, MySQL se convirtió en la plataforma preferida por los desarrolladores web y las aplicaciones basadas en web. Dado que está diseñado para procesar millones de consultas y miles de transacciones, MySQL es una elección popular para las empresas de comercio electrónico que necesitan gestionar múltiples transferencias de dinero. La flexibilidad on-demand es la principal función de MySQL.

MySQL es el DBMS que se encuentra detrás de algunos de los sitios web y aplicaciones basadas en web más importantes del mundo, como Airbnb, Uber, LinkedIn, Facebook, Twitter y YouTube.

 

 

 

¿Qué es el lenguaje de consulta estructurada (SQL)?

El SQL es un lenguaje de programación que utilizan casi todas las bases de datos relacionales para consultar, manipular y definir los datos, además de para proporcionar control de acceso. El SQL se desarrolló por primera vez en IBM en la década de 1970 con Oracle como uno de los principales contribuyentes, lo que dio lugar a la implementación del estándar ANSI SQL. El SQL ha propiciado muchas ampliaciones de empresas como IBM, Oracle y Microsoft. Aunque el SQL se sigue utilizando mucho hoy en día, están empezando a aparecer nuevos lenguajes de programación.

 

 

Evolución de la base de datos

Las bases de datos han evolucionado drásticamente desde su inicio a principios de la década de 1960. Las bases de datos de navegación, como la base de datos jerárquica (que se basaba en un modelo de árbol y permitía una relación de uno a muchos) y la base de datos de red (un modelo más flexible que permitía relaciones múltiples), eran los sistemas originales que se utilizaban para almacenar y manipular datos. Aunque eran sencillos, estos primeros sistemas eran inflexibles. En la década de 1980, se hicieron populares las bases de datos relacionales, seguidas de las bases de datos orientadas a objetos en la década de 1990. Más recientemente, las bases de datos NoSQL surgieron como respuesta al crecimiento de Internet y la necesidad de acelerar la velocidad y el procesamiento de los datos no estructurados. Hoy en día, las bases de datos en la nube y las bases de datos de autogestión están abriendo nuevos horizontes en lo que respecta a la forma en la que se recopilan, se almacenan, se gestionan y se utilizan los datos.

 

 

¿Cuál es la diferencia entre una base de datos y una hoja de cálculo?

Tanto las bases de datos como las hojas de cálculo (como Microsoft Excel) son modos cómodos de almacenar información. Las principales diferencias entre los dos son:

  • Cómo se almacenan y se manipulan los datos
  • Quién puede acceder a los datos
  • Cuántos datos pueden almacenarse

Las hojas de cálculo se diseñaron originalmente para un usuario y sus características así lo reflejan. Son perfectas para un único usuario o para un pequeño número de usuarios que no necesiten hacer una gran manipulación de datos increíblemente complicada. Las bases de datos, por otro lado, están diseñadas para contener recopilaciones mucho más grandes de información organizada, a veces en cantidades masivas. Las bases de datos permiten que muchos usuarios accedan y consulten los datos de forma rápida y segura al mismo tiempo mediante una lógica y un lenguaje muy complejos.

 

 

Tipos de bases de datos

Existen muchos tipos diferentes de bases de datos. La mejor base de datos para una organización específica depende de cómo pretenda la organización utilizar los datos.

  • Bases de datos relacionales. Las bases de datos se hicieron predominantes en la década de 1980. Los elementos de una base de datos relacional se organizan como un conjunto de tablas con columnas y filas. La tecnología de bases de datos relacionales proporciona la forma más eficiente y flexible de acceder a información estructurada.
  • Bases de datos orientadas a objetos. La información de una base de datos orientada a objetos se representa en forma de objetos, como en la programación orientada a objetos.
  • Bases de datos distribuidas. Una base de datos distribuida consta de dos o más archivos que se encuentran en sitios diferentes. La base de datos puede almacenarse en varios ordenadores, ubicarse en la misma ubicación física o repartirse en diferentes redes.
  • Almacenes de datos. Un repositorio central de datos, un data warehouse es un tipo de base de datos diseñado específicamente para consultas y análisis rápidos.
  • Bases de datos NoSQL. Una base de datos NoSQL, o base de datos no relacional, permite almacenar y manipular datos no estructurados y semiestructurados (a diferencia de una base de datos relacional, que define cómo se deben componer todos los datos insertados en la base de datos). Las bases de datos NoSQL se hicieron populares a medida que las aplicaciones web se volvían más comunes y complejas.
  • Bases de datos orientadas a grafos. Una base de datos orientada a grafos almacena datos relacionados con entidades y las relaciones entre entidades.
  • Bases de datos OLTP. Una base de datos OLTP es una base de datos rápida y analítica diseñada para que muchos usuarios realicen un gran número de transacciones.

 

Estos son solo algunos de las varias docenas de tipos de bases de datos que se utilizan hoy en día. Otras bases de datos menos comunes se adaptan a funciones científicas, financieras o de otro tipo muy específicas. Además de los diferentes tipos de bases de datos, los cambios en los enfoques de desarrollo tecnológico y los avances considerables, como la nube y la automatización, están impulsando a las bases de datos en direcciones completamente nuevas. Algunas de las bases de datos más recientes incluyen

  • Bases de datos de código abierto. Un sistema de base de datos de código abierto es aquel cuyo código fuente es de código abierto; tales bases de datos pueden ser bases de datos SQL o NoSQL.
  • Bases de datos en la nube. Una base de datos en la nube es una recopilación de datos, estructurados o no estructurados, que reside en una plataforma de cloud computing privada, pública o híbrida. Existen dos tipos de modelos de bases de datos en la nube: tradicional y base de datos como servicio (DBaaS). Con DBaaS, un proveedor de servicios realiza las tareas administrativas y el mantenimiento.
  • Base de datos multimodelo. Las bases de datos multimodelo combinan distintos tipos de modelos de bases de datos en un único servidor integrado. Esto significa que pueden incorporar diferentes tipos de datos.
  • Bases de datos de documentos/JSON. Diseñadas para almacenar, recuperar y gestionar información orientada a los documentos, las bases de datos de documentos son una forma moderna de almacenar los datos en formato JSON en lugar de en filas y columnas.
  • Bases de datos de autogestión. El tipo de base de datos más nuevo e innovador, las bases de datos de autogestión (también conocidas como bases de datos autónomas) están basadas en la nube y utilizan el machine learning para automatizar el ajuste de la base de datos, la seguridad, las copias de seguridad, las actualizaciones y otras tareas de gestión rutinarias que tradicionalmente realizan los administradores de bases de datos.

 

 

¿Qué es un software de base de datos?

El software de base de datos se utiliza para crear, editar y mantener archivos y registros de bases de datos, lo que facilita la creación de archivos y registros, la entrada de datos, la edición de datos, la actualización y la creación de informes. El software también maneja el almacenamiento de datos, las copias de seguridad y la creación de informes, así como el control de acceso múltiple y la seguridad. La seguridad sólida de las bases de datos es especialmente importante hoy en día, ya que el robo de datos es cada vez más frecuente. En ocasiones, el software de base de datos también se denomina "sistema de gestión de bases de datos" (DBMS).

El software de base de datos simplifica la gestión de datos, ya que permite a los usuarios almacenar datos de forma estructurada y acceder posteriormente a ellos. Por lo general, tiene una interfaz gráfica que ayuda a crear y administrar los datos y, en algunos casos, los usuarios pueden construir sus propias bases de datos mediante el uso de software de base de datos.

 

Uso de bases de datos para mejorar el rendimiento del negocio y la toma de decisiones

Con la recopilación masiva de datos del Internet of Things que está transformando la vida y la industria en todo el mundo, las empresas de hoy en día tienen acceso a más datos que nunca. Las empresas visionarias ahora pueden utilizar las bases de datos para ir más allá del almacenamiento básico de datos y las transacciones con el fin de analizar grandes cantidades de datos de múltiples sistemas. Mediante el uso de bases de datos y otras herramientas informáticas y de inteligencia empresarial, las organizaciones ahora pueden aprovechar los datos que recopilan para funcionar de forma más eficiente, permitir una mejor toma de decisiones y ser más ágiles y escalables.

La base de datos de autogestión está preparada para proporcionar un impulso significativo a estas capacidades. Dado que las bases de datos de autogestión automatizan procesos manuales costosos y tediosos, liberan a los usuarios empresariales para que puedan ser más proactivos con sus datos. Al tener control directo sobre la capacidad de crear y utilizar bases de datos, los usuarios ganan control y autonomía al mismo tiempo que mantienen importantes estándares de seguridad.

 

Desafíos de las bases de datos

Las bases de datos de las grandes empresas de hoy en día soportan a menudo consultas muy complejas y se espera que proporcionen respuestas casi instantáneas a esas consultas. En consecuencia, se solicita a los administradores de bases de datos que empleen una amplia variedad de métodos para ayudar a mejorar el rendimiento. Algunos desafíos comunes a los que se enfrentan incluyen:

  • Absorción de aumentos significativos en el volumen de datos. La explosión de datos provenientes de sensores, máquinas conectadas y docenas de otras fuentes hace que los administradores de bases de datos tengan que luchar para administrar y organizar los datos de sus empresas’ de manera eficiente.
  • Garantía de seguridad de los datos. Actualmente, se producen filtraciones de datos en todas partes, y los piratas informáticos son cada vez más ingeniosos. Garantizar que los datos estén seguros es más importante que nunca, pero también que los usuarios puedan acceder a ellos fácilmente.
  • Mantenimiento al día con la demanda. En el entorno empresarial actual de rápido crecimiento, las empresas necesitan tener acceso en tiempo real a sus datos para poder tomar decisiones a tiempo y aprovechar las nuevas oportunidades.
  • Gestión y mantenimiento de la base de datos y la infraestructura. Los administradores de bases de datos deben supervisar continuamente la base de datos por si surgen problemas y realizar un mantenimiento preventivo, así como aplicar parches y actualizaciones de software. A medida que las bases de datos se hacen más complejas y los volúmenes de datos crecen, las empresas se enfrentan a los gastos de contratar talentos adicionales para supervisar y ajustar sus bases de datos.
  • Eliminación de los límites de la escalabilidad. Un negocio necesita crecer si quiere sobrevivir, y su gestión de datos debe crecer con él. No obstante, para los administradores de bases de datos resulta muy difícil predecir cuánta capacidad necesitará la empresa, especialmente con las bases de datos on-premise.

Abordar todos estos desafíos puede requerir mucho tiempo y puede impedir que los administradores de bases de datos realicen funciones más estratégicas.

 

Cómo mejora la tecnología autónoma la gestión de bases de datos

Las bases de datos de autogestión son la ola del futuro y ofrecen una posibilidad fascinante para las organizaciones que deseen utilizar la mejor tecnología de bases de datos disponible sin los problemas que supone ejecutar y utilizar esa tecnología.

Las bases de datos de autogestión utilizan una tecnología basada en la nube y el machine learning para automatizar muchas de las tareas rutinarias necesarias para gestionar bases de datos, como el ajuste, la seguridad, las copias de seguridad, las actualizaciones y otras tareas de gestión rutinarias. Al automatizar estas tediosas tareas, los administradores de bases de datos se quedan libres para realizar un trabajo más estratégico. Las funciones de autogestión, autoprotección y autorreparación de las bases de datos de autogestión están preparadas para revolucionar la forma de gestionar y proteger los datos de las empresas, lo que permite obtener ventajas de rendimiento, reducir costes y mejorar la seguridad.

 

Futuro de las bases de datos y las bases de datos autónomas

La primera base de datos autónoma se anunció a finales de 2017 y muchos analistas independientes de la industria reconocieron rápidamente la tecnología y su impacto potencial en la informática.

La perspectiva de IDC de febrero de 2018 elogió la tecnología de base de datos autónoma para hacer que el “software empresarial sea más fácil de implementar, utilizar y administrar, gracias al uso de la inteligencia artificial y el machine learning para proporcionar capacidades que requieren poca o ninguna intervención humana para gestionar el software.”

El informe de KuppingerCole de enero de 2018 (PDF) afirmaba que “este enfoque tiene enormes beneficios potenciales, no solo para reducir la mano de obra y los costes para los clientes, sino para mejorar drásticamente la resistencia de las bases de datos’ tanto frente a los errores humanos como frente a las actividades maliciosas, internas o externas. Cada base de datos también está diseñada para tener características de seguridad habilitadas de manera predeterminada y parámetros relevantes configurados automáticamente de acuerdo con las mejores prácticas de seguridad actuales.”


 

  

Recuerde lo siguiente si desea agilizar su trabajo con las teclas aceleradoras:

v  La tecla que me permite desplazarme al inicio del renglón es INICIO.

v  La tecla que me permite desplazarme al final del renglón es FIN.

v  Las teclas que me permiten desplazarme al inicio de documento son CTRL+INICIO.

v  Las teclas que me permiten desplazarme al final del documento son CTRL+FIN.

v  Las teclas que me permiten desplazarme de palabra en palabra son Ctrl + Flecha Izquierda

  o con Ctrl + Flecha Derecha

v  Las teclas que me permiten seleccionar todo el documento trabajado son

CTRL+E en office  (Para StarOffice: CTRL + A)

v  Las teclas para definir interlineado sencillo son: CTRL+1.

v  Las teclas para definir interlineado doble son: CTRL+2.

v  Las teclas para definir interlineado a 1.5 espacios son: CTRL+5.


martes, 19 de octubre de 2021

Los metadatos y paradatos

 

¿Qué son los metadatos?

Los metadatos (del griego μεταmeta, 'después de, más allá de​ y latín datum, 'lo que se da', «dato»​), literalmente «sobre datos», son datos que describen otros datos. En general, un grupo de metadatos se refiere a un grupo de datos que describen el contenido informativo de un objeto al que se denomina recurso.



Los metadatos son datos sobre datos. En otras palabras, es información que se usa para describir los datos contenidos en algo como una página web, documento o archivo. Otra forma de pensar en los metadatos es como una breve explicación o resumen de lo que son los datos.

Un ejemplo simple de metadatos de un documento podría incluir una colección de información como el autor, el tamaño del archivo, la fecha en que se creó el documento y las palabras clave para describir el documento. Los metadatos de un archivo de música pueden incluir el nombre del artista, el álbum y el año de su lanzamiento.

Para los archivos de computadora, los metadatos se pueden almacenar dentro del archivo en sí o en otro lugar, como es el caso de algunos archivos de libros EPUB que mantienen los metadatos en un archivo ANNOT asociado.

Los metadatos representan información detrás de escena que se utiliza en todas partes, por todas las industrias, de múltiples maneras. Es omnipresente en los sistemas de información, las redes sociales, los sitios web, el software, los servicios de música y la venta minorista en línea. Los metadatos se pueden crear manualmente para seleccionar y elegir lo que se incluye, pero también se pueden generar automáticamente en función de los datos.

Los metadatos describen elementos HTML invisibles que comunican directamente y aclaran la información del sitio web para los motores de búsqueda, desempeñando un papel fundamental en la optimización eficaz del motor de búsqueda para los minoristas. Esta serie de microcomunicaciones incluye títulos de páginas, etiquetas de descripción y otros protocolos, y pueden describir propósitos, características y contenido general.

Son una forma estructurada de comunicar información sobre un conjunto de datos, que se utiliza en una variedad de entornos con especial relevancia para las empresas de comercio electrónico.

Etimología del término

La etimología de este término consta de dos palabras, una griega y otra latina. Por un lado la palabra griega “meta”, que significa después de o más allá de, y por otro lado el vocablo latino “datum”, que significa dato. Por tanto, la expresión metadatos significa más allá de los datos.

Según esta etimología, metadatos son un conjunto de datos que describen el contenido informativo de un recurso, de archivos o de información de los mismos. Es decir, es información que describe otros datos. Pero no existe una sola definición de metadatos, son varias las expresiones con las que se conoce, como informaciones sobre datos, informaciones sobre informaciones o datos sobre informaciones.

“Metadatos” es una palabra bastante nueva (apareció en la segunda mitad del siglo XX), mientras que “datos” se remonta a mediados del siglo XVII.

Características de los metadatos

Entre las principales características de los metadatos se encuentran las siguientes:

  • Son paquetes de información altamente estructurados que explican contenido, calidad y características de los datos del sitio web.
  • Son precisos y en muchos casos cortos e integrados por palabras simples.
  • Ofrecen puntos de acceso a la información del sitio web.
  • Codifican la descripción del sitio web.

¿Para qué sirven?

Los metadatos sirven para una variedad de propósitos, siendo el descubrimiento de recursos uno de los más comunes. Aquí, se puede comparar con una catalogación efectiva, que incluye identificar recursos, definirlos por criterios, reunir recursos similares y distinguir entre los que son diferentes.

También es un medio eficaz para organizar los recursos electrónicos, que es un uso importante dado el crecimiento de los recursos basados ​​en la Web. Normalmente, los enlaces a los recursos se han organizado como listas y se han creado como páginas web estáticas, con los nombres y recursos codificados en HTML. Sin embargo, una práctica más eficaz es utilizar metadatos para crear estas páginas. Para fines web, la información se puede extraer y reformatear mediante el uso de herramientas de software.

Otro uso de los metadatos es como un medio para facilitar la interoperabilidad y la integración de recursos. El uso de metadatos para describir recursos permite su comprensión tanto por humanos como por máquinas. Esto permite los niveles más efectivos de interoperabilidad, o cómo se intercambian datos entre muchos sistemas con plataformas operativas, estructuras de datos e interfaces dispares. A su vez, facilita la búsqueda de recursos en la red.

Los metadatos también facilitan la identificación digital a través de números estándar que identifican de forma única el recurso que definen los metadatos. En esta línea, otra práctica es combinar metadatos para que actúen como un conjunto de datos identificativos que diferencian objetos o recursos, apoyando las necesidades de validación.

Finalmente, los metadatos son una forma importante de proteger los recursos y su accesibilidad futura. Es una preocupación crítica dada la fragilidad de la información digital y su susceptibilidad a la corrupción o alteración. Para fines de archivo y preservación, toma elementos de metadatos que rastrean el linaje del objeto y describen sus características físicas y comportamiento para que pueda replicarse en tecnologías en el futuro.

Tipos de metadatos

Los metadatos son una herramienta a través de la que las empresas que dominan una gran cantidad de información obtienen la ayuda necesaria para organizar esa información y facilitar el trabajo de los usuarios, incrementando su productividad.

Estos son los principales tipos de metadatos:

Según su función

Según la función que tengan esos metadatos, se dividen en:

Lógicos

Son datos que explican de qué forma los datos simbólicos pueden utilizarse para hacer deducciones de resultados lógicos, por lo que se caracterizan por la compresión.

Simbólicos

Son los datos que detallan los datos subsimbólicos, por lo que introducen sentido.

Subsimbólicos

Son aquellos datos que no contienen ninguna información sobre su significado.

Según su variabilidad

En este caso, los metadatos se dividen en dos tipos:

Inmutables

Son los datos que no cambian independientemente de la parte del recurso que sea visible.

Mutables

Son los datos diferentes de los demás e incluso difieren de parte a parte.

Según su contenido

En este caso, los metadatos son fraccionados por su contenido. Así, se da la opción de diferenciar entre los metadatos que detallan el recurso en sí y los metadatos que describen el contenido de ese recurso.

¿Cuál es el ciclo de vida de los metadatos?

Los metadatos tienen un ciclo de vida que va detallando cada etapa por la que pasan, haciendo determinadas labores en cada una de ellas. Así, en este aspecto podemos diferenciar el ciclo de vida de los metadatos en tres fases:

  • Creación: en esta etapa es cuando se crean los metadatos. Estos pueden desarrollarse de diferentes maneras:
    • Manualmente: puede llegar a ser un procedimiento un tanto complicado, aunque todo depende del formato que se utilice y del volumen que se esté buscando. De todos modos, es más usada cualquiera de las otras dos formas de creación que detallamos a continuación.
    • Forma automática: en este caso, el software recibe toda la información requerida por sí solo, es decir, sin ningún tipo de ayuda externa. Sin embargo, a pesar de los avances tecnológicos en cuanto a los algoritmos que se emplean en este aspecto, es poco viable que el ordenador consiga por sí mismo, sacar todos y cada uno de los metadatos de manera automática. Así que esta forma tampoco llega a ser la más adecuada, aunque también se use de forma frecuente.
    • Forma semiautomática: esta es la manera ideal para crear metadatos. Mediante este sistema se establecen una serie de algoritmos autónomos que sostiene el usuario en cuestión y que no permiten que el software pueda sacar por sí mismo los datos deseados, sino que necesita ayuda externa para ello.
  • Manipulación: en esta fase se realizan cambios en determinados aspectos. Por ello, si los datos en cuestión cambian, los metadatos también deben cambiar y esto se realizará fácilmente y de manera automática, aunque hay ocasiones en las que se necesita ayuda humana para llevar a cabo esta labor.
  • Destrucción: como última fase que puede realizarse en la vida de los metadatos está la destrucción de los mismos. En este caso hay que estudiar bien la manera de hacerlo. Existen distintas formas de quitar metadatos. En determinadas ocasiones se eliminan los metadatos a la misma vez que sus recursos de manera conjunta. Sin embargo, hay otras situaciones en las que se conservan los metadatos por diferentes motivos, como por ejemplo para controlar las modificaciones en un documento.

¿Cómo se almacenan?

Los metadatos se pueden almacenar en una variedad de lugares. Cuando los metadatos se relacionan con bases de datos, los datos a menudo se almacenan en tablas y campos dentro de la base de datos.

A veces, los metadatos existen en un documento especializado o en una base de datos diseñada para almacenar dichos datos, denominada diccionario de datos o repositorio de metadatos. Hay algunos tipos de archivos de datos especializados que incluyen tanto los datos brutos como los metadatos.

De manera más general, los metadatos se pueden almacenar en cualquier lugar (por ejemplo, en correos electrónicos, cuestionarios, instrucciones de recopilación de datos u hojas de cálculo).

Ventajas de una correcta gestión de metadatos

Invertir en el desarrollo de metadatos puede generar beneficios en tres áreas clave:

  • Puede extender la longevidad de los datos. La vida útil de un conjunto de datos típico puede ser muy corta, a menudo porque los metadatos relevantes faltantes o no disponibles lo hacen inútil. Cuando se desarrollan y mantienen metadatos completos, se contrarresta la entropía y la degradación de datos típicas.
  • También facilita la reutilización y el intercambio de datos. Los metadatos son clave para garantizar que los datos muy detallados o complicados sean interpretados, analizados y procesados ​​más fácilmente por el creador de los datos y otros.
  • Los metadatos son esenciales para mantener registros históricos de conjuntos de datos a largo plazo, compensando las inconsistencias que pueden ocurrir en la documentación de datos, personal y métodos. También pueden permitir que los conjuntos de datos diseñados para un solo propósito se reutilicen para otros fines y a largo plazo.

Desarrollar y mantener metadatos puede ser una propuesta costosa. Existen costes asociados con la edición y publicación de datos y metadatos. Su administración y mantenimiento a largo plazo también puede resultar engorroso. Sin embargo, los metadatos son una inversión que puede no ser opcional en una era en la que la información es fundamental para la fuerza vital de una organización.

Ejemplos de metadatos

Aquí tienes un ejemplo detallado de metadatos.

Acabas de tomar una foto de un oso en el bosque. La subes a tu computadora y la colocas en tu base de datos de imágenes. Para encontrarlo rápidamente, utilizarás los descriptores de metadatos para buscar la foto en el futuro. Esto es especialmente importante porque tienes muchas otras fotografías de osos y quieres poder recordar algunas específicas.

Los metadatos ayudan a acotar su búsqueda utilizando descriptores que identifican la imagen. Primero, se anota la fecha en que se tomó la foto y el autor. Esta fecha da una buena base de dónde comenzar tu búsqueda de la imagen. A continuación, se pueden adjuntar a la imagen algunas palabras clave como oso o bosque. Estos son sus metadatos. Usando una combinación de las palabras clave de metadatos, podrás encontrar las imágenes exactas. Estos tipos de metadatos se incluyen en la categoría “descriptiva”.

Otros ejemplos de uso de metadatos son los siguientes:

Búsquedas de metadatos y sitios web

Los metadatos incrustados en los sitios web son de vital importancia para el éxito del sitio. Incluye una descripción del sitio web, palabras clave, metaetiquetas y más, todos los cuales juegan un papel en los resultados de búsqueda.

Algunos términos de metadatos comunes que se utilizan al crear una página web incluyen metatítulo y meta descripción. El metatítulo explica brevemente el tema de la página para ayudar a los lectores a comprender qué obtendrán de la página si la abren. La meta descripción es más información, aunque breve, sobre el contenido de la página.

Ambas piezas de metadatos se muestran en los motores de búsqueda para que los lectores tengan una idea rápida de lo que trata la página. El motor de búsqueda utiliza esta información para agrupar elementos similares, de modo que cuando busque una palabra clave específica o un grupo de palabras clave, los resultados sean relevantes para su búsqueda.

Los metadatos de una página web también pueden incluir el idioma en el que se escribió la página, como si es una página HTML.

Metadatos para seguimiento

Los minoristas y los sitios de compras en línea utilizan metadatos para rastrear los hábitos y movimientos de los consumidores. Los especialistas en marketing digital siguen cada uno de tus clics y compras, almacenando información sobre ti, como el tipo de dispositivo que usas, tu ubicación, la hora del día y cualquier otro dato que puedan recopilar legalmente.

Con estos metadatos crean una imagen de tu rutina e interacciones diarias, tus preferencias, tus asociaciones y tus hábitos, y pueden usar esa imagen para comercializar sus productos.

Los proveedores de servicios de Internet, los gobiernos y cualquier otra persona con acceso a grandes colecciones de información de metadatos podrían utilizar los metadatos de páginas web, correos electrónicos y otros lugares donde hay usuarios en línea para monitorizar la actividad web.

Dado que los metadatos son una breve representación de los datos más grandes, esta información se puede buscar y filtrar para encontrar información sobre millones de usuarios a la vez y rastrear cosas como incitación al odio, amenazas, etc. Se sabe que algunos gobiernos recopilan estos datos , incluidos no solo el tráfico web, sino también las llamadas telefónicas, la información de ubicación y más.

Metadatos en archivos de computadora

Cada archivo que guardas en tu computadora incluye información básica sobre el archivo para que el sistema operativo entienda cómo manejarlo, y para que tu u otra persona pueda recopilar rápidamente de los metadatos cuál es el archivo.

Por ejemplo, en Windows, cuando ve las propiedades de un archivo, puede ver claramente el nombre del archivo, el tipo de archivo, dónde está almacenado, cuándo fue creado y modificado por última vez, cuánto espacio ocupa en el disco duro, quién es el propietario del archivo y más.

La información puede ser utilizada por el sistema operativo así como por otros programas. Por ejemplo, puedes usar una utilidad de búsqueda de archivos para encontrar rápidamente todos los archivos en tu computadora que se crearon en algún momento de hoy y que pesen más de 3 MB.

Metadatos en las redes sociales

Cada vez que haces amigo de alguien en Facebook, escuchas la música que Spotify recomienda para ti, publicas un estado o compartes el tweet de alguien, los metadatos funcionan en segundo plano.

Los metadatos online son útiles en situaciones de redes sociales muy específicas, como cuando estás buscando a alguien en Facebook. Puedes ver una imagen de perfil y una breve descripción del usuario de Facebook para aprender solo los conceptos básicos sobre él antes de decidirte a hacerle amigo o enviarle un mensaje.

Gestión de bases de datos y metadatos

Los metadatos en el mundo de la gestión de bases de datos pueden abordar el tamaño y el formato u otras características de un elemento de datos. Es fundamental interpretar el contenido de los datos de la base de datos. El lenguaje de marcado extensible (XML) es un lenguaje de marcado que define los objetos de datos utilizando un formato de metadatos.

Por ejemplo, si tienes un conjunto de datos con fechas y nombres distribuidos por todas partes, no puedes saber qué representan los datos o qué describen las columnas y filas. Con metadatos básicos como nombres de columnas, puedes echar un vistazo rápidamente a la base de datos y comprender qué está describiendo un conjunto particular de datos.

Si hay una lista de nombres sin metadatos para describirlos, podría ser cualquier cosa, pero cuando agregas metadatos en la parte superior que dice “Ex Empleado”, ahora sabes que esos nombres representan a todos los empleados que han sido despedidos. La fecha junto a ellos también puede entenderse como algo útil como “Fecha de terminación” o “Fecha de contratación”.

Herramientas para encontrar metadatos

Aquí tienes varias herramientas que puedes utilizar para encontrar metadatos.

FOCA

FOCA es una herramienta que se utiliza principalmente para encontrar metadatos e información oculta en los documentos. Estos documentos pueden estar en páginas web y pueden descargarse y analizarse con FOCA.

Es capaz de analizar una amplia variedad de documentos, siendo los más comunes los archivos de Microsoft Office, Open Office o PDF, aunque también analiza archivos de Adobe InDesign o SVG, por ejemplo.

Estos documentos se buscan mediante tres posibles motores de búsqueda: Google, Bing y DuckDuckGo. La suma de los resultados de los tres motores equivale a muchos documentos. También es posible agregar archivos locales para extraer la información EXIF ​​de los archivos gráficos, y se realiza un análisis completo de la información descubierta a través de la URL incluso antes de descargar el archivo.

Octopai

Octopai es una solución de automatización de gestión de metadatos multiplataforma centralizada que permite a los equipos de datos y análisis descubrir y controlar los metadatos compartidos.

El producto realiza un escaneo de metadatos al recopilarlos automáticamente de ETL, bases de datos y herramientas de informes. Los metadatos se almacenan y administran en un repositorio central, y un motor inteligente que utiliza cientos de rastreadores busca todos los metadatos y presenta los resultados rápidamente.

Octopai se utiliza mejor para casos de uso en inteligencia empresarial, gobernanza y catalogación de datos.

Infogix

Infogix ofrece un conjunto de capacidades integradas de gobernanza de datos que incluyen glosarios comerciales, catalogación de datos, linaje de datos y gestión de metadatos.

La herramienta también proporciona cuadros de mando personalizables y flujos de trabajo de código cero que se adaptan a medida que madura cada capacidad de datos de la organización. Los clientes de referencia utilizan Infogix para la gobernanza de datos y para la gestión de riesgo, cumplimiento y valor de datos.

El producto también es flexible y fácil de usar, y también admite trabajos de análisis de datos más pequeños.

Collibra

El diccionario de datos de Collibra documenta los metadatos técnicos de una organización y cómo se utilizan. Describe la estructura de un dato, su relación con otros datos y su origen, formato y uso.

La solución sirve como un repositorio de búsqueda para los usuarios que necesitan comprender cómo y dónde se almacenan los datos y cómo se pueden utilizar. Los usuarios también pueden documentar roles y responsabilidades y utilizar flujos de trabajo para definir y mapear datos. Collibra es único porque el producto se creó pensando en los usuarios finales empresariales.

Alex Solutions

Es un catálogo de datos empresariales unificados agnósticos en tecnología. Cuenta con un glosario empresarial que permite a los usuarios definir y mantener términos comerciales clave y vincularlos a activos, procesos y resultados de datos físicos.

La calidad de los datos basada en políticas combina el linaje de los datos con la creación de perfiles de datos y el etiquetado inteligente basado en el aprendizaje automático. Alex también ofrece etiquetado inteligente que ayuda a los usuarios a agregar contexto comercial a los activos de datos físicos. La implementación y la integración son simples y la interfaz de usuario del producto es amigable para los usuarios comerciales.

IBM InfoSphere Metadata Workbench

Los analistas de datos y empresas utilizan Infosphere Metadata Workbench de IBM para explorar y analizar las relaciones entre los activos de información y el repositorio de metadatos. Su eficiencia proviene de su capacidad para proporcionar análisis de impacto con una visión general de los efectos que producen los cambios en los entornos de gestión de la información.

 

PARADATOS

Se conoce como paradatos al conjunto de datos que se genera durante la interacción entre un usuario y un recurso o servicio de un escenario educativo (un entorno virtual de aprendizaje, repositorio, red social, etcétera). En función del recurso o servicio accedido y las operaciones realizadas con el mismo, los paradatos generados contendrán más o menos información. Esta información se puede almacenar para ser posteriormente analizada, con el objetivo de comprender mejor cómo los usuarios interactúan en dicho escenario educativo, detectando posibles problemas, así como oportunidades de mejora tanto del propio escenario educativo y de las herramientas utilizadas como del entendimiento del proceso que siguen los usuarios en el mismo. A partir del análisis realizado, es posible entonces construir, entre otros, sistemas de recomendación, esquemas de reputación, visualizaciones de la interacción, etc.

Por ejemplo, si un usuario se descarga un documento de un repositorio de objetos de aprendizaje, será posible saber que el usuario U ha descargado el documento D en el momento T. Esta información puede usarse para detectar aquellos recursos más descargados o, por el contrario, aquellos que nunca son accedidos por los usuarios, pero también conocer en qué épocas del semestre académico se produce una mayor utilización del repositorio. Otra posibilidad es si un usuario U evalúa un recurso R con una valoración X en el momento T, por ejemplo, un comentario en un grupo de Facebook. Esto permite conocer los comentarios mejor o peor valorados por los usuarios, así como los usuarios más activos.

En general, el objetivo es guardar la interacción de los usuarios con el sistema en forma de tuplas (U, T, S, R, X): un usuario U en el momento T utiliza un servicio S sobre un recurso R con un resultado X. Esta es la mínima información que debe ser almacenada para su posterior análisis.