Lenguajes de etiquetas

Uno de los retos iniciales a los que se tuvo que enfrentar la informática fue el de cómo almacenar la información en los archivos digitales. Como los primeros archivos sólo contenían texto sin formato, la solución utilizada era muy sencilla: se codificaban las letras del alfabeto y se transformaban en números.

De esta forma, para almacenar un contenido de texto en un archivo electrónico, se utiliza una tabla de conversión que transforma cada carácter en un número. Una vez almacenada la secuencia de números, el contenido del archivo se puede recuperar realizando el proceso inverso.

Ejemplo sencillo de codificación de caracteres

Ejemplo sencillo de codificación de caracteres

El proceso de transformación de caracteres en secuencias de números se denomina codificación de caracteres y cada una de las tablas que se han definido para realizar la transformación se conocen con el nombre de páginas de código. Una de las codificaciones más conocidas (y una de las primeras que se publicaron) es la codificación ASCII. La importancia de las codificaciones en HTML se verá más adelante.

Una vez resuelto el problema de almacenar el texto simple, se presenta el reto de almacenar los contenidos de texto con formato. En otras palabras, ¿cómo se almacena un texto en negrita? ¿y un texto de color rojo? ¿y otro texto azul, en negrita y subrayado?

Utilizar una tabla de conversión similar a las que se utilizan para textos sin formato no es posible, ya que existen infinitos posibles estilos para aplicar al texto. Una solución técnicamente viable consiste en almacenar la información sobre el formato del texto en una zona especial reservada dentro del propio archivo. En esta zona se podría indicar dónde comienza y dónde termina cada formato.

No obstante, la solución que realmente se emplea para guardar la información con formato es mucho más sencilla: el archivo electrónico almacena tanto los contenidos como la información sobre el formato de esos contenidos. Si por ejemplo se quiere dividir el texto en párrafos y se desea dar especial importancia a algunas palabras, se podría indicar de la siguiente manera:

<parrafo>
Contenido de texto con <importante>algunas palabras</importante> resaltadas de forma especial.
</parrafo>

El principio de un párrafo se indica mediante la palabra <parrafo> y el final de un párrafo se indica mediante la palabra </parrafo>. De la misma manera, para asignar más importancia a ciertas palabras del texto, se encierran entre <importante> y </importante>.

El proceso de indicar las diferentes partes que componen la información se denomina marcar (markup en inglés). Cada una de las palabras que se emplean para marcar el inicio y el final de una sección se denominan etiquetas.

Aunque existen algunas excepciones, en general las etiquetas se indican por pares y se forman de la siguiente manera:

  • Etiqueta de apertura: carácter <, seguido del nombre de la etiqueta (sin espacios en blanco) y terminado con el carácter >
  • Etiqueta de cierre: carácter <, seguido del carácter /, seguido del nombre de la etiqueta (sin espacios en blanco) y terminado con el carácter >

Así, la estructura típica de las etiquetas HTML es:

<nombre_etiqueta> ... </nombre_etiqueta>

HTML es un lenguaje de etiquetas (también llamado lenguaje de marcado) y las páginas web habituales están formadas por cientos o miles de pares de etiquetas. De hecho, las letras “ML” de la sigla HTML significan “markup language”, que es como se denominan en inglés a los lenguajes de marcado. Además de HTML, existen muchos otros lenguajes de etiquetas como XML, SGML, DocBook y MathML.

La principal ventaja de los lenguajes de etiquetas es que son muy sencillos de leer y escribir por parte de las personas y de los sistemas electrónicos. La principal desventaja es que pueden aumentar mucho el tamaño del documento, por lo que en general se utilizan etiquetas con nombres muy cortos.

Facebook ahora permite ver fotos a pantalla completa Facebook tomó nuevas medidas para mejorar su reproducción de imágenes, mostrando las imágenes en alta resolución por defecto y permitiendo verlas en u...
Firefox 15, continuan las mejoras de memoria.. pero y la fragmentación Desde hace tiempo que el equipo de trabajo del navegador de Mozilla ha puesto su mejor esfuerzo en corregir la que es considerada por muchos usuarios ...
Llamadas de WhatsApp ya están disponibles Las llamadas de WhatsApp ya están disponibles para los usuarios de la popular aplicación de mensajería instantánea, siempre y cuando cuenten con la ...
Ranking Sistemas Operativos Octubre 2012 Entrados en el último cuarto del año, el conjunto de distros que componen lo que conocemos cono Linux ha logrado obtener unos buenos resultados acercá...
Compresor de archivos CSS & Javascript Minify and GZip Compress JavaScript & CSS tool es una sencillo compresor online disponible para ser usado por cualquier desarrollador interesado. ...
La NASA enviará un robot a Marte en 2020 La NASA lanzará un vehículo robótico en el año 2020 que tendrá una nueva misión: saber si Marte es un planeta con las condiciones necesarias para mont...
Firefox 13, beta El equipo de trabajo Firefox 13 acaba de liberar la primera beta de su popular navegador open source. Tras el reciente lanzamiento de una versión n...
mysql-fetch-lengths mysql_fetch_lengths — Devuelve la longitud de cada salida en un resultado Descripción array mysql_fetch_lengths ( int $id_resultado ) Devuelv...
Scripts to install web portals systems Joomla is an award-winning content management system (CMS), which enables you to build Web sites and powerful online applications. Many aspects, inclu...
WordPress 3.5, el mejor hasta ahora.. Cinco meses después del lanzamiento de la última versión final, el equipo de trabajo de Automattic lo tiene todo listo para la llegada del nuevo WordP...