Lenguajes de etiquetas

Uno de los retos iniciales a los que se tuvo que enfrentar la informática fue el de cómo almacenar la información en los archivos digitales. Como los primeros archivos sólo contenían texto sin formato, la solución utilizada era muy sencilla: se codificaban las letras del alfabeto y se transformaban en números.

De esta forma, para almacenar un contenido de texto en un archivo electrónico, se utiliza una tabla de conversión que transforma cada carácter en un número. Una vez almacenada la secuencia de números, el contenido del archivo se puede recuperar realizando el proceso inverso.

Ejemplo sencillo de codificación de caracteres
Ejemplo sencillo de codificación de caracteres

El proceso de transformación de caracteres en secuencias de números se denomina codificación de caracteres y cada una de las tablas que se han definido para realizar la transformación se conocen con el nombre de páginas de código. Una de las codificaciones más conocidas (y una de las primeras que se publicaron) es la codificación ASCII. La importancia de las codificaciones en HTML se verá más adelante.

Una vez resuelto el problema de almacenar el texto simple, se presenta el reto de almacenar los contenidos de texto con formato. En otras palabras, ¿cómo se almacena un texto en negrita? ¿y un texto de color rojo? ¿y otro texto azul, en negrita y subrayado?

Utilizar una tabla de conversión similar a las que se utilizan para textos sin formato no es posible, ya que existen infinitos posibles estilos para aplicar al texto. Una solución técnicamente viable consiste en almacenar la información sobre el formato del texto en una zona especial reservada dentro del propio archivo. En esta zona se podría indicar dónde comienza y dónde termina cada formato.

No obstante, la solución que realmente se emplea para guardar la información con formato es mucho más sencilla: el archivo electrónico almacena tanto los contenidos como la información sobre el formato de esos contenidos. Si por ejemplo se quiere dividir el texto en párrafos y se desea dar especial importancia a algunas palabras, se podría indicar de la siguiente manera:

<parrafo>
Contenido de texto con <importante>algunas palabras</importante> resaltadas de forma especial.
</parrafo>

El principio de un párrafo se indica mediante la palabra <parrafo> y el final de un párrafo se indica mediante la palabra </parrafo>. De la misma manera, para asignar más importancia a ciertas palabras del texto, se encierran entre <importante> y </importante>.

El proceso de indicar las diferentes partes que componen la información se denomina marcar (markup en inglés). Cada una de las palabras que se emplean para marcar el inicio y el final de una sección se denominan etiquetas.

Aunque existen algunas excepciones, en general las etiquetas se indican por pares y se forman de la siguiente manera:

  • Etiqueta de apertura: carácter <, seguido del nombre de la etiqueta (sin espacios en blanco) y terminado con el carácter >
  • Etiqueta de cierre: carácter <, seguido del carácter /, seguido del nombre de la etiqueta (sin espacios en blanco) y terminado con el carácter >

Así, la estructura típica de las etiquetas HTML es:

<nombre_etiqueta> ... </nombre_etiqueta>

HTML es un lenguaje de etiquetas (también llamado lenguaje de marcado) y las páginas web habituales están formadas por cientos o miles de pares de etiquetas. De hecho, las letras “ML” de la sigla HTML significan “markup language”, que es como se denominan en inglés a los lenguajes de marcado. Además de HTML, existen muchos otros lenguajes de etiquetas como XML, SGML, DocBook y MathML.

La principal ventaja de los lenguajes de etiquetas es que son muy sencillos de leer y escribir por parte de las personas y de los sistemas electrónicos. La principal desventaja es que pueden aumentar mucho el tamaño del documento, por lo que en general se utilizan etiquetas con nombres muy cortos.

Google utilizará fotos y comentarios de usuarios en sus anuncios Google comenzará a probar una nueva fórmula publicitaria a partir del 11 de noviembre. Ya ya está dando mucho de qué hablar. Los de Mountain View h...
El Indice TIOBE de diciembre 2012 Objective-C sigue en aumento. Otros lenguajes de aplicaciones móviles teléfono, tales como C, C + + y Java están aumentando también, pero no lo sufici...
Mozilla Marketplace La tienda de aplicaciones de Mozilla se presentará durante la Mobile World Congress para iniciar su lanzamiento definitivo a lo largo de 2012. La F...
Microsoft podría comprar BlackBerry por 7000 millones de dólares No es la primera vez que aparecen rumores sobre una posible compra de BlackBerry, antes conocida como RIM, y de hecho hace unos meses, a principios de...
Twitter presenta acuerdo para darle poder a los verdaderos creadores de las patentes Twitter dio a conocer hoy un plan bautizado como “Acuerdo de los Innovadores de Patentes” (IPA), que promete usar las patentes creadas por sus ingenie...
Cómo reservar una copia gratis de Windows 10 Una nueva notificación le pide a los usuarios de Windows 7 y 8.1 que reserven una actualización del próximo sistema operativo, que llegará el 29 de ju...
Variables locales en PERL Las variables locales se pueden declarar en cualquier momento, y de ese modo una sub puede trabajar en ellas sin interferir en las que son usadas por ...
Facebook ya tiene mas de 1000 millones de usuarios La red social que comenzó como una comunidad de estudiantes ya tiene la misma cantidad de usuario que la sexta parte de los habitantes de todo el mund...
mysqli commit mysqli_commit, mysqli->commit — Completa la transacción actual Descripción Estilo por procedimientos: bool mysqli_commit ( mysqli $identi...
Científicos crean un transistor de un sólo átomo Un grupo de investigadores de la Universidad de New South Wales creó un transistor de un sólo átomo de fósforo, que podría abrir el camino a electróni...
Características básicas de XHTML
Tagged on: