jueves, noviembre 16, 2006

Como los lenguajes de marcado pueden ayudar a recuperar documentos I

Que a nadie le despite eso de los lenguajes de marcado. Por si alguien no los conoce con ese nombre, dire que son los tipicos que todos conocemos, esos que estan detras de cada documento de internet que se crea: html y xml. Y los buscadores para localizar estos documentos en la web rastrean en ese codigo para recuperar informacion.
Sin embargo, este codigo no esta pensado para eso, es decir, en la mayoria de ocasiones no cuenta con las suficientes etiquetas o campos para que el contenido del documento se refleje en ellas, ya que en realidad la informacion que aporta es para que el software oportuno se sienta comodo y sepa qué es qué. Si bien, los buscadores tambien buscan en el texto completo del propio documento (ya que tambien esta en el codigo) ésto es bastante inutil, debido a que los buscadores no saben ni mucho menos diferenciar los contextos. (Por ello se esta llevando a cabo proyectos entorno a la llamada web semantica, que trata de solventar este tema.)
Por eso hay que establecer una serie de etiquetas dentro de ese codigo para que los buscadores puedan darnos una respuesta que se ajuste lo mas posible a lo que pedimos. A esas etiquetas se les ha llamado Metadatos y aun estan en proceso de difusion. Hay de muchos tipos diferentes porque cada tipo de documento necesita unos metadatos diferentes.
En proximas entradas, seguire hablando del tema.