lunes, diciembre 11, 2006

Recurso de información

Navegando, buscando informacion de DTDs he encontrado una tesis muy completa que no solo habla de ellos, sino que practicamente toca todos los temas relacionados con el mundo digital y de internet. Aqui reproduzco un trocito de su indice y os dejo el enlance porque es un filon de informacion importante, ademas que tiene un monto de herramientas para desplazarse entre sus contenidos. Eso si, leele la advertencia sobre descarga que aparece al final de cada pagina. Es importante.
  • Parte del indice:
El gran hipertexto: la WWW
Lenguajes hipertextuales
Estructura de un hipertexto
El documento hipertextual
Descripción del documento hipertextual
Catalogación de hipertextos
Indización y clasificación de hipertextos
Resumen de hipertextos
Búsqueda y recuperación del documento hipertextual
Hacia la Web Semántica
Nuevos conceptos

DTDs y Archivos o como los lenguajes de marcados nos ayudan a recuperar doc. II

Seguimos con los metadatos (aunque no lo parecezca por el titulo). El punto en el que me quede fue en su gran variedad, no solo a raíz de cumplir todas las funciones que mencione en "Mucho más que recuperar información", sino que según el tipo de documento se aplican una serie de metadatos u otro. No es lo mismo catalogar una revista que un libro, o para adaptarnos al mundo digital, no es lo mismo ponerle metadatos a un pdf que a un sitio web completo (se que es obvio, pero este es un bloc de documentacion para no documentalistas ni relacionados con el mundillo). Ambos documentos tiene una naturaleza distintas, cosas que necesitan ser descritas en unos, no existen en otros.
Por ello se ha desarrollado las DTDs o Definiciones de Tipo de Documento (siglos en ingles, claro) que no son nada nuevo ni pertenencen la campo de las ciencias de la informacion, sino que es algo puramente informatico, que los documentalista han cogido para solucionar problemillas como la inclusión de documentos en papel en la web o el tratamiento adecuado de estos en la inmensa maraña que es la web (Creedme: la web necesita un batallon de documentalistas con urgencia)
A lo que iba. Una de estas DTD son las EAD, especialmente pensadas para la descripcion de archivos, para que todos los elementos que deben ser descritos se describan sin faltar ninguno, y se describan como deban describirse para que la colección de archivos no pierdan algun datos importante en su organización, y por lo tanto, en el contexto de ese documento en esa colección, ya que uno de los principio basicos de la archivistica, sin el cual cada uno de los documentos se desvirtuaria y careceria de sentido. Insisto tanto en ello para señalar que en un archivo cada uno de los documentos esta relacionado unos con otro de manera indisoluble, y por lo tanto, no sirve cualquier cosa para su descripción.
Un inciso: ¿para que describimos, es decir, por qué hago tanto hincapie en la necesidad de la descripcion? Respuesta simple: sin descripcion no hay documento, no se puede localizar, y por lo tanto se pierde, no existe. Asi pues si un archivo desea digitalizar su fondo, primero debe de pensar (aparte de muchisimas cosas mas, tantas que haria falta un manual entero y no una entrada de un blog) en los intrumentos de descripcion que va a usar en ese entorno digital en el que se va a mover el archivo. Y ahi es donde entra la DTD o la EAD, en concreto. Sin embargo, sabed que esta no es la unica DTD para archivos que existe. Estan NEDA, que es una adaptacion española de la EAD hecha por el Ministerio de Cultura (ya que parece ser que nadie -los archiveros- se animaba a utilizar la primera) y MoREq.
Enlances para ampliar informacion sobre ellas, estan recogidos en Notas de Clase. Aqui solo os dejo un link refererido a la EAD, de la revista digital hipertext.net, y un tutorial donde se desarrolla el concepto de DTD alojado en la Universidad de las Palmas de Gran Canaria. Eso si, es 100% de Informatica.

sábado, diciembre 02, 2006

Contexto del Modelo OAIS

El otro dia me dia cuenta de que no habia explicado de donde salia y que era en palabras sencillas el modelo OAIS o Sistema abierto de informacion en archivos (una traducción al español mucho mas exacta que la que hice muy subgeneris en la exposicion, extraida de Teresa Silió), y como este blog pretende explicar lo más llanamente posible los puntos de unión entre la tecnologia y la documentacion, es casi obligado escribir esta entrada.
Su demominación puede llevar a equivoco en principio, por lo de sistema abierto de archivo, ya que parece relacionarse con la iniciativa de archivos abiertos, pero en realidad lo unico en lo que coindicen ambos iniciativas en que tratan de sistema de archivos porque el sentido de la palabra abierto tiene diferentes significados en uno y en otros. En la inicitiva de OAI se refiere al acceso libre de la informacion guardada, pero en el modelo OAIS se refiere al caracter no definido del propio sistema de gestión, es decir su naturaleza flexible y no cerrada para poder adoptarla a las caracteristicas propias de la organización o de los propios documentos que se van a gestionar.
La ISO (International Organization for Standardization), la organización que marca la pauta de como se tienen que realizar cualquier proceso en cualquier campo o área para garantizar cierta calidad, encargo al Consultative Committe for Data Space System, otro organismo internacional formado por más de 50 agencias espaciales, (CCDSS) la realizacion de este modelo, y así nació.
Si quereis saber más información respecto a ambos (OAIS y OAI) aqui os dejo este documento para que le echeis un vistazo.

Fundamentos tecnológicos del acceso abierto: Open Archives Initiative y Open Archival Information System, de Teresa Silió

(Ojala lo hubiera encontrado antes para la exposición porque contiene información muy clara) Además también aclara y contextualiza conceptos como el DOI (Digital Object Identifiers), el CrossRef, usado por los editores para enlazar la citacion de un articulo o revista con su DOI, y el OAI-PHM, un protocolo, componente del OAI que sirve "para la extracción de normalizadade los metadatos que están accesibles en los repositorios que cumplen el estándar Dublin Core", que a su vez es un modelo de metadatos muy utilizado en bibliotecas. Como veís, aquí todo se relaciona con todo.

martes, noviembre 28, 2006

Fuentes del modelo OAIS

Pues aquí estan las fuentes que he utilizado. Tambien os pongo la direccion del modelo en ingles para los que seais más atrevidos o les interese:




Modelo OAIS (Open Archival Information Systems)

Este es el tema que elegí en la exposicion de Perservación digital y queria colgar parte de él en el blog por si alguien en un futuro se encuentra en la tesitura de buscar informacion en español sobre él, ya que se que actualmente no hay mucha. Además es una explicación muy sencilla de como funciona el modelo, ya que por ahora, el documentos original esta en un ingles muy técnico y no hay quien entienda nada. Las fuentes irán arriba, porque esta entrada ya va a quedar bastante larga. Además, es otra muchas de como la documentacion se relaciona con las TIC.
Ahi va:

"El modelo no es solo una serie de pautas de conservación y almacenamiento de objeto digitales, sino que conlleva también todo un proceso de gestión de esos objetos digitales que se almacenara en el sistema. Establece tres fases:
  • Adquisición (ingest): los documentos, después de haber pasado por la selección y valoración previa que también incluye este modelo, se transforman los documentos originales en objetos digitales conservables. Es la primera transformación. Esto significa que debe de haber una verificación previa del documento digital para poder pasar formar parte del repositorio con garantías. Implica:
    • validadacion de la sintaxis
    • cumplimiento de reglas de integridad en bases de datos
    • ausencia de elementos dañinos: virus, contraseñas y compresiones

  • Conservación (archival storage): se lleva a cabo en un repositorio digital seguro y tiene que establecen de forma periódica medidas o mecanismos para comprobar si hay errores y que el documento conserva la legibilidad. Es decir, estas medidas serían las encaminadas a evitar la obsolescencia tecnología de hardware y software, y este modelo no se decanta por una o por otra, sino que en función de la que se adopta de todas las que se barajan (emulación, migración o preservación) se aplicaran unos mecanismos de conservación u otros:
    • Preservación de la tecnología - no se aplica ninguna transformación en el código que soporta el documento
    • Emulación - se aplica una modificacion del codigo del entorno tecnológico (hardware y software)
    • Migración – se aplica una transformación del código fuente de documento.
  • Recuperación de información: Se lleva a cabo en tres etapas, puesto que los documentos no están en un formato ni en un repositorio al que puedan acceder los usuarios. Así que se generan estas fases.
    • Búsqueda del documento en el catalogo o inventario generado en el propio sistema a partir de los metadatos.
    • Conversión del documento a un formato que permita su difusión
    • Traslado de ese documento a un área del sistema accesible para los usuarios durante el tiempo de consulta"



domingo, noviembre 26, 2006

Mucho mas que recuperar información

Los metadatos no solo tiene la utilidad de asignar al documento una serie de etiquetas o campos cuyo contenido serán los que describan al documentos para su posterior localización, sino que también ofrecen mucha más informacián. Ésto es lo que he descubierto al hacer el trabajo de Perservación digital. Los metadatos no solo describen el contenido del documento, sino que también lo hacen con el entorno en el que fue creado: con qué programa concreto, en qué hardware concreto, qué organización lo hizo, para qué cometido, si ha estado guardado en dónde y durante cuanto tiempo, y si tiene relaciones con otros documentos y en ese caso, cuáles.
Ademas informan sobre las medidas de seguridad o autentificación del documento que se han tomado para constatar que la informacion en el contenida no se ha modifica.
Todos estos datos y algunos más que se me escaparan sirven no solo para identificar al documento, sino también que ayudan a su perservación, ya que resulta fundamental saber el entorno de creacion de un documentos a nivel tecnologico y a nivel de contexto (quién, cuando y para que lo hizo) para decidir en primer lugar si lo conservamos y, en segundo cómo y cuánto.

domingo, noviembre 19, 2006

Documatica Existe!!

Mirando y buscando cosas de preservacion para la exposion del lunes, me he encontrado con algo sorprendente: una introduccion a la documatica. Puse la categoria entre comillas porque pense que el termino como tal no existía, pero leyendo este manual creado por el profesor Tramullas de la Universidad de Zaragoza, recoge la definicion de este termino, ademas de desarrollar aspectos referentes a esta area, y voy a quitar las comillas.

Esta muy bien y lo mas importante, accesible en su totalidad en linea.
"Introcucción a la Documentación"

jueves, noviembre 16, 2006

Como los lenguajes de marcado pueden ayudar a recuperar documentos I

Que a nadie le despite eso de los lenguajes de marcado. Por si alguien no los conoce con ese nombre, dire que son los tipicos que todos conocemos, esos que estan detras de cada documento de internet que se crea: html y xml. Y los buscadores para localizar estos documentos en la web rastrean en ese codigo para recuperar informacion.
Sin embargo, este codigo no esta pensado para eso, es decir, en la mayoria de ocasiones no cuenta con las suficientes etiquetas o campos para que el contenido del documento se refleje en ellas, ya que en realidad la informacion que aporta es para que el software oportuno se sienta comodo y sepa qué es qué. Si bien, los buscadores tambien buscan en el texto completo del propio documento (ya que tambien esta en el codigo) ésto es bastante inutil, debido a que los buscadores no saben ni mucho menos diferenciar los contextos. (Por ello se esta llevando a cabo proyectos entorno a la llamada web semantica, que trata de solventar este tema.)
Por eso hay que establecer una serie de etiquetas dentro de ese codigo para que los buscadores puedan darnos una respuesta que se ajuste lo mas posible a lo que pedimos. A esas etiquetas se les ha llamado Metadatos y aun estan en proceso de difusion. Hay de muchos tipos diferentes porque cada tipo de documento necesita unos metadatos diferentes.
En proximas entradas, seguire hablando del tema.

miércoles, noviembre 15, 2006

Rumbo del blog

Hoy (ya se un pelin tarde) me se ha ocurrido el enfoque que voy a darle a este blog. Como dice arriba, debajo del titulo, va a explorar los puntos de unión, que son muchos, que hay entre la informatica y la documentacion; cómo la informática y las nuevas tecnologias se han fusionado hasta tal punto con las ciencias de la informacion (documentacion, biblioteconomia y archivistica) que ya no se puede realizar tareas propias de estas disclipinas sin recurrir a cuestiones puramente tecnologicas.
Nosotros, es decir, la gente que por razon u otra esta relacionada con el mundo de la documentación (incluyo aqui a la demas ciencias afines: biblioteconomia y archivista, no se me mosqueen) estos no resulta ser nada nuevo. Ya ni siquiera resulta ser motivo de discursion alguna (aunque en el mundo de la archivista, la cosa tuvo su miga), pero la gente ajena a este mundo, e incluso los propios profesionales de la informatica todavia siguen guardando la vieja imagen tradiccional del bibliotecario o archivero polvoriento que solo se ocupaba obsesivamente de que los documentos se conservaran como oro en paño.
Nada mas lejos de la realidad, ahora el profesional que se dedica a esta cuestiones es alguien que aparte de dar prioridad por encima (casi) de todo lo demas a la difusion de esa informacion, tiene que estar al tanto de los ultimos avances en el campo de las nuevas tecnologias, mas que nada porque es alli donde esta ahora la mayor parte de la informacion y donde cada dia se crean nuevos contenidos y documentos (podcast, blogs, canales y otros medios de creacion y difusion) Pero no solo eso, sino que ademas las propias tareas del profesional de la informacion (utilizo el termino para incluir a todos los pertenecientes a este area) le exigen manejar y entender mas herramientas informaticas que en otros puesto de trabajo que tambien manejan programas. Asi si un contable solo tiene que saber manejar como va el Contaplus, el Lotus en cualquier de su versión, y por supuesto el Excel, el profesional de la informacion, depende que en que puesto naturalmente, se le exige saber como funcionan las bases de datos que maneja, como se crean, se modifican, y gestionan los documentos que manejan en la empresa donde trabaje, sean estos de la tipologia que sean y con el programa o recurso informatico que se use para ello, ademas de editores de contenidos, sean graficos o textuales, e incluso lenguajes de programacion.
Por ello, y tal como esta expuesto en la cabecera (perdon que me haya desviado del un pellin) este blog va encaminado a mostrar cuán de relacinados están la documentacion y la informatica. Pido disculpas por anticipado si pasa por aquí cualquier informatico y ve alguna barbaridad. Es mas toda corrección y participacion de cualquier informatico que pueda aportar su punto de vista sera más que bien recibida.
Proxima entrada: Cómo los lenguajes de marcado nos ayudan a recuperar documentos.

Migracion!!!

Hoy nos hemos mudado a la nueva version beta de blogger.
Esta tiene mucho mejor aspecto, pero lo mas sobresaliente son los contenidos que puedes ir añadiendo como canales, listas, link de otros sitios web interesantes.
Asi que se la recomiendo a todo el mundo.

miércoles, octubre 25, 2006

Archivos de ayuntamientos en red.

Vamos a comentar como estan de avanzados cuatros ayuntamientos de la geografia española en relación con sus sistemas de documentacion eletronica a través de su web: Madrid, Barcelona, Girona y Arganda del Rey.

MADRID
En principio no parece haber un acceso a los archivos municipales desde la web. Solo nos ofrece informacion acerca de su ubicacion, como llegar..., datos de interes que hay que tener en cuenta para poder utilizarlo antes de ir directamente. Sin embargo, hay mas informacion sobre el Archivo General de la Villa (el archivo munipal de Madrid) dentro del acceso cultura y ocio/archivo y biblioteca. No obstante, solo nos dicen el cuadro de clasificiacion que tiene el archivo y los intrumentos de descripcion (inventarios, indices y catalogo) que utilizan, pero no nos da informacion sobre la norma de descripicon archivistica que utilizan
Sin embargo, se pueden realizar bastantes tramites en relación con bastantes areas: tributos y pagos municipales, incidencias con la higiene publica y medio ambiente, tramites relacionados con el padron. Ademas tambien se puede descargar impresos, solicitar duplicados de recibos y tasas abonadas, y pequeños programas que ayudan a calcular impuestos y tasas, junto por supuesto, solicitar el llamado certificado digital o firma electrónica para que tengan validez administrativo.

ARGANDA DEL REY
Este ayuntamiento no solo nos da una completa informacion general del archivo tanto como sus fondos, el cuadro de clasificacion y la norma de descripicon que utiliza que es la ISAD (G), sino que además tiene un catalogo on-line que permite la localizacion de documentos e incluso en ocasiones su visualizacion. Admas, estan accesibles tambien estudios historios, fotografias, peliculas y archivos sonoros en la web.
En relación a los tramites que se pueden relalizar a traves de la pagina parece que se limitan a la descarga de impresos en relacion con todo las gestiones de las que se ocupa el ayuntamiento en todas las areas, contando ademas con un buscador.

GIRONA
Este ayuntameinto tambien nos proporciona tanto una informacion general bastante completa como una posibilidad de busqueda de sus fondos aun mejor que la del ayuntamiento de arganda del rey, ya que esta estructurado por pasos en los que se va decidiendo la forma de busqueda y poco a poco se va acotando esa busqueda sin el que interesado sea apenas conciente ello. Eso lo hacen posible los combos y menus en los que hay que elegir. Ademas, en algunos documentos, como peliculas se puede visualidar unos poco segundo de la misma, y en otros, accedes a una descripción de la serie o del expediente o documentos que has hallado.
En relacion con las gestiones no solo se puedes decargar impresos, sino realmente realizar los tramites y pagos de impuesto en la propia web a partir del DNI y de un PIN, proporcionado por el ayuntamiento en situ.

BARCELONA
De igual manera en este ayuntamiento se puede consultar y en ocasiones tramitar on-line muchas de las cuestiones que un municipio tan grande tiene a su cargo. Dispone tambien de un buscador, pero no es la unica forma de acceso como ocurre en el ayuntamiento de Arganda, sino que esta en forma de lista por areas tematicas, mucho mas facil para los interesados.
En relacion con el archivo, se encuentran en la red englobados el historico de barcelona, el municpal, los archivos de los distintos distritos de la ciudad de barcelona, aunque se encuentre en diferente localizaciones. Se hace una descipcion de los fondos, es decir, en cada una de las paginas a las que accedemos por estos enlaces nos cuentan las series que tiene el fondo ademas de acceder a los inventarios en pdf.

miércoles, octubre 18, 2006

Archivando registros electronico

Ese es el titulo de un articulo en el se hace una panoramica de como esta la situacion actual de los archivos eletronico que se crean a partir de la inclusion de las TIC en la administracion publica y privada. Resulta curioso como este hecho, que si bien es importante, practicamente ha vuelto del reves todas los estructuras sobre las que se basaba la profesion archivistica, y ahora para gestionar estos documentos, no solo hace falta establecer nuevos metodos, sino inclusos nuevos conceptos para manejar algo que en realidad no es fisico, no es palpable, no parece estar en ninguna parte.
Quiza de este hecho vengan todas la dificultades que se desgrana en el articulo como la propia naturaleza del archivo electronico ( es decir, qué es lo que hay que tratar y conservar y qué es lo que hay que ignora de todo el maremagnun que se crea a nivel digital) y quién (¿el creador del documento, el gestor de informacion o conocimiento, el archivero?), cómo y cuándo (¿cuando ya no tiene valor primario -concepción del modelo ciclo de vida- o siempre si tomamos el modelo del record continuun?) tiene que realizar qué tareas (¿qué metadatos utilizamos?).
Quiza la parte mas peliaguada de toda esta serie de problemas encadenados sea el tema de la concervacion, puesto que como toda información, ésta depende de su mismo soporte. Siempre estaba el problema del deterioro del papel para la conservacion de la informacion, pero este problema endemico a toda información se multiplica con el documentos electronico con los multiples formato, la necesidad de tener equipo y sotfware para su visualizacion, y el hecho de ambos evolucionen de un forma tan rapida que la informacion de hoy no pueda ser leida mañana.
A este problema el autor repasa tres posible soluciones (conversion a formatos standard, migracion, y "emulacion") que cada una de ellas presenta sus ventajas y sus inconvenientes. Cual de ellas se adoptara (o incluso una cuarta que pueda surgir) dependera de los investigacion que se realicen a cabo para averiguar cual plantea menos inconveniente, o quiza solo de que una de ella sea mas accesible que las otras para entidades publicas y privadas.

miércoles, octubre 11, 2006

1ST CONTACT

HOLA!!
Avisar que este blog se ha creado solo y exclusivamente para la asignatura de sistemas avanzados, asi que si llegais a el buscando otra cosa, os lo comento para que no perdais el tiempo en este sitio.
Pero si me conoceis y en algun momento de locura transitoria os he hablado de él y por alguna extraña concatenacion de circunstancias (que me funcione el router de mi casa, que me aburra, que se me ocurra algo que poner...) decido añadir mas cosas, quizas este blog ya no sera solo y exclusivamente para la asignatura antes mencionada.
Ya veremos como termina esto... o mas bien si es que empieza.....
Hasta otra....(o no)