miércoles, enero 17, 2007

Recursos de informacion sobre Google

Una de cal y otra de arena.
Aqui va un par de libro sobre Google muy buenos que he consultado para hacer el trabajo:
  • Taylor, Neil. Buscame: el sorprendente éxtio de Google. Gestión, Barcelona, 2006
  • Vise, David A. y Malseed, Mark. La historia de Google: los secretos del mayor éxito empresarial, mediático y tecnológico de nuestro tiempo. La esfera de los libros, Madrid, 2006
Y un articulo que he encontrado en mi recolección de fuentes, sobre el negocio de la búsqueda en general. Contextualiza brevemente a Google y a sus competidores, aunque esta algo atrasado:
  • Grau Moracho, Jordi y Guallar Delgado,Javier "El negocio de buscar en internet. Análisis del mercadode los buscadores en 2003" en eprints.rclis.org

Google: Punto nº 1:"Lo importante es pensar como sacar más publicidad"

Recientemente he encontrado dos artículos sobre el rumbo que puede tomar Google con su politica de publicidad. En el primero de ello de Libertad digital, la compañia famosa por su ética y transparencia esta empezando a abrir la mano: ahora deja elegir a los anunciantes donde poner su publicidad, lo que se puede la contextualización de ésta, y también deja a elección de estos el tipo que sea: banners por ejemplo, pero aún no pop-ups.
En el segundo, en baquia.com, el articulo titulado Hacia el Pc con orejas ya es para asustarse. Además todos los enlaces que contiene el propio articulo no tiene desperdicio. Me he quedado muy corta en el trabajo. Muy corta.

martes, enero 09, 2007

Google: Un empresa peculiar, pero no tanto

El capitulo 6 del libro de John Batelle Buscar: cómo Google y sus rivales han revolucionado los mercados y transformado nuestra cultura plantea varios interrogantes y dudas, además de mostrarnos la cara oculta del negocio que puede suponer la busqueda, no por el sitio en si, sino más bien porque son los que, sí tienen exito, envian a la gente a una dirección o a otro. Esto constituye un negocio que los buscadores en general llevan aprovechando desde que se crearon. (Algunos de los cuales se crearon especificamente para eso. Sino, vease el caso de GoTo.com o actualmente Overture). Sin embargo, Google es un caso atipico y un tanto peculiar, en cierto modo debido a la personalidad de sus dos fundadores, Larry Page y Sergey Brin, y su negocio no es precisamente ese, y aunque tardaron en encontarlo, les ha salido mas rentable que la manera tradicional.
Ya en 1999, (habían fundado la empresa en 1998) y aunque el buscador atendia alrededor de 3 millones de consultas diarias, la empresa no disponía de un modelo de negocio que funcionara, es decir, que diera mas beneficios que perdidas, porque la infraestrutura escalonada o de computación distribuida que utilizaba era la más barata posible, pero costaba algo. Antes de que se produjera el repliegue del gasto publicitario de la mayoria de la empresas por el hundimiento del NASQAD en la primavera del 2000, se resistian a poner publicidad en su buscador, al menos la clase de publicidad llamativa y artificial, e intentaron vender anuncios de texto que se relacionaran con una serie de palabras-clave. Pero no funciono todo lo bien que debia, y cuando ocurrido la caída de la bolsa, muchos sitios web desaparecieron por falta de patrocinadores.
Para sobrevivir a este cataclismo, Google desarrollo AdWords o mas bien imitó en esencia el modelo de venta publicitaria de GoTo.com. Se trataba de un progama que automatizaba la compra de anuncios en la pagina del buscador. Estos anuncios aparecian en la lista de resultados de la palabra clave que estaba relacionada con el contenido del negocio del anunciante, pero a diferencia de GoTo.com se separa de las paginas puramente informativas. Con esto, la empresa experimento un notable mejoría y empezó a crecer, y a crecer, y a crecer, porque en el año 2001 se lanzo a una serie de compras y adquisiones que le hieron aumentar de tamaño como Usenet, un sistema de mensajeria publica compuesto por más de 845 millones de entradas que se remontan a 1981, Blogger, Picasa o Keyhole (empresa de imagenes por satelite de donde nacio Google Earth) a lo largo de 2002 y 2003, junto con el lanzamiento de nuevos productos relacionados con el mundo de las busquedas como Google Images Search, Google News, Google Books Search, y otros no tanto como Gmail.
Y por supuesto, también se mejoró AdWords tal y como lo conocemos hoy en día, en el cual se incluía la subasta y el pago por click junto con la clasificacion según la popularidad del sitio del anunciante en cuestion (que se gestionan por los clicks que hubiera tenido) al que se le sumaría posteriormente AdSense un nuevo sistema por el que tanto Google como los editores de sitio-web se beneficiarian de la inclusión de publicidad en sus páginas, y por otro lado la compañia, aumento y diversifico notablemente su plataforma para poner anuncios, sin "contaminar"su inmaculada página. Con ello Google lo consigue todo: ser bueno y ser "malo" (entre comillas, claro, ver el punto 6 de su filosofía de empresa que viene todo muy bien explicado -pero hay que leer entre lineas)

lunes, diciembre 11, 2006

Recurso de información

Navegando, buscando informacion de DTDs he encontrado una tesis muy completa que no solo habla de ellos, sino que practicamente toca todos los temas relacionados con el mundo digital y de internet. Aqui reproduzco un trocito de su indice y os dejo el enlance porque es un filon de informacion importante, ademas que tiene un monto de herramientas para desplazarse entre sus contenidos. Eso si, leele la advertencia sobre descarga que aparece al final de cada pagina. Es importante.
  • Parte del indice:
El gran hipertexto: la WWW
Lenguajes hipertextuales
Estructura de un hipertexto
El documento hipertextual
Descripción del documento hipertextual
Catalogación de hipertextos
Indización y clasificación de hipertextos
Resumen de hipertextos
Búsqueda y recuperación del documento hipertextual
Hacia la Web Semántica
Nuevos conceptos

DTDs y Archivos o como los lenguajes de marcados nos ayudan a recuperar doc. II

Seguimos con los metadatos (aunque no lo parecezca por el titulo). El punto en el que me quede fue en su gran variedad, no solo a raíz de cumplir todas las funciones que mencione en "Mucho más que recuperar información", sino que según el tipo de documento se aplican una serie de metadatos u otro. No es lo mismo catalogar una revista que un libro, o para adaptarnos al mundo digital, no es lo mismo ponerle metadatos a un pdf que a un sitio web completo (se que es obvio, pero este es un bloc de documentacion para no documentalistas ni relacionados con el mundillo). Ambos documentos tiene una naturaleza distintas, cosas que necesitan ser descritas en unos, no existen en otros.
Por ello se ha desarrollado las DTDs o Definiciones de Tipo de Documento (siglos en ingles, claro) que no son nada nuevo ni pertenencen la campo de las ciencias de la informacion, sino que es algo puramente informatico, que los documentalista han cogido para solucionar problemillas como la inclusión de documentos en papel en la web o el tratamiento adecuado de estos en la inmensa maraña que es la web (Creedme: la web necesita un batallon de documentalistas con urgencia)
A lo que iba. Una de estas DTD son las EAD, especialmente pensadas para la descripcion de archivos, para que todos los elementos que deben ser descritos se describan sin faltar ninguno, y se describan como deban describirse para que la colección de archivos no pierdan algun datos importante en su organización, y por lo tanto, en el contexto de ese documento en esa colección, ya que uno de los principio basicos de la archivistica, sin el cual cada uno de los documentos se desvirtuaria y careceria de sentido. Insisto tanto en ello para señalar que en un archivo cada uno de los documentos esta relacionado unos con otro de manera indisoluble, y por lo tanto, no sirve cualquier cosa para su descripción.
Un inciso: ¿para que describimos, es decir, por qué hago tanto hincapie en la necesidad de la descripcion? Respuesta simple: sin descripcion no hay documento, no se puede localizar, y por lo tanto se pierde, no existe. Asi pues si un archivo desea digitalizar su fondo, primero debe de pensar (aparte de muchisimas cosas mas, tantas que haria falta un manual entero y no una entrada de un blog) en los intrumentos de descripcion que va a usar en ese entorno digital en el que se va a mover el archivo. Y ahi es donde entra la DTD o la EAD, en concreto. Sin embargo, sabed que esta no es la unica DTD para archivos que existe. Estan NEDA, que es una adaptacion española de la EAD hecha por el Ministerio de Cultura (ya que parece ser que nadie -los archiveros- se animaba a utilizar la primera) y MoREq.
Enlances para ampliar informacion sobre ellas, estan recogidos en Notas de Clase. Aqui solo os dejo un link refererido a la EAD, de la revista digital hipertext.net, y un tutorial donde se desarrolla el concepto de DTD alojado en la Universidad de las Palmas de Gran Canaria. Eso si, es 100% de Informatica.

sábado, diciembre 02, 2006

Contexto del Modelo OAIS

El otro dia me dia cuenta de que no habia explicado de donde salia y que era en palabras sencillas el modelo OAIS o Sistema abierto de informacion en archivos (una traducción al español mucho mas exacta que la que hice muy subgeneris en la exposicion, extraida de Teresa Silió), y como este blog pretende explicar lo más llanamente posible los puntos de unión entre la tecnologia y la documentacion, es casi obligado escribir esta entrada.
Su demominación puede llevar a equivoco en principio, por lo de sistema abierto de archivo, ya que parece relacionarse con la iniciativa de archivos abiertos, pero en realidad lo unico en lo que coindicen ambos iniciativas en que tratan de sistema de archivos porque el sentido de la palabra abierto tiene diferentes significados en uno y en otros. En la inicitiva de OAI se refiere al acceso libre de la informacion guardada, pero en el modelo OAIS se refiere al caracter no definido del propio sistema de gestión, es decir su naturaleza flexible y no cerrada para poder adoptarla a las caracteristicas propias de la organización o de los propios documentos que se van a gestionar.
La ISO (International Organization for Standardization), la organización que marca la pauta de como se tienen que realizar cualquier proceso en cualquier campo o área para garantizar cierta calidad, encargo al Consultative Committe for Data Space System, otro organismo internacional formado por más de 50 agencias espaciales, (CCDSS) la realizacion de este modelo, y así nació.
Si quereis saber más información respecto a ambos (OAIS y OAI) aqui os dejo este documento para que le echeis un vistazo.

Fundamentos tecnológicos del acceso abierto: Open Archives Initiative y Open Archival Information System, de Teresa Silió

(Ojala lo hubiera encontrado antes para la exposición porque contiene información muy clara) Además también aclara y contextualiza conceptos como el DOI (Digital Object Identifiers), el CrossRef, usado por los editores para enlazar la citacion de un articulo o revista con su DOI, y el OAI-PHM, un protocolo, componente del OAI que sirve "para la extracción de normalizadade los metadatos que están accesibles en los repositorios que cumplen el estándar Dublin Core", que a su vez es un modelo de metadatos muy utilizado en bibliotecas. Como veís, aquí todo se relaciona con todo.

martes, noviembre 28, 2006

Fuentes del modelo OAIS

Pues aquí estan las fuentes que he utilizado. Tambien os pongo la direccion del modelo en ingles para los que seais más atrevidos o les interese:




Modelo OAIS (Open Archival Information Systems)

Este es el tema que elegí en la exposicion de Perservación digital y queria colgar parte de él en el blog por si alguien en un futuro se encuentra en la tesitura de buscar informacion en español sobre él, ya que se que actualmente no hay mucha. Además es una explicación muy sencilla de como funciona el modelo, ya que por ahora, el documentos original esta en un ingles muy técnico y no hay quien entienda nada. Las fuentes irán arriba, porque esta entrada ya va a quedar bastante larga. Además, es otra muchas de como la documentacion se relaciona con las TIC.
Ahi va:

"El modelo no es solo una serie de pautas de conservación y almacenamiento de objeto digitales, sino que conlleva también todo un proceso de gestión de esos objetos digitales que se almacenara en el sistema. Establece tres fases:
  • Adquisición (ingest): los documentos, después de haber pasado por la selección y valoración previa que también incluye este modelo, se transforman los documentos originales en objetos digitales conservables. Es la primera transformación. Esto significa que debe de haber una verificación previa del documento digital para poder pasar formar parte del repositorio con garantías. Implica:
    • validadacion de la sintaxis
    • cumplimiento de reglas de integridad en bases de datos
    • ausencia de elementos dañinos: virus, contraseñas y compresiones

  • Conservación (archival storage): se lleva a cabo en un repositorio digital seguro y tiene que establecen de forma periódica medidas o mecanismos para comprobar si hay errores y que el documento conserva la legibilidad. Es decir, estas medidas serían las encaminadas a evitar la obsolescencia tecnología de hardware y software, y este modelo no se decanta por una o por otra, sino que en función de la que se adopta de todas las que se barajan (emulación, migración o preservación) se aplicaran unos mecanismos de conservación u otros:
    • Preservación de la tecnología - no se aplica ninguna transformación en el código que soporta el documento
    • Emulación - se aplica una modificacion del codigo del entorno tecnológico (hardware y software)
    • Migración – se aplica una transformación del código fuente de documento.
  • Recuperación de información: Se lleva a cabo en tres etapas, puesto que los documentos no están en un formato ni en un repositorio al que puedan acceder los usuarios. Así que se generan estas fases.
    • Búsqueda del documento en el catalogo o inventario generado en el propio sistema a partir de los metadatos.
    • Conversión del documento a un formato que permita su difusión
    • Traslado de ese documento a un área del sistema accesible para los usuarios durante el tiempo de consulta"



domingo, noviembre 26, 2006

Mucho mas que recuperar información

Los metadatos no solo tiene la utilidad de asignar al documento una serie de etiquetas o campos cuyo contenido serán los que describan al documentos para su posterior localización, sino que también ofrecen mucha más informacián. Ésto es lo que he descubierto al hacer el trabajo de Perservación digital. Los metadatos no solo describen el contenido del documento, sino que también lo hacen con el entorno en el que fue creado: con qué programa concreto, en qué hardware concreto, qué organización lo hizo, para qué cometido, si ha estado guardado en dónde y durante cuanto tiempo, y si tiene relaciones con otros documentos y en ese caso, cuáles.
Ademas informan sobre las medidas de seguridad o autentificación del documento que se han tomado para constatar que la informacion en el contenida no se ha modifica.
Todos estos datos y algunos más que se me escaparan sirven no solo para identificar al documento, sino también que ayudan a su perservación, ya que resulta fundamental saber el entorno de creacion de un documentos a nivel tecnologico y a nivel de contexto (quién, cuando y para que lo hizo) para decidir en primer lugar si lo conservamos y, en segundo cómo y cuánto.

domingo, noviembre 19, 2006

Documatica Existe!!

Mirando y buscando cosas de preservacion para la exposion del lunes, me he encontrado con algo sorprendente: una introduccion a la documatica. Puse la categoria entre comillas porque pense que el termino como tal no existía, pero leyendo este manual creado por el profesor Tramullas de la Universidad de Zaragoza, recoge la definicion de este termino, ademas de desarrollar aspectos referentes a esta area, y voy a quitar las comillas.

Esta muy bien y lo mas importante, accesible en su totalidad en linea.
"Introcucción a la Documentación"