Evil Robot Blog
The Evil Robot

The Evil Robot There's a brand new talk, but it's not very clear


about me

Support Amnesty International

Software:
Torta
Karmack
Plata
FUmanchu!

Rants:
AboutMe
Blogging
El origen del hombre americano
Propositos2006
Propositos2007
SWFing

Pictures:
Sicilia - thumbs
Visita Dimo 2007 - thumbs
Tokyo - thumbs
Barcelona - thumbs
Lisbon - thumbs
Gilberto Gil - thumbs
Visita Fidel - thumbs
Hiver - thumbs
Dogs - thumbs
Italy - thumbs
Eurockeennes - thumbs
Grenoble - thumbs
Chipie - thumbs
Place aux Herbes - thumbs

Eek Friends:
Alejo
Javier
Nelson

Old Posts:
Archive

Created with:
emacs
bash
libXSLT

Subscribe with Bloglines

Noticas de Colombia

Keep on Blogging!

Dimo's Art

Quebec Hispano

2010 - January

Nuevo blog [permanent link][ Save this post] January 17, 2010 - 17:50

Es hora de abandonar mi venerable sistema de blogging, que no es otra cosa que un script de shell, un manojo de templates xsl y un par de funciónes de emacs lisp. Los escribí luego de usar blogspot por un rato sin sentirme satisfecho. Este fué mi primer post. Es duro abandonar este sistema pero hay un par de cosas que me gustan de los sitemas de bloggin actuales y mis viejos scripts ya no aguantan mas modificaciones. 7 años de blogging, nada mal para un humilde script de bash.

De ahora en adelante estaré blogueando aquí. Actualicen sus lectores.


Algunas reflexiones sobre google [permanent link][ Save this post] January 12, 2010 - 18:49

Gracias a Google millones de usuarios encuentran cada día las páginas web que mejor responden a sus necesidades. Tal es el éxito del motor de busqueda de Google que la probabilidad de que un usuario llegué a una página web a partir de Google, y no de otro sitio web, es bastante alta. Y cada vez lo es más. Este fenómeno, que hace de Google el actor más poderoso de la web, puede ser perjudicial por razones que intentaré explicar en este post.

Repasemos algunas ideas básicas. La web es un conjunto de documentos creados independientemente por diferentes autores y conocidos como páginas web. Las páginas web están conectadas por enlaces, elementos de una página que dirigen la atención del lector hacia otra página (que, generalmente, complementa la que están leyendo).

Los enlaces permiten que los usuarios puedan explorar la red de manera selectiva, siguiendo enlace tras enlace, según sus deseos y la información que rodea el enlace. Para explicar esta actividad es frecuente hablar de la navegación de la web, comparando las páginas a puertos marítimos en los cuales se puede escuchar hablar de otros puertos a visitar.

La necesidad de encontrar rapidamente una página sobre un tema preciso sin tener que navegar multiples páginas motivó la creación de indices generales de la web, inicialmente alimentados manualmente. Mas tarde aparecieron indices alimentados automáticamente usando el contenido de las páginas para calcular su pertinencia respecto a una busqueda particular. Finalmente aparecen motores de busqueda que no solo usan el contenido de una página sino también su "reputación" calculada gracias a los enlaces que conducen a ella. Para entender esta ultima generación de motores de busqueda, podemos imaginarlos como programas que calculan cual sería el destino final más probable de una persona navegando la web enlace tras enlace en busca de una determinada información.

El algoritmo de Google funciona tan bien que practicamente elimina la necesidad de navegar la red: otras personas ya han navegado antes, han descubierto cuales son las mejores páginas y han creado enlaces que le permiten a Google calcular si una página es "buena" con respecto a una cierta busqueda.

A medida que Google se convierte en el principal punto de entrada a la web, la metáfora de la navegación es entonces cada vez menos adecuada, moverse en la web se parece más a un viaje en tren sin escalas a partir de unas pocas estaciónes, donde la principal es Google.

El buen funcionamiento de algoritmo de Google depende del que la reputación de las páginas web, calculada gracias a los enlaces, refleje efectivamente sus méritos. Para eso es necesario que los usuarios descubran continuamente nuevas páginas y cambien los enlaces de sus páginas según su juicio, favoreciendo a las mejores páginas. Existe entonces una contradicción: entre mas frecuente se hace el visitar páginas directamente a partir de Google, en detrimento de la navegación enlace tras enlace, más dificil es que páginas nuevas sean descubiertas por suficientes usuarios para entrar a competir con las páginas ya existentes. Lo que ocurre en el modelo de la "estación de trenes" es que los usuarios visitan aquello que Google considera lo más adecuado, eventualmente enlazando estas páginas y confirmando así su reputación a los ojos de Google.

Una consecuencia del fenómeno descrito es que para conseguir reputación y enlaces una página web no puede contar con el crecimiento natural que resultaba unicamente de sus méritos y de la navegacion de la web por sus usuarios. Ahora se necesita un alto número inicial de enlaces para no ser inmediatamente ignorado en beneficio de páginas similares con mejor "ranking" en los motores de busqueda.

Existe dos posibilidades para entrar en la competencia. La primera es contar con "amigos" influyentes en la web, es decir páginas con suficiente popularidad como para generar suficiente tráfico inicial a una página desconocida. La segunda es comprar enlaces a un proveedor de publicidad. Google, por ejemplo.

Otra consecuencia aberrante de la enorme influencia de Google et al es el florecimiento de las técnicas de optimización de páginas para ganar visibilidad en los motores de busqueda (SEO). Una de ellas consiste en sembrar enlaces con el fin de manipular el cálculo de su reputación. Otra técnica consiste en maquillar el contenído de una página y su URL según el valor que se cree que Google da a los diferentes elementos de la página. El resultado de esto es que las páginas escritas por los pequeǹos autores que crean buen contenido sin participar en el juego de la optimización son penalizadas fuertemente.

Conclusión

El fénomeno descrito hace parte de una tendencia general hacia la concentración de influencia en la web en las manos de unos cuantos actores. En mi opinión esta tendencia pone peligro el espiritu original de la web y el potencial de la misma para mejorar la manera como la información circula entre los seres humanos. Las consecuencias de esta evolución son palpables para aquellos que recordamos una epoca "dorada" de la web en la que un usuario cualquiera podía competir con Hallmark por la atención de los amantes de tarjetas electronicas o un estudiante podia tener un sitio tan popular como el de IBM sobre tal o cual tema de programación. Creo que seria positivo encontrar maneras de descentralizar funciones tan importantes como la que cumplen los motores de busqueda hoy en día, aunque es probable que en muchos casos esto no sea posible tecnicamente.