¡Sí! ¡Hay una historia de los de los buscadores de Internet antes de Google! ¡Y una prehistoria también! Es evidente que el motor de búsqueda creado por Larry Page y Sergéi Brin en 1998 es el más empleado en la actualidad. Pero no fue ni es el único. El recorrido hasta el algoritmo PageRank fue intenso y lleno de intentos y fracasos que trataremos de recopilar en este texto.

Definiciones necesarias antes de contar la historia de los buscadores

Aunque tanta gente utiliza un motor de búsqueda (por no decir Google) con frecuencia, la mayoría de usuarios no piensa en cómo funcionan estas maravillas. Básicamente un search engine consiste en un sistema informático cuya función es ubicar archivos almacenados en la inmensa red de servidores que existen en Internet. Para ello emplea indexadores o crawlers (arañas) que localizan dichos archivos, sin importar el formato en el que son creados y almacenados en la web.

En efecto, esos rastreadores o arañas hacen posible que el buscador nos muestre un listado ordenado de resultados como respuesta a nuestra consulta. Sin embargo para que los buscadores actuales logren este cometido necesitan tres condiciones esenciales:

  • Un procedimiento para localizar y organizar los archivos de forma simultánea.
  • Capacidad para hallar nuevo contenido de manera automática y progresiva.
  • Un sistema para ubicar mediante el contenido indexado, fragmentos puntuales requeridos por el usuario.

Los searchers pioneros sólo cumplían con una o dos de estas condiciones. De allí que la historia de los buscadores de Internet consista en la evolución de estas herramientas para alcanzar y perfeccionar estas tres funciones juntas.

Motor busqueda inicios

Prehistoria: la historia de los buscadores antes de la popularización de Internet

En la década de los 60s del siglo pasado, Gerard Salton y sus colegas informáticos de la Universidad de Cornell desarrollaron SMART. En esencia, era un sistema para recuperar y analizar información de manera mecánica en redes de ordenadores, utilizando procesamiento del lenguaje natural mediante vectores. Este procedimiento superó el modelo Booleano utilizado hasta entonces, ya que permitía filtrar, recuperar e indexar documentos de forma más rápida.

Internet no era un concepto formalmente establecido y la comunicación en línea entre computadoras estaba restringida a los ámbitos científicos y militares.

En este contexto, SMART definió los principios funcionales de los search engines contemporáneos.

Tecnologia ordenadores busqueda

Los protocolos de Internet: un hito en la historia de los buscadores

El modelo de protocolos de red TCP/IP fue desarrollado en los años 70 del siglo XX y estableció el fundamento de la actual Internet. Esto ocurría poco más de una década antes de la creación de la World Wide Web. Para entonces comenzaban a surgir los primeros motores de búsqueda fundamentados en este tipo de conexión. De esta manera se iniciaba la historia de los buscadores contemporáneos.

WHOIS

WHOIS apareció en 1982 y fue una de las primeras soluciones empleadas para hacer consultas en bases de datos mediante Internet. En ese momento tuvo una considerable capacidad para obtener información, pero hoy es un recurso limitado a la búsqueda y registro de dominios específicos.

Archie

Entre finales de los 80 e inicios de los 90, los servidores de recuperación y almacenamiento FTP públicos eran muy utilizados por su fácil accesibilidad. No obstante, la búsqueda de información en ellos era dificultosa, ya que requería tener conocimiento de la localización del servidor y del documento. 

El lanzamiento de Archie en 1990 terminó con este escollo. Dicho sistema creado por Alan Emtage (Universidad McGill, Canadá), mantiene un inventario de documentos de todos los servidores FTP que consigue. Y tales archivos no sólo pueden ser ubicados, sino también descargados. Al día de hoy está en desuso, pero es considerado el primer search engine propiamente dicho, ya que permitía encontrar contenidos y no sólo usuarios.

Verónica y Jughead

Verónica son las siglas de Very Easy Rodent Oriented Netwide Index to Computerized Archives. Se trata de un motor de búsqueda creado en 1992 para ubicar archivos en el protocolo Gopher lanzado un año antes. Verónica resolvió el problema de la búsqueda manual en Gopher, gracias a un sistema muy parecido al de Archie.

Poco tiempo después llegaría Jughead, un buscador también compatible con Gopher, pero su capacidad limitada sólo permitía indagar en el menú de muy pocos servidores con este protocolo. En compensación, su función de filtrado y localización de archivos en un solo servidor era excelente.

motores busqueda ordenador

La era WWW y los nuevos search engines

En agosto de 1991 es lanzada la primera versión pública de la World Wide Web por su creador, el físico Timothy Berners-Lee. Sin embargo la novel red informática que se hizo de dominio público en abril de 1993 planteó un reto singular. En ese momento no existían motores de búsqueda adaptados a su protocolo HTML (Hyper Text Markup Language), basado en el lenguaje homónimo.

El crecimiento exponencial de la web hizo inviable la continuidad de los buscadores manuales, como W3 Catalog, Aliweb y el primer directorio de Yahoo! (Yahoo! Search). Esto marcó el punto de inflexión en la historia de los buscadores.

Comienza la nueva generación de rastreadores avanzados en la historia de los buscadores

En consecuencia, la automatización de los buscadores se imponía como condición para una experiencia óptima en la web. Así Wanderer (1993) sería el primer robot rastreador de la web y el motor de búsqueda pionero en generar una base de datos web: Wandex. Comenzó ubicando servidores y paulatinamente empezaría a captar URL específicas. 

A finales del 93 también surgió JumpStation, de la mano de Jonathan Fletcher, en Escocia. Llegó a indexar hasta 275 mil entradas en menos de un año, generando un recopilatorio de búsqueda por título. Lamentablemente Fletcher no contó con el apoyo de la Universidad de Stirling para continuar el proyecto y éste concluyó en 1994. Por su parte WebCrawler (contemporánea de JumpStation) fue el primer search engine en rastrear por completo los textos de sus páginas web registradas.

old computer internet

Comienza el recorrido de las grandes marcas de buscadores

En efecto, varios motores de búsqueda comenzaron a cultivar una imagen de marca mientras crecían en popularidad y aportaban novedades.

Lycos

Esta plataforma llegó a ser la más visitada en 1999, a cinco años de su lanzamiento. Lycos sumó cerca de 400 mil archivos indexados en un mes durante sus inicios. Y en sólo un par de años ya acumulaba más de 60 millones de páginas registradas. Siendo una gran corporación diversificada, pasó por varios procesos de venta y su fuerza como motor de búsqueda se extinguió. 

AltaVista

¿Quién no recuerda a Altavista? Sin duda fue un motor muy popular y el primero en emplear lenguaje natural para sus búsquedas, sustituyendo las cadenas de consultas. Creado por Digital Equipment Corporation en 1995, terminó en manos de Yahoo! plataforma que finalmente adoptaría en 2000 el buscador de Google.

Excite

También en 1995 ocurrió el lanzamiento de Excite, el search engine pionero en el uso de relaciones de palabras y estadísticas para añadir relevancia a sus resultados de exploración. Hoy es célebre por la negativa de sus propietarios a adquirir Google en 1999 a un precio irrisorio.

Ask

Comenzó con la denominación Ask Jeeves en 1996 y luego asumió el de Ask.com. Su algoritmo ExpertRank considera la relevancia del tema. Es decir, si una página web especializada se vincula con otros sitios dedicados al mismo tema, entonces éste es más pertinente. En la actualidad, Ask se concentra más en su repositorio de preguntas y respuestas aportadas por los usuarios que a su función inicial de buscador.   

Buscando en internet

Bing de Microsoft y finalmente Google en la historia de los buscadores

Bing (2009) es el resultado de la evolución de los buscadores de Microsoft que comenzó en 1998 con MSN Search. Más tarde en 2004 pasaría a denominarse Windows Live Search, cuando la empresa fundada por Bill Gates empezó a emplear sus propios resultados de búsqueda. 

Aun sin el nivel de preferencia de Google, Bing ocupa un interesante tercer lugar entre los motores de búsqueda más usados. Asimismo es apreciado por la estructuración de sus datos y códigos que optimizan el posicionamiento de websites y su página infinita para ubicar imágenes.

Google

Definitivamente exponer las funcionalidades que hacen de Google el motor de búsqueda más utilizado en el mundo (81%) requiere de un espacio mucho más amplio. En concreto la cantidad de algoritmos que emplea para disponer sus resultados podría ser una de las ventajas de mayor relevancia.

buscador ordenador

El primero y más esencial de estos algoritmos es PageRank que es capaz de crear una jerarquía fiable y pertinente de sitios web. Para lograrlo tiene en cuenta dos premisas principalesen su algoritmo de búsqueda:

  • Por un lado la cantidad de páginas web externas que enlazan con un website confirman la relevancia y confiabilidad de este último.
  • Del mismo modo los links desde sitios fiables y relevantes tienen más valor que los procedentes de páginas de dudosa reputación.

Finalmente, la calidad de los resultados de búsqueda es lo que atrajo a Google la cantidad de usuarios que hoy acumula. Un trabajo lento pero firme en el que se distinguieron de otros buscadores que copaban el mercado pero que no ofrecían buena calidad en los resultados. En realidad la historia de los buscadores de Internet sigue escribiéndose y las innovaciones en este sentido continuarán sumando ventajas para los usuarios. A día de hoy, Google es parte esencial de la historia de los de los buscadores, de su presente y, al menos durante unos años, de su futuro.