martes, 25 de septiembre de 2007

lunes, 10 de septiembre de 2007

Como nacio la era del internet


Cómo nació la era de Internet

En la primera parte de este artículo, realicé un breve recorrido por la historia y la explicación de los diferentes tipos de capas con los cuales Internet ha funcionado. Con la finalidad de dar continuidad al tema, a continuación describo quiénes han sido los arquitectos y creadores de las distintas modalidades y funciones que Internet nos muestra hoy en día.

Direcciones y nombres

En Internet todo host ha de tener una única dirección para que la información sea evadida con éxito. Cada IP está compuesta por dos partes: la red en la que se puede encontrar el host, y este último dentro de la red. Sin embargo, no todas las direcciones son estáticas. La mayoría de los servidores disponen de una IP fija, pero a menudo, cuando la computadora es conectada a Internet a través de módem telefónico o línea ADLS, su IP variará entre sesiones. Esto se debe a que la dirección se asignará de forma dinámica (automática) dentro de un grupo de las que tiene disponibles el proveedor (ISP). Esto significa que el ISP tan sólo requiere una IP por conexión, en lugar de una por cliente, y explica por qué en ocasiones se pueden experimentar falsas ¿? De cortafuegos nada más con conectarse a Internet. Si se ha asignado una dirección IP que había estado ocupada previamente por una máquina que recibía contenidos de streaming o participaba en una sesión de juego en red que cortó abruptamente, el host que envía información puede continuar mandando paquetes de datos, sin saber que la comunicación ha cesado hasta que los time-outs lo hagan. Lo que un firewall puede detectar como actividad sospechosa, es posible que no sea otra cosa que esos paquetes “sin dueño”.

Una dirección IP ocupa 32 bits, y TCP/IP ve esta información en formato binario, aunque para el ojo humano sea mucho más fácil funcionar en el decimal. Esto se debe a que una IP se presenta normalmente como cuatro números decimales, de hecho cuatro octetos iguales separados por puntos. Sin embargo, a pesar de que esta notación es mucho más sencilla de recordar que una cadena binaria de 32 bits, no es tan fácil como el nombre. Por esta razón, existen los nombres para los dominios, cada uno de los cuales ha de estar asociado a una dirección IP. Seria una simple cuestión de traducir el nombre con una búsqueda en una base de datos, si no fuera por que hay miles de millones de direcciones IP y miles de millones de solicitudes para su traducción cada día por lo tanto resulta ¿? ¿? ¿? ¿? nombrar si se quiere que Internet funcione adecuadamente. El primer paso en este proceso para bautizar un host será examinar la configuración TCP/IP para asegurarse de que el origen y el destino no son el mismo. Después se interroga al archivo HOSTS, un archivo de texto ASCII que contiene los nombres de los hosts de acceso más frecuente y las IP de anfitriones locales y remotos que residen en la red local. Es posible utilizar este archivo, que en Windows XP suele encontrarse en WINDOWS\SYSTEM32\DRIVERS\ETC, para crear atajos de conversión de nombres de cuatro octetos junto a una palabra clave. Al teclear esta ultima en un navegador, éste será remitido directamente al sitio en cuestión sin necesidad de escribir toda la URL. Si ni el local host o el archivo HOSTS encuentran el nombre, el módulo RESOLVER de TCP/IP remitirá el problema al Domain Name System (DNS).

DNS es un sistema de distribución vinculado de bases de datos, que contiene todos los nombres de dominio y direcciones IP de Internet. Un modelo de base de datos de única y centralizada no funcionaria por que seria demasiado grande para manejarla y se tardaría mucho en resolver las peticiones. Al utilizar un modelo de distribución la búsqueda puede repetirse por Internet, que resulte en archivos que son mas fáciles de actualizar y rápidos de resolver. La búsqueda inicial para www.google.com, por ejemplo, iría a un servidor raíz, uno de aquellos que contienen las direcciones IP de todos los Top Level Domain (TLD) de los nombres de servidores; un TLD es lo que se conoce como com, edu, gob, etc. El servidor raíz .com pasa la dirección des servidor de segundo nivel DNS, en este caso google.com. A su vez, éste envía la dirección IP para www.google.com. De esta forma, dicho en pocas palabras, fuciona Internet.

Arquitectos del WWW

Hoy Internet funciona gracias a los servidores de alta velocidad y a routers que se basan en el protocolo TCP/IP inventado por Vinton Cerl.

Nació en 1943 y estuvo siempre fascinado con la programación y en como podría usarse para controlar ordenadores remotos. El NWG (Network Working Group) para el que trabajaba, y que también controlaba ARPANET, estaba intentando encontrar la forma de que todos sus equipos se comunicaran entre si, algo que Cerf creía que podía ayudarles a conseguir tarde o temprano. El primer intento del NWG fue un método al que denominaron Network Control Protocol (NCP), pero Cerf estaba convencido de que se podía mejorar a fondo y se puso a escribir un nuevo protocolo con su colega científico Robert Kahn. En septiembre de 1974, Cerf y Kahn presentaron un documento en el que se definían sus nuevas propuestas para un protocolo de comunicación. Bajo el titulo “A Protocol for Packet Network Intercommunication” (Un protocolo para intercomunicación de redes de paquetes), en él se describían lo que ellos llamaban protocolos de transmisión-control (TCP), que ahora forman la base de cómo se mueve la información a través de Internet. En 1976 se produjo un cambio fundamental en el protocolo TCP, ya que fue dividido por la mitad. La parte que se encargaba de la ruta de los paquetes de datos se convirtió en una entidad separada llamada Internet Protocol (IP), y continuo utilizándose para dividir un mensaje en paquetes de información, que después eran transmitidos por la red. El nuevo protocolo fue denominado, entonces, TCP/IP y ahora es la base del Internet que todos usamos.

El proyecto de hipertexto de Tim Berners-Lee sentó las bases de la Web al inventar http, HTML y URL.zz

Nacido en 1955 se graduó en el Queen’s college en la universidad de Oxford en 1976, ya que mostro gran interés por las computadoras. Mientras trabajaba para el CERN, un laboratorio suizo de partículas, escribió un programa denominado “Enquire” que permitía catalogar y almacenar información, pero también asociaciones y vínculos con la información de los archivos. No se publico nunca, pero formo la base de una idea mucho mas grande. En 1984 recibió una beca en el CERN y cinco años después propuso lo que él llamo su “sistema de hipertexto”, que hoy denominamos World Wide Web. Su anterior trabajo, Enquire, sirvió de base a su nuevo proyecto y, al desarrollar los componentes del nuevo sistema, su servidor y cliente se pusieron en marcha en Internet en 1991. Berners-Lee pasó los siguientes dos años depurando sus especificaciones basándose en el feedback que estaba recibiendo de sus colegas científicos. Así fue el humilde comienzo de la World Wide Web, taly como la conocemos hoy. Actualmente, Berners-Lee es el director del World Wide Web Consortium, que coordina el desarrollo de la Web. Nunca comercializó su invención, y en 2003 se le concedió el titulo de Sir. En el momento presente es difícil imaginar el mundo sin Internet y World Wide Web. Berners-Lee es uno de los autenticos pioneros de la era digital.

El software Mosaic permitió tener texto, sonido y gráficos por primera vez en un navegador de Internet

Marc Andreessen nació en 1972, su logro fue el navegador Mosaic, Andreessen mostró muy pronto gran interés por los ordenadores e Internet. Al principio todas las páginas Web eran de texto, así que él pensó que debía haber una forma mas sencilla de navegar y, con su colega Eric Bina, comenzó a desarrollar una interfaz gráfica para Internet. El resultado fue el navegador Mosaic, lanzado en 1993 y que al final de su primer año de vida ya había sido descargado dos millones de veces. Dado el gran interés que despertó su navegador, andreessen fue abordado por Jim Clark, el fundador de Silicon Graphics, y juntos pusieron en marcha Mosaic Communications Corp en 1994. Como la anterior Compañía en la que trabajaba Andreessen, NCSA, puso objeciones al nombre Mosaic, se cambio finalmente por Netscape. La nueva empresa se hizo publica en 1995, y permitió que Andreessen ganara 50 millones de dólares. Con la llegada de Internet Explorer de Microsoft, Netscape no pudo mantener su mercado y en 1998 hizo algo sin precedentes: dejo su Código fuente en Internet. Netscape fue adquirida por AOL en 1998, Andreessen cambió de aires y fundo la nueva compañía llamada Opsware (www.opsware.com), que proporciona herramientas de software a desarrolladores. De su fama y fortuna, Andreessen ha dicho: “Es extraño, pero intento no prestarles demasiada atención”.

Como inventor de Flash, Jonathan Gay convirtió el entorno gris y monótono de Internet en un lugar vibrante y dinámico.

Jonathan estaba fascinado con la construcción. Sus juguetes de Lego fomentaron un interés de niño en la ingeniería que pudiera hasta su vida adulta. Su pasión por construir cosas, muy pronto le llevo hasta una PC, una de las primeras Apple II. Programando juegos, Gay se dio cuenta que podía satisfacer sus ambiciones de ingeniería y construcción atreves del computador. Rápidamente se paso de los juguetes a los editores gráficos, y Gay añadió dibujo PostScript a un programa Macintosh denominado SuperPaint II. También se le atribuye el diseño de Intellidraw para Aldus y, para explotar sus nuevos talentos, Gay fundo su propia compañía, FutureWave Software. El primer producto de la compañía fue SmartSketch. Después de asistir a SIGGRAPH en 1995, Gay añadió animación a su software al lanzar su nueva versión FutureSplash Animator en 1996. Ese año también vio a Microsoft desarrollar su nuevo portal en Internet MSN, que quería que fuera como la televisión, así que recurrieron a FutureSplash Animator, para añadir gráficos en movimiento a la sede. Al ver el futuro de la animación online, Macromedia se acercó a Gay y le compró FutureSplash Animator en diciembre de 1996. Macromedia entonces relanzo el software como Flash v1.0. Hoy hay 1.5 millones de usuarios de Flash en todo el mundo, y 98 por ciento de los navegadores de Internet pueden ejecutar archivos de este tipo.

Google, el motor de búsqueda más popular de Internet intenta catalogar toda la información del mundo

zLarry Page y Sergey Brin inventaron Google. Como graduados en informática en la Universidad de Stanford, se dice que los creadores de Google no se gustaron en su primer encuentro. No estaban de acuerdo en nada que discutían si tenían una cosa en común: el deseo de intentar resolver el problema de cómo extraer información con significado de las masas de datos de Internet. Así en 1996 Page y Brin comenzaron su colaboración en un proyecto denominado BakcRub, que podría analizar “back links” (vínculos traseros) que contienen las páginas Web. Pronto se propagó el rumor sobre esta tecnología de búsqueda, mientras su desarrollo continuaba hasta 1998, cuando Page y Brin construyeron el primer servidor Google en su dormitorio con un disco duro de un terabyte. Como ninguna compañía mostró interés por la tecnología, incluyendo a David Filo, de Yahoo!, decidieron desarrollarla ellos mismos. El 7 de septiembre de 1998 Google abrió sus puertas. El motor de búsqueda comenzó a funcionar con 10,000 solicitudes al día, pero la evolución ha sido rápida. Al final de pasado siglo, Google se había convertido en el índice más grande del mundo con mil millones de páginas disponibles para buscar. Al año siguiente la compañía tenía ganancias. Desarrollos recientes incluyen AdWords, Google News, Google Print y Froogle para buscar productos. Hoy Google es el motor de búsqueda más utilizado del planeta con 300 millones de visitas cada día.

Routers

Los routers son ordenadores especializados en conmutación de paquetes que dejan que los datos fluctúen entre redes en lugar de permanecer confinados. Cada paquete que llega es examinado, y la dirección IP es comprobada en su tabla de ruta. Si se encuentra la dirección de red el paquete se envía, si no, es pasado al siguiente router en línea, que busca la dirección y así sucesivamente. Un simple mensaje puede dividirse en docenas de paquetes, todos viajando a través de routers hacia el mismo destino, pero utilizando la ruta más eficiente para tal fin. Los routers CISCO 12000 pueden mover 60 millones de paquetes de datos por segundo y se utilizan en backbones para Interntet.

¿Qué Sigue?

IPv6

A pesar de que la versión 4 de Internet Protocol (IPv4) atenderá a 4,2941967,296 direcciones (256x256x26x256) éstas se están agotando. En su mayoría se debe a factores históricos, tales como las direcciones disponibles divididas en clases para tipos de redes distintos, que proporciona cada clase un grupo de direcciones diferentes. Una red de clase C, por ejemplo, tiene 256 direcciones, de las cuales se pierden 255, si se usa solo una. Una dirección entera de clase A (que empieze por 127) es designada a la función loopback, utilizada únicamente para pruebas. Aun así, esta función de pruba consume un total de 16.8 millones de direcciones nada menos, con todo lo que ello supone. Con IPv6, y pasando de largo IPv5, que existió como un protocolo oscuro de uso limitado, se cambia de la numeración de 32 bits a los 128 bits, o por decirlo de otra forma, cuatro mil millones de veces los cuatro mil millones de direcciones del anterior protocolo IPv4. De hecho, IPv6 proporciona 304,2825366,9204938,4633374,6072431,7681211,546 direcciones únicas, ó 665,5703793,3482866,9431898,599 direcciones por cada metro cuadrado de la superficie de la Tierra. En el lado negativo, las direcciones IPv6 están escritas en hexadecimal para reducir lo que serían 63 números decimales por dirección. A efectos eminentemente prácticos, esto significa una dirección de 39 caracteres comprimida en 32 caracteres hexadecimales y 7 grupos de dos puntos. Sin embargo, la mayoría de direcciones podría contener múltiples ceros, y éstos pueden reducirse al utilizar un método de notación con dos puntos, que elimina los ceros insignificantes y del inicio. El resultado final es una dirección diferente, pero no más difícil de escribir o recordar que una de IPv4.