Clusters de Linux 

http://clusters.fisica.uson.mx/



¿Qué son los Clusters?

(Presentación Breve ppt)

Clusters de PlayStation2 (ppt)

Antecedentes de los Clusters de Computadoras y la Clase Beowulf

En muchas ramas de las ciencias la complejidad de los problemas que se estudian requieren contar acceso a una supercomputadora, siendo éstas máquinas poderosas que pueden desarrollar varios miles de millones de operaciones por segundo. Las supercomputadoras tradicionales emplean procesamiento en paralelo; contienen arreglos de microprocesadores ultrarrápidos que trabajan en sincronía para resolver problemas complejos como pronósticos numéricos del estado del tiempo, o modelar estructuras complejas de la materia. Los fabricantes de supercomputadoras como Cray, IBM, Silicon Graphics, entre otros, producen modelos por diseño especial y cuestan decenas de millones de dólares - precios que van más allá de los presupuestos de inversión de los grupos de investigación.

En los últimos años, el personal académico de diversas universidades y centros de investigación se han dado a la tarea de aprender a construir sus propias supercomputadoras conectando computadoras personales y desarrollando software para enfrentar tales problemas extraordinarios.

En 1994, se integró el primer cluster de PCs en el Centro de Vuelos Espaciales Goddard de la NASA, para resolver problemas computacionales que aparecen en las ciencias de la Tierra y el Espacio. Los pioneros de este proyecto fueron Thomas Sterling, Donald Becker y otros científicos de la NASA. El cluster de PCs desarrollado tuvo una eficiencia de 70 megaflops (millones de operaciones de punto flotante por segundo). Los investigadores de la NASA le dieron el nombre de Beowulf a este cluster, en honor del héroe de las leyendas medievales, quien derrotó al monstruo gigante Grendel.

En 1996, hubo también otros dos sucesores del proyecto Beowulf de la NASA. Uno de ellos es el proyecto Hyglac desarrollado por investigadores del Instituto Tecnológico de California (CalTech) y el Laboratorio de Propulsión Jet (JPL), y el otro, el proyecto Loki construido en el Laboratorio Nacional de Los Alamos, en Nuevo México. Cada cluster se integró con 16 microprocesadores Intel Pentium Pro y tuvieron un rendimiento sostenido de más de un gigaflop con un costo menor a $50,000 dólares. 

En 1996, en el Laboratorio Nacional de Oak Ridge en Tennessee, se enfrentaban al problema de elaboración de un mapa de las condiciones ambientales del territorio de Estados Unidos. El territorio fue dividido en 7.8 millones de celdas de 1Km. Cada celda contenía la información de 25 variables, desde la precipitación promedio mensual hasta el contenido de Nitrógeno del suelo. Ninguna estación de trabajo o PC podría con esta tarea. Se requería una supercomputadora de procesamiento paralelo. En la actualidad cuentan con un cluster de 130 PCs para trabajar en la elaboración del mapa de eco regiones.

Motivación de la Computación de Alto Rendimiento

La computación en paralelo de alto rendimiento, se logra al dividir una tarea enorme y compleja entre varios procesadores. Durante la Segunda Guerra Mundial, antes de la invención de la computadora electrónica, se utilizó una técnica similar para realizar grandes cálculos asociados con el diseño de la bomba atómica para el Proyecto Manhattan. Para reducir enormemente el tiempo para resolver un problema matemático grande, cada parte del problema era resuelto por una persona distinta. A éstas personas se les llamaba computadoras. En la actualidad las computadoras electrónicas pueden trabajar en armonía para resolver problemas científicos que no se soñaba resolver hace más de una década.

La disponibilidad gratuita, alta confiabilidad y la eficiencia de Linux, ha sido una gran fortuna para las ciencias computacionales desde la década de los 1990s y su popularidad crece cada día en los medios académicos. Los científicos utilizan Linux para convertir PCs en estaciones de trabajo UNIX efectivas para la realización de un gran número de tareas, incluyendo cómputo numérico de modelos complejos. El desarrollo de los clusters de computadoras tipo Beowulf, ha extendido la utilidad del Linux al campo del cómputo paralelo de alto rendimiento. Adicionalmente, la naturaleza de fuente abierta del sistema Linux ha permitido a los programadores, añadir directamente características adicionales al sistema operativo para responder a las necesidades en los clusters de computación.   

Este artículo presenta una revisión de las tecnologías de software y hardware que pueden utilizarse para la construcción de un Cluster. Las tecnologías van desde el nivel de red, a través del sistema operativo y niveles de capas medias, hasta el nivel de las herramientas y aplicaciones.    

Ligas Principales de Computación con Clusters

Artículos de Revistas

Proyectos Beowulf Específicos

Herramientas de Software para la Construcción de Clusters

Documentación de Linux relacionada con el tema

Herramientas y Software para Cómputo en Paralelo

Programas de Software de Aplicaciones Científicas

Noticias sobre Clusters

Congresos, Escuelas y Reuniones


Comentarios y/o Observaciones envíelas a:

Carlos Lizárraga Celaya
 
Departamento de Física
Universidad de Sonora
Apartado Postal 1626
Hermosillo, Sonora 83000 MEXICO

E-mail: carlos@fisica.uson.mx

Ultima actualización: 28 de Septiembre de 2002