Tecnología Grid
De Computacion
'3.1'INTRODUCCIÓN
En el presente capítulo se cubrirán aspectos referentes al estudio de hardware y software, costo, rendimiento, disponibilidad, para así poder tener una visión más detallada del ambiente Grid, posteriormente se procederá al diseño e implementación mediante la instalación y configuración de las herramientas seleccionadas, además se realizará la configuración adicional de herramientas que ayuden al monitoreo y administración del Grid.
'3.2'OBJETIVOS
·Estudiar el entorno a nivel de hardware, software y red en donde se implantará la Tecnología Grid Computing.
·Implementar la arquitectura Grid Computing. Instalación y configuración.
·Realizar pruebas de instalación.
'3.3'ESTUDIO A NIVEL DE HARDWARE, SOFTWARE Y RED DE LOS EQUIPOS
'3.3.1'DESCRIPCIÓN DE HARDWARE
Para la realización del proyecto la Unidad de Proyectos y Sistemas Informáticos de la UTPL ha facilitado el uso de las salas de cómputo para implementar la Tecnología Grid, para la Plataforma Linux se ha utilizado los equipos de la Sala Oracle y para la Plataforma Mac la Sala “B”.
Para implementar el Grid en la Plataforma Linux se ha dispuesto de 15 PC’s IBM (Anexo 3.1),a continuación se describe las características generales de hardware que poseen dichas máquinasen las siguientes tablas:
Descripción de Hardware – Plataforma Linux
|
|
|
|
|
|
|
Procesador |
|
|
|
|
|
Memoria |
|
|
|
|
|
Tarjeta de Red |
|
|
|
|
|
Disco[#_ftn2 [20]] |
|
|
|
|
Para la implementación de Grid en la Plataforma Mac se ha dispuesto de 24 iMAC’s y 1 POWER MAC G5 (Anexo 3.1), a continuación detallamos las características generales de hardware:
Descripción de Hardware – Plataforma Mac
iMac
|
|
|
|
|
|
|
Procesador |
|
|
|
|
|
Memoria |
|
|
|
|
|
Tarjeta de Red |
|
|
|
|
|
Discos |
|
|
|
|
Power Mac G5
|
|
|
|
|
|
|
Procesador |
|
|
|
|
|
Memoria |
|
|
|
|
|
Tarjeta de Red |
|
|
|
|
|
Discos |
|
|
|
|
Todas las máquinas disponibles para el Grid cumplen con los requerimientos para su implementación en las dos plataformas.
'3.3.2'DESCRIPCION DE SOFTWARE.
Descripción de Software – Plataforma Linux
| <center>Sistema Operativo |
|
|
|
|
|
|
</center>
Descripción de Software – Plataforma 'Mac'
| <center> |
|
|
Power Mac G5 |
|
|
iMac |
|
</center>
'3.3.3'DESCRIPCIÓN DE RED
La administración de la red de los equipos donde se implementa el Grid están administrados por el grupo de Telecomunicaciones de la Universidad. A continuación se detalla las configuraciones de red que poseen las máquinas (Tablas 3.6 y 3.7).
Configuración de Red – Plataforma Linux
| <center>Hostname |
|
|
|
|
|
loja.grid.com |
|
|
|
|
|
saraguro. grid.com |
|
|
macara.grid.com |
|
|
gonzanama.grid.com |
|
|
quilanga.grid.com |
|
|
catamayo.grid.com |
|
|
zapotillo.grid.com |
|
|
pindal.grid.com |
|
|
olmedo.grid.com |
|
|
celica.grid.com |
|
|
paltas.grid.com |
|
|
calvas.grid.com |
|
|
sozoranga.grid.com |
|
|
puyango.grid.com |
|
|
espindola.grid.com |
|
</center>
Protocolo DNS
Dominio: grid.com
Puerta de Enlace: 172.16.3.10
Configuración de Red – Plataforma Mac
| <center>'Hostname' |
|
|
|
|
|
ProfesorSalaB.local |
|
|
|
|
|
uprod3salab01.local |
|
|
uprod3salab13.local |
|
|
uprod3salab02.local |
|
|
uprod3salab14.local |
|
|
uprod3salab03.local |
|
|
uprod3salab15.local |
|
|
uprod3salab04.local |
|
|
uprod3salab16.local |
|
|
uprod3salab05.local |
|
|
uprod3salab17.local |
|
|
uprod3salab06.local |
|
|
uprod3salab18.local |
|
|
uprod3salab07.local |
|
|
uprod3salab19.local |
|
|
uprod3salab08.local |
|
|
uprod3salab20.local |
|
|
uprod3salab09.local |
|
|
uprod3salab21.local |
|
|
uprod3salab10.local |
|
|
uprod3salab22.local |
|
|
uprod3salab11.local |
|
|
uprod3salab23.local |
|
|
uprod3salab12.local |
|
|
uprod3salab24.local |
|
</center>
Protocolo DHCP
Dominio: .local
Puerta de Enlace: 172.16.11.10
'3.4'DISEÑO Y CONFIGURACIÓN DEL AMBIENTE GRID
Para el diseño de la Arquitectura Grid se ha realizado el estudio de diferentes topologías, el mismo que da como resultado tres alternativas para la elaboración del diseño, a continuación se presenta una descripción de cada uno de ellas:
'3.4.1'DISEÑO FÍSICO
Según la Topología Intragrid escogida anteriormente, se ha elaborado el diseño físico considerando también las arquitecturas de las herramientas seleccionadas para cada una de las plataformas en las que se implementará el Grid de Computadoras.
'3.4.2'ENTORNO DE RED
Para empezar con la implementación de la arquitectura se necesita configurar la red con algunos servicios según lo requiera cada herramienta en las dos plataformas respectivamente, estos servicios son:
| <center>Servicios |
|
|
|
Permite resolver los dominios de todas la peticiones que realicen los usuarios que se encuentren en la red interna, en el ambiente grid. |
|
|
Necesario para enviar y recibir certificados. |
|
|
Necesario para sincronizar el tiempo del sistema en todas las máquinas del ambiente grid, ya que el GSI[#_ftn3 [21]] certifica utilizando timestamps[#_ftn4 [22]]. |
|
|
Permite la comunicación entre las máquinas. |
|
|
Permite interactuar con archivos remotos montados en los hosts del ambiente grid como si estuvieran montados localmente, de esta manera no se redunda en archivos de ejecución. |
</center>
Estos servicios son necesarios para mantener comunicadas todas las máquinas, las configuraciones tanto para la máquina servidor como para las máquinas clientes, se detallan en los Anexos [../../Datos%20de%20programa/Microsoft/Word/Anexos/Anexo%203.3%20-%20Requisitos%20Red_Servidor.doc 3.3] y [../../Datos%20de%20programa/Microsoft/Word/Anexos/Anexo%203.4%20-%20Requisitos%20Red_Clientes.doc 3.4]
'3.4.3'SOFTWARE SELECCIONADO
De la investigación sobre las herramientas para la implementacióndelGrid, se presenta las alternativasescogidas:
Herramientas para la implementación del Grid
| <center>Plataforma |
|
|
Linux |
|
|
Mac OS X |
|
</center>
Herramientas de monitoreo
| <center>Plataforma |
|
|
Linux |
|
|
Mac OS X |
|
</center>
'3.5'IMPLEMENTACIÓN DE LA ARQUITECTURA GRID
'3.5.1'PLATAFORMA LINUX
Como se ha mencionado para la implementar la Tecnología Grid en la Plataforma Linux se dispuso de 15 PC’s IBM, con las características de hardware, software y red antes mencionadas.
Para empezar la construcción del Grid, primero se procede a instalar los pre-requisitos[#_ftn5 [23]] necesarios para la instalación del Globus Toolkit 4.0.1, la descarga y configuración de estas herramientas se presentan en los Anexos 3.5 y 3.6_a
| <center>Requerimientos |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
</center>
Posterior a esto se procede a descargar el paquete del Globus Toolkit 4.0.1 (Anexo 3.5) para su instalación y configuración, como se mencionó anteriormente se implantará estas herramientas para plataformas Linux bajo los sistemas operativos RedHat 9 y RedHat Enterprise AS 3.
| <center>Plataforma |
|
|
RedHat 9 | |
|
RedHat AS3 |
</center>
La instalación y configuración del Globus Toolkit 4.0.1 tanto para el servidor como para los nodos se describe en el manual de instalación en los Anexos 3.6 y 3.7
Siguiendo la topología escogida y la arquitectura del Globus Toolkit, la construcción de la infraestructura Grid en la plataforma Linux con 15 máquinas,
| <center>Máquinas |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
</center>
proporcionó un supercomputador con una capacidad de 45 GHz de procesador.
Contando con 15 máquinas que cumplen las siguientes funciones:
| <center>Cantidad |
|
|
|
|
|
·loja.grid.com |
|
·GSI (Grid Security Infrastructure) - para habilitar una autentificación y para tener una comunicación segura a través de una red abierta.·Servidor de SimpleCa – provee los certificados de autorización para cada uno de los nodos.·GRAM – realiza la gestión o manejo de recursos ·Servidor de Base de Datos Postgresql – almacena todos trabajos que se ejecutan en el Grid |
|
|
·saraguro. grid.com·gonzanama.grid.com·catamayo.grid.com·pindal.grid.com·celica.grid.com·calvas.grid.com·macara.grid.com·quilanga.grid.com·zapotillo.grid.com·olmedo.grid.com·paltas.grid.com·sozoranga.grid.com·espindola.grid.com |
|
·Solicitan autorización para realizar trabajos dentro del Grid·Ejecuta los trabajos asignados por el servidor. |
</center>
Una vez implementado el Grid en la plataforma Linux, se procede ha realizar las pruebas para verificar la comunicación entre todas las máquinas y la ejecución de trabajos en cada una de ellas.
'3.5.2'PLATAFORMA MAC
Para la Plataforma Mac se dispuso de 24 iMac’s y 1 Power Mac G5 con las características dehardware, software yred antes mencionadas.
Para empezar la construcción del Grid, se configura el software Xgrid que viene incorporado en el software del sistema operativo, en la máquina que actúa como servidor (Power Mac G5) el Mac OS X Server 10.4.3 y en las máquinas que lo harán como clientes (iMac’s) Mac OS X 10.4.8. (Anexos 3.8 y 3.9)
Con la configuración de la herramienta Xgrid para construir la infraestructura Grid con 25 máquinas,
|
| <center>Máquinas |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
|
</center>
se consiguió construir un supercomputador con 91,84 Ghz de capacidad de procesador.
| {| width="100%" |
CPU_max = 91,84
|
|}
Contando con 25 máquinas que servirán de nodos, las mismas que cumplen las siguientes funciones:
| <center>Cantidad |
|
|
|
|
|
·ProfesorSalaB.local |
|
·Controlador – Realiza la división de trabajos y envía las subtareas a los agentes conectados.·Xgrid Admin – Monitorea los nodos y las tareas del Grid·Server Admin – Permite administrar el Grid ·Cliente – Ejecuta los trabajos asignados por el servidor·Agente – Solicita autorización para realizar trabajos dentro del Grid |
|
|
·uprod3salab01.local·uprod3salab02.local·uprod3salab03.local·uprod3salab04.local·uprod3salab05.local·uprod3salab06.local·uprod3salab07.local·uprod3salab08.local·uprod3salab09.local·uprod3salab10.local·uprod3salab11.local·uprod3salab12.local·uprod3salab13.local·uprod3salab14.local·uprod3salab15.local·uprod3salab16.local·uprod3salab17.local·uprod3salab18.local·uprod3salab19.local·uprod3salab20.local·uprod3salab21.local·uprod3salab22.local·uprod3salab23.local·uprod3salab24.local |
|
·Cliente – Ejecuta los trabajos asignados por el servidor·Agente – Solicita autorización para realizar trabajos dentro del Grid |
</center>
Una vez implementado el Grid en la Plataforma Mac, se procede ha realizar las pruebas para verificar la comunicación entre todas las máquinas y la ejecución de trabajos en cada una de ellas.
'3.6'POST-INSTALACIÓN DE LA ARQUITECTURA GRID
'3.6.1'PRUEBAS Y RESULTADOS DE LA INSTALACIÓN
PLATAFORMA LINUX
En esta etapa se procede a verificar la instalación y la conectividad entre máquinas del Grid, se debe comprobar si un cliente es capaz de lanzar un trabajo, lo mismo que se hará desde una sesión de un usuario de la misma máquina, en este caso desde la máquina principal loja.grid.com se enviará un multi-trabajo hacia todos los nodos, con los siguientes requerimientos:
·Haber obtenido y tener correctamente instalado en el $HOME/.globus su certificado de usuario.
·Estar correctamente mapeado en los ficheros grid-mapfile.
Si el usuario cumple los requisitos anteriores deberá crear un proxy para obtener autentificación temporal. Siguiendo el proceso, se crea un proxy temporal para todos los nodos del grid, como ejemplo se creara en la máquina Saraguro cuyo usuario es usersar:
|
[usersar@saraguro root]$ grid-proxy-init -verify -debugUser Cert File: /home/usersar/.globus/usercert.pemUser Key File: /home/usersar/.globus/userkey.pemTrusted CA Cert Dir: /etc/grid-security/certificatesOutput File: /tmp/x509up_u503Your identity: /O=Grid/OU=GlobusTest/OU=simpleCA-loja.grid.com/OU=grid.com/CN=Usuario LojaEnter GRID pass phrase for this identity:Creating proxy ...++++++++++++.......++++++++++++Done |
Después de introducir la contraseña, el sistema indica el tiempo restante de validez del proxy, el mismo que será suficiente para lanzar las pruebas, además se debe de cargar un entorno de ejecución, que puede ser configurado en el etc/profile de su máquina o desde el directorio $GLOBUS_LOCATION ejecutar:
|
[root@catamayo root]# |
Se levanta el servicio GRAM en nuestra máquina principal, que permite la asignación de recursos para la comunicación entre nodos.
Ahora se puede realizar las pruebas. Para ello se ejecutará el comando globusrun-ws con el script que contiene el trabajo a realizar, para este ejemplo se usará un script multijob.xml. (Anexo 3.6_b)
|
[userloj@loja userloj]$ globusrun-ws -submit -f multijob.xml -JDelegating user credentials...Done.Submitting job...Done.Job ID: uuid:5f75e832-3413-11db-a3a1-0011254bf418Termination time: 08/26/2006 08:26 GMTCurrent job state: ActiveCurrent job state: CleanUpCurrent job state: DoneDestroying job...Done.Cleaning up any delegated credentials...Done. |
Si todo está bien, en el $HOME del usuario aparecerá el ficheros: stdout_loja con la siguiente información:
|
[usercat@catamayo usercat]$ cat stdout_catamayoJob desde Catamayo...Job desde Catamayo...Job desde Catamayo...Job desde Catamayo...Job desde Catamayo...Job desde Catamayo...Job desde Catamayo...Job desde Catamayo...Job desde Catamayo...Job desde Catamayo...Job desde Catamayo...Job desde Catamayo...[usercat@catamayo usercat]$ |
Para cada uno de los nodos el resultado se presenta de igual forma: ('Anexo 3.6_c)'
|
[userloj@loja userloj]$ cat stdout_lojaJob dede Loja....Job dede Loja....Job dede Loja....Job dede Loja....Job dede Loja....Job dede Loja....Job dede Loja....Job dede Loja....Job dede Loja....Job dede Loja....Job dede Loja....Job dede Loja....Job dede Loja....Job dede Loja....Job dede Loja....[userloj@loja userloj]$ |
De esta forma se ha comprobado la correcta instalación del Globus Toolkity lacomunicación entre los nodos del Grid implementado bajo la plataforma Linux.
PLATAFORMA MAC
Para verificar la configuración de Xgrid tanto en la máquina principal como en los nodos, se ingresa a la herramienta Xgrid Admin en la que se podrá observar todos los nodos que se encuentran conectados.
Para enviar a ejecutar un trabajo, se lo realiza mediante la herramienta xgrid de línea de comandos en una terminal, en la que se indica:
|
ProfesorSalaB:~ root# xgrid -h <controller> -p <password> -job <reference> <parameter>ProfesorSalaB:~ root# |
Utilizando la referencia –job submit :
|
ProfesorSalaB:~ root# xgrid -h ProfesorSalaB.local -p grid2006 -job submit /bin/echo “Hello World!”ProfesorSalaB:~ root#ProfesorSalaB:~ root# xgrid -h ProfesorSalaB.local -p grid2006 -job list33??Ss0:00.15 /bin/echoProfesorSalaB:~ root#ProfesorSalaB:~ root# xgrid -h ProfesorSalaB.local -p grid2006 -job results -id 33Hello World!ProfesorSalaB:~ root# |
O –job run:
|
ProfesorSalaB:~ root# xgrid -h ProfesorSalaB.local -p grid2006 -job run /bin/echo “Hello World!”Hello World!ProfesorSalaB:~ root# |
Los errores que puedan presentarse durante la instalación y su solución, se encuentran en el Anexo 3.6_d.
'3.7'COMPARACIÓN DEL GRID EN LAS PLATAFORMAS LINUX Y MAC.
La instalación y configuración de las herramientas Grid en plataformas Linux y Mac ha sido satisfactoria según lo demostrado mediante las pruebas realizadas, a continuación se presenta un cuadro comparativo de varios criterios que se han considerado para evaluar la implementación del Grid en las dos plataformas.
|
|
|
|
|
|
|
'Tiempo de 'Implementación |
|
- Tuvo una duración de 3 meses aproximadamente, debido a que la herramienta que se utilizo (Globus Toolkit) involucra una cantidad de requerimientos de software y de red, invirtiendo una gran cantidad de tiempo en la instalación y configuración de cada equipo. - Tambiénse presentaron algunos problemas a nivel de hardware siendo necesario realizar una revisión de todos los equipos.-Finalmente era preciso realizar una investigación más exhaustiva sobre los componentes que conforman la herramienta para no tener problemas en la configuración de cada componente y requerir tiempo adicional en la solución de estos inconvenientes. |
|
-Duración aproximada de 2 semana, debido a que la herramienta utilizada (Xgrid) para la implementación del grid esta incluida dentro del sistema operativo Mac OS X Server y Mac OS X como un servicio adicional del sistema, no siendo necesaria la configuración de ningún requerimiento. |
|
Costo |
|
-El costo es relativamente bajo, debido a que se utilizó equipos convencionales que no requerían ningún hardware adicional y las herramientas utilizadas son bajo licencia de software libre. |
|
-El trabajar bajo una plataforma Macinvolucra en si un costo elevado tanto en la adquisición de equipos, como en el software propietario de esta plataforma. |
|
Complejidad |
|
-La implementación de Grid tuvo una gran complejidad debido a la interfaz de línea de comandos que únicamente posee esta herramienta, haciendo más compleja su configuración.-Se presentaron también algunos inconvenientes en la configuracióndando lugar a errores en los componentes del Globus, siendo muchos de ellos difíciles de identificar. |
|
- La complejidad presentada al momento de implementar el grid en Mac fue notablemente baja, debido a que este servicio nos brinda una interfaz muy amigable que permite la configuración y la integración tanto del servidor como de los agentes de una forma muy sencilla. |
|
Seguridad |
|
-La herramienta utilizadapara la implementación del Grid en Linux, brinda gran seguridad de los datos y en laidentidad de usuarios, a través de la encriptación de claves y el uso de certificados Proxy. |
|
- La seguridad en esta plataforma se realiza con la autenticación mediante contraseñas. |
'3.8'CONCLUSIONES
- Se ha concluido que es de gran importancia, realizar un estudio previo de la disponibilidad de hardware, software y red, para conocer bajo qué entorno se implementará las herramientas Grid, además de las características y capacidad total que se obtendrá al final de la implementación.
- Se ha determinado el nivel de implementación de las herramientas utilizadas considerando los criterios anteriormente planteados obteniendo los siguiente resultados:
|
|
| <center>Plataformas LINUX |
|
| ||||
|
|
'' |
|
|
|
|
|
| |
|
'Tiempo de 'Implementación |
|
|
|
|
|
|
| |
|
Costo |
|
|
|
|
|
|
| |
|
Complejidad |
|
|
|
|
|
|
| |
|
Seguridad |
|
|
|
|
|
|
| |
</center>
- Por lo tanto se podría decir que la implementación de un Grid en una plataforma MAC, es más viable en cuanto a tiempo y facilidad de implementación, considerando que la herramienta utilizada Xgrid, forma parte del conjunto de servicios de la plataforma Mac, además por su interfaz gráfica es mucho más sencilla su configuración.
- En cuanto a la plataforma Linux, es una solución más económica por el hardware y el software Open Source que se utiliza, en está plataforma existe complejidad al momento de la configuración de la herramienta Globus Toolkit, debido a que se necesita tener un poco más de conocimientos sobre la funcionalidad de sus componentes, así como del sistema en el que está siendo implementado.
- Se ha comprobado, en base a las pruebas realizadas,que el Grid de Computadoras implementado tanto en la plataforma Linux y en Mac, nos proporcionan escalabilidad para integrar nuevos equipos, y una infraestructura segura y con gran capacidad para la ejecución de aplicaciones paralelas, realizándolo de forma transparente, sin interferir con las actividades normales del usuario.
[#_ftnref1 '[19]]'Tanto los procesadores de la plataforma Linux como los de la plataforma Mac utilizan una tecnología Core Duo que simula la presencia virtual de dos procesadores
[#_ftnref2 [20]]Para la descripción de las particiones del Disco Duro de cada máquina ver [../../Datos%20de%20programa/Microsoft/Word/Anexos/Anexo%203.2%20-%20Descripcion%20Sala%20Oracle.doc Anexo 3.2]
[#_ftnref3 [21]] GSI – Grid Security Infrastructure
[#_ftnref4 [22]] timestamps – marcas de tiempo
[#_ftnref5 [23]] Guía de instalación - Disponible en:http://www.globus.org/toolkit/docs/4.0/admin/docbook/quickstart.html
Construction of II Sc-Grid using Globus Toolkit 4.0.0 – V. Pushparajan – Indian Institute of Science
