1. Introducción

PVMS intenta proveer de un sistema de archivos en red distribuído de alta eficiencia y escalable, normalmente utilizado en entornos de clustering. PVFS es un proyecto de Software Libre que no requiere hardware especial o modificiciones en el núcleo para que funcione. Las características de este sistema de archivos distribuído son:

PVFS provee un mismo espacio de nombre para todo el cluster y es accesible por las utilidades habituales. PVFS se monta en todos los nodos y en el mismo directorio simultáneamente, permitiendo el acceso simultáneo a todos los ficheros del sistema PVFS, a través del mismo esquema de directorios. Una vez que el sistema está montado, podremos trabajar con las herramientas típicas, como ls, cp y rm

Para conseguir un alto rendimiento en el acceso a los datos concurrentemente, PVFS distribuye los datos en múltiples nodos del cluster, denominados I/O nodes. Distribuyendo los datos en múltiples nodos, los clientes poseen diferentes rutas hacia los datos, eliminado de esta forma los cuellos de botella (bottlenecks) y mejorando o aumentando el ancho de banda para múltimples clientes.

PVFS permite prescindir de las llamadas al kernel en los accesos al sistema de archivos, gracias al uso de una API nativa. Esta implementa un subconjunto de operaciones UNIX que permiten contactar directamente con los servidores PVFS.

Vista del sistema PVFS

Vista del sistema PVFS

La imagen superior muestra como se asignan los nodos para el uso de PVFS. Estos son divididos en nodos de computación (compute nodes) donde se ejecutan las aplicaciones, y los nodos de gestión que manejan las operaciones con los metadatos y los nodos de entrada/salida (I/O) que almacenan la información. Los nodos de administración y entrada/salida también pueden ser utilizados como nodos de computación.