Bases de datos NoSQL y escalabilidad horizontal

  24 Marzo 2011

Alicante, 24 de marzo de 2011 - ¿Cómo almacena sus datos Twitter?, ¿Facebook?, ¿Google? A medida que las TIC avanzan e Internet se hace más ubicua, surgen muchos proyectos cuya cantidad de datos hace inviable el uso de bases de datos relacionales.

La respuesta a la necesidad de gestionar volúmenes masivos de información surge de la base de datos NoSQL, término acuñado a finales de los 90 y que engloba todas las tecnologías de almacenamiento estructurado que no cumplen el esquema relacional.

La cantidad de información manejada por comunidades, redes sociales, buscadores, y muchos otros proyectos en el ámbito de la Web 2.0 es abrumadora, lo que ha hecho que surjan nuevas arquitecturas de almacenamiento de información, que deben ser de alto rendimiento, escalables y distribuidas.

Dentro de las plataformas NoSQL encontramos varios grupos:

  • Basadas en clave/valor. Se almacenan valores asociados a una clave. Son sencillas y las de mayor rendimiento.
  • Basadas en documento. Son una particularización de las clave/valor, en las que el valor puede ser un documento. Permiten consultas complejas.
  • Basadas en columna. Los valores se almacenan en columnas en lugar de filas. Son útiles cuando se gestionan datos agregados.
  • Basadas en grafo. Las relaciones se tratan como un dato más.
  • Basadas en objetos. Los datos son objetos y las relaciones punteros entre ellos. Permiten operaciones muy complejas pero suelen tener bajo rendimiento.
  • Otras. Cubren necesidades muy específicas y tienen escasa implantación: basadas en tupla, multivaluadas, jerárquicas, etc.

Algunas de las bases de datos NoSQL más usadas son:

Aunque esta tecnología surgió de unas necesidades muy concretas, su difusión y algunos proyectos para encapsular sus funcionalidades y hacerlas más amigables a desarrolladores acostumbrados a SQL está provocando que también se usen en proyectos de pequeño tamaño, con lo que todo indica que a medio plazo convivirán con las bases de datos tradicionales independientemente del volumen de datos a gestionar.

Juan Carlos García Candela

Se permite la reproducción de este artículo manteniendo la integridad del mismo, y siempre que se incluya el enlace a esta página como fuente de referencia.

Lo último de García Candela, Juan Carlos