A partir de febrero de 2012, la mayoría de las bases de datos consisten en software de servidor y un conjunto de archivos que residen en una sola computadora. Los enfoques más avanzados utilizan varias computadoras y muchos archivos, a veces en diferentes ubicaciones. Los métodos paralelos y distribuidos mejoran la velocidad de acceso para bases de datos muy grandes, el acceso para organizaciones geográficamente dispersas y la confiabilidad para aplicaciones que dependen del tiempo de actividad.

Computadora central

Estructura

Una base de datos distribuida aloja datos en dos o más computadoras de servidor en ubicaciones separadas. Por ejemplo, una oficina central en Chicago tiene una base de datos y un almacén en Kansas City tiene otra. Los dos comparten un enlace a través de Internet para que la base de datos de Chicago reciba registros de envíos de Kansas City todas las noches. Una base de datos paralela típica reside en una ubicación con un conjunto de archivos, aunque varias computadoras comparten la carga de trabajo.

Velocidad

La principal ventaja de una base de datos paralela es la velocidad. Al igual que una base de datos estándar que se ejecuta en una computadora, una base de datos paralela recibe lenguaje de consulta estructurado o solicitudes SQL de los usuarios. El servidor los divide en una serie de pasos, luego los ejecuta. Un servidor de base de datos estándar realiza todos los pasos por sí mismo, mientras que una base de datos paralela asigna pasos a diferentes computadoras. Cuando cada computadora finaliza su tarea, la base de datos reúne la información y envía los resultados al usuario. Debido a que cada computadora trabaja solo en una parte del trabajo, juntos terminan una solicitud SQL en mucho menos tiempo. A medida que crecen los requisitos de la base de datos de una organización, agrega computadoras a la base de datos paralela para cumplir con la mayor carga de trabajo.

Acceso

Las bases de datos distribuidas mejoran el acceso, ya que cada oficina local tiene su propia base de datos. La mayoría de las transacciones SQL se realizan a nivel de la oficina sin las demoras en las redes de datos de larga distancia. Cada base de datos local tiene información en común con las demás, pero también puede tener datos únicos de la ubicación. Periódicamente, las bases de datos locales se sincronizan a través de una red de larga distancia para mantenerse actualizadas entre sí. Por el contrario, una base de datos paralela no mejora el acceso a ubicaciones remotas.

Fiabilidad

Las bases de datos distribuidas y paralelas abordan la confiabilidad de diferentes maneras. Una base de datos que se ejecuta en una sola computadora depende completamente de la confiabilidad de esa máquina: en el momento en que la computadora falla, la base de datos deja de estar disponible. La mayoría de las bases de datos paralelas tienen una función que monitorea el estado de cada computadora; Si uno falla, el programa del servidor lo elimina del servicio, pero la base de datos permanece disponible, aunque con un rendimiento reducido. Para una base de datos distribuida, los servidores locales restantes continúan procesando información si uno desarrolla un problema; la interrupción afecta solo a los usuarios locales de la computadora fallida.