InternacionalAcceso estudiantes

La computación paralela: características, tipos y usos

La computación paralela consiste en el uso simultáneo de varios procesadores o núcleos que ejecutan una serie de instrucciones que conforman las distintas partes en las que se ha descompuesto un problema computacional.

Mujer Ingeniero en data center
Toda esta evolución tecnológica sería inviable sin estudios específicos.

Las personas que están involucradas en el mundo de la tecnología es probable que hayan oído hablar de la computación paralela o procesamiento en paralelo, y probablemente sepan que tiene algo que ver con más de un procesador/núcleo trabajando en el mismo problema al mismo tiempo.

Lo cierto es que la computación paralela está presente en muchos ámbitos de nuestra vida diaria. Es por este motivo que los profesionales de la tecnología deben conocer los entresijos del uso paralelo de computadoras. En el Máster en Ingeniería Matemática de UNIR se forma a los estudiantes en una materia que está ampliamente extendida en la actualidad.

A medida que el Internet de las cosas (IoT) se consolide, miles de millones de dispositivos necesitarán utilizar esta estrategia informática para evitar ahogarse en un océano cada vez más creciente de datos. Una tecnología de computación en paralelo utilizada para este propósito es la computación de alto rendimiento (HPC – High-Performance Computing), un área para la cual se requiere de un perfil específico dentro del mercado laboral.

¿En qué consiste el procesamiento en paralelo?

De manera general, la computación paralela consiste en el uso simultáneo de múltiples procesadores o núcleos que ejecutan cada uno una serie de instrucciones que conforman las distintas partes en las que se ha descompuesto un problema computacional para resolver.

Para poder poner en marcha el cómputo en paralelo:

  • El problema computacional debe dividirse en distintos componentes, trabajos o problemas que puedan ser resueltos al mismo tiempo.
  • Las instrucciones de estos se deben de poder ejecutar en cualquier momento.
  • Debe ser posible resolver los problemas cada vez en menos tiempo cuantos más recursos informáticos estén trabajando a la vez.

Los recursos informáticos que se utilizan en el procesamiento en paralelo son o una computadora con múltiples procesadores/núcleos o múltiples computadoras conectadas en red (computación distribuida).

Beneficios de usar la computación paralela

Las ventajas principales de la computación paralela radican en que las computadoras pueden ejecutar código de manera más eficiente, lo que supone un ahorro de tiempo y dinero al clasificar el big data más rápido que nunca, además de resolver problemas más complejos.

  • Modelos de computación para el mundo real: el mundo que nos rodea no es en serie. Las cosas no suceden una a la vez, esperando que termine un evento antes de que comience el siguiente. Para calcular datos sobre el clima, el tráfico, las finanzas, la industria, la agricultura, los océanos, los casquetes polares y la atención médica es necesaria la computación paralela.
  • Ahorrar tiempo: la computación en serie obliga a los procesadores rápidos a hacer cosas de manera ineficiente.
  • Ahorrar dinero: al ahorrar tiempo, la computación paralela abarata las cosas. El uso más eficiente de los recursos puede parecer insignificante a pequeña escala, pero cuando se amplía la visión a un sistema a miles de millones de operaciones (software bancario, por ejemplo) se consiguen enormes ahorros de costes.
  • Resolución de problemas complejos o grandes: la informática está evolucionando. Con la Inteligencia Artificial (IA) y el big data una aplicación web puede procesar millones de transacciones por segundo. Además, los “grandes desafíos” como asegurar el ciberespacio o hacer que la energía solar sea asequible requerirán petaFLOPS de recursos informáticos. Esto solo es posible con la computación paralela.
  • Aprovechar los recursos: los seres humanos crean 2,5 quintillones de bytes de información al día. Con el procesamiento paralelo, varias computadoras con varios núcleos cada una pueden examinar muchas veces más datos en tiempo real.

Sala de servidores

Tipos de computación paralela

Los distintos tipos o arquitecturas de procesamiento en paralelo y cómo funcionan son:

SISD (Single Instruction, Single Data)

En el tipo de computación denominada Instrucción Única, Datos Únicos (SISD), un único procesador se encarga de gestionar simultáneamente un algoritmo como una única fuente de datos.

SISD representa una organización informática que tiene una unidad de control, una de procesamiento y una de memoria similar a la computadora serie. SISD ejecuta las instrucciones secuencialmente y puede o no ser capaz de realizar procesamiento en paralelo, dependiendo de su configuración. Las instrucciones ejecutadas secuencialmente podrán cruzarse a lo largo de sus fases de ejecución. Es posible que haya más de una unidad funcional dentro de una computadora SISD. Sin embargo, una unidad de control está a cargo de todas las unidades funcionales.

Dichos sistemas permiten el procesamiento de tuberías o el uso de numerosas unidades funcionales para lograr un procesamiento paralelo.

MISD (Multiple Instruction, Single Data)

Los procesadores múltiples son estándar en las computadoras que utilizan Instrucción Múltiple, Datos Únicos (MISD). Al utilizar varios algoritmos, todos los procesadores comparten los mismos datos de entrada.

Las computadoras MISD pueden realizar simultáneamente muchas operaciones en el mismo lote de datos. Como era de esperar, la cantidad de operaciones se ve afectada por la cantidad de procesadores disponibles.

La estructura MISD consta de muchas unidades de procesamiento, cada una de las cuales opera según sus instrucciones y sobre un flujo de datos comparable. La salida de un procesador se convierte en la entrada del siguiente.

SIMD (Single Instruction, Multiple Data)

Las computadoras que utilizan la arquitectura SIMD (Instrucción Única, Datos Múltiples) tienen múltiples procesadores que ejecutan instrucciones idénticas. Sin embargo, cada procesador proporciona las instrucciones con su colección única de datos.

Las computadoras SIMD aplican el mismo algoritmo a varios conjuntos de datos. La arquitectura SIMD cuenta con varios componentes de procesamiento, los cuales están bajo la supervisión de una única unidad de control. Mientras procesa numerosos datos, cada uno recibe la misma instrucción de la unidad de control. Varios módulos incluidos en el subsistema compartido ayudan en la comunicación simultánea con cada CPU.

MIMD (Multiple Instruction, Multiple Data)

Las computadoras de Instrucción Múltiple, Datos Múltiples (MIMD) se caracterizan por la presencia de múltiples procesadores y cada uno de ellos es capaz de aceptar de forma independiente su flujo de instrucciones. Este tipo de computadoras tienen muchos procesadores y, además, cada CPU extrae datos de un flujo de datos diferente.

Una computadora MIMD es capaz de ejecutar muchas tareas simultáneamente. Aunque las computadoras MIMD son más adaptables, desarrollar los sofisticados algoritmos que impulsan estas máquinas es más complejo.

Concepto de flujo de datos

SPMD (Single Program, Multiple Data)

Los sistemas SPMD, que significa Programa Único, Datos Múltiples, son un subconjunto de MIMD. Aunque una computadora SPMD está construida de manera similar a una MIMD, cada uno de sus procesadores es responsable de ejecutar las mismas instrucciones.

SPMD es una programación de paso de mensajes utilizada en sistemas informáticos de memoria distribuida. De este modo, un grupo de computadoras separadas, denominadas colectivamente nodos, forman una computadora con memoria distribuida. Cada nodo inicia su aplicación y utiliza rutinas de envío/recepción para enviar y recibir mensajes cuando interactúa con otros nodos.​

MPP (Massively Parallel Processing)

Se crea una estructura de almacenamiento llamada Procesamiento Masivo en Paralelo (MPP) para gestionar la ejecución coordinada de las operaciones del programa por parte de numerosos procesadores.

Dado que cada CPU utiliza su sistema operativo y su memoria, este procesamiento coordinado se puede aplicar a diferentes secciones del programa. Como resultado, las bases de datos MPP pueden manejar enormes cantidades de datos y ofrecer análisis basados en grandes conjuntos de datos considerablemente más rápido.

Los procesadores MPP normalmente se comunican a través de una interfaz de mensajería y pueden tener hasta 200 o más procesadores trabajando en una aplicación. Funciona permitiendo la transmisión de mensajes entre procesos a través de un conjunto de enlaces de datos correspondientes.

Los tipos más comunes de computadoras utilizadas en sistemas de procesamiento paralelo son SIMD y MIMD. Aunque las computadoras SISD no pueden funcionar en paralelo por sí solas, se puede crear un clúster conectando muchas de ellas. En un sistema paralelo más extenso, la CPU de cada computadora puede funcionar como un procesador. Las computadoras funcionan como una sola supercomputadora cuando se usan colectivamente. Computación grid es el nombre de este método.

Computación paralela vs. Computación distribuida

La computación distribuida es el proceso de conectar varias computadoras a través de una red para que puedan actuar juntas como una sola más potente y capaz de realizar cálculos que ninguna computadora de la red por sí sola podría acometer. La computación distribuida ofrece dos ventajas clave:

  • Fácil escalabilidad: se consigue simplemente agregando más computadoras al sistema distribuido.
  • Redundancia: dado que muchas máquinas diferentes prestan el mismo servicio, puede seguir ejecutándose incluso si una (o más) de las computadoras falla.

Las principales diferencias entre computación paralela y distribuida son:

  • Número de computadoras: la computación paralela normalmente requiere una computadora con múltiples procesadores. Sin embargo, la distribuida implica varios sistemas informáticos autónomos (y a menudo geográficamente separados y/o distantes) que trabajan en tareas divididas para resolver un problema computacional.
  • Escalabilidad: los sistemas informáticos paralelos son menos escalables que los distribuidos porque la memoria de una sola computadora solo puede manejar una cantidad limitada de procesadores a la vez. Un sistema informático distribuido siempre puede escalar con computadoras adicionales.
  • Memoria: en la computación paralela, todos los procesadores comparten la misma memoria y los procesadores se comunican entre sí con su ayuda. Los sistemas informáticos distribuidos, por otro lado, tienen su propia memoria y procesadores.
  • Sincronización: en la computación paralela todos los procesadores comparten el mismo reloj para la sincronización, mientras que en los sistemas distribuidos se utilizan algoritmos específicos.
  • Uso: la computación paralela se utiliza para aumentar el rendimiento de la computadora y para la computación científica, mientras que la computación distribuida para compartir recursos y mejorar la escalabilidad.

Los fundamentos, conceptos clave y usos de la computación paralela y distribuida se abordan con detalle en el Máster en Ingeniería de Software de UNIR.

Globo terráqueo rodeado de ordenadores y un servidor

Aplicaciones y ejemplos de programación paralela

Históricamente la programación paralela se ha utilizado para modelar problemas complejos en áreas de la ciencia y la ingeniería (cuestiones medioambientales, medicina, etc.). Hoy en día, las aplicaciones comerciales impulsan el desarrollo de computadoras más rápidas. Estas aplicaciones requieren el procesamiento de grandes cantidades de datos, por ejemplo:

  • Big Data, Bases de Datos, Minería de Datos
  • Inteligencia artificial (IA)
  • Búsqueda de petróleo
  • Motores de búsqueda web, servicios empresariales basados en web
  • Imagenología médica y diagnóstico
  • Diseño farmacéutico
  • Modelización financiera y económica
  • Gestión de corporaciones nacionales y multinacionales
  • Gráficos avanzados y realidad virtual, particularmente en la industria del entretenimiento
  • Tecnologías multimedia y de vídeo en red
  • Entornos de trabajo colaborativos

Algunos ejemplos concretos de la utilización de la computación paralela son:

  • Smartphones: los teléfonos móviles inteligentes actuales son ejemplos de computación paralela puesto que tienen procesadores de varios núcleos.
  • Ordenadores portátiles y de sobremesa: utilizan un sistema de procesadores similar al de los smartphones.
  • Sistema informático de los transbordadores de la NASA: el programa Space Shuttle utiliza 5 ordenadores IBM AP-101 en paralelo. Controlan la aviónica del transbordador y procesan grandes cantidades de datos a gran velocidad en tiempo real. Las máquinas pueden realizar 480.000 instrucciones por segundo. El mismo sistema también se ha utilizado en los aviones de combate F-15 y en el bombardero B-1..
  • Supercomputadora American Summit: fue construida por el Departamento de Energía de Estados Unidos en su Laboratorio Nacional de Oak Ridge. Es una máquina de 200 petaFLOPS que puede procesar 200 mil billones de operaciones por segundo. Si cada ser humano del planeta realizara un cálculo por segundo, necesitaría 10 meses para hacer lo que Summit logra en un solo segundo. Los científicos la están utilizando para comprender la genómica, los terremotos, el clima, la física y crear nuevos materiales.
  • SETI (Search for Extra Terrestrial Intelligence): la Búsqueda de Inteligencia Extraterrestre monitoriza millones de frecuencias 24×7. Para aliviar la carga de trabajo, SETI utiliza computación paralela a través de Berkeley Open Infrastructure for Network Computing (BOINC), mediante la cual millones de personas donan tiempo de computadora no utilizado para procesar todas esas señales.
  • Bitcoin: es una tecnología blockchain que utiliza varias computadoras para validar transacciones. Blockchain y Bitcoin no funcionan sin computación paralela.
  • Internet de las cosas (IoT – Internet of Things): desde sensores hasta automóviles inteligentes, drones…la computación paralela permite seguir el ritmo de la avalancha de datos de telemetría en tiempo real procedentes del IoT.

Toda esta evolución tecnológica sería inviable sin estudios específicos, de ahí la importancia de estudiar matemáticas computacionales y de contar con perfiles técnicos como el de ingeniero de computación.

    Títulos que te pueden interesar

    Noticias relacionadas

    Cara de niña asiática autenticación por reconocimiento facial

    ¿Qué son las redes convolucionales y para qué se usan?

    Este tipo de red neuronal artificial imita al ojo humano para identificar diferentes características y objetos, principalmente en el tema de imágenes. Se utilizan en el ámbito de la salud, la seguridad o las redes sociales.

    Hombre y mujer cotejando datos en un ordenador

    ¿Qué es Data Mesh o malla de datos?

    Data Mesh es un enfoque de la ciencia de datos que promueve la descentralización de la gestión y el control de los datos. Esto posibilita la autonomía de los equipos de una organización y promueve la escalabilidad.

    Ingeniera con portátil como concepto de industria 4.0

    LoRaWAN: ¿en qué consiste este protocolo y para qué se emplea?

    LoRaWAN es un protocolo de conectividad inalámbrico que está revolucionando la Industria 4.0 por su largo alcance y su bajo consumo energético.

    Docencia 100% online

    Nuestra metodología te permite estudiar sin desplazarte mediante un modelo de aprendizaje personalizado

    Clases en directo

    Nuestros profesores imparten 4.000 horas de clases online a la semana. Puedes asistir en directo o verlas en otro momento

    Mentor - UNIR

    En UNIR nunca estarás solo. Un mentor realizará un seguimiento individualizado y te ayudará en todo lo que necesites

    La fuerza que necesitas

    Nuestra vida académica y social

    Acompañamiento personalizado