Важнейшими характеристиками любых вычислительных машин являются их производительность и быстродействие. Часто эти две характеристики отождествляют, но иногда используется и та и другая.
Под производительностью (performance) понимают количество операций, выполняемых на данной вычислительной системе в единицу времени. Быстродействие (speed) – величина, обратная среднему времени выполнения одной операции.
Производительность измеряется в миллионах команд в секунду MIPS (millions instructions per second) или миллионах операций с плавающей запятой в секунду MFLOPS (millions floating point operations per second).
Кроме производительности важными характеристиками вычислительных систем являются масштабируемость вычислительной системы (scalability) - способность вычислительной системы к наращиванию и сокращению ресурсов (прежде всего, производительности и оперативной памяти), реконфигурируемость вычислительной системы (programmability) – варьирование числа узлов и графа их связей, надежность и живучесть вычислительной системы (reliability and robustness). Хорошо масштабируемая система обеспечивает линейный рост производительности с ростом количества процессоров в ней.
Асимптотическая производительность векторно-конвейерных систем.
Как отмечалось выше, основным признаком векторно-конвейерных систем является наличие конвейерных функциональных устройств, содержащих ряд конвейеров операций (например, конвейер сложения вещественных чисел, конвейер умножения таких же чисел и т.п.). Поэтому оценка производительности векторно-конвейерных систем основана на оценке производительности конвейеров операций.
Методику оценки производительности конвейеров операций рассмотрим на примере конвейера операции сложения. Положим, что имеется -ступенчатый конвейер операции сложения и пусть все ступени конвейера операций требуют одинакового времени выполнения . Тогда для выполнения операции сложения векторов , требуется время
 (1)

где - фиксированное время запуска конвейера, - время "разгона" конвейера.
После запуска конвейера и его "разгона" конвейер выдает результат через каждый такт . Т.е. максимальная скорость выдачи результатов конвейером (максимальное быстродействие) равна
 (2)

Быстродействие конвейера принято называть асимптотическим быстродействием. Быстродействие конвейера приближается к асимптотическому быстродействию в случае, когда в формуле (1) можно пренебречь слагаемыми , . Эта ситуация имеет место когда длина обрабатываемых векторов много больше величин . При этом предполагается, что отсутствуют конфликты при обращении к памяти.
Аналогичная ситуация имеет место для конвейеров любых операций. Условно принято говорить, что асимптотическое быстродействие конвейера операций достигается на векторах бесконечной длины.
При работе конвейера в последовательном режиме, очевидно, максимальная скорость выдачи результатов равна
 (3)

Таким образом, конвейерная обработка увеличивает производительность вычислительной системы в раз (на векторах бесконечной длины).
Асимптотическая производительность векторно-параллельных и многопроцессорных систем.
Методику оценки производительности векторно-параллельных систем и MIMD-систем рассмотрим на примере операции сложения векторов , на -процессорной системе. Время выполнения этой операции как на векторно-параллельной системе, так на MIMD-системе можно оценить по формуле
 (4)

где - время коммуникаций, - время вычислений; - диаметр коммуникационной сети системы, [] - ближайшее целое, большее A, - производительность каналов межпроцессорного обмена, [сек] - время выполнения операции сложения двух чисел на одном процессоре системы.
Если пренебречь коммуникационными расходами, то в качестве минимального времени выполнения операции сложения компонент , векторов , на процессорах системы можно принять время ( - время сложения всех компонент векторов ,, а - минимальное время сложения двух компонент этих векторов). Таким образом, максимальная скорость выдачи результатов -процессорной векторно-параллельной системой и MIMD-системой (максимальное быстродействие) равна
 (5)

Быстродействие векторно-параллельной системы и MIMD-системы также принято называть асимптотическим быстродействием. Быстродействие векторно-параллельной системы и MIMD-системы приближается к асимптотическому быстродействию в случае, когда в формуле (4) можно пренебречь коммуникационной составляющей и когда величина n кратна количеству процессоров в системе . Заметим, что пренебрежение коммуникационными расходами предполагает также, что команды не конфликтуют между собой при доступе к памяти.
При сложении векторов , на одном процессоре системы максимальная скорость выдачи результатов равна, очевидно,
 (6)

Таким образом, параллельное сложение векторов на векторно-параллельных и MIMD-системах увеличивает производительность максимум в раз.
Аналогичная ситуация имеет место при выполнении ни векторно-параллельных системах или MIMD-системах любых бинарных операций.
Длина полупроизводительности
Важной характеристикой параллельных вычислительных систем является величина – длина векторов, на которых достигается половина асимптотического быстродействия системы. Эта величина называется длиной полупроизводительности.
Смыслы асимптотического быстродействия и длины полупроизводительности различны. Асимптотическое быстродействие, главным образом, характеризует технологию изготовления ЭВМ, в то время как длина полупроизводительности представляет собой критерий степени параллелизма системы.
Относительная производительность различных алгоритмов на данной параллельной вычислительной системе определяется длиной полупроизводительности.
Введем в рассмотрение величину

где – средняя длина обрабатываемых векторов. Тогда означает, что данный алгоритм может быть эффективно распараллелен для решения на данной вычислительной системе, 1 - означает противоположное.
Пример 1
Рассмотрим операцию перемножения двух матриц (для выполнения которой необходима операция скалярного произведения векторов) на параллельных вычислительных системах CYBER-205 и CRAY-1 (см. табл. 1).
Таблица 1    
ЭВМОперация[MFLOPS]
CYBER-205Сложение векторов100102
CYBER-205Скалярное произведение100116
CRAY-1Перемножение двух матриц1537

Положим, что средняя длина обрабатываемых векторов равна 100. Тогда

Т.е. для решения рассматриваемой задачи система CRAY-1 гораздо более эффективна по сравнению с системой CYBER-205
Реальная производительность (производительность на тестах).
Существующие тестовые наборы можно разделить на три группы:
В вычислительной практике чаще всего применяют стандартные тесты. Рассмотрим некоторые из них.
Поскольку большую часть времени выполнения программ обычно занимают циклы, часто именно они применяются в качестве тестов. В настоящее время наиболее известным тестом производительности является набор тестов Linpack, который представляет собой набор программ для решения СЛАУ методом исключения Гаусса. Основным параметром тестов Linpack является порядок СЛАУ . Обычно используются тесты с =100 и тесты =1000. Известно количество операций (как функция размерности СЛАУ ), которые необходимо выполнить для решения систем линейных алгебраических уравнений (СЛАУ) методом исключения Гаусса. Поэтому, зная время решения задачи, легко найти производительность системы в MFLOPS. Известный список TOP 500, включающий в себя 500 самых высокопроизводительных компьютеров мира, строится на основе тестирования с помощью тестов Linpack.
Для MPP-систем часто используют набор тестов Linpack-parallel. Приведем результаты исполнения теста Linpack-parallel на некоторых параллельных системах:
Для суперкомпьютеров широко используются набор тестов NAS parallel benchmark. Тесты представляют собой набор алгоритмов решения некоторых задач вычислительной газодинамики и гидродинамики.
Гипотеза Минского.
Гипотеза Минского. В -процессорной векторно-параллельной вычислительной системе или MIMD-вычислительной системе, в которой производительность каждого процессора равна единице, общая производительность растет как (см. рис. 1)
В первых параллельных вычислительных системах, когда количество процессоров было невелико, гипотеза Минского подтверждалась. В современных системах с большим количеством процессоров имеет место зависимость производительности от числа процессоров, показанная на рис. 1 пунктиром. Основные причины такой зависимости:
Таким образом, если количество процессоров системы превышает величину , то целесообразно использовать мультипрограммный режим работы системы.
Рис. 1.  К гипотезе Минского.