Вход

Однокристальные мультикомпьютеры. Понятие барьерной синхронизации и методы ее реализации

Рекомендуемая категория для самостоятельной подготовки:
Реферат*
Код 184885
Дата создания 2014
Страниц 21
Источников 3
Мы сможем обработать ваш заказ (!) 29 марта в 18:00 [мск]
Файлы будут доступны для скачивания только после обработки заказа.
1 420руб.
КУПИТЬ

Содержание

Введение 3
1.Характеристика задачи обеспечения барьерной синхронизации 5
2.Концепция и технология параллельного программирования неоднородных систем на кристалле 11
Заключение 20
Список литературы 21

Фрагмент работы для ознакомления

Данные об оптических поверхностях размещаются в локальной памяти процессорного элемента (ПЭ), на котором будет размещен процесс, обрабатывающий запросы на информацию о поверхностях («менеджер поверхностей»). Данные о начальном наборе лучей помещаются в общий буфер лучей для расчета, из которого лучи на обработку будут забираться по мере развертывания итераций цикла («параллельная обработка лучей»).Цикл разворачивается в количестве одновременно работающих итераций от (1) до (количество лучей) в зависимости от реализации конкретной аппаратной платформы, наличия ресурсов и других факторов. Далее можно детализировать тело цикла независимо, не затрагивая схему верхнего уровня (рис. 3).Каждая итерация получает на обработку один луч для расчета прохождения через очередную поверхность. Запрашиваются параметры поверхности («Выч-е номера поверхности»), вычисляются два новых луча, прямой и отраженный («Расчет лучей»). Далее проверяются их интенсивности и завершение прохождения («Проверка интенсивности»), результат проверки поступает на вход условного оператора («Выбор места назначения луча»), после чего они удаляются (ветвь «Drop»), попадают в выходной буфер (ветвь «Finish») или вновь в исходный буфер на новую обработку (ветвь «Continue»). Конечно, ветвь «Drop» не обязательно представлять на схеме. Она нарисована исключительно для наглядности отображения обработки.И, наконец, общая схема (рис. 5). Следует отметить, что не обязательно обобщенная схема должна представляться на одном «листе» программы. Иерархия может быть отображена как на одном экране (на рисунке), так и на различных «листах» и в различных файлах.Данный пример содержит иллюстрацию возможностей по описанию динамики вычислений и параллелизма в рамках предложенной концепции. Схема программы содержит статические компоненты (терминальные операторы), а также динамическое управление (условные операторы и циклы).Как известно, общая задача размещения программ на однородных ВС в общем случае является NP-полной задачей. Для неоднородных СнК необходимо учитывать еще два фактора: ограничения на размещения и различные параметры выполнения, обусловленные неоднородностью вычислительных модулей и коммуникационной системы.Комплекс VIPE обеспечивает размещение элементов схемы программы на модулях неоднородной СнК в следующих режимах: автоматическом, ручном и в автоматическом с установленными ограничениями. Представление схемы параллельной программы позволяет легко и наглядно задавать, анализировать и управлять ее размещением.Таким образом, представлена целостная концепция параллельного программирования неоднородных СнК, описывающая все этапы разработки от неформального описания алгоритма до получения готовой программы, размещения и характеристик выполнения - и реализованная в виде интегрированной среды параллельного программирования VIPE.Методология и инструментарий основаны на математической модели параллельных вычислений, которая гарантирует получение одинаковых результатов независимо от того, выполняется ли алгоритм виртуально или на модели платформы, а также от конкретной конфигурации платформы.Интегрированная среда программирования VIPE позволяет:Разработать параллельный алгоритм решения задачи, провести иерархическую декомпозицию до нужной гранулярности, спроектировать параллельный алгоритм, эффективный для выполнения на параллельной СнК как ВС с распределенной архитектурой.На ранних этапах сделать оценку времени выполнения и вычислительной сложности алгоритма. Это позволяет до этапа детального проектирования платформы рамочно оценить требования к вычислительным ресурсам, памяти, коммуникационной среде.Рис. 3. Цикл расчета прохождения луча через оптическую поверхностьПолностью запрограммировать алгоритм, провести функциональную отладку и тестирование разработанного ПО. Выполнять ПО на различных моделях и конфигурациях вычислительной платформы, более детально получить характеристики выполняемых программ и требований к аппаратуре.Используя компилятор, под конкретную платформу произвести сборку загрузочных модулей для запуска непосредственно на вычислительной платформе.Возможность использовать преимущества конвейерного параллелизма, естественного параллелизма прикладных алгоритмов, естественную динамику выполняемой задачи для улучшения характеристик параллельной программы, повышения производительности (performance, throughput), сокращения времени выполнения (latency).ЗаключениеИтак, рассмотрены некоторые варианты реализации барьерной синхронизации. Для проведения их сравнения были определены понятия синхронизационных гарантий и для синхронизационных операций указаны наборы гарантий, ими предоставляемые. Также были классифицированы возможные варианты реализации барьерной синхронизации по способу получения гарантии по доставке пакетов. Для варианта посторонними операциями без подтверждений доставки и без подсчета пакетов были рассмотрены два варианта реализации барьерной синхронизации, дана оценка их временной сложности и проведено сравение возможной применимости того или иного варианта в зависимости от размера сети.СписоклитературыМакагон Д.В., Сыромятников ЕЛ. Сети для суперкомпьютеров // Открытые системы. СУБД. Сентябрь 2011. № 7.Корж А.А., Макагон Д.В., Жабин И.А., Сыромятников ЕЛ. и др. Отечественная коммуникационная сеть 3D-Top с поддержкойглобально адресуемой памяти для суперкомпьютеров транспетафлопсного уровня производительности // Параллельные вычислительные технологии (ПаВТ'2010): Труды Междунар. научн. конф. (Уфа, 29 марта — 2 апреля2010 г.), http://omega.sp.susu.ac.ru/ books/conference/PaVT2010/fulEl 34.pdf. Alverson R., Roweth D., Kaplan L. The Gamini System Interconnect, 18lh // IEEE Symposium on High Performance Interconnects. 2010.Современная технология дает возможность создания СБИС емкостью свыше 2 транзисторов, позволяя реализовать на одной микросхеме мощные мультикомпьютеры, содержащие 100 и более процессорных модулей. Тип Современная технология дает возможность создания СБИС емкостью свыше 2 транзисторов, позволяя реализовать на одной микросхеме мощные мультикомпьютеры, содержащие 100 и более процессорных модулей. Типичными представителями таких однокристальных систем являются матричные мультикомпьютеры фирмы, объединяющие от 32 до 100 процессорных элементов, связанных коммуникационной средой в двухмерную матричную структуру [1].Функционирование мультикомпьютеров сопряжено с выполнением ряда коммуникационных операций, к числу которых относится барьерная синхронизация. Она заключается в согласовании моментов завершения и запуска параллельных ветвей программы в определенной ее точке (называемой барьером) и предполагает приостановку выполнения некоторых ветвей (процессов) до наступления условия синхронизации, при котором все требуемые процессы достигли барьера [2]. Недостаточно эффективная организация синхронизации может значительно увеличить общее время выполнения параллельной программы, ограничивая производительность мультикомпьютера. Современная технология дает возможность создания СБИС емкостью свыше транзисторов, позволяя реализовать на одной микросхеме мощные мультикомпьютеры, содержащие 100 и более процессорных модулей. Типичными представителями таких однокристальных систем являются матричные мультикомпьютеры фирмы, объединяющие от 32 до 100 процессорных элементов, связанных коммуникационной средой в двухмерную матричную структуру [1].Функционирование мультикомпьютеров сопряжено с выполнением ряда коммуникационных операций, к числу которых относится барьерная синхронизация. Она заключается в согласовании моментов завершения и запуска параллельных ветвей программы в определенной ее точке (называемой барьером) и предполагает приостановку выполнения некоторых ветвей (процессов) до наступления условия синхронизации, при котором все требуемые процессы достигли барьера [2]. Недостаточно эффективная организация синхронизации может значительно увеличить общее время выполнения параллельной программы, ограничивая производительность мультикомпьютера. Современная технология дает возможность создания СБИС емкостью свыше транзисторов, позволяя реализовать на одной микросхеме мощные мультикомпьютеры, содержащие 100 и более процессорных модулей. Типичными представителями таких однокристальных систем являются матричные мультикомпьютеры фирмы, объединяющие от 32 до 100 процессорных элементов, связанных коммуникационной средой в двухмерную матричную структуру [1].Функционирование мультикомпьютеров сопряжено с выполнением ряда коммуникационных операций, к числу которых относится барьерная синхронизация. Она заключается в согласовании моментов завершения и запуска параллельных ветвей программы в определенной ее точке (называемой барьером) и предполагает приостановку выполнения некоторых ветвей (процессов) до наступления условия синхронизации, при котором все требуемые процессы достигли барьера [2]. Недостаточно эффективная организация синхронизации может значительно увеличить общее время выполнения параллельной программы, ограничивая производительность мультикомпьютера.ичными представителями таких однокристальных систем являются матричные мультикомпьютеры фирмы, объединяющие от 32 до 100 процессорных элементов, связанных коммуникационной средой в двухмерную матричную структуру [1].Функционирование мультикомпьютеров сопряжено с выполнением ряда коммуникационных операций, к числу которых относится барьерная синхронизация. Она заключается в согласовании моментов завершения и запуска параллельных ветвей программы в определенной ее точке (называемой барьером) и предполагает приостановку выполнения некоторых ветвей (процессов) до наступления условия синхронизации, при котором все требуемые процессы достигли барьера [2]. Недостаточно эффективная организация синхронизации может значительно увеличить общее время выполнения параллельной программы, ограничивая производительность мультикомпьютера.

Список литературы [ всего 3]

1. Макагон Д.В., Сыромятников ЕЛ. Сети для суперкомпьютеров // Открытые системы. СУБД. Сентябрь 2011. № 7.
2. Корж А.А., Макагон Д.В., Жабин И.А., Сыромятников ЕЛ. и др. Отечественная коммуникационная сеть 3D-Top с поддержкой глобально адресуемой памяти для суперкомпьютеров транспетафлопсного уровня производительности // Параллельные вычислительные технологии (ПаВТ'2010): Труды Междунар. научн. конф. (Уфа, 29 марта — 2 апреля2010 г.), http://omega.sp.susu.ac.ru/ books/conference/PaVT2010/fulEl 34.pdf.
3. Alverson R., Roweth D., Kaplan L. The Gamini System Interconnect, 18lh // IEEE Symposium on High Performance Interconnects. 2010.
Очень похожие работы
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
bmt: 0.00489
© Рефератбанк, 2002 - 2024