Библиотека knigago >> Компьютеры и Интернет >> Околокомпьютерная литература >> Параллельные вычисления общего назначения на графических процессорах


СЛУЧАЙНЫЙ КОММЕНТАРИЙ

# 904, книга: Балканский синдром
автор: Чингиз Акифович Абдуллаев

"Балканский синдром" Чингиза Абдуллаева — это захватывающий шпионский детектив, который разворачивается на фоне нестабильной политической арены Балканского региона. Главный герой книги, Аслан, бывший советский агент, оказался втянутым в смертельно опасную игру, когда ему поручают выследить и устранить таинственную девушку по имени Лейла. По мере того, как Аслан погружается в свое расследование, он обнаруживает, что Лейла, возможно, обладает компрометирующей информацией, которая может...

Кирилл Александрович Некрасов , Святослав Игоревич Поташников , Антон Сергеевич Боярченков , Анатолий Яковлевич Купряжкин - Параллельные вычисления общего назначения на графических процессорах

Параллельные вычисления общего назначения на графических процессорах
Книга - Параллельные вычисления общего назначения на графических процессорах.  Кирилл Александрович Некрасов , Святослав Игоревич Поташников , Антон Сергеевич Боярченков , Анатолий Яковлевич Купряжкин  - прочитать полностью в библиотеке КнигаГо
Название:
Параллельные вычисления общего назначения на графических процессорах
Кирилл Александрович Некрасов , Святослав Игоревич Поташников , Антон Сергеевич Боярченков , Анатолий Яковлевич Купряжкин

Жанр:

Околокомпьютерная литература, Учебники и самоучители по компьютеру

Изадано в серии:

неизвестно

Издательство:

Издательство Уральского Университета

Год издания:

ISBN:

978-5-7996-1722-6

Отзывы:

Комментировать

Рейтинг:

Поделись книгой с друзьями!

Помощь сайту: донат на оплату сервера

Краткое содержание книги "Параллельные вычисления общего назначения на графических процессорах"

В учебном пособии изложены основные принципы организации высокоскоростных параллельных вычислений на графических процессорах. Рассмотрены подходы к программированию графических процессоров с использованием шейдерной модели и NVIDIA CUDA. Проанализированы примеры. Пособие предназначено для проведения практических занятий по программированию графических процессоров для магистрантов.

Читаем онлайн "Параллельные вычисления общего назначения на графических процессорах". [Страница - 3]

до нескольких гигабайтов
Рис. 1.1. Архитектура графического процессора NVIDIA G80 [4]

Параллельная архитектура графических процессоров ориентиро‑
вана на исполнение алгоритмов, в которых элементы больших вход‑
ных массивов обрабатываются одинаковым образом независимо или
почти независимо друг от друга, то есть использующих распарал л еливание вычислений по данным. Множества элементов, подверга‑
емых однотипной независимой обработке, называют потоками (дан‑
ных либо результатов), так что графические процессоры осуществляют
поточно-параллельную обработку данных.
6

1.2. Архитектура графического процессора (GPU)

Концепция программирования, заключающаяся в потоко‑
вой обработке данных, известна под аббревиатурой SIMD (от англ.
Single Instruction — Multiple Data — одна инструкция для множества
данных, рис. 1.2). Процессор, работающий по принципу SIMD, пре‑
образует поток данных в поток результатов, используя программу как
функцию преобразования.
Инструкции
(вычислительное ядро)

GPU
Данные

Результаты

Рис. 1.2. Поточно-параллельная обработка данных SIMD

Выбор концепции SIMD для графических процессоров обусловлен
тем, что она обеспечивает параллельное использование большого ко‑
личества «вычислителей» без явного управления ими: распределения
задач, синхронизации вычислений и коммуникации между параллель‑
ными расчетами. Разработчикам GPU это позволяет за счет упроще‑
ния архитектуры добиваться большей производительности, а при про‑
граммировании сокращает работу.
C 2001 по 2006 годы графические процессоры включали в себя «вы‑
числители» двух типов: вер ш инные и пиксел ьные конв ейеры (или
шейдеры, см. пояснения ниже) [7–8]. Первые были предназначены для
проектирования на плоскость экрана вершин, задающих отображае‑
мые поверхности, а вторые — для расчета цветов пикселей на экране.
Так выпущенные в 2006 году процессоры ATI Radeon X1900–1950 име‑
ли 8 вершинных и 48 пиксельных конвейеров, которые к тому же были
суперскалярными (одновременно обрабатывали по 4 компоненты век‑
тора).
В 2007 году производители GPU перешли от различающихся вер‑
шинных и пиксельных конвейеров к унифицированным потоковым
процессорам, заменяющим как вершинные, так и пиксельные конвей‑
еры. Графические процессоры 2014–2015 годов выпуска ATI Radeon
Fiji XT и NVIDIA GM200–400 включают 4096 и 3072 потоковых процес‑
7

1. Структура и возможности вычислительной системы с графическим процессором

сора (для 32‑битовых вычислений «одинарной» точности) при несколь‑
ко различной внутренней архитектуре. При этом производительность
графических процессоров продолжает быстро увеличиваться.
1.2.2. Взаимодействие графического и центрального процессоров
Графический процессор не имеет средств прямого взаимодействия
с устройствами ввода-вывода (кроме монитора), а также доступа к опе‑
ративной памяти компьютера. Поэтому управление графическим про‑
цессором осуществляется только через центральный процессор. Схема
взаимодействия центрального и графического процессоров приведе‑
на на рис. 1.3.
Графический ускоритель (видеокарта)
Регистры и разделяемая память вычислительных блоков

GPU

• • • Языки для GPU: HLSL, CUDA

Кеш для
констант

Вычислительные
блоки GPU

Программа
для GPU

Общая память GPU (видеопамять)
Шина
данных(обычно
PCI-Express
либо AGP
Шина
данных
− PCI-Express)
• • Драйвер графического процессора
• Языки программирования высокого
уровня для CPU

Оперативная память
компьютера

CPU

Пользователь

Внешние устройства

Рис. 1.3. Схема взаимодействия CPU и GPU с памятью и между собой

Графические ускорители подключаются к системной плате персо‑
нального компьютера через высокоскоростную шину данных (в на‑
стоящее время PCI-Express). Посредством этой шины центральный
процессор получает доступ к видеопамяти, а также к некоторым раз‑
делам кеш-памяти, расположенной на самом графическом процессо‑
ре. Через эту же шину CPU загружает в графический процессор про‑
грамму и запускает ее.
8

1.2. Архитектура графического процессора (GPU)

Перед запуском программы, исполняемой на GPU, центральный
процессор передает графическому процессору данные двух видов:
· значения констант, используемых в программе;
· один или несколько больших массивов данных для потоковой
обработки.
К --">

Оставить комментарий:


Ваш e-mail является приватным и не будет опубликован в комментарии.

Книги схожие с «Параллельные вычисления общего назначения на графических процессорах» по жанру, серии, автору или названию: