Библиотека knigago >> Компьютеры и Интернет >> Околокомпьютерная литература >> Параллельные вычисления общего назначения на графических процессорах


СЛУЧАЙНЫЙ КОММЕНТАРИЙ

# 936, книга: Высматриватель
автор: Юна Анатольевна Летц (Юна)

"Высматриватель" Юны Летц - пронзительный и захватывающий роман, который исследует темные уголки человеческой психики и последствия насилия. История разворачивается вокруг главного героя, Луиса, одаренного художника, чья жизнь принимает трагический оборот после того, как его возлюбленная становится жертвой жестокого убийства. Травма заставляет Луиса погрузиться в мрачную одержимость, и он становится "Высматривателем", патрулируя улицы в поисках убийцы. Летц мастерски...

Кирилл Александрович Некрасов , Святослав Игоревич Поташников , Антон Сергеевич Боярченков , Анатолий Яковлевич Купряжкин - Параллельные вычисления общего назначения на графических процессорах

Параллельные вычисления общего назначения на графических процессорах
Книга - Параллельные вычисления общего назначения на графических процессорах.  Кирилл Александрович Некрасов , Святослав Игоревич Поташников , Антон Сергеевич Боярченков , Анатолий Яковлевич Купряжкин  - прочитать полностью в библиотеке КнигаГо
Название:
Параллельные вычисления общего назначения на графических процессорах
Кирилл Александрович Некрасов , Святослав Игоревич Поташников , Антон Сергеевич Боярченков , Анатолий Яковлевич Купряжкин

Жанр:

Околокомпьютерная литература, Учебники и самоучители по компьютеру

Изадано в серии:

неизвестно

Издательство:

Издательство Уральского Университета

Год издания:

ISBN:

978-5-7996-1722-6

Отзывы:

Комментировать

Рейтинг:

Поделись книгой с друзьями!

Помощь сайту: донат на оплату сервера

Краткое содержание книги "Параллельные вычисления общего назначения на графических процессорах"

В учебном пособии изложены основные принципы организации высокоскоростных параллельных вычислений на графических процессорах. Рассмотрены подходы к программированию графических процессоров с использованием шейдерной модели и NVIDIA CUDA. Проанализированы примеры. Пособие предназначено для проведения практических занятий по программированию графических процессоров для магистрантов.

Читаем онлайн "Параллельные вычисления общего назначения на графических процессорах". [Страница - 2]

моделей.
Поскольку графические процессоры создавались именно для реше‑
ния задачи визуализации, рассмотрим ее основные составляющие.
Пусть, для определенности, трехмерная сцена представляет со‑
бой совокупность поверхностей, разбитых для дискретной компью‑
терной обработки на плоские треугольники. В некоторых массивах,
которые обычно называют текстурами, хранится информация о цве‑
тах треугольников. Кроме того, известны положения и характеристи‑
ки источников света. Задача визуализации состоит в том, чтобы сфор‑
мировать изображение этой сцены на плоскости экрана, положение
которой определяется точкой зрения наблюдателя.
Процесс формирования изображения включает в себя следующие
основные этапы:
· проектирование треугольников, представляющих сцену, на пло‑
скость экрана;
· разбиение полученных проекций на отдельные пиксели, для ко‑
торых будут определяться цвета (стадия растеризации треуголь‑
ников);
4

1.2. Архитектура графического процессора (GPU)

· определение видимого цвета элементов поверхности треуголь‑
ников с учетом исходного цвета и отражающих свойств самой
поверхности, прозрачности других поверхностей, освещенно‑
сти и теней.
Обрабатываемые сцены обычно состоят из очень многих треуголь‑
ников, которые разбиваются на еще большее количество пикселей, так
что их визуализация требует больших вычислительных ресурсов. Вме‑
сте с тем и вершины, и пиксели можно обрабатывать почти или со‑
всем независимо друг от друга. Соответственно задача визуализации
допускает очень эффективное распараллеливание.
Именно в целях распараллеливания графических вычислений цен‑
тральные процессоры персональных компьютеров стали с у п е р с к а л я р н ы ми — получили возможность одновременного (в екторного)
исполнения некоторых операций сразу над несколькими числами (рас‑
ширения 3DNow! и SSE).
Большинство центральных процессоров ПК состоит из несколь‑
ких ядер, что дополнительно увеличивает их потенциал как систем
для параллельных вычислений. Тем не менее исторически сложилось
так, что наиболее эффективными устройствами для распараллелива‑
ния вычислений на ПК стали и до сих пор остаются специализиро‑
ванные графические процессоры (GPU). Эти процессоры, разраба‑
тывавшиеся именно для обработки графики, практически полностью
ориентированы на параллельную обработку данных.

1.2. Архитектура графического процессора (GPU)
1.2.1. Распараллеливание вычислений по данным
Конструктивно графический процессор представляет собой вычис‑
лительное устройство, работающее отдельно от центрального процес‑
сора, параллельно с ним. Обычно графические процессоры размещают
на отдельных печатных платах с собственной системой охлаждения,
которые называют графическими ускорителями (или видеокартами).
Вместе с GPU на плате графического ускорителя расположена видео­
память — специализированная оперативная память, в которой хра‑
нятся обрабатываемые графическим процессором массивы данных.
5

1. Структура и возможности вычислительной системы с графическим процессором

На рис. 1.1 в качестве примера показана архитектура графическо‑
го процессора G80 — одного из процессоров компании NVIDIA [4].
Главной (и общей для всех графических процессоров) характеристи‑
кой этой архитектуры является то, что GPU представляет собой си‑
стему из параллельных вычислительных устройств, каждое из которых
применяет заданную, единую для всех устройств, программу (в ычисл и т е ль н о е я д р о , англ. kernel) к различным элементам входных мас‑
сивов данных, расположенных в общей памяти.
Отдельный «вычислитель» (процессор),
осуществляющий конвейерную обработку
данных

Центральный процессор (Host)
Устройство управления вычислительными процессами
(Tread Execution Manager)

SM

Параллельный кеш данных (Parallel Data
Cache, Shared Memory) – разделяемая память, одновременно доступная всем «вычислителям» одного мультипроцессора

16 мультипроцессоров
SM

SM

SM

SM

ј

SM

SM

SM

SM

Кеш графического процессора, доступный всем мультипроцессорам.
Центральному процессору доступен частично и только для записи
Общая память для размещения входных данных и результатов
(видеопамять, Global Memory), доступная как всем мультипроцессорам
GPU, так и центральному процессору. Размер − --">

Оставить комментарий:


Ваш e-mail является приватным и не будет опубликован в комментарии.

Книги схожие с «Параллельные вычисления общего назначения на графических процессорах» по жанру, серии, автору или названию: