Считается, что прадедушкой современной видеокарты является адаптер MDA (MonochromeDisplayAdapter), представленный в 1981 году для IBM PC. Видеокарта того времени имела 4Кбайт видеопамяти, работала только с текстовой информацией и с разрешением 720х350 точек и могла выдавать на дисплей 25 строк по 80 символов в строке. Цвет букв зависел от типа монитора: белые, изумрудные или янтарные, а сами буквы могли выводиться в обычном, подчеркнутом, инверсном (темные на светлом фоне) и мигающем режимах. Дальнейшее развитие MDA было выпущено в 1982 году известной тогда компаниейHerculesи называлосьHerculesGraphicsController(HGC). «Геркулес» отличался отMDAспособностью выводить текст в 132 колонки и 44 строки. Но и эта видеокарта не позволяла работать с графикой. Стоит заметить, что длина карты HGC была более 30 см.

Рисунок 7. Видеоадаптер HGC

И только с выходом видеоадаптера CGA (ColorGraphicsAdapter), который стал основой для последующих стандартов, появилась возможность работать с цветной графической информацией в разрешении 320х200 (4 цвета) и 640х200 (монохромный режим), при этом объём памяти видеокарты уже равнялся 16 Кбайт. Все упомянутые выше карты для соединения с ПК использовали шинуMultibus.

Следующий стандарт для видеокарт – EnhancedGraphicsAdapter(EGA), разработанный в 1984 году, позволял при разрешении 640x350 работать с 16 цветами из 64-цветной палитры одновременно. Ёмкость видеопамяти составляла теперь от 64 до 256 Кбайт, а также была заявлена совместимость с CGA и MDA. Начиная сEGA, видеоадаптеры начали использовать «широкую» шинуISA.

Все описанные выше видеокарты подключались к монитору через 9-контактный разъём и передавали информацию в цифровом виде. Только с выходом адаптера стандарта MCGA (MultiColorGraphicsAdapter– многоцветный графический адаптер) произошёл переход на аналоговый сигнал, так как палитра была увеличена до 262144 цветов (по 64 оттенка на каждый из базовых цветовRed/Green/Blue). Разрешение экрана, выдаваемое MCGA при работе с текстом, было 640х400 с 256 одновременно отображаемыми цветами, для графических приложений – 320х200 точек. Разъём для подключения к монитору приобретает привычный для нас вид – 15-контактный «D-Sub». Еще одна особенностьMCGA– точка на экране теперь сталаквадратной (раньше она была прямоугольной). Это означает, что окружность, выведенная на экран, будет действительно окружностью, а не эллипсом.

Следующим витком эволюции компьютерной видеоподсистемы является VGA (VideoGraphicsArray– графический видеомассив), который появился в 1987 году. Адаптеры VGA уже поддерживали разрешение 640х480 и 256 цветов (из палитры в 262144 цвета), объём памяти составлял 256-512 Кбайт, а соотношение сторон экрана равнялось привычным сейчас 4:3.

И наконец, в 1991 году появляются первые адаптеры SVGA (SuperVGA), позволяющие работать при разрешении 800х600 и 1024х768 точек, количество отображаемых цветов увеличилось до 65536 (HighColor) и 16,7 млн. (TrueColor). Также появляется возможность пользователю задать частоту обновления экрана монитора – до этого момента она была жёстко привязана к определённому значению. Память видеоадаптеров SVGA была уже более 1 Мбайт.

С развитием графических оболочек операционных систем (например, Windows) видеокарты взяли на себя часть вычислений по окончательному выводу изображения на экран, которые обычно производил центральный процессор: перемещение окон, рисование линий, шрифтов и другие. С появлением трёхмерных игр видеокарты обзавелись 3D-акселератором, который сначала имел вид отдельной карты, вставляемой в свободный разъём на материнской плате – до этого момента видеоадаптер позволял работать только с двухмерной графикой (2D). Акселератор, как правило, включался в разрыв кабеля между видеокартой и монитором и брал на себя видеовывод, когда этого требовала выполняющаяся на компьютере программа. Далее, с развитием технологий производства полупроводников, графический чип стал содержать в себе все необходимые блоки, отвечающие как за 2D-, так и 3D-графику.

Именно тогда доминирующая на тот момент компания 3dfx (все активы 3dfx после банкротства перешли к NVIDIA) представляет технологию SLI (ScanLineInterleave– чередование строчек), благодаря которой появилась возможность объединить две подобные видеокарты с шиной PCI для формирования изображения методом чередования строк, что увеличивало быстродействие графической подсистемы и разрешение экрана.

Рисунок 8. Спаренный видеоускоритель (SLI)

На рисунке 7 показана видеокарта Quantum3D ObsidianX-24 на базе двух Voodoo2 в режиме SLI

Действительно, всё новое – это хорошо (в данном случае – очень хорошо) забытое старое: спустя почти 15 лет NVIDIA возродила SLI в видеокартах для шины PCIe.

Рисунок 9. Видеокарта с шиной AGP

Ближе к концу 90-х прошлого века видеоадаптеры получили собственную шину – AGP (AcceleratedGraphicsPort– ускоренный графический порт) и приобрели черты современных видеокарт: объём локальной видеопамяти достиг десятков мегабайт, появилась возможность выводить видеоизображение на ещё один приёмник, например, телевизор. На рисунке 8 изображена видеокарта на базе SiS315 с шиной AGP.

Практически все современные видеокарты состоят из следующих основных компонентов:

Видеопамять.

Набор микросхем, (видеочипсет).

Видео BIOS.

Тактовые генераторы.

Принцип работы видеокарт (при формировании двумерного изображения) не сильно отличается от принципов, на которых была основана работа адаптера CGA. Центральный процессор компьютера формирует изображение (кадр) в виде массива данных и записывает его в видеопамять, а конкретно - в кадровый буфер. После этого видеочипсет последовательно, бит за битом, строка за строкой, считывает содержимое кадрового буфера и передает его RAMDAC (цифро-аналоговый преобразователь данных, хранящихся в памяти). Он в свою очередь формирует аналоговый RGB-сигнал, который вместе с сигналами синхронизации передаётся на монитор. Сканирование видеопамяти осуществляется синхронно с перемещением луча по экрану монитора, сигналы синхронизации вырабатывают встроенные в видеокарту тактовые генераторы.

Несмотря на то что в консоли работать можно (а иногда и нужно), большинство пользователей предпочитает графический интерфейс. Самый прагматичный подход, как водится, лежит где-то посередине. Для решения одних задач лучше подходит текстовый режим, других - многооконный. А предназначение системы - дать пользователю возможность выбирать между первым и вторым.

XWindow (именно Window, а не Windows: обратите на это внимание) - графическая среда для UNIX-систем. В ее основу легла клиент-серверная модель, только реализована она в пределах одной рабочей станции. Для передачи данных используется специальный протокол сетевой связи (X Network Protocol).

Первоначальный вариант XWindow был создан еще в 1987 г. Таким образом, считать, что Linux концепцией своего графического интерфейса только эксплуатирует идею, поданную Microsoft, неправильно. Другое дело, что корни Linux лежат очень глубоко, несмотря на то что эта ОС относительно молода. Традиции UNIX не позволяли навязывать пользователю какую-то одну концепцию, вследствие чего оконный режим востребован ровно настолько, насколько это соответствует реальным потребностям потребителя. Развитие свободного ПО идет по всем направлениям, поэтому успех какого-то одного не так бросается в глаза. Впрочем, именно многогранность и следует считать основным достоинством OpenSource.

Сама по себе система XWindow не является тем, что принято называть графическим интерфейсом пользователя. “Иксы” (так именуют XWindow в обиходе) - лишь его составная часть, которая не формирует изображение, а только предоставляет другим программам средства для работы с видеоподсистемой. X-сервер, запущенный “в чистом виде”, продемонстрирует пользователю серый экран, и на нем не будет ничего, кроме курсора мыши.

Кстати, этого более чем достаточно для работы одного приложения, нуждающегося в графическом интерфейсе. Например, довольно популярный в недавнем прошлом LiveCD MoviX вообще обходился без оконного менеджера (программы, отвечающей за отображение окон и предоставляющей пользователю механизм работы с ними), поскольку предназначался для запуска мультимедийного проигрывателя Mplayer и ни для чего более.

Аналогичный механизм можно использовать для организации рабочих мест сотрудников, которым не требуется разнообразное ПО. А заодно и убить второго зайца, значительно упростив работу подразделения техподдержки, ибо вероятность того, что пользователем случайно будет нажата не та кнопка и вызвана не та программа, минимизирована. Так что в некоторых случаях XWindow может выступать не как некий вспомогательный и незаметный инструмент, а как основной графический интерфейс. Но это скорее (и, видимо, к сожалению) исключение, а не правило. В большинстве случаев

За настройку XWindow отвечает файл /etc/X11/xorg.conf. Он состоит из секций вида:

Section “Название секции”

Identifier “имя”

Каждая секция должна иметь уникальный идентификатор. Причем совершенно не обязательно наличие в файле всех возможных частей. Те, надобность в которых отсутствует, исключаются из его состава.

Секция ServerLayout содержит общую информацию о физических устройствах видеоподсистемы. Она имеет самый высокий приоритет - именно с нее система начинает анализ файла. В этой секции описывается оборудование, отвечающее за ввод информации и ее вывод.

В секции Files система ищет информацию о необходимых для работы XWindow файлах и путях к ним. Именно тут перечисляются все каталоги со шрифтами, используемыми в графическом режиме.

Секция Module предназначена для дополнительных подключаемых модулей, требуемых для нормального функционирования графической подсистемы. В частности, здесь расположены приказы загружать нужные шрифты.

Секция InputDevice содержит данные о порядке работы устройств ввода информации. Как правило, это клавиатура и мышь. Данный блок относится к категории часто редактируемых. Связано это с тем, что именно в нем описываются раскладки клавиатуры и способ их переключения, а не все дистрибутивы располагают удобным графическим инструментарием для изменения этих параметров.

А может быть, пользователям просто лень разбираться в баобабообразных меню, если речь идет о редактировании всего двух строк в одном-единственном файле. Судите сами. Если вдруг вы обнаружите, что точка с запятой находятся на цифровой панели клавиатуры, а не слева внизу от кнопки Enter, а раскладки переключаются не одновременным нажатием на Ctrl и Shift, а непонятно как, то самый простой путь - внести изменения в файл xorg.conf.

Нужная нам информация находится в секции InputDevice, описывающей устройство с идентификатором Keyboard0. Строки, указывающие, что в системе используются две раскладки - английская и русская (winkeys), переключение между которыми производится привычным для пользователя Windows способом, должны выглядеть так:

Option “XkbLayout” “us,ru(winkeys)”

Option “XkbOptions” “grp:ctrl_shift_toggle,grp_led:scroll”

Параметр led:scroll указывает, что индикатором переключения будет служить лампочка включения режима скроллинга, которая все равно не используется. А если вы считаете, что переключать раскладки двумя клавишами не очень удобно, то замените grp:ctrl_shift_toggle на caps_toggle, и доселе “лишняя” клавиша Caps Lock получит оправдание для своего существования.

Секция Device нужна для описания видеоадаптеров. Там явным образом указывается название используемого драйвера, поэтому самый простой способ получить информацию об этом модуле - посмотреть содержимое xorg.conf.

Например, на вашей машине установлена видеокарта nVidia и вы сомневаетесь, что система использует фирменный драйвер, поддерживающий трехмерную графику. Откройте конфигурационный файл и посмотрите параметр Driver секции Device. Если его значение - “nvidia”, то ваши сомнения напрасны, а если - “nv”, то они имеют под собой все основания.

В секции Monitor перечисляются характеристики монитора. При необходимости таких блоков может быть несколько, тем более что для показа режимов работы дисплея имеется другая секция. Она называется Screen, и в ней описываются настройки дисплея, работающего под управлением графического адаптера, идентификаторы которых указываются в строках Device и Monitor. Это хорошо видно из следующего примера:

Section “Screen”

Identifier “Screen0”

Device “Card0”

Monitor “Monitor0”

В данном случае задаются настройки графической подсистемы для видеокарты и монитора, обозначенных в секциях идентификаторами Card0 и Monitor0 соответственно. Раздел Screen устроен очень просто - в нем перечислены все разрешенные режимы работы.

Несмотря на простоту устройства конфигурационного файла, ряд дистрибутивов включают в себя графические инструменты для настройки XWindow. Таким образом, пользователю предоставляется еще одна степень свободы, ведь у таких утилит есть широкий круг поклонников, которые не собираются изменять своим привычкам.

Пользователям Linux XP следует запустить “Центр настройки”, где в разделе оборудования есть опция “Настройка видеосистемы”. В открывшемся окне ему предстоит выбрать модели видеоадаптера и дисплея. Со вторым всё довольно просто - достаточно знать тип монитора и поддерживаемые им разрешения. Конкретную модель указывать не нужно.

С видеокартой дела обстоят несколько сложнее. Выбирать из списка придется не по названию модели, а по имени драйвера. Что же делать пользователю, который не знает, как именно разработчики назвали модуль. Выход один: в общем случае внимательно просмотреть все предлагаемые программы и прочитать краткие пояснения к каждой из них.

Традиционно функционально богатый инструмент предлагает пользователю дистрибутив SuSE. В центре управления YAST есть раздел “Оборудование”, где и можно найти соответствующую утилиту. Она позволит задать нужное разрешение экрана, раскладку клавиатуры и настроить некоторые дополнительные устройства - планшет и сенсорный дисплей. Для выбора драйвера графической платы пользователю придется воспользоваться программой обзора оборудования, также входящей в состав YAST.

В дистрибутивах Fedora и ASPLinux конфигуратор графического режима находится в разделе “Администрирование”. Список поддерживаемых видеоадаптеров и мониторов достаточно широк - то, что пользователь найдет свою модель, практически гарантировано. В отдельной вкладке настраивается режим работы с двумя мониторами.

AltLinux также предлагает пользователю фирменный центр настройки, в котором есть инструмент для конфигурирования графического интерфейса. С его помощью можно сменить тип монитора, драйвер видеокарты, глубину цвета и разрешение экрана.

Напоследок -- несколько важных замечаний. Существуют дистрибутивы, которые при неверной настройке графического режима сами пытаются загрузить заведомо работоспособную конфигурацию. Однако рассчитывать на это не следует. Лучше заранее принять необходимые меры предосторожности.

Во-первых, перед началом работы по настройке видеорежима сделайте резервную копию файла xorg.conf. Если что-то пойдет не так, как планировалось, то всегда можно будет восстановить предыдущую конфигурацию из консоли и запустить XWindow командой startx.

Во-вторых, если очень нужно запустить графический режим (хотя бы для того, чтобы выйти в Интернет и прочесть документацию), а перебрано уже с десяток моделей видеокарт и ни одна не подошла, то выбирайте универсальный драйвер vesa. Конечно, про оптимизацию XWindow в этом случае говорить не приходится, но что-то - это всё же лучше, чем совсем ничего.

В-третьих, большинство современных дистрибутивов автоматически создают конфигурационный файл, позволяющий получить если не оптимальные, то вполне приемлемые параметры графической подсистемы. А как известно, лучшее - враг хорошего. Не стоит сразу пытаться починить то, что и не ломалось.

Cтраница 1

Графическая подсистема: цветная графика - 8 бит; разрешение 1280x1024 точек; скорость сдвига экрана 25 млн точек / сек.

Черно-белые изображения в этой книге напечатаны с использованием графической подсистемы Postscript . Многие изображения созданы в программе Matlab, в которой особенно удобно строить кривые в трехмерном пространстве. Изображения, в которых требовалась заливка областей, ограниченных кривыми, получены с помощью пакета Mathematica. Изображения, для которых необходима точечная графика (для данного пиксела в данный момент времени определяется его цвет, черный или белый), были сгенерированы на Фортране с последующим преобразованием выходного файла в формат Postscript.

Используя графический пакет, можно легко создать свою собственную графическую подсистему, максимально адаптированную под набор конкретных задач, решаемых пользователем.

Видео ОЗУ или Видеопамять: быстродействующая оперативная память ЭВМ, являющаяся результатом развития динамических ОЗУ для графической подсистемы ЭВМ и ее мультимедийных приложений.

Если в интеллектуальной системе с БЗ, ориентированной, например, на некоторую область научных исследований и разработок, используется подсистема машинной графики, в которой ключевым моментом является общение пользователя с визуальными образами объектов исследуемой предметной области и отношений между ними, то такая графическая подсистема по сути представляет из себя подсистему когнитивной компьютерной графики.

Программное обеспечение средств машинной графики по отношению к вычислительной среде, в которой оно эксплуатируется, можно разделить на две группы: 1) пакеты прикладных программ (ППП), подсистемы САПР или системы иных назначений, эксплуатирующиеся в среде операционных систем (ОС) общего назначения; 2) графические подсистемы, эксплуатирующиеся в рамках специализированных систем, предназначенных для конкретного применения и работающих под управлением специализированной ОС.

В противоположность этому Win32 API имеет огромное количество вызовов для управления окнами, геометрическими фигурами, текстом, шрифтами, полосами прокрутки, диалоговыми окнами, пунктами меню и другими элементами графического интерфейса. В том случае, когда графическая подсистема запускается в режиме ядра (это верно для большинства версий Windows, но не для всех), вызовы являются системными; в противном случае вызовы являются только библиотечными. Должны ли мы обсуждать эти вызовы в книге или нет. Так как они на самом деле не связаны с функциями операционной системы, мы решили этого не делать, несмотря на то, что они выполняются ядром.

Целесообразность включения структурных компонентов дизайна в систему графической подготовки студентов втуза определяется двумя аспектами. Кроме того, основной метод дизайнера - художественное конструирование - представляет собой визуально-графический метод композиционного формообразования, который сходен по своей структуре с методом машинной разработки изделия, осуществляемой в графической подсистеме САПР. Ориентированный на дизайн, метод пространственно-графического моделирования оказывается органически связанным с проблемой автоматизации учебно-проектировочной деятельности студентов, а также с вопросами поискового конструирования.

При этом основным документом первичного описания графической информации является чертеж для программирования (см.гл. З), по которому разрабатывается подпрограмма формирования модели ГИ. При этом в памяти ЭВМ хранятся подпрограммы, которые обеспечивают формирование модели ГИ с заданными значениями параметров. На рис. 1.1 показана схема обработки графической информации при первом и втором способах формирования модели ГИ. Здесь под обработкой понимаются средства работы с моделью ГИ, предоставляемые пользователю графической подсистемой и зависящие от используемых методов автоматизации конструирования и выполнения конструкторской документации.

Хотя интерфейс Win32 API также присутствует в системе Windows 98 (и в операционной системе для компактных мобильных компьютеров Windows СЕ), не во всех версиях Windows реализован каждый вызов, кроме того, иногда встречаются несущественные различия. Например, в системе Windows 98 нет средств безопасности, поэтому вызовы API, относящиеся к ней, просто возвращают в этой системе код ошибки. Кроме того, у некоторых вызовов в различных версиях операционной системы Windows могут различаться входные и выходные параметры. Например, в системе Windows 2000 все экранные координаты, задаваемые в качестве параметров графическим функциям, представляют собой действительно 32-разрядные числа, тогда как в Windows 98 используются только младшие 16 разрядов, так как большая часть графической подсистемы все еще остается 16-разрядной. Существование интерфейса Win32 API на нескольких различных операционных систем облегчает перенос программ с одной системы на другую, но благодаря наличию этих небольших различий требуется определенная аккуратность, чтобы программа оставалась переносимой.

Производительность Release 14 начинается с быстродействия. Загрузка происходит гораздо быстрее, чем в любой из предыдущих версий. Операции с экраном, а также обычные функции редактирования, такие как выбор, копирование и перемещение, также выполняются быстрее. Оптимальная с точки зрения памяти и быстродействия архитектура, включая передовую графическую подсистему HEIDI и новые, эффективно использующие память средства, такие как облегченные полилинии и штриховки, использующие новый принцип построения. Зумирование и панорамирование в пространстве листа больше не требуют регенерации и происходят в 5 - 10 раз быстрее.

Схема функционирования подсиспемы вывода графической информации.

Фрагменты выделяются так, чтобы их комбинация создавала определенный чертеж. Например, расчетная схема получается в результате вычерчивания на одном и том же поле конечно-элементной схемы, номеров и опор. Фрагменты образуются по исходным данным и результатам расчета конкретной задачи. Они и составляют графическую информацию, которая хранится в архиве под своими именами. Чертеж выполняется с помощью управляющей таблицы, в которой указывается, какие фрагменты требуются для каждого конкретного чертежа. Графическая подсистема является открытой и легко расширяемой для выдачи новых чертежей. Для этого нужно составить список фрагментов по данному типу чертежа и записать его в управляющую таблицу. Если какой-либо из фрагментов этого списка не реализован в подсистеме, необходимо составить программы по его выделению и выдаче на графопостроитель.

Это ВС, выполненная на базе 32-разрядных микропроцессорных наборов или 32-разрядных ПЭВМ и обладающая следующими архитектурными и техническими характеристиками. Емкость ОЗУ должна составлять несколько Мбайт. АРМ должно иметь выход на ЛВС класса Эзернет. Виртуальная память должна позволять производить подкачку данных не только из винчестерского диска АРМ, но также из ресурсов памяти других устройств или вычислительных систем, доступных через ЛВС. АРМ должно иметь выход на внешний интерфейс типа VME или Multibus-2 и несколько гнезд в собственной шине для соединения с измерительными, управляющими или другими вычислительными системами. Ввод информации должен осуществляться как с клавиатуры, так и с флоппи-диска. Особое значение должно придаваться графической подсистеме. Быстродействие графической подсистемы (нижний предел) - смена 5000 векторов за 1 с в базовой системе или смена до 40 000 векторов за 1 с с графическим ускорителем. Обычно в АРМ помимо центрального процессора ставятся сопроцессоры, в том числе графической обработки.

Графическая подсистема

Одним из наиболее значительных отличий ОСWindows от старой доброй MS-DOS заслуженно считается визуальный интерфейс. Нельзя не отметить, что первопроходцем в создании графической среды была отнюдь не компания Microsoft. Использующие графику прототипы разрабатывались еще в 70-х годах (Xerox Palo Alto Research Center). Пальма первенства в разработке графической ОС принадлежит фирме Apple Computer, которая в январе 1983 года сообщила о создании ОС Liza. Microsoft заявила о работе над Windows только в ноябре 1983 года, а первая версия, Windows 1.0, вышла в свет спустя ровно два года. Между прочим, за этот период Apple уже успела анонсировать знаменитый Macintosh (январь 1984 г.).

Графический интерфейс пользователя (Graphical User Interface, GUI) Windows за более чем двадцать лет существования значительно расширился и был улучшен. Основой GUI служит графический интерфейс устройства (Graphics Device Interface, GDI). По большому счету GDI является языком графического программирования. Инженеры Microsoft добились того, что Windows абстрагирована от конкретного графического устройства, будь то дисплей, принтер, плоттер и т. п. Интерфейс GDI поддерживает аппаратно-независимую графику, поэтому Windows требуется лишь драйвер конкретного устройства.

Графические функции 32-разрядной Windows в основном сосредоточены в динамически подключаемой библиотеке GDI32.DLL. Кроме того, пока еще используется 16-разрядная библиотека GDI.EXE. Свое нестандартное расширение она унаследовала еще от первых версий Windows. Эти библиотеки общаются с файлами драйверов графических устройств *.DRV. Что же умеет GDI? Очень многое:

Управлять выводом текста и шрифтами.

Управлять цветом и палитрами.

Работать с графическими примитивами (образами, путями, заливками и т. д.).

Отображать битовые образы (bitmaps, icons, cursors).

Работать с метафайлами.

Взаимодействовать с графическими устройствами.

Разработчики Borland Delphi провели огромную работу с целью упростить общение с GDI (рис. 10.1). Первое, что заслуживает похвалы: программист Delphi (в отличие от своих коллег, пишущих в среде Microsoft Visual C++) освобожден от кропотливой работы, связанной с получением и освобождением контекста устройства. Для этого создан специальный класс TCanvas (холст), инкапсулирующий в себе подавляющее большинство функций GDI и решающий проблемы с дескриптором контекста устройства.

Создатели Delphi внедрили класс TCanvas практически во все графические элементы управления, что позволило использовать возможности деловой графики при работе с такими компонентами.

Вместе с тем, если набора возможностей TCanvas для воплощения ваших художественных фантазий недостаточно, возможна работа напрямую с методами Win32 API.

В этой главе наряду с графическими функциями Delphi будут рассмотрены и многие функции GDI. Такой подход позволит создать целостную картину возможностей программирования деловой графики в Windows.

Не будем в очередной раз вспоминать пословицу о том, что «все новое это», а просто попробуем логическим путем рассудить, к чему придут ускорители трехмерной графики в ближайшем и (даже) более-менее отдаленном времени. Рассуждать будем не просто, а по частям. Итак.

Внешние интерфейсы и вывод изображения

Нет сомнений, что через некоторое время все системы отображения (мониторы, проекторы и пр.) будут подсоединяться к ускорителю по цифровому интерфейсу. В начале это будут плоды эволюции специализированного интерфейса (DVI), но позже, вполне логично ожидать постепенное замещение специализированной цифровой последовательной шины ее аналогом общего назначения, например одним из потомков USB или FireWire. Почему я в этом уверен?

Во-первых, разрешение и тем более частота кадров отображающих устройств не будут расти столь же стремительно, как вычислительная мощь ускорителя. Этому есть несколько причин, первая из них - ограниченное разрешение глаза, для которого изображение с 3..4 тысячами точек по горизонтали уже воспринимается (при условии разглядывания целиком) как монолитное и бесконечно детализированное. Во-вторых, кадровая частота выше 150..200 смен изображений в секунду не имеет смысла даже при условии отсутствия сглаживания движущихся объектов: почти десятикратное превосходство над кинематографической частотой обеспечит сглаживание движения за счет инерции восприятия в глазу, который невольно будет накапливать, и усреднять по нескольку кадров подряд. Разумеется, возможны варианты - такие как панорамные и сферические дисплеи, или стереодисплеи, требующие две картинки для разных глаз, но все они, так или иначе, могут довольствоваться разрешением порядка десяти тысяч точек по горизонтали. Дальнейшее увеличение разрешения возможно, но не видится приоритетной задачей - гораздо больше сил (уже сейчас) тратится на повышение реалистичности картинки, чем на ее сглаживание.

Итак, медленный (относительно) рост разрешения и кадровой частоты позволит в скором времени обычным шинам общего назначения служить каналом для передачи информации на монитор и другие устройства отображения. Почему это важно? Потому что это очень удобно. Представьте себе, что в каждый из 6 USB портов вы можете подключить (при желании по дисплею). Представьте, что самый элементарный фотоаппарат или КПК может быть при желании подсоединен к проектору или монитору через тот же интерфейс, через который вы осуществляете синхронизацию и передачу данных на PC. И т.д. и т.п.

В более отдаленном времени возможность соединять «все-со-всем», пользуясь одними и теме же интерфейсами (+ открытые протоколы передачи данных разных форматов) откроет прекрасные перспективы, причем не только в области отображения визуальной информации…

Итак, у нашего ускорителя будущего появился первый более-менее четкий элемент - один или несколько универсальных внешних портов на основе скоростных последовательных шин. Кстати, им не обязательно находится на самой плате (модуле, карте) ускорителя, он может использовать для передачи изображения и порты системной платы - тем паче, что системная шина заведомо будет опережать по пропускной способности внешние универсальные интерфейсы периферии.

В этом же ключе, логично ожидать появление дисплеев и проекторов со встроенными радиоинтерфейсами (уже существуют первые модели проекторов с разновидностями 802.11). Очевидно что все будущие ПК, КПК, ноутбуки и прочие устройства будут включать в себя те или иные беспроводные интерфейсы и передача изображений на ближайший экран, без какого-либо проводного соединения очень удобна, как в бизнес, так и в бытовых или персональных применениях. Кстати, о дисплеях:

Дисплеи и другие системы отображения

Обсудим вопрос демонстрации передаваемых с ускорителя картинок. Во-первых, очевидно, что в ближайшем будущем практически все дисплеи станут плоскими и будут использовать ту или иную технологию плоских панелей. Пока мы не говорим о проекторах, но и они в большинстве своем используют в наше время не сканирующие вакуумные трубки, а работающие на просвет миниатюрные высокотемпературные ЖК матрицы или матрицы с массивами микромеханических зеркал. Разрешение и размер дисплеев подрастут, но ничего особенно нового здесь ждать не приходится - слишком большие панели не удобны и даже вредны - они занимают много места и их не просто транспортировать (вес, хрупкость). Поэтому, размеры более 20 дюймов по диагонали по-прежнему будут сопутствовать только специфическим нишам. Идеальным решением для больших размеров являются те или иные разновидности проекторов - в паре с очень компактными экранами они могут обеспечивать изображение разных размеров в достаточно широких пределах и при этом являются сами по себе вполне компактными устройствами.

Итак, персональный дисплей будущего это плоская панель размером от 17 до 20..24 дюймов с разрешением порядка 3..4 тысяч точек по горизонтали и предельной физической частотой обновления информации около 100 кадров в секунду. Далее, в игру вступают различные проекторы и составные панели. Первые получат более высокое разрешение и яркость, опять таки до 3..4 тысяч точек - что не только позволит полноценно отображать на них фильмы очень высокого качества, но и потребует новых стандартов для съемки, сжатия и передачи движущегося изображения - даже передовые HDTV стандарты далеки от таких цифр. Именно в этой области и произойдет наиболее значимый прогресс, в плане качества захвата, хранения и передачи картинки. Но мы не должны забывать, что основная тема данной статьи - трехмерная графика в будущем.

Во-вторых, очень широкое, если не повсеместное, распространение получат панели способные создавать объемное изображение без применения дополнительных средств, таких как специальные стерео очки. Здесь могут дать результат различные технологии. В отдаленном будущем вероятны голографические ЖК матрицы (я лично знаком с бывшими сокурсниками занятыми такими исследованиями для компании LG), способные воспроизводить больше характеристик захваченного потока света, чем традиционные системы и давать объемную, цветную(!) голографическую картинку. Такие решения потребуют существенно большего разрешения матрицы и специальной формы представления данных, а потому не следует ожидать их появления в коммерческих количествах в ближайшие пять лет. Возможны и какие либо гибридные решения, в которых дифракционные динамически настраиваемые структуры разводят свет от матрицы для правого и левого глаза, следя при этом за положением головы и обеспечивая оптимальную глубину зоны устойчивого восприятия стереоизображения. И, наконец, наиболее вероятные уже в ближайшее время системы с простым разделением изображения для правого и левого глаза, на основе одной ЖК панели. Такие системы уже доступны коммерчески. Очевидно, что в ближайшее время появятся реконфигурируемые матрицы, способные работать как в режиме разделения изображения на два глаза, так и в режиме обычной плоской матрицы с широкими углами обзора - чисто технически это не представляет никакой трудности.

Итак, дисплеи будущего станут тоньше и легче, и, вероятно, получат стереорежим, как обязательную опцию. Но, в области больших размеров и разрешений куда как более впечатляющие качественные и количественные скачки будут происходить в проекционных устройствах.

Системная шина, шина памяти и передача данных

То, что системные шины вскоре все станут последовательными, уж не является секретом для большинства читателей. Проприетарные соединения между компонентами чипсета, HT, PCI-Express и даже LPC четко продемонстрировали реализацию уже не новой тенденции на перевод всего и вся на последовательные сигнальные каналы. Однако давайте прикинем, как конкретно этот процесс отразится на ускорителях. В ближайшее время появятся ускорители с PCI-Express интерфейсом с пропускной способностью 16х - именно такой слот для графических и других высокопроизводительных PCI-Express карт будут иметь первые PC. Однако гибкая возможность масштабирования этой шины позволяет пойти далее.

Представьте себе, что в чип заранее встроены 32 канала PCI-Express с возможностью динамической конфигурации. Во-первых, как только появятся производительные рабочие станции (и чипсеты) со слотами конфигурации 32х, можно будет сделать профессиональную карту на основе того же чипа. Во-вторых, можно сделать серверный вариант карты с 8х (типичный серверный разъем), и в сервер может быть одновременно установлено несколько таких карт. И, наконец, при необходимости можно сделать многочиповое решение, просто соединив двое или несколько чипов тем или иным образом, с участием вторых 16 каналов.

Но это только начало. В будущем шины памяти также станут более интеллектуальными и последовательными. Это позволит не только проще масштабировать пропускную способность памяти, но и упростить разводку на плате, т.к. данные разных каналов могут передаваться не синхронно и, соответственно, длинна проводников не обязательно должна быть одинаковой. Это позволит повысить тактовую частоту и снизить стоимость разводки. Кроме того, уже знакомые нам по PCI-Express одиночные двунаправленные каналы могут действовать независимо друг от друга и в дуплексном режиме - т.е. основная проблема задержек при интенсивных обращениях ускорителя к памяти - проблема переключения из режима чтения в режим записи и проблема параллельных потоков данных будет красиво и естественно решена. В итоге, снизится необходимость в интенсивном кэшировании некоторых типов данных и освободившиеся ресурсы на чипе можно будет бросить на самое главного - буфер кадров, полностью разместив его на чипе и связав с блоками закраски очень широкой шиной. Впрочем, мы несколько забегаем вперед.

А теперь самое интересное - а, собственно, почему последовательная шина памяти и последовательная системная шина должны быть разными? Рано или поздно мы можем ожидать схожую, при желании совместимую, а возможно и просто четко совместимую сигнальную технологию, которая позволит просто снабдить чип 256-ю (или скорее 256+32+8 - догадайтесь почему;-)) высокоскоростными последовательными каналами и, в зависимости от воли разработчиков конкретного продукта, раздавать их на общение с системой (процессором и чипсетом), на общение с локальной памятью, на общение с другими чипами в многочиповом решении, а также на различные интерфейсы ввода и вывода, например, один канал можно отдать на чип захвата видеосигнала. Изначально каналы равноправны, и каждый из них, например, может занимать 4-ку соседних выводов чипа. Это позволит расположить прочие элементы на плате ускорителя так, как того пожелает душа разработчика, а затем, не особенно задумываясь, протянуть к ним каналы с ближайших выводов чипа.

Очевидно, что подобный подход - обширный массив одинаковых и гибко распределяемых каналов передачи данных, имеет и более глобальные перспективы. Рано или поздно (скорее рано - см. материалы по HT) и системная логика (чипсеты) и процессоры тоже придут к подобной схеме, позволив в итоге создавать совершенно фантастические топологии вычислительных систем, как наборов активных компонент, соединенных различными по числу каналов шинами - словно игрушки собранные из детского конструктора «Лего».

Архитектура и программируемость ускорителя

Происходящая унификация хорошо заметна. Например, вершинные и пиксельные блоки (далее процессоры) внутри ускорителя уже сейчас имеют унифицированную систему команд и схожую программную архитектуру (отличается число регистров, но не методы работы с ними). Но, еще до общей унификации, нас ждет появление третьего типа процессоров - процессор генерации вершин или, иначе, «тесселяции». И, соответственно новый тип шейдеров - тесселяционные шейдеры. Его место в графическом конвейере - перед вершинными процессором:

А так же, очень вероятно появление отдельного процессора для выборки, распаковки, фильтрации и генерации текстур.

Основная задача блока тесселяции, на основе гибкой программы (шейдера тесселяции, TS) создавать новые треугольники и вершины, и затем, передавать их вершинному шейдеру (VS) на уже привычную нам трансформацию и освещение. Этот подход позволит наиболее общим путем переложить на ускоритель построение примитивов более высокого порядка, нежели треугольники, например гладких сплайновых поверхностей. В первую очередь, наличие такого процессора позволит увеличить сложность сцен и реализовать адаптивную детализацию моделей и окружения без дополнительной нагрузки на центральный процессор и системный канал передачи данных. Например, хорошо известная разработчикам симуляторов задача построения ландшафта с адаптивной детализацией в данный момент не может быть решена эффективно только на ускорителе. Любые решения выглядят как компромисс, а с появлением тесселяционного процессора позволит генерировать адаптивное представление ландшафта на лету, не загружая системный процессор или шину.

Обратите внимание на зеленый блок - это процессор фильтрации, выборки и обработки текстур. На данный момент все нестандартные операции с текстурами, такие как специальные методы фильтрации или генерация процедурных текстур исполняются на уровне пиксельных шейдеров, а некоторые задачи, такие как распаковка сжатых форматов текстур реализованы только жестко аппаратно. Однако, гораздо эффективнее выделить для этого отдельный процессор и в будущем это будет сделано. Текстурные шейдеры (TxS) уже известные по программным пакетам реалистичной графики, будут отвечать за генерацию по запросу процедурных текстур, выборку, преобразование и модификацию значений обычных текстур, реализацию оптимальных методов сжатия и, самое главное, на специальные методы фильтрации, например продвинутую анизотропную, стохастическую или, очень важную для будущих приложений фильтрацию с учетом движения объекта для реализации эффективного и качественного сглаживания движущихся объектов.

Между процессорами расположены очереди данных, отмеченные на рисунке стрелками. Они позволяют накапливать (а по возможности и кэшировать для повторного использования) рассчитанные одним процессором для другого данные, и таким образом избежать задержек, позволив процессорам работать параллельно и в должной степени асинхронно. Именно наличие таких четких однонаправленных потоков данных позволяет эффективно распараллеливать задачи по построению изображения и одновременно именно этот факт накладывает на шейдеры существенные ограничения - например, они не могут иметь произвольный доступ к данным соседних примитивов или пикселей, т.к. они могут рассчитываться параллельно или еще не быть рассчитанными. Впрочем, обладая возможностью, так или иначе, записать поток данных с выхода шейдерного процессора и снова подав его на вход, мы можем (так сказать «в несколько проходов») реализовать более сложные алгоритмы, включая произвольный доступ, пускай и не самым удобоваримым путем.

На нашей схеме и процессор тесселяции и геометрический процессор, и пиксельный процессор могут получать данные у процессора выборки текстур, и тонкие черные стрелочки символизируют очередь запросов на получение таких данных. Например, при генерации ландшафта процессор тесселяции может таким образом получать доступ к карте высот, сохраненной в виде двумерной текстуры, а процессор трансформации может использовать текстуру как карту смешения (Displacement Map) вершин.

Перед нами графический ускоритель будущего. Основная концепция - набор из некоего числа одинаковых шейдерных процессоров (разумеется с неограниченной длинной программы, обширным набором команд включая динамическое управление исполнением команд - условия, циклы и подпрограммы). Во время построения изображения процессоры динамически соединяются между собой в некую топологию, например, так:

а между процессорами (кружки) организуются одно и двунаправленные асинхронные очереди данных, которыми фактически заведуют контроллеры потока (см. предыдущую схему). Каждый контроллер настраивается для того или иного метода хранения данных (стек, очередь, просто произвольный доступ) и получает в монопольное владение часть скоростной внутренней памяти (кэша) ускорителя или реализует доступ к потоку данных из внешней по отношению к чипу ускорителя локальной или системной памяти. Возможен и режим с произвольным, не потоковым доступом, но в реальных приложениях следует всячески избегать подобных настроек, ибо они способны существенно подорвать производительность в результате плохо оптимизируемых попыток доступа к внешней памяти. Однако, так или иначе, за счет интенсивного кэширования и использования предсказания паттернов доступа данная задача может быть решена на твердую «4», пусть и не в первом поколении таких ускорителей, открыв путь к более привычным программистам подходам, например, к произвольной индексации элементов массивов.

Итак, появляется множество возможностей. Не только альтернативные методы фильтрации, выбора и генерации вершин и пикселей, но и такие варианты как шейдер программирующий новый метод полноэкранного сглаживания, и даже шейдер отвечающий за динамическое перераспределение ресурсов (вычислительных и памяти) ускорителя, т.е. некая «операционная система». Понятно, что самому программисту крайне тяжело управлять всей коммуникацией блоков такого чипа, но это и не надо - этим будет заниматься API. Программист будет формулировать задачу в виде набора шейдеров различного назначения (фактически - функций на некоем языке программирования высокого уровня) и описания структур передаваемых и получаемых или параметров, а следовательно, и того, в каком порядке данные будут проходить через эти шейдеры. Остальное берет на себя API - DirectX или OpenGL будущего. API компилирует шейдерный код в машинные инструкции, оптимизирует их, настраивает взаимодействие очередей и блоков, распределяет кэш и другие ресурсы. Например, встает логичный вопрос - сколько процессоров отдать под шейдер А а сколько под шейдер Б, так, чтобы вся система была максимально сбалансирована и ни одного миллиметра силикона не простаивало без дела. Ответ на этот вопрос не однозначен. Можно грубо указывать важность шейдера в тех или иных единицах, еще при написании его на языке высокого уровня, а можно и создать API анализирующий по ходу построения кадров значения внутренних счетчиков производительности в чипе и динамически перераспределяющий процессоры по мере исполнения приложения каждую секунду или около того.

Представьте себе - играя в FPS, вы выходите к воде и больше процессоров отдается на пиксельные шейдеры, появляется детализированный монстр и чуть больше ресурсов уходит вершинным процессорам. Тонкая и кропотливая работа по балансу нагрузки на различные блоки ускорителей, реализуемая ныне во время программирования приложения путем достаточно утомительных итераций, проб и ошибок, будет автоматизирована на уровне API и железа!

Новые и улучшенные подходы к построению изображения

Разумеется, получив в свое распоряжение столь гибкую систему, мы не можем не обратить свой взгляд к альтернативным методам построения изображения. Новые примитивы, например объемные (3D) полигоны с заданным картой смещения рельефом (с точностью до одного пикселя!), шары или гладкие поверхности (на сей раз истинно гладкие, а не аппроксимированные треугольниками). И, конечно, мягкие тени: станет возможна трассировка лучей для расчета т.н. «глобального» освещения, в то время как закраска идет традиционным методом. Хотите? -Пожалуйста. Комбинированные методы с использованием Radiosity? - Нате. Да, и на худой конец, может быть легко реализована «стопроцентная» старая добрая обратная трассировка лучей. При условии, что сцена, пусть даже описанная примитивами достаточно высокого уровня, будет полностью размещена в локальной памяти ускорителя. Тогда она сможет интерпретироваться им практически без участия процессора.

Несомненно, важным видится сглаживание движущихся объектов. Именно оно отличает реалистичную кинематографическую графику от игровой аппаратной, и именно благодаря ему, мультфильмы с использованием компьютерных персонажей смотрятся при 25 кадрах в секунду куда как лучше, чем всем лучшие шутеры при 120. Подход к сглаживанию должен быть сбалансированным - грубая сила, выражаемая в расчете N кадров вместо одного и последующем их усреднении не допустима. Грамотное использование пиксельных, текстурных и специальных сглаживающих шейдеров вкупе с информацией о скорости каждой конкретной точки позволит создать очень аккуратно и качественно сглаженные движущиеся предметы, нарисовав при этом только одно (!) изображение за один проход. Ключ к этому - гибкая архитектура ускорителя описанная мной.

Толи еще будет, ой-ой-ой

Интересно, что вопросы питания, энергопотребления и теплорассеивания беспокоят конструкторов современных PC куда как сильнее вопросов надежности. Следует ожидать новых форм факторов для ускорителей, в виде некоего похожего на процессорный модуля (картриджа), такого, каким был в свое время процессор Pentium II или, например, такого, каким сконструирован ныне Itanium. Металлическая коробка, снизу контактный разъем, вертикальная установка оным на плату. Внутри, чип ускорителя и память. Интерфейсы перенесены на материнскую плату - все данные, включая захват видео и результирующую картинку, идут в цифровом виде по общей системной шине.

Итоги

Динамическое распределение ресурсов
Большой массив одинаковых по возможностям процессоров
Общий коммутатор
Большой набор контроллеров очередей и доступа к памяти
Только цифровые интерфейсы, все на основе массива последовательных шин общего назначения
Память, работающая напрямую с такими шинами
Устройства вывода с общими периферийными интерфейсами, а также беспроводными интерфейсами
Фокусировка на качестве, а не на разрешении или тем более кадровой частоте изображения
Стерео дисплеи.

Итак, ставка сделана, придет время, и я смогу ответить, насколько процентов я был прав, а насколько ошибался;-)

Ждать не так уж и долго.

Приложение

Вопрос, чем эта штука отличается от CPU?

Ответ 1 - ориентацией на эффективную параллельную обработку достаточно простых потоков данных, наличием специализации.

Ответ 2 - если рассуждать строго, то чем дальше, тем практически ничем.

Очень сложно сказать, кто первый придет к логической точке сращивания - или очередной CPU от Intel научится программно рассчитывать изображения уровня современных компьютерных мультфильмов (на что надо не так уж много - ~20 лет) или очередной ускоритель от NVIDIA или ATI научится исполнять Microsoft Windows или (на худой конец) один из клонов Linux. Может быть и такое.