Визуализация данных в науке и технике

Аннотация: В этой лекции мы рассмотрим такие вопросы: ассоциации как основа работы человеческого мозга, понятие о теориях обработки, систематизации и визуализации информации, Mind mapping и визуальное мышление.

Как уже говорилось выше, предметом этого курса является mind mapping – эффективная техника повышения персональной продуктивности. Но прежде чем обсуждать области применимости mind map "ов, правила их построения и типичные ошибки их использования, более того, прежде чем пытаться объяснить, что такое mind mapping вообще, нужно поговорить о визуальном (или радиантном) мышлении, воплощением и результатом которого являются mind map "ы.

Ассоциации как основа работы человеческого мозга

Вы когда-нибудь задумывались о том, на каких принципах основана работа тех сверхмощных компьютеров, которые каждый из нас носит внутри своего черепа? Готов держать пари – первая мысль, пришедшая в голову большинству читателей, была о микропроцессорах, лежащих в основе наших ноутбуков и рабочих станций. Однако смутные подозрения о несопоставимости "весовых категорий" кремниевого микрочипа и головного мозга все же не дают нам с уверенностью рассуждать о том, как все просто – двоичная арифметика, "есть импульс – нет импульса" и все такое. Да, как модель работы мозга двоичная машина вполне приемлема, но очень уж грубая это модель (мы же помним, что любая модель отражает только одно, наиболее важное в данном контексте свойство объекта, правда?). Как-то слишком примитивно получается – свести наше мышление к нулям и единичкам. А как же тогда объяснить тот каскад мелких воспоминаний – ощущений, цветов, запахов, идей, проносящихся перед нашим мысленным взором, когда мы о чем-то думаем? Многие из этих образов для большинства посторонних людей никак не связаны с предметом наших размышлений и значат что-то конкретное только для них, поскольку связаны с какими-то личными воспоминаниями и переживаниями. Позвольте себе подумать о чем-то и не придерживайтесь какого-то определенного направления мысли – вы будете удивлены тем, как быстро и далеко вы уйдете от первоначальной темы размышлений: сменяющиеся образы, связанные, как звенья одной цепи, вытаскивая друг друга из закромов памяти, быстро уведут вас от объекта, о котором вы подумали. Конечно, можно попытаться объяснить подобное поведение нашего мозга тем, что он просто отрабатывает гениально сложную разветвленную программу обработки информации с учетом данных, уже хранящихся в памяти, но все далеко не так просто.

Любая информация , поступающая в наш мозг (неважно, что это – прикосновение, вкус, запах, цвет, звук), вытаскивает за собой на свет Божий массу мелких воспоминаний, мыслей и ощущений, подобно тому, как от упавшего в пруд камня расходятся по поверхности воды концентрические круги. А каждое из этих воспоминаний тянет за собой массу других, которые, в свою очередь , вызывают к жизни все новые и новые образы, мысли или идеи. Да, я понимаю, что уже немного утомил читателя своими пространными рассуждениями. А суть их состояла в том, что единички и нолики, возможно хороши для того, чтобы объяснить, как работает наш мозг на "физическом уровне", но если речь идет о принципах его работы , то следует говорить не о битах, а об ассоциациях как минимальных единицах обработки информации человеческим мозгом . Помните понятие лексемы как минимальной единицы языка, имеющей самостоятельный смысл? Так вот, в том языке, на котором "говорит" наш мозг, такими лексемами являются ассоциации. Что же такое ассоциация ?

Ассоциация :

в физиологии – образование временной связи между индифферентными раздражителями в результате их многократного сочетания по времени;

в психологии – закономерная связь между отдельными событиями, фактами, предметами или явлениями, отраженными в сознании и закрепленными в памяти.

При наличии ассоциативной связи между психическими явлениями A и B возникновение в сознании человека явления A закономерным образом влечет появление в сознании явления B.

Итак, каждая ассоциация связана с огромным числом новых ассоциаций, которые, в свою очередь , связаны с новыми и новыми понятиями. Таким образом, мышление можно представить в виде сложного ассоциативного алгоритма, своего рода слалома по ветвям дерева ассоциаций, расходящимся от ствола – основной мысли. В свое время профессор Анохин (http://ru.wikipedia.org/wiki/Анохин,_Пётр_Кузьмич) говорил, что возможности мозга по формированию ассоциативных связей намного превосходят его возможности по хранению информации. Что же касается информационной емкости мозга, то она тоже весьма впечатляет – доктор Марк Розенцвейг (http://en.wikipedia.org/wiki/Mark_Rosenzweig) писал, что даже в том случае, если бы человек запоминал 10 единиц информации ( слово , изображение или другое элементарное впечатление) каждую секунду в течение 100 лет, заполнить удалось бы менее одной десятой суммарного объема человеческой памяти. И сколько бы таких единиц информации ни хранилось у нас в голове, количество ассоциаций, связанных с ними, еще на несколько порядков выше! Потенциал человеческого мозга, связанный с созданием ассоциаций, поистине безграничен: все наши идеи, воспоминания и ощущения хранятся у нас в голове в виде своеобразных "треков" – извилистых ветвящихся дорожек, связывающих их с другими нашими мыслями.

Вот пример того, что обычно творится у нас в голове:

Не правда ли, весьма знакомая картина?

Таким образом, в основе работы нашего мозга лежат два важнейших принципа.

Ассоциативное мышление – связь каждого воспоминания с массой других образов, и именно об этом принципе мы с вами говорили последние десять минут.
Иерархия понятий – в каждом таком ассоциативном "треке" один из образов является главным (корневым), от которого расходятся ветви-дорожки к другим понятиям, идеям, воспоминаниям. В результате мы получаем некое дерево (или граф) образов, связанных с исходным понятием.

Если же постараться объединить эти два принципа (которые работают в комплексе, дополняя друг друга), то следует сказать о так называемом радиантном , или визуальном , мышлении . О нем мы поговорим в этой же лекции, но чуть позже. А пока постараемся разобраться в том, какие же теории обработки, систематизации и визуализации информации существуют в данный момент, и не имеют ли они каких-то общих черт с описанными нами выше принципами работы человеческого мозга.

Понятие о теориях обработки, систематизации и визуализации информации

Cуществующие теории обработки информации

Начнем с определений.

Обработка информации – любое преобразование информации из одного вида в другой, производимое по строгим формальным правилам.

Теория обработки информации (information-processing theory) – направление научного знания, изучающее то, как люди обращаются с информацией, отбирают и усваивают ее, а затем используют в процессе принятия решений и управления своим поведением.

Теории обработки информации применяются при изучении восприятия, памяти, внимания, речи, мышления и решения задач экспериментальной психологии. В свою очередь, большой вклад в развитие упомянутых теорий внесли математическая логика, техника связи, теория информации и теория вычислительных систем. Почему же мы говорим "теории" – во множественном числе? Дело в том, что на самом деле следует говорить о целом семействе абсолютно разрозненных теоретических и исследовательских программ. Естественно, как и в любом научном сообществе, согласия между исследователями нет и в помине – мнения ученых сходятся лишь в некоторых исходных посылках, теории и методологии исследований. В рамках упомянутого семейства можно выделить такие широко известные в узких кругах подходы, как трансформационная лингвистика (http://ru.wikipedia.org/wiki/Генеративная_лингвистика), психология Пиаже (http://www.gumer.info/bibliotek_Buks/Psihol/Jaroschev/11.php) и радикальный бихевиоризм. Бихевиоризм, в частности, занимался изучением поведения животных и активно распространял свои принципы на все области психологии. Однако возникли некоторые трудности при попытке распространить теорию и методы бихевиоризма на символические процессы человека, в частности, на языковые способности. Когда разочарование ученых в привычных методах стало всеобщим, исследователи-психологи обратились к другим теориям, в результате чего о бихевиоризме почти забыли. Тем не менее, ученые, развивающие теории обработки информации, разделяют со своими предшественниками-бихевиористами веру в эмпиризм, операционализм и т.п. Да, психологи отказались от распространения на людей выводов, полученных вследствие экспериментов с животными, и от объяснения видимого поведения индивидов внешними причинами, в частности, влияниями окружающей среды. В то же время общая методология и статистические методы обработки результатов экспериментов остались прежними – просто животных в качестве испытуемых сменили люди. Ученая братия вновь признала существование врожденных способностей и начала активно обсуждать такие внутренние процессы, как планы, стратегии, образы, решения и ассоциации .

ХХ век ознаменовался бурным развитием технологий связи – телефонии, радио и телевидения. Очень показательной была продемонстрированная психологами аналогия между обработкой информации человеческим мозгом и работой описанного в теории связи информационного канала. Большую роль в создании математической теории информации и переносе понятий теории связи на работу человеческого мозга сыграли исследования Клода Шеннона (знакомое имя, не правда ли?). Созданная им теория описывает передачу сообщений любой природы от любого источника любому получателю, в том числе и передачу сигналов внутри человеческого мозга.

Но вспомним еще об одном непонятном названии, упомянутом нами в начале этого раздела, – трансформационной лингвистике. В свое время Ноам Хомский (http://ru.wikipedia.org/wiki/Хомский,_Ноам) утверждал, что человеческий язык невозможно научно объяснить с позиций бихевиоризма. Он настаивал на том, что этот подход абсолютно неправильно представляет природу языка, игнорируя его структуру, правила и грамматику. Взамен этого он говорил о "правилах в голове" человека, позволяющих преобразовать (трансформировать) передаваемую информацию – разбить ее на смысловые единицы (слова) и связать эти единицы между собой. Отойдя от бихевиоризма, новая парадигма обработки информации в поисках идей все больше склонялась к лингвистике. Вот и современные исследователи стремятся обнаружить психологические процессы или умственные операции, которые лежат в основе языковой активности. Активно изучаются такие виды когнитивной активности, как восприятие, память, мышление и понимание. И понятие ассоциации опять не осталось в стороне.

Что же касается теории вычислительных систем, то за этим названием также скрывается целый выводок абсолютно разношерстных дисциплин. Сюда входят теория алгоритмов, численные методы, теория конечных автоматов, языки программирования, теория искусственного интеллекта и многое другое… И это не единственная черта, которая роднит теорию вычислительных систем с психологией обработки информации, – оба направления выросли из математической логики, оба занимались изучением природы разумного поведения, а появление вычислительных машин и развитие принципов, на которых они строились, привело к возникновению еще одной аналогии человеческих психических и интеллектуальных способностей. Машинные модели помогли в изучении мышления и в особенности – процесса решения задач. Отталкиваясь от этой аналогии, психологи пытаются объяснить, каким образом мозг получает информацию, перекодирует и сохраняет ее в памяти, каким образом он затем использует ее для принятия решений и управления поведением. Конечно, полного соответствия между работой мозга и компьютера нет и быть не может, но все же ученым удалось создать стройную концепцию, способную объяснить, каким образом интеллектуальная система – будь это человек или некое устройство – создает новые знания. Догадайтесь, какое понятие играет тут важнейшую роль? Да, конечно, вы правы – это понятие ассоциации !

Систематизация и структурирование информации

Итак, с обработкой информации мы разобрались, перейдем теперь к систематизации. Конечно, мы не забываем о том, что систематизация информации – это составная часть алгоритма обработки информации, некий его этап, но все равно, об этом этапе нужно сказать отдельно. Как всегда, сначала обратимся к определению:

Систематизировать – распределить элементы информации по признакам родства, сходства, т. е. классифицировать и типизировать их.

Мозг человека (в контексте процессов восприятия, запоминания, преобразования информации и т.п.) работает именно с систематизированной информацией. Например, процесс запоминания проходит намного эффективнее, если человеку удается рационально структурировать получаемую информацию, разложить по полочкам, как говорят в народе. В коммуникативных процессах (помните, мы говорили о языке и лингвистике?) систематизированное представление передаваемой информации также играет важную роль. Систематизация и структурирование информации – важнейшие психологические механизмы, благодаря которым человеческий мозг может эффективно обрабатывать большие потоки информации.

Стремление к целостному охвату объекта изучения, к систематизации знаний свойственно любому процессу познания. Многие исследователи отмечали, что процесс работы мозга над проблемой идет от осознания свойств, характеристик и функций объекта изучения к поиску недостающих структурных элементов, связей и отношений между ними. А если овладеть системным подходом и развить свое умение систематизировать и структурировать информацию, можно помочь мозгу работать эффективнее в процессе учебы и при решении профессиональных задач.

Структуры данных бывают разные – линейные (список), табличные, иерархические (дерево). Деревья (графы) понятий, построенные на основе ассоциативных связей, – наиболее естественный для нашего мозга способ представления (структурирования) данных (хотя, строго говоря, не следует путать ассоциативные и классификационные отношения). Вспомним о визуальном мышлении? Кстати, раз уж мы заговорили о деревьях, то нам пора плавно перейти к рассмотрению вопроса о визуализации информации. Но прежде отметим, что существует целое направление научного знания, изучающее методы и приемы структурирования информации, которое называется информационной архитектурой . Классики говорят, что

информационная архитектура – как наука занимается принципами систематизации информации и навигации по ней с целью помочь людям более успешно находить и обрабатывать нужные им данные.

Первое, что приходит нам в голову при слове "визуализация", – это графики и диаграммы (вот она, сила ассоциаций!). С другой стороны, визуализировать таким образом можно только числовые данные, никому еще не удавалось построить график на основе связного текста. Для текста мы можем построить план, выделить основные мысли (тезисы) – сделать краткий конспект. О недостатках и вреде конспектирования мы поговорим чуть позже, а сейчас скажем о том, что если объединить план и краткий конспект – "развесить" тезисы по ветвям дерева, структура которого соответствует структуре (плану) текста, – то мы получим отличную структурную схему текста, которая запомнится намного лучше, чем любой конспект. В этом случае ветви будут играть роль тех "треков" – дорожек, связывающих понятия и тезисы, о которых мы говорили ранее.
Помните, как мы строили UML-диаграммы на основе описания проектируемой программной системы, полученного от ее будущих пользователей? Полученные картинки воспринимались и клиентами, и разработчиками намного проще и быстрее, чем текстовое описание. Точно так же можно "изобразить" абсолютно любой текст, не только техническое задание на разработку системы. Подход, описанный нами выше, позволяет визуально представить абсолютно любой текст – будь это сказка, техническое задание, лекция, фантастический роман или результаты совещания – в виде удобного и простого для восприятия дерева. Строить его можно как угодно – лишь бы получилась наглядная и понятная схема, которую хорошо бы еще проиллюстрировать подходящими по смыслу рисунками.
Такие схемы удобно применять и в общении при обсуждении каких-либо вопросов и проблем. Как показывает практика, отсутствие четких стандартов нотации не создает абсолютно никаких коммуникативных сложностей для участников обсуждений. Наоборот, использование невербальных форм представления информации позволяет концентрировать внимание именно на ключевых точках проблемы. Таким образом, визуализация является одним из наиболее перспективных направлений повышения эффективности анализа, представления, восприятия и понимания информации.
Ух, наконец-то мы покончили с нудным описанием научных теорий, методов и приемов, применяющихся для обработки, систематизации и визуализации информации! Предыдущая часть главы сильно утомила и автора, и читателей, и тем не менее, она была необходима: в результате мы увидели, что особенности работы нашего мозга уже активно применяются учеными в самых разных областях науки, многие вещи, которые кажутся нам привычными, – персональные компьютеры, пользовательские интерфейсы, базы знаний и т.д. – изначально строились с учетом ассоциативного характера человеческого мышления и его склонности к иерархическому представлению и визуализации информации. Но вершиной и естественным графическим выражением мыслительных процессов человека является mind mapping, к обсуждению которого мы наконец-то переходим. А заодно попытаемся расширить наше понимание принципов визуального мышления.

"Говорят, один рисунок стоит тысячи слов, и это действительно так, но при условии, что рисунок хороший." Боумена

С возрастанием количества накапливаемых данных, даже при использовании сколь угодно мощных и разносторонних алгоритмов Data Mining, становится все сложнее "переваривать" и интерпретировать полученные результаты. А, как известно, одно из положений Data Mining - поиск практически полезных закономерностей. Закономерность может стать практически полезной, только если ее можно осмыслить и понять.

В 1987 году по инициативе ACM SIGGRAPH IEEE Computer Society Technical Committee of Computer Graphics, в связи с необходимостью использования новых методов, средств и технологий данных, были сформулированы соответствующие задачи направления визуализации.

К способам визуального или графического представления данных относят графики, диаграммы, таблицы, отчеты, списки, структурные схемы, карты и т.д.

Визуализация традиционно рассматривалась как вспомогательное средство при анализе данных, однако сейчас все больше исследований говорит о ее самостоятельной роли.

Традиционные методы визуализации могут находить следующее применение:

∙ представлять пользователю информацию в наглядном виде;

∙ компактно описывать закономерности, присущие исходному набору данных;

∙ снижать размерность или сжимать информацию;

∙ восстанавливать пробелы в наборе данных;

∙ находить шумы и выбросы в наборе данных.

Визуализация инструментов Data Mining

Каждый из алгоритмов Data Mining использует определенный подход к визуализации. В предыдущих лекциях мы рассмотрели ряд методов Data Mining. В ходе использования каждого из методов, а точнее, его программной реализации, мы получали некие визуализаторы, при помощи которых нам удавалось интерпретировать результаты, полученные в результате работы соответствующих методов и алгоритмов.

∙ Для деревьев решений это визуализатор дерева решений, список правил, таблица сопряженности.

∙ Для нейронных сетей в зависимости от инструмента это может быть топология сети, график изменения величины ошибки, демонстрирующий процесс обучения.

∙ Для карт Кохонена: карты входов, выходов, другие специфические карты.

∙ Для линейной регрессии в качестве визуализатора выступает линия регрессии.

∙ Для кластеризации: дендрограммы, диаграммы рассеивания.

Диаграммы и графики рассеивания часто используются для оценки качества работы того или иного метода.

Все эти способы визуального представления или отображения данных могут выполнять одну из функций:

∙ являются иллюстрацией построения модели (например, представление структуры (графа) нейронной сети);

∙ помогают интерпретировать полученный результат;

∙ являются средством оценки качества построенной модели;

∙ сочетают перечисленные выше функции (дерево решений, дендрограмма).

Визуализация Data Mining моделей

Первая функция (иллюстрация построения модели), по сути, является визуализацией Data Mining модели. Существует много различных способов представления моделей, но графическое ее представление дает пользователю максимальную "ценность". Пользователь, в большинстве случаев, не является специалистом в моделировании, чаще всего он эксперт в своей предметной области. Поэтому модель Data Mining должна быть представлена на наиболее естественном для него языке или, хотя бы, содержать минимальное количество различных математических и технических элементов.

Таким образом, доступность является одной из основных характеристик модели Data Mining. Несмотря на это, существует и такой распространенный и наиболее простой способ представления модели, как "черный ящик". В этом случае пользователь не понимает поведения той модели, которой пользуется. Однако, несмотря на непонимание, он получает результат - выявленные закономерности. Классическим примером такой модели является модель нейронной сети.

Другой способ представления модели - представление ее в интуитивном, понятном виде. В этом случае пользователь действительно может понимать то, что происходит "внутри" модели. Таким образом, можно обеспечить его непосредственное участие в процессе.

Такие модели обеспечивают пользователю возможность обсуждать ее логику с коллегами, клиентами и другими пользователями, или объяснять ее.

Понимание модели ведет к пониманию ее содержания. В результате понимания возрастает доверие к модели. Классическим примером является дерево решений. Построенное дерево решений действительно улучшает понимание модели, т.е. используемого инструмента Data Mining.

Кроме понимания, такие модели обеспечивают пользователя возможностью взаимодействовать с моделью, задавать ей вопросы и получать ответы. Примером такого взаимодействия является средство "что, если". При помощи диалога "системапользователь" пользователь может получить понимание модели.

Теперь перейдем к функциям, которые помогают интерпретировать и оценить результаты построения Data Mining моделей. Это всевозможные графики, диаграммы, таблицы, списки и т.д.

Примерами средств визуализации, при помощи которых можно оценить качество модели, являются диаграмма рассеивания, таблица сопряженности, график изменения величины ошибки.

Диаграмма рассеивания представляет собой график отклонения значений, прогнозируемых при помощи модели, от реальных. Эти диаграммы используют для непрерывных величин. Визуальная оценка качества построенной модели возможна только по окончанию процесса построения модели.

Таблица сопряженности используется для оценки результатов классификации. Такие таблицы применяются для различных методов классификации. Они уже использовались нами в предыдущих лекциях. Оценка качества построенной модели возможно только по окончанию процесса построения модели.

График изменения величины ошибки . График демонстрирует изменение величины ошибки в процессе работы модели. Например, в процессе работы нейронных сетей пользователь может наблюдать за изменением ошибки на обучающем и тестовом множествах и остановить обучение для недопущения "переобучения" сети. Здесь оценка качества модели и его изменения может оцениваться непосредственно в процессе построения модели.

Примерами средств визуализации, которые помогают интерпретировать результат, являются: линия тренда в линейной регрессии, карты Кохонена, диаграмма рассеивания в кластерном анализе.

Методы визуализации

Методы визуализации, в зависимости от количества используемых измерений, принято классифицировать на две группы :

∙ представление данных в одном, двух и трех измерениях;

∙ представление данных в четырех и более измерениях.

Представление данных в одном, двух и трех измерениях

К этой группе методов относятся хорошо известные способы отображения информации, которые доступны для восприятия человеческим воображением. Практически любой современный инструмент Data Mining включает способы визуального представления из этой группы.

В соответствии с количеством измерений представления это могут быть следующие способы:

∙ одномерное (univariate) измерение, или 1-D;

∙ двумерное (bivariate) измерение, или 2-D;

∙ трехмерное или проекционное (projection) измерение, или 3-D.

Следует заметить, что наиболее естественно человеческий глаз воспринимает двухмерные представления информации.

При использовании двух- и трехмерного представления информации пользователь имеет возможность увидеть закономерности набора данных:

∙ его кластерную структуру и распределение объектов на классы (например, на диаграмме рассеивания);

∙ топологические особенности;

∙ наличие трендов;

∙ информацию о взаимном расположении данных;

∙ существование других зависимостей, присущих исследуемому набору данных.

Если набор данных имеет более трех измерений, то возможны такие варианты:

∙ использование многомерных методов представления информации (они рассмотрены ниже);

∙ снижение размерности до одно-, двухили трехмерного представления. Существуют различные способы снижения размерности, один из них - факторный анализ - был рассмотрен в одной из предыдущих лекций. Для снижения размерности и одновременного визуального представления информации на двумерной карте используются самоорганизующиеся карты Кохонена.

Представление данных в 4 + измерениях

Представления информации в четырехмерном и более измерениях недоступны для человеческого восприятия. Однако разработаны специальные методы для возможности отображения и восприятия человеком такой информации.

Наиболее известные способы многомерного представления информации:

∙ параллельные координаты;

∙ "лица Чернова";

∙ лепестковые диаграммы.

Параллельные координаты

В параллельных координатах переменные кодируются по горизонтали, вертикальная линия определяет значение переменной. Пример набора данных, представленного в декартовых координатах и параллельных координатах, дан на рис. 16.1 . Этот метод представления многомерных данных был изобретен Альфредом Инселбергом (Alfred Inselberg) в 1985 году.

Визуализация информации

По сложившейся уже традиции, начнем с определения.

Визуализация информации – представление информации в виде графиков, диаграмм, структурных схем, таблиц, карт и т.д.

ecsocman.edu.ru

Зачем визуализировать информацию? "Глупый вопрос!" – воскликнет читатель. Конечно же, текст с картинками воспринимается лучше, чем "серый" текст, а картинки с текстом воспринимаются еще лучше. Недаром все мы так любим комиксы – ведь они позволяют нам буквально схватывать информацию на лету, казалось бы, не прикладывая ни малейших умственных усилий! А вспомните, насколько хорошо запоминался вам во время учебы материал тех лекций, которые сопровождались слайдами!

Первое, что приходит нам в голову при слове "визуализация", - ϶ᴛᴏ графики и диаграммы (вот она, сила ассоциаций!). С другой стороны, визуализировать таким образом можно только числовые данные, никому еще не удавалось построить график на базе связного текста. Для текста мы можем построить план, выделить основные мысли (тезисы) – сделать краткий конспект. О недостатках и вреде конспектирования мы поговорим чуть позже, а сейчас скажем о том, что если объединить план и краткий конспект – "развесить" тезисы по ветвям дерева, структура которого соответствует структуре (плану) текста͵ – то мы получим отличную структурную схему текста͵ которая запомнится намного лучше, чем любой конспект. В этом случае ветви будут играть роль тех "треков" – дорожек, связывающих понятия и тезисы, о которых мы говорили ранее.

Помните, как мы строили UML-диаграммы на базе описания проектируемой программной системы, полученного от ее будущих пользователей? Полученные картинки воспринимались и клиентами, и разработчиками намного проще и быстрее, чем текстовое описание. Точно так же можно "изобразить" абсолютно любой текст, не только техническое задание на разработку системы. Подход, описанный нами выше, позволяет визуально представить абсолютно любой текст – будь это сказка, техническое задание, лекция, фантастический роман или результаты совещания – в виде удобного и простого для восприятия дерева. Строить его можно как угодно – лишь бы получилась наглядная и понятная схема, которую хорошо бы еще проиллюстрировать подходящими по смыслу рисунками.

Такие схемы удобно применять и в общении при обсуждении каких-либо вопросов и проблем. Как показывает практика, отсутствие четких стандартов нотации не создает абсолютно никаких коммуникативных сложностей для участников обсуждений. Наоборот, использование невербальных форм представления информации позволяет концентрировать внимание именно на ключевых точках проблемы. Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, визуализация является одним из наиболее перспективных направлений повышения эффективности анализа, представления, восприятия и понимания информации.

Ух, наконец-то мы покончили с нудным описанием научных теорий, методов и приемов, применяющихся для обработки, систематизации и визуализации информации! Предыдущая часть главы сильно утомила и автора, и читателей, и тем не менее, она была необходима: в результате мы увидели, что особенности работы нашего мозга уже активно применяются учеными в самых разных областях науки, многие вещи, которые кажутся нам привычными, – персональные компьютеры, пользовательские интерфейсы, базы знаний и т.д. – изначально строились с учетом ассоциативного характера человеческого мышления и его склонности к иерархическому представлению и визуализации информации. Но вершиной и естественным графическим выражением мыслительных процессов человека является mind mapping, к обсуждению которого мы наконец-то переходим. А заодно попытаемся расширить наше понимание принципов визуального мышления.

Визуализация информации - понятие и виды. Классификация и особенности категории "Визуализация информации" 2017, 2018.

Визуализация - ИЗОБРАЖЕНИЙ 24. Визуализация Display Визуальное представление данных Источник: ГОСТ 27459 87: Системы обработки информации. Машинная графика. Термины и определения …

Способ отображения информации о состоянии технологического оборудования и параметрах технологического процесса на мониторе компьютера или операторской панели в системе автоматического управления в промышленности, предусматривающий также… … Википедия

В общем смысле метод представления информации в виде оптического изображения (например, в виде рисунков и фотографий, графиков, диаграмм, структурных схем, таблиц, карт и т. д.). Очень эффективно визуализация используется для представления… … Словарь бизнес-терминов

Египетские иероглифы позволяли интуитивно наглядно описывать понятия … Википедия

Визуализация типовой формы - 98. Визуализация типовой формы Form flash Визуальное представление типовой формы Источник: ГОСТ 27459 87: Системы обработки информации. Машинная графика. Термины и определения … Словарь-справочник терминов нормативно-технической документации

Визуализация - (лат. visualis зрительный) 1. формирование зрительного наглядного или мысленного образа (например, можно «воочию» представить себе страницу книги, где находится нужный текст); 2. в психопатологии присоединение к нарушениям мышления зрительных… … Энциклопедический словарь по психологии и педагогике

ГОСТ 27459-87: Системы обработки информации. Машинная графика. Термины и определения - Терминология ГОСТ 27459 87: Системы обработки информации. Машинная графика. Термины и определения оригинал документа: 5. Абсолютная команда визуализации Absolute command Команда визуализации, в которой используются абсолютные координаты… … Словарь-справочник терминов нормативно-технической документации

Содержание 1 Как это работает 2 Безопасность 3 Действующие службы передачи дорожной … Википедия

извлечение информации из данных - разведка данных Технология анализа хранилищ данных, базирующаяся на методах ИИ и инструментах поддержки принятия решений. Процесс обнаружения корреляции, тенденций, шаблонов, связей и категорий. Выполняется путем тщательного исследования данных с … Справочник технического переводчика

Тип Сист … Википедия

Книги

, Кабаков Роберт И.. R -это мощный язык для статистических вычислений и графики, который может справится поистине с любой задачей в области обработки данных. Он работает во всех важных операционных системах и…
R в действии. Анализ и визуализация данных на языке R , Роберт И. Кабаков. R– это мощный язык для статистических вычислений и графики, который может справиться поистине с любой задачей в области обработки данных. Он работает во всех важныхоперационных системах и…

Которая занимается проектированием пользовательских интерфейсов. В общих чертах Юрий рассказывает о набирающих в последнее время популярность дизайнерских методиках — визуализации и инфографике, о сферах их применения и классификации, процессе создания, инструментах и примерах из практики.

Тема визуализации информации и инфографики регулярно всплывает при работе, да и в целом интересна как практика проектирования и дизайна. Хотя мы в компании работаем над веб-системами, где большинство задач решается стандартными средствами конструирования вроде форм или информационных блоков, иногда требуется емко и компактно подать большое количество информации. Часто это достаточно специфичные задачи, на продумывание интерфейса которых уходит немало времени. Правда, и задачи эти — одни из самых интересных.

У практики отображения информации в графическом виде много синонимов, но в последнее время чаще всего используются два: визуализация данных и инфографика. Существуют эти подходы уже достаточно давно , литературы по этому поводу написано много (среди наиболее известных авторов и дизайнеров: Edward Tufte, Stephen Few, Ben Fry), но в первую очередь интересно, где и как используется инфографика.

Применение

Сейчас существует множество интересных примеров визуализации, но многие из них — скорее объекты искусства, чем практически полезные носители информации. И для тех, и для других можно выделить следующие области использования:

Статистика и отчеты

Самодостаточный жанр, когда данные за некий период времени показываются вместе. Например, статической картинкой в приложении к отчету или настраиваемым графиком в сервисе статистики, с возможностью изменения параметров его отображения.

Справочная информация

Дополнение к основному тексту, наглядно иллюстрирующее его упоминаемыми данными. Скажем, дать общее представление о динамике одного из показателей, либо отобразить какой-то процесс и его этапы; может быть — показать структуру некого явления.

Интерактивные сервисы

Продукты и проекты, в которых инфографика является частью функциональности. Так, в качестве средства навигации по сервисам со сложным workflow может выступать диаграмма процесса. Почти все, что связано с работой с картами и вовсе редко обходится без смешения инфографики и интерактивности, не говоря уже о специализированных системах вроде диспетчерских и большей части компьютерных игр.

Иллюстрации

Не совсем чистый жанр — скорее, использование практик и подходов красивого отображения данных для создания самостоятельных иллюстраций. Они несут некий смысл, но это не основная их задача — основной ценностью является качество исполнения.

Эксперименты и искусство

Визуализация данных без особого практического смысла, скорее в качестве экспериментов или инсталляций. Чаще всего это сложные и громоздкие изображения, которые сложно «прочитать» бегло — объем данных и взаимосвязей между ними таков, что нужно разбираться с картинкой по частям; либо просто абстрактные изображения, автоматически сгенерированные. В последнее время направление все более популярно и периодически выходит за рамки компьютерной графики — например, в виде графиков-скульптур.

(внимание! более 9 мегабайт)

Классификация

Набор инструментов визуализации достаточно обширен — от простейших линейных графиков до сложных отображений множества связей. Разбить их можно на несколько типов:

Графики

Показывают зависимость данных друг от друга. Строятся по осям X и Y, хотя могут быть и трехмерными.

Линейный график (line chart, area chart)

Наиболее распространенный случай. Объединяет линией набор точек, соответствующих значениям по осям. Например, ежедневная посещаемость сайта за месяц. Может показывать сразу несколько наборов данных — например, статистику просмотров для 3 наиболее популярных страниц.

График рассеивания (scatterplot)

Показывает распределение ограниченного набора точек, соответствующих значениям по осям. Между точек часто рисуется выравнивающая кривая — она наглядно показывает закономерности среди значений. Например, связь между стажем работы и производительностью труда среди 50 сотрудников компании (просто соединить полученные точки в виде линейного графика нельзя — и смысл искажается, и линия будет дерганой).

Диаграммы сравнения

Показывают соотношения набора данных. Во многих случаях строятся вокруг осей, хотя и необязательно.

Столбиковая диаграмма (bar chart)

Показывает один или несколько наборов данных, сравнивая их между собой. Существует два варианта отображения в случае нескольких наборов: либо в виде нескольких стоящих рядом столбиков, либо в виде одного, но поделенного внутри в соответствии с долями значений. Например, ежегодная прибыль трёх компаний за последние 5 лет или их доли рынка за это же время.

Круговая диаграмма (pie chart)

Отображает процент, занимаемый каждым значением внутри набора данных, в виде разбитого на части круга. Например, доли рынка сотовых операторов. Может отображать сразу несколько наборов данных — в этом случае диаграммы наложены друг на друга, причем каждая из них меньше предыдущей. Например, доли рынка сотовых операторов за последение 3 года.

Площадная диаграмма (bubble chart)

Смесь графика и диаграммы — по двум осям расставлен набор точек, соответствующий значениям. При этом сами точки не соединены и имеют различную величину, которая задается третьим параметром. Например, сравнение количества купленных товаров, общей стоимости покупки и величины общего бюджета покупателя.

Кольцевая диаграмма (ring chart)

Показывает процент от максимального количества, которое занимает одно из значений в наборе данных, в виде частично закрашенного кольца. Например, количество завоеванных на чемпионате медалей относительно максимального. Часто используется сразу несколько таких диаграмм, сравнивающих разные значения.

Диаграмма разброса (span chart)

Показывает минимальную и максимальную величину значений внутри набора данных в виде урезанной столбиковой диаграммы. Начало столбика лежит не на горизонтальной оси, а в точке минимального значения по вертикали. Например, разброс стоимости квадратного метра жилья в разных районах города.

Лепестковая диаграмма (radar chart)

Сравнивает величины нескольких значений, каждая из которых соответствует точке на оси. Количество осей соответствует количеству значений, а точки объединены линями. Например, сравнение рентабельности каждого из 8 направлений деятельности компании.

Облако тегов (tag cloud)

Сравнивает ключевые слова или фразы (значения), содержащиеся внутри фрагмента текста (набора данных), задавая каждому из них свой размер шрифта. Размер шрифта зависит от величины параметра. Например, 25 самых часто упоминаемых в газетах слов за декабрь 2008 года.

Тепловая диаграмма (heat map)

Сравнивает значения внутри набора данных, закрашивая их одним из цветов в заранее выбранном спектре. Основой является изображение или другая диаграмма, на которой расставлены значения. Цвет зависит от величины параметра и чаще всего накладывается в виде пятен. Например, элементы главной страницы сайта, по которым пользователи кликают чаще всего.

Деревья и структурные диаграммы

Показывают структуру набора данных и взаимосвязи между его элементами.

Дерево (tree)

Показывает иерархию набора данных, в которой элементы являются родительскими или дочерними по отношению друг к другу. Выстраивается в виде соединенных линиями узлов, как правило, сверху вниз. Узел обычно отображается кругом или прямоугольником. Например, карта сайта.

Ментальная карта (mind map)

Показывает состав и структуру явления или понятия в виде дерева, в котором каждый узел имеет один или несколько дочерних элементов. Это частный случай дерева, с той разницей, что ветви расходятся из узла, расположенного в центре изображения. Например, конспект книги по управлению проектами, который отражает ее содержание и основные понятия.

Формализованные структурные диаграммы

Показывают состав и структуру системы или ее части в виде карточек, которые описаны с разной степенью детализации и связаны друг с другом как родительские и дочерние.
Отображается в стандартизованном виде — например, с помощью UML (Unified Modeling Language) или IDEFIX (Integration Definition for Information Modeling). Например, все сущности, необходимые для работы одного из модулей программной системы.

Диаграмма Венна-Эйлера (Venn/Euler diagram)

Показывает отношения между значениями набора данных в виде накладывающихся друг на друга кругов (чаще всего трёх). Область, в которой пересекаются все круги, показывает общее между ними. Например, пересечением соблюдения сроков, бюджета и поставленных задач является успех проекта.

Плоское дерево (tree map)

Показывает иерархию набора данных, в которой элементы являются родительскими или дочерними по отношению друг к другу. Отображается в виде набора вложенных прямоугольников, каждый из которых является ветвью дерева, а находящиеся внутри него — дочерними элементами и ветвями. Прямоугольники различаются по размеру в зависимости от параметра и имеют цвет, который задается другим параметром. Например, детальная структура бюджета компании, в котором цветом показан процент изменения каждого пункта по сравнению с предыдущим годом.