Меню Рубрики

Как называется анализ с построением диаграмм

Значительный набор возможностей предоставляет пользователю Excel для графического представления данных. Составлять диаграммы можно как на одном рабочем листе с таблицей, так и на отдельном листе рабочей книги, который называется листом диаграммы. Диаграмма, созданная на одном рабочем листе с таблицей, называется внедренной. Для построения диаграмм в Excel используется:

Мастер диаграмм позволяет строить несколько типов графиков, для каждого из которых можно выбрать модификацию основного варианта диаграммы.

Основные компоненты диаграммы представлены на следующей схеме:

Примечание: для объемной диаграммы составные части несколько отличаются.

В зависимости от выбранного типа диаграммы можно получить различное отображение данных:

линейчатые диаграммы и гистограммы могут быть использованы для иллюстрации соотношения отдельных значений или показа динамики изменения данных за определенный период времени;

график отражает тенденции изменения данных за определенные промежутки времени;

круговые диаграммы предназначены для наглядного отображения соотношения частей и целого

точечная диаграмма отображает взаимосвязь между числовыми значениями нескольких рядов данных и представляет две группы чисел в виде одного ряда точек, часто используется для представления данных научного характера;

диаграмма с областями подчеркивает величину изменения данных во времени, показывая сумму введенных значений, а также демонстрирует вклад отдельных значений в общую сумму;

кольцевая диаграмма показывает вклад каждого элемента в общую сумму, но, в отличие от круговой диаграммы, может содержать несколько рядов данных (каждое кольцо – отдельный ряд);

лепестковая диаграмма позволяет сравнивать общие значения из нескольких рядов данных;

поверхностная диаграмма используется для поиска наилучшего сочетания двух наборов данных;

пузырьковая диаграмма представляет разновидность точечной диаграммы, где два значения определяют положение пузырька, а третье – его размер;

биржевая диаграмма часто используется для демонстрации цен на акции, курсов валют, для определения изменения температуры, а также для научных данных

Кроме того, можно строить диаграммы так называемого нестандартного типа, позволяющие совмещать в одной диаграмме различные типы представления данных.

При работе с нестандартным типом диаграмм предусмотрена возможность быстрого просмотра диаграммы. Каждый нестандартный тип диаграммы основывается на стандартном типе и содержит дополнительные формат и параметры, такие как легенда, сетка, подписи данных, вспомогательная ось, цвета, шаблоны, заливки и места расположения различных элементов диаграммы.

Можно использовать либо один из встроенных нестандартных типов диаграмм, либо создать свой собственный. Нестандартные типы диаграмм находятся в книгах.

Для создания диаграммы на рабочем листе необходимо выделить данные, которые будут в ней использованы, и вызвать Мастер диаграмм. Может быть выбран как один ряд данных (или отдельная строка в таблице, или отдельный столбец), так и несколько.

Примечание: данные, не входящие в прямоугольный блок, выделяются при нажатой клавише Ctrl.

Для вызова Мастера диаграмм используется:

пункт меню Вставка|Диаграмма;

кнопка Мастер диаграмм на стандартной панели инструментов

Мастер диаграмм предполагает несколько шагов, которые должен сделать пользователь.

Стандартный вид диалогового окна Мастера диаграмм приведен на рис.1.

Созданные диаграммы в любое время могут редактироваться. Excel позволяет:

Изменять размеры диаграммы

Перемещать диаграммы на рабочем листе

Менять тип и подтип диаграммы, корректировать цвет рядов или точек данных, их местоположение, настраивать изображение рядов, добавлять подписи данных

источник

Лабораторная работа №11 ПОСТРОЕНИЕ ГРАФИКОВ И ДИАГРАММ

Цель работы: изучить цели и способы построения графиков и диаграмм, применение различных типов диаграмм в зависимости от представляемых на них данных, а также способы прогнозирования при помощи линий тренда.

Методические указания

Диаграммы используют для наглядного представления результатов вычислений. В MS Excel можно построить два типа диаграмм: внедренные (эффективны при подготовке отчетов для отображения диаграммы рядом с данными, по которым они построены) и на отдельных листах (удобны для вывода на печать при создании слайдов).

Существует несколько правил размещения данных для диаграммы на рабочем листе.

1. MS Excel предполагает, что ось категорий Х идет вдоль длинной стороны выделенного диапазона ячеек. Если выделен квадратный диапазон или он занимает по ширине больше ячеек, чем по высоте, то названия категорий будут расположены в верхней строке диапазона. Если высота выделенного диапазона больше ширины, то названия категорий идут вниз по левому столбцу диапазона.
2. Названия вдоль короткой стороны выделенного диапазона используются, как правило, как метки легенды для каждого ряда данных. Если ряд данных один, MS Excel использует это название в качестве заголовка диаграммы.
3. Если в ячейках, предназначенных для названий категорий, находятся числа (а не текст или значения даты), MS Excel предполагает, что в этих ячейках содержится ряд данных, и строит диаграмму без меток на оси категорий, вместо этого нумеруя категории.
4. Если числа находятся в ячейках, предназначенных для названий рядов, MS Excel предполагает, что в этих ячейках содержатся первые точки рядов данных, а каждому ряду данных присваивает имя Ряд1, Ряд2 и т.д.
При использовании Мастера диаграмм сначала рекомендуется выделить на рабочем листе данные, по которым нужно строить диаграмму, включая заголовки данных.

Существуют следующие типы стандартных диаграмм:

1. Гистограмма (столбиковая диаграмма). Используется для сравнения отдельных величин или их изменений в течение некоторого периода времени. Возможно отображение вклада каждой категории в общую сумму при построении нормированной гистограммы или гистограммы с накоплением. Гистограммы могут быть двумерными и объемными. Объемные гистограммы не добавляют ничего нового в представлении данных, однако они производят большее впечатление и используются при подготовке
отчетов и слайдов для докладов. Анализ данных удобнее делать на плоских (двумерных) диаграммах. В качестве разновидности гистограмм следует отметить цилиндрическую, коническую и пирамидальную диаграммы.
2. Линейчатая. Используется для сопоставления отдельных значений в определенный момент времени. Горизонтальное расположение полос позволяет подчеркнуть положительные или отрицательные отклонения от некоторой величины. Данный тип диаграмм можно использовать для отображения отклонений по разным статьям бюджета в заданный момент времени. Возможно отображение вклада каждой категории в общую
сумму, построение нормированной диаграммы.
3. График. Отображает зависимость данных от величины, которая изменяется с постоянным шагом. Графики часто применяются для отображения ситуации с производством, продажей или уровнем цен, чтобы продемонстрировать тенденцию изменения дохода или продаж за равные промежутки времени.
4. Круговая.Отображает соотношение частей целого. Строится по одному ряду, первому в выделенном диапазоне. Предполагается, что все компоненты в сумме составляют 100%. Диаграмма отображает вклад в общую сумму каждого компонента. Процентное соотношение частей вычисляется автоматически. Сектора круговой диаграммы можно выдвинуть из общего круга, чтобы подчеркнуть точки данных, которые они
отображаю (выделяется один сектор и мышкой вытаскивается из диаграммы).
Для сравнения большого числа точек данных лучше использовать вторичные круговые диаграммы или вторичные гистограммы, так как трудно сопоставлять части, если их больше пяти.
5. Точечная.Отображает функциональные зависимости данных от величины, которая может меняться с произвольным непостоянным шагом. Используется для построения графиков функций в декартовой системе координат.
6. С областями. Позволяет прослеживать непрерывные изменения как суммы значений всех рядов данных, так и вклад каждого ряда в эту сумму. Удобны для построения динамики процесса производства или продаж.
7. Кольцевая. Подобно круговой, сравнивает вклад частей в целое, однако может отображать несколько рядов данных.
8. Лепестковая.Является аналогом графика, в полярной системе координат отображая распределение значений, относительно начала координат.
9. Поверхность. Отображает изменение функции двух переменных в виде поверхности. Может использоваться для построения линий уровня.
10. Пузырьковая.Отображает на плоскости набор из трех значений. Подобна точечной, но третья величина отображает размер пузырька.
11. Биржевая.Отображает наборы из трех (самый высокий курс, самый низкий курс, курс закрытия), четырех (курс открытия, самый высокий курс, самый низкий курс, курс закрытия и объем) либо пяти значений (объем, высокий курс, низкий курс и курс закрытия, а также объем, курс открытия, высокий курс, низкий курс и курс закрытия).

Пример 1. Используя Мастер диаграмм в пошаговом режиме построить график функции y = cos(p x) 2 , при [- 30о; 30о] с шагом 5о. При разработке формулы учесть, что для встроенных тригонометрических функций MS Excel требуются аргументы, заданные в радианах.

Решение. Для построения графика функции создайте таблицу ее значений при различных значениях аргумента, изменяющегося с шагом 5 о (рис. 8.1).

1. Команда Вставка – Диаграммы.
2. Выбрать Тип диаграммы(рис. 8.2) – позволяет выбрать тип и вид диаграммы.

Рис. 8.2. Выбор типа диаграмм

3.Выбор источника данных диаграммы (рис. 8.3) – позволяет задать диапазон, содержащий данные для построения диаграммы. Диапазон можно задать как с клавиатуры, так и с помощью мыши. Следует указать, как размещаются ряды данных (в строках или в столбцах). Имеется также возможность добавления новых рядов, удаления существующих, задания названий рядов данных, их значений, подписей по горизонтальной оси Х.

Рис. 8.3. Выбор источник данных диаграммы

4. Параметры диаграммы (названия диаграммы, осей Х и Y, включать и выключать отображение осей, основных и промежуточных линий сетки, управлять отображением легенды, таблицы данных, видом подписей данных)можно установить, выделив диаграмму и выбрав соответствующие параметры на вкладке Макет (рис. 8.4).

Рис. 8.4. Задание параметров

5. Размещение диаграммы(рис. 8.5) – позволяет определить, является ли диаграмма встроенной или ее следует разместить на отдельном листе (вкладка Конструктор – категория Расположение – команда Переместить диаграмму).

Рис. 8.5. Расположение диаграммы

В результате проделанных действий будет построен график функции, изображенный на рис. 8.6.

Пример 2. Постройте поверхность z для х и у Î [-1; 1] с шагом 0,1.

Решение. Для построения поверхности z создайте таблицу ее значений при различных значениях переменных, изменяющихся с шагом 0,1 (рис. 8.7).

Рис. 8.7. Таблица значений функции z при различных значениях переменных

Выделим все исходные данные, вставка диаграммы. Затем выберем тип диаграммы – поверхность (рис. 8.8).

Рис. 8.8. Поверхность для функции z

Редактирование диаграмм.

Диаграмму можно перемещать по рабочему листу или изменять еѐ размеры (в случае внедрѐнных диаграмм).
Предварительно диаграмму выделяют щелчком мыши, появляется рамка с чѐрными маркерами. Путем перетягивания маркеров можно изменять размеры диаграмм.

Чтобы удалить диаграмму, еѐ нужно выделить и нажать «Delete».

В любой диаграмме различают следующие элементы: область диаграммы, область построения, ряды данных, легенды, стрелки, линии максимума и минимума, линии сетки, надписи, проекции, оси.
Любой из элементов диаграммы можно редактировать (форматировать). Существует множество инструментов для изменения внешнего вида построенной диаграммы и любого ее объекта. Можно изменить тип уже построенной диаграммы, добавить на диаграмму новые ряды или точки данных, удалить часть включенных в диаграмму данных, добавить заголовки, легенду и любые другие надписи, поясняющие диаграмму.
Так как диаграмма связана с данными, на основе которых она построена, при любых изменениях данных на рабочем листе диаграмма будет автоматически обновляться. Если появилась необходимость добавить на уже существующую диаграмму какие-то данные, достаточно выделить на рабочем листе их и перетащить в область построения диаграммы.
Самым простым способом форматирования, как самой диаграммы, так и отдельных ее объектов, является использование команд контекстного меню. Форматирование диаграмм предполагает изменение цвета, размера шрифта, масштаба осей.

Применение диаграмм для анализа данных.

Возможны два варианта действий.
1. Перемещение маркеров для изменения значений на рабочем листе;
2. Анализ с помощью линий тренда.

Линия тренда показывает тенденцию изменения данных, используется для составления прогнозов. Линия тренда позволяет получить приблизительную аналитическую зависимость между аргументом и значением таблично заданной функции.
При создании линии тренда на основе данных диаграммы используются та или иная аппроксимация. Существует пять типов аппроксимирующих линий (это различные зависимости – линейная, степенная, логарифмическая, полиноминальная и экспоненциальная). Также можно вычислить линию, показывающую скользящее среднее (линейную фильтрацию). В этом случае каждая точка данных на линии тренда строится на основании среднего значения указанного числа точек данных (периодов), чем больше число периодов, используемых для вычислений скользящего среднего, тем более гладкой, но менее точной становится линия тренда). Линию тренда можно добавить к любому ряду данных, построенному на следующих диаграммах:
диаграммы с областями, графики, гистограммы, линейчатые или точечные диаграммы. Добавленная к ряду данных линия тренда связывается с ним, при изменении любых точек ряда данных линия тренда автоматически пересчитывается и обновляется на диаграмме.

Для добавления линии тренда к ряду данных, который необходимо проанализировать, следует в контекстном меню выбранного ряда данных выбрать команду Добавить линию тренда (рис. 8.9)

Рис. 8.9. Диалоговое окно команды Формат линия тренда

В диалоговом окне «Формат линии тренда»можно выбрать один из шести типов аппроксимации данных:
а) линейная: y = mx + b
б) логарифмическая: y = c ´ ln(x) + b
в) полиномиальная: y = b + c1 ´ x + c2 ´ x 2 + . + c6 ´ x 6
г) степенная: y = c ´ x b
д) экспоненциальная: y = c ´ e bx
е) скользящее среднее (линейная фильтрация).

Помимо этого можно определить название аппроксимирующей кривой, сделать прогноз на указанное количество периодов вперѐд или назад, задать точку пересечения с осью Y, показать уравнение кривой на диаграмме, поместить на диаграмму величину lостоверности аппроксимации. Чем ближе величина R^2 достоверности аппроксимации к 1, тем достоверней прогноз.
Для анализа данных могут быть использованы планки погрешностей. Как правило, они используются для визуального представления допущенных погрешностей или степени неопределѐнности ряда данных. Чем больше неопределѐнностей, тем шире планка погрешностей.
Для того, чтобы добавить на диаграмму планки погрешностей, следует сначала выбрать требуемый ряд данных. Затем на вкладке Макетгруппа Анализвыбрать команду Планки погрешностейи задать необходимые параметры погрешностей (тип планки, величину погрешности: фиксированное значение, относительное значение, стандартное отклонение, стандартная погрешность, пользовательская погрешность).

На плоских линейчатых диаграммах, гистограммах и графиках можно перетаскивать точки в новое положение. При этом автоматически меняются соответствующие значения в ячейках на рабочих листах.

Дата добавления: 2016-12-29 ; просмотров: 2708 | Нарушение авторских прав

источник

При описании результатов эмпирического исследования обычно приводится большое количество фактического и цифрового материала. Наглядность ему придает использование таблиц и схем.

Таблицы представляют собой упорядоченные по горизонтали и вертикали наборы количественных и качественных данных. При описании результатов эмпирического исследования обычно приводится большое количество фактического и цифрового материала. Наглядность ему придает использование таблиц и схем.

Таблицы представляют собой упорядоченные по горизонтали и вертикали наборы количественных и качественных данных.

Таблицу следует располагать в работе непосредственно после текста, в котором она упоминается впервые, или на следующей странице. Таблицы слева, справа, сверху и снизу ограничиваются линиями. Таблицы нумеруются арабскими цифрами. Номер следует размещать в правом верхнем углу после слова «Таблица» (например, Таблица 1). Допускается нумерация таблиц как сквозная — по всей работе, так и в пределах раздела. Если в работе одна таблица, ее не нумеруют.

В таблицах рекомендуется использовать вертикальные линии для более четкого разделения столбцов или делать промежутки между столбцами не менее 4 мм. Горизонтальные линии следует использовать только для выделения главных разделов таблицы. Однако, когда колонки таблицы содержат цифры, чтение затрудняется; тогда можно использовать разделяющие линии (Куликов, 2001, с. 116).

Таблица должна иметь номер и заголовок. Номер ставится сразу после слова «Таблица». Заголовок помещается ниже слова «Таблица». Слово «Таблица» и заголовок начинаются с прописной (большой) буквы, точка в конце заголовка не ставится. Кавычки для выделения слова «Таблица» или названия таблицы не используются.

Графы строк и столбцов таблицы также должны иметь заголовки, начинающиеся с прописных (больших) букв, подзаголовки — со строчных, если последние подчиняются заголовку. Заголовки граф указываются в единственном числе. Графу «№ п/п» (номер по порядку) в таблицу включать не следует. Если заголовки граф очень длинные, то они могут быть заменены краткими условными сокращениями или цифрами, пояснения которых должны быть помещены в текст заглавия всей таблицы.

Таблица — Распределение общей дисперсии (в %) каузальной атрибуции в зависимости от трех критериальных параметров (по данным Л. МакАртура)
(Хекхаузен X. Мотивация и деятельность. 2-е изд., перераб. СПб.: Питер-Пресс; М.: Смысл, 2003. С. 642)

Стандартный вид таблиц для представления первичных результатов: по строкам — испытуемые, по столбцам — значения измеренных параметров. В таблицах целесообразно размещать сводные итоги статистической обработки, а также другие типы систематизированных данных.

Таблицу следует размещать так, чтобы читать ее можно было без поворота работы. Если такое размещение невозможно, таблицу располагают так, чтобы ее можно было читать, поворачивая работу по часовой стрелке.

При переносе таблицы на другую страницу ее заголовки следует повторить и над ней размещают слова «Продолжение таблицы», с указанием ее номера. Если заголовки таблицы велики, допускается их не повторять: в этом случае следует пронумеровать графы и повторить их нумерацию на следующей странице. Основой заголовок таблицы не повторяют.

Если цифровые или иные данные в какой-либо строке таблицы отсутствуют, то ставится прочерк. Если все показатели, приведенные в таблице, выражены в одной единице измерения, то ее обозначение указывается в пояснительном тексте заголовка таблицы. Если все показатели, приведенные в какой-либо графе, выражены в одних и тех же единицах измерения, то ее обозначение помещается в скобках после заголовка графы. Заменять кавычками повторяющиеся в таблице элементы — цифры, знаки и др. — не допускается. При наличии в тексте небольшого по объему цифрового материала его нецелесообразно оформлять в таблицу, а следует давать в виде текста, располагая цифровые данные в колонки.

Нет необходимости в тексте повторять все коэффициенты и числовые критерии, представленные в таблице. Выделите в тексте, комментирующем таблицу, наиболее важные показатели, на которые должен обратить внимание читатель, подтверждающие вашу гипотезу и выводы.

Выделите курсивом соответствующие статистические символы, например, t, р, F и т.п.).

Для представления эмпирических данных полезно использовать такие графические формы, как диаграммы, гистограммы, полигоны распределения, а также различные графики. Их следует располагать в работе непосредственно после текста, в котором они упоминаются впервые, или на следующей странице, если в указанном месте они не помещаются.

Зависимости изучаемых параметров наглядно могут отражать графики.

График представляет собой линию, которая изображает зависимость между переменными. На осях откладываются значения изучаемых количественных показателей. При использовании двумерного графика по оси абсцисс обычно размешают независимую переменную, по оси ординат — зависимую переменную.

Л.В. Куликов дает следующие рекомендации по построению диаграмм и графиков.

1. График и текст должны взаимно дополнять друг друга.
2. График должен быть понятен «сам по себе» и включать все необходимые обозначения.
3. На одном графике не разрешается изображать больше четырех кривых.
4. Линии на графике должны отражать значимость параметра, важнейшие необходимо обозначать цифрами.
5. Надписи на осях следует располагать внизу и слева.
6. Точки на разных линиях принято обозначать кружками, квадратами и треугольниками (Куликов, 2001, с. 116).

Рис. 1. График. Возрастная динамика изменения значимости протестной мотивации употребления водки и других крепких спиртных напитков («Употребляю, потому что мне запрещают») среди юношей и девушек (%)
(Собкин B.C., Адамчук Д.В. Особенности употребления алкоголя в подростковой среде // Вестник практической психологии образования. 2006. № 1 (6))

Диаграммы используются главным образом для изображения соотношения между величинами.

Это способ графического изображения величин при помощи фигур (секторов, столбцов и т.п.), площади которых пропорциональны величинам. Совмещенные диаграммы позволяют в одном поле объединить две диаграммы, имеющие одинаковые отметки на оси абсцисс, но разный размах варьирования значений признаков, величина которых отображается на оси ординат. Секторная диаграмма — диаграмма, в которой числа (обычно проценты) изображены в виде круговых секторов.

Рис. 2. Диаграмма. Отношение выпускников к ЕГЭ (в целом по республике)
(Мартынова Т.Ф., Павлова Л.E. Социологический опрос выпускников в контексте организации эксперимента по введению ЕГЭ в Республике Саха (Якутия) // Психология образования: региональный опыт. Материалы Второй национальной научно-практической конференции. М., 2005)

Разновидностью диаграмм является гистограмма. Гистограмма — это столбчатая диаграмма, состоящая из вертикальных прямоугольников, расположенных основаниями на одной прямой (например, оси абсцисс).

Гистограммы часто используются для графического представления плотности распределения (частотного распределения), при котором число случаев в классе изображается в виде вертикальных полос (столбиков, полос). По оси абсцисс откладывают значения наблюдаемой величины, а по оси ординат — ее частоты (отношение числа наблюдений, попавших в данный промежуток, к числу всех наблюдений) в каждом из промежутков, деленные на длину промежутков. В результате получается ступенчатая линия (Куликов, 2001, с. 114).

Рис. 3. Гистограмма. Возрастная динамика юношей и девушек, употребляющих алкоголь на территории школы (% от числа учащихся, употребляющих спиртные напитки)
(Собкин B.C., Адамчук Д.В. Особенности употребления алкоголя в подростковой среде // Вестник практической психологии образования. 2006. № 1 (6))

Аналог диаграммы — полигон. Этот графический способ отображения данных преимущественно используется для изображения дискретных рядов.

Диаграммы и профили представляют результаты диагностики с использованием многопараметрических (многокомпонентных) тестов или тестовых наборов. Они позволяют в наглядной форме показать индивидуальные и усредненные оценки по тестам или по факторам.

Для отображения корреляционных связей между параметрами можно использовать схему, которая называется корреляционной плеядой. Параметры изображаются кружками, внутри них проставляются номера признаков или сокращенно записывается название признаков (параметра). Если записываются номера, то они должны быть расшифрованы в подписях к рисунку. Линии, соединяющие кружки, кодируют характер корреляционных связей. Например, положительные связи (положительной направленности) могут быть изображены сплошными линиями, отрицательные — прерывистыми, связи достоверные на уровне 5% — одной линией, а достоверные на уровне 1% — двумя линиями. Использованные обозначения должны быть объяснены в тексте под рисунком. Признаки лучше распределять группами, объединяющими их по какому-либо критерию. В центре корреляционной плеяды обычно размещают либо наиболее важный параметр, либо тот, у которого наибольшее число значимых коэффициентов корреляции.
Рис. 4. Полигон. Оцениваемая учителями стабильность различных каузальных факторов успешности занятий определенным предметом и корреляция между выраженностью этого фактора и прогнозируемым учителем успехом школьников, показатели которых репрезентативны для соответствующей подгруппы класса (по данным Ф. Райнберга)
(Хекхаузен X. Мотивация и деятельность. 2-е изд., перераб. СПб.: Питер-Пресс; М.: Смысл, 2003. С. 687)

Читайте также:  Какие анализы нужно принести гастроэнтерологу

Большую наглядность представлению результатов корреляционного анализа придают корреляционные кольца и корреляционные ряды. Подробнее со способами графического представления данных эмпирического исследования можно познакомиться в книге Л.B. Куликова (2001).

Все иллюстрации, графики, диаграммы в работе обозначаются как рисунки: «Рис. 1», «Рис. 2» и т.д. Они должны иметь названия, которые помещаются под ними после слов «Рис. 1» (или 2, 3 и т.п.). Их необходимо нумеровать арабскими цифрами порядковой нумерацией в пределах всей работы. При необходимости после заголовка помещается текст, поясняющий содержание и обозначения рисунка.

На все таблицы, диаграммы, схемы, иллюстрации должны быть даны ссылки в тексте. Недооценка словесного описания каждой таблицы, диаграммы, графика считается методической ошибкой. Неверно полагать, что в таблице, на диаграмме «и так все видно». Должны быть названы все сходства и различия, их оценки по величине, даны ссылки на статистическую значимость различий, отмечен размах варьирования показателей, названы наибольшие и наименьшие позиции. Детальное описание данных помогает анализу и обобщению результатов, придает доказательность выводам.

При ссылках на таблицы, следует писать: «в соответствии с данными в таблице 5»; или «как видно из таблицы 5»; или «результаты, приведенные в таблице 5, показывают, что. »; или давать ссылку в скобках: (таблица 5).

При ссылках на рисунки пишется: «как видно на рис. 3»; «как представлено на рис. 6»; или «из рис. 3 видно, что. »; или дается ссылка в скобках (рис. 3) и т.п. Если далее по тексту необходимо повторно обратиться к рисунку, то ссылка к нему делается следующим образом: (см. рис. 6) или (см. рис. 6 на с. 24).

При ссылках на формулы обычно пишется: «. по формуле 3». При ссылках на приложение пишется, например: «данные, полученные в результате первичной обработки, приведены в приложении 1», или: «программа развивающих занятий, использованная в нашей работе, приводится в приложении 2».

При использовании числительных нужно обратить внимание на правильное их написание. Однозначные количественные числительные (от нуля до девяти) пишутся словами, если при них нет единиц измерения. Например: «в двух случаях из восьми» (неправильно — «в 2 случаях из 8»), Многозначные количественные числительные пишутся цифрами. Например: «67 испытуемых» (неправильно — «шестьдесят семь испытуемых»). Числа с сокращенным обозначением единиц измерения пишутся цифрами. При этом после сокращенных единиц измерения (миллиметр — мм) точки не ставятся. Количественные числительные при записи арабскими цифрами не имеют падежных окончаний, если сопровождаются существительными. Например, правильно написать «в 30 случаях из 100» (неправильно — «в 30-ти случаях из 100»).

Однозначные и многозначные порядковые числительные часто пишутся словами: «девяносто пятый». Если порядковые числительные записываются арабскими цифрами и склоняются в тексте, для этого существуют определенные правила. Падежные окончания числительных, оканчивающиеся на две гласные, «й» или согласную, состоят из одной буквы. Например, «шестая» — «6-я», а не «6-ая». Падежные окончания числительных, оканчивающихся на гласную, состоят из двух букв. Например, «эксперимент первого типа» — «эксперимент 1-го типа» (а не «1-ого типа» или «1-о типа»).

Представляйте описание качественных показателей и данных в логичной и упорядоченной последовательности, которая сделает их ясными для читателя. В ряде исследований (или на отдельных его этапах) количественные показатели не используются. В этом случае исследователь сообщает об основных тенденциях и темах, которые выявляются при субъективном или объективном анализе полученных качественных данных (продуктов деятельности, описаний, интроспективных отчетов, стенографии интервью). Подзаголовки в анализе таких результатов делают более структурированными для читателя.шаблоны для dle 11.2

источник

Когда вы будете готовы создать диаграмму для данных в Excel в Интернете, может оказаться, что это поможет вам узнать больше о каждом типе диаграммы. Вы узнаете, как организовать данные для нужного типа диаграммы, и выясните, какой тип диаграммы лучше всего подходит для ваших данных.

Данные в столбцах или строках листа можно представить в виде гистограммы. В гистограмме категории обычно отображаются по горизонтальной оси, а значения — по вертикальной оси, как показано на этой диаграмме:

Гистограмма с группировкой На гистограмме с группировкой значения выводятся в виде плоских столбцов. Используйте этот тип диаграммы при наличии категорий, представляющих:

диапазоны значений (например, количество элементов);

специфические шкалы (например, шкала Ликерта с масками, такими как «Полностью согласен», «Согласен», «Не знаю», «Не согласен», «Полностью не согласен»);

неупорядоченные имена (например, названия элементов, географические названия или имена людей).

Гистограмма с накоплением Гистограмма с накоплением представляет значения в виде плоских столбцов с накоплением. Используйте этот тип диаграммы, когда есть несколько ряд данных и нужно подчеркнуть итоговое значение.

Нормированная гистограмма Нормированная гистограмма представляет значения в виде плоских нормированных столбцов с накоплением для представления 100 %. Используйте этот тип диаграммы, когда есть несколько рядов данных и нужно подчеркнуть их вклад в итоговое значение, особенно если итоговое значение одинаково для всех категорий.

Данные, расположенные в столбцах или строках листа, можно представить в виде графика. На графиках данные категорий равномерно распределяются вдоль горизонтальной оси, а все значения равномерно распределяются вдоль вертикальной оси. Графики позволяют отображать непрерывное изменение данных с течением времени на оси с равномерным распределением и идеально подходят для представления тенденций изменения данных с равными интервалами, такими как месяцы, кварталы или финансовые годы.

График и график с маркерами. Графики с маркерами, отмечающими отдельные значения данных, или без маркеров можно использовать для отображения динамики изменения данных с течением времени или по категориям данных, разделенным равными интервалами, особенно когда точек данных много и порядок их представления существенен. Если категорий данных много или значения являются приблизительными, используйте график без маркеров.

График с накоплением и график с накоплением с маркерами. Графики с накоплением, отображаемые как с маркерами для конкретных значений данных, так и без них, могут отображать динамику изменения вклада каждого значения с течением времени или по категориям данных, разделенным равными интервалами.

Нормированный график с накоплением и нормированный график с накоплением с маркерами. Нормированные графики с накоплением с маркерами, отмечающими отдельные значения данных, или без маркеров могут отображать динамику вклада каждой величины в процентах с течением времени или по категориям данных, разделенным равными интервалами. Если категорий данных много или значения являются приблизительными, используйте нормированный график с накоплением без маркеров.

Графики лучше всего подходят для вывода нескольких рядов данных— если нужно отобразить только один ряд данных, вместо графика рекомендуется использовать точечную диаграмму.

На графиках с накоплением данные суммируются, что может быть нежелательно. Увидеть накопление на графике бывает непросто, поэтому иногда вместо него стоит воспользоваться графиком другого вида либо диаграммой с областями с накоплением.

Данные в одном столбце или строке листа можно представить в виде круговой диаграммы. Круговая диаграмма отображает размер элементов одного ряд данных относительно суммы элементов. точки данных на круговой диаграмме выводятся как проценты от всего круга.

Круговую диаграмму рекомендуется использовать, если:

нужно отобразить только один ряд данных;

все значения ваших данных неотрицательны;

почти все значения данных больше нуля;

имеется не более семи категорий, каждой из которых соответствуют части общего круга.

Круговые диаграммы Круговые диаграммы отображают вклад каждой величины в общую сумму в двухмерном виде.

Данные, расположенные только в столбцах или строках листа, можно представить в виде кольцевой диаграммы. Как и круговая диаграмма, кольцевая диаграмма отображает отношение частей к целому, но может содержать несколько ряд данных.

Кольцевая диаграмма На диаграммах этого типа данные отображаются в виде колец, каждое из которых представляет ряд данных. Если в метках данных отображаются проценты, каждое кольцо в сумме должно давать 100 %.

Примечание: Кольцевые диаграммы трудны для восприятия. Вместо них можно использовать линейчатые диаграммы с накоплением или гистограммы с накоплением.

Данные в столбцах или строках листа можно представить в виде линейчатой диаграммы. Линейчатые диаграммы используют для сравнения отдельных элементов. В диаграммах этого типа категории обычно располагаются по вертикальной оси, а величины — по горизонтальной.

Линейчатые диаграммы рекомендуется использовать, если:

метки осей имеют большую длину;

выводимые значения представляют собой длительности.

С группировкой На линейчатой диаграмме с группировкой значения выводятся в виде плоских столбцов.

С накоплением Линейчатая диаграмма с накоплением показывает вклад отдельных величин в общую сумму в виде плоских столбцов.

100% с накоплением Этот тип диаграмм позволяет сравнить по категориям процентный вклад каждой величины в общую сумму.

Данные в столбцах или строках листа можно представить в виде диаграммы с областями. Диаграммы с областями могут использоваться для отображения изменений величин с течением времени и привлечения внимания к итоговому значению в соответствии с тенденцией. Отображая сумму значений рядов, такая диаграмма также наглядно показывает вклад каждого ряда.

С областями Диаграммы с областями отображают изменение величин с течением времени или по категориям. Обычно вместо диаграмм с областями без накопления рекомендуется использовать графики, так как данные одного ряда могут быть скрыты за данными другого ряда.

С областями с накоплением Диаграммы с областями с накоплением показывают изменения вклада каждой величины с течением времени или по категориям в двухмерном виде.

Нормированная Нормированные диаграммы с областями с накоплением отображают изменения вклада каждой величины в процентах с течением времени или по категориям.

Данные в столбцах и строках листа можно представить в виде точечной диаграммы. Поместите данные по оси X в одну строку или столбец, а соответствующие данные по оси Y — в соседние строки или столбцы.

Точечная диаграмма имеет две оси значений: горизонтальную (X) и вертикальную (Y). На точечной диаграмме значения «x» и «y» объединяются в одну точку данных и выводятся через неравные интервалы или кластеры. Точечные диаграммы обычно используются для отображения и сравнения числовых значений, например научных, статистических или технических данных.

Точечные диаграммы рекомендуется использовать, если:

требуется изменять масштаб горизонтальной оси;

требуется использовать для горизонтальной оси логарифмическую шкалу;

значения расположены на горизонтальной оси неравномерно;

на горизонтальной оси имеется множество точек данных;

требуется настраивать независимые шкалы точечной диаграммы для отображения дополнительных сведений о данных, содержащих пары сгруппированных полей со значениями;

требуется отображать не различия между точками данных, а аналогии в больших наборах данных;

требуется сравнивать множество точек данных без учета времени; чем больше данных будет использовано для построения точечной диаграммы, тем точнее будет сравнение.

Точечная диаграмма. Диаграмма этого типа позволяет отображать точки данных без соединительных линий для сравнения пар значений.

Точечная диаграмма с плавными линиями и маркерами и точечная диаграмма с плавными линиями. На этой диаграмме точки данных соединены сглаживающими линиями. Такие линии могут отображаться с маркерами или без них. Сглаживающую кривую без маркеров следует использовать, если точек данных достаточно много.

Точечная диаграмма с прямыми линиями и маркерами и точечная диаграмма с прямыми линиями На этой диаграмме показаны прямые соединительные линии между точками данных. Прямые линии можно отобразить с маркерами или без них.

Данные в столбцах или строках листа можно представить в виде лепестковой диаграммы. Лепестковая диаграмма позволяет сравнить агрегированные значения нескольких ряд данных.

Лепестковая диаграмма и лепестковая диаграмма с маркерами. Лепестковые диаграммы отображают изменения значений относительно центральной точки с маркерами для отдельных точек данных или без них.

Заполненная лепестковая диаграмма. На такой диаграмме область, покрытая рядами данных, заполнена цветом.

Примечание: Эта страница переведена автоматически, поэтому ее текст может содержать неточности и грамматические ошибки. Для нас важно, чтобы эта статья была вам полезна. Была ли информация полезной? Для удобства также приводим ссылку на оригинал (на английском языке).

Don’t have time to figure this out? Our expert partners at Excelchat can do it for you, 24/7.

источник

  1. Ввести понятие диаграммы, объяснить необходимость ее использования; познакомить обучающихся с типами диаграмм; формирование навыков анализа данных с помощью диаграмм различных типов.
  2. Развитие творческих способностей, логического и аналитического мышления.
  3. Нравственное воспитание личности, формирование целеустремленности, аккуратности при работе за ЭВМ
  1. На доске – текст домашнего задания
  2. Презентация для демонстрации во время объяснения нового материала (Приложение 3).
  3. Для контроля знаний, полученных на предыдущем занятии:
  1. Для закрепления материала на рабочих столах каждой ЭВМ разместить файл в формате Excel с готовыми текстами заданий (Приложение 4).

Группа обучающихся по усмотрению преподавателя условно делится на 3 подгруппы: обучающиеся первой подгруппы выполняют компьютерное тестирование (Приложение 1), обучающиеся второй подгруппы определяют значение формулы, образованной копированием по карточкам (Приложение 2).

С оставшимися обучающимися проводится фронтальный опрос:

  1. Назначение и запуск приложения Excel.
  2. Типы данных, используемые в Excel.
  3. Понятие относительных и абсолютных ссылок.
  4. Понятие функции. Виды функций (привести примеры).

Объяснение материала ведется с использованием презентации (Приложение 3).

После того, как рабочая таблица на листе построена, можно с ней работать. И хотя в таблице сразу выводится результат после ввода в нее данных, вычисления обычно на этом не заканчиваются. Далее, как правило, начинается анализ результатов, оценка иных вариантов ситуации, т.е. рассуждения на тему «А что было бы, если бы…» («… что было бы, если бы ананасов завезли на 20 кг меньше, а рыбы – на 100 больше?»).

Такой подход – перебор вариантов решения задачи – очень полезен. Для многих задач это единственный способ нахождения приемлемого варианта решения задачи. Для этих целей Excel незаменим: быстро меняем данные – мгновенно получаем результат.

С развитием компьютерных технологий развилась одна из областей применения ЭВМ – визуализация информации. Существует несколько направлений в этой области: инженерная графика, деловая графика и ряд других. Построение диаграмм с помощью ЭВМ – одно из основных средств деловой графики.

Диаграмма – это условное изображение числовых величин или их соотношений графическим способом Примером диаграммы, ее частным случаем является всем известный график функции.

В деловой, финансовой, экономической сферах роль диаграмм очень велика. Сколько же времени должен затратить экономист фирмы, впиваясь взглядом в таблицу, выискивая в ней максимальные и минимальные значения различных показателей, выявляя соотношения этих значений для различных подразделений! Естественно, что подобный анализ многократно упрощается при наличии диаграмм. Иногда достаточно одного-двух взглядов на диаграмму для получения нужной информации.

Диаграммы MS Excel дают возможность графического представления различных числовых данных. Выбрав тип, макет и стиль диаграммы, которые в новой версии Office Excel 2007 всегда доступны на ленте, каждую диаграмму можно быстро и профессионально обработать.

В Excel можно строить два типа диаграмм: внедренные и диаграммы на отдельных листах. Внедренные создаются на рабочих листах рядом с таблицами, данными и текстом и используются при создании отчетов. Диаграммы на отдельном листе удобны для подготовки слайдов или для вывода на печать.

Excel предлагает различные типы диаграмм и предусматривает широкий спектр возможностей для их изменения (типа диаграммы, надписей, легенды и т.д.) и для форматирования всех объектов диаграммы.

Для создания диаграмм в MS Excel прежде всего следует подготовить данные для построения диаграмм и определить ее тип. Построение диаграммы выполняется с помощью Мастера диаграмм. Это программа с большими возможностями. Для решения задачи необходимо выделить в таблице диапазон ячеек, значения которых следует представить в виде диаграммы, и уяснить для себя: данные какого столбца (строки) следует откладывать по оси Х (т.е. рассматривать как категории), а каких столбцов (строк) – по оси Y (рассматривать как значения).

Количество рядов данных (У) должно быть меньше, чем категория (Х). Исходя из этого, определяется расположение рядов (в строках или столбцах) если диаграмма строится для диапазона ячеек, имеющего больше столбцов, чем строк, или равное их число, то рядами данных считают строки. Если диапазон ячеек имеет больше строк, то рядами данных считают столбцы. Excel предполагает, что названия, связанные с рядами данных, считаются их именами и составляют легенду диаграммы. Данные, интерпретируемые как категории, считаются названиями категорий и выводятся вдоль оси Х.

Excel 2007 поддерживает различные типы диаграмм, помогая пользователям отображать данные понятным для конкретной аудитории способом. При создании или изменении существующей диаграммы можно выбрать один из множества доступных подтипов диаграмм каждого типа.

Гистограммы. Данные, которые расположены в столбцах или строках, можно изобразить в виде гистограммы. Гистограммы используются для демонстрации изменений данных за определенный период времени или для иллюстрирования сравнения объектов. В гистограммах категории обычно формируются по горизонтальной оси, а значения — по вертикальной.

Линейчатые диаграммы. Похожи на гистограммы (отличие – повернуты на 90 0 по часовой стрелке). Используются для сопоставления отдельных значений в определенный момент времени, не дают представления об изменении объектов во времени. Горизонтальное расположение полос позволяет подчеркнуть положительные или отрицательные отклонения от некоторой величины.

Линейчатые диаграммы можно использовать для отображения отклонений по разным статьям бюджета в определенный момент времени. Можно перетаскивать точки в любое положение. Линейчатые диаграммы иллюстрируют сравнение отдельных элементов.

Графики. Графики позволяют изображать зависимость данных (ось У) от величины, которая меняется с постоянным шагом (ось Х). Метки оси категорий должны располагаться по возрастанию или убыванию.

Графики чаще используют для коммерческих или финансовых данных, равномерно распределенных по времени (отображение непрерывных данных), или таких категорий, как продажи, цены и т.п.

Может возникнуть необходимость использовать графики для отображения равномерно распределенных значений, например, месяцев, кварталов или финансовых лет. Это особенно важно при наличии нескольких рядов — для одного ряда можно использовать ось категорий. Также графики можно использовать при наличии нескольких равномерно распределенных числовых меток, особенно лет. Если числовых меток больше десяти, вместо графика лучше использовать точечную диаграмму.

Круговые диаграммы. Данные, которые расположены в одном столбце или строке, можно изобразить в виде круговой диаграммы. Круговая диаграмма демонстрирует размер элементов одного ряда данных пропорционально сумме элементов. Точки данных на круговой диаграмме выводятся в виде процентов от всего круга. Эти диаграммы можно использовать, когда компоненты в сумме составляют 100%.

Точечные диаграммы. Точечная диаграмма показывает отношения между численными значениями в нескольких рядах данных или отображает две группы чисел как один ряд координат x и y.

Точечная диаграмма имеет две оси значений, при этом один набор значений выводится вдоль горизонтальной оси (оси X), а другой — вдоль вертикальной оси (оси Y). На точечной диаграмме эти значения объединяются в одну точку данных и выводятся с неравными интервалами, или кластерами. Точечные диаграммы обычно используются для представления и сравнения числовых значений, например, научных, статистических или инженерных данных. Для вывода данных таблицы в виде точечной диаграммы следует поместить данные по оси X в одну строку или столбец, а соответствующие данные по оси Y — в соседние строки или столбцы.

Диаграммы с областями. Диаграммы с областями иллюстрируют величину изменений в зависимости от времени и могут использоваться для привлечения внимания к суммарному значению в соответствии с трендом.

Например, данные, отражающие прибыль в зависимости от времени, можно отобразить в диаграмме с областями, чтобы обратить внимание на общую прибыль.

Отображая сумму значений рядов, такая диаграмма наглядно показывает вклад каждого ряда.

Поверхностные диаграммы. Поверхностная диаграмма используется, когда требуется найти оптимальные комбинации в двух наборах данных. Как на топографической карте, цвета и штриховки выделяют зоны одинаковых диапазонов значений. Поверхностные диаграммы можно использовать для иллюстрации категорий и наборов данных, представляющих собой числовые значения.

Кольцевые диаграммы. Как и круговая диаграмма, кольцевая диаграмма отображает отношение частей к целому, но может содержать более одного ряда

Создание диаграмм в приложении Excel. Чтобы создать в Excel базовую диаграмму, которую впоследствии можно изменять и форматировать, сначала введите на лист данные для этой диаграммы. Затем просто выделите эти данные и выберите нужный тип диаграммы на ленте (вкладка Вставка, группа Диаграммы).

Изменение диаграмм. Создав диаграмму, можно вносить в нее изменения. Например, можно изменить вид осей, добавить название диаграммы, переместить или скрыть легенду, а также добавить дополнительные элементы диаграммы.

Имеются следующие возможности изменения диаграммы:

  1. Изменение вида осей диаграммы. Можно указать масштаб осей и изменить промежутки между значениями или категориями.
  2. Добавление к диаграмме названия и подписи. Для пояснения отображенных на диаграмме данных можно добавить название диаграммы, названия осей и подписи.
  3. Добавление легенды и таблицы данных. Можно отобразить или скрыть легенду либо изменить ее расположение. В некоторых диаграммах также можно отобразить таблицу данных и значения, представленные на диаграмме.

Эффектный формат диаграмм. Помимо применения встроенного стиля диаграммы можно легко изменить форматирование ее отдельных элементов, например, маркеров данных, области диаграммы, области построения, чисел и текста в названиях и подписях, что привлечет внимание и сделает диаграмму оригинальной.

Имеются следующие возможности форматирования диаграммы:

  1. Заливка элементов диаграммы. Для привлечения внимания к определенным элементам диаграммы можно залить их цветом, текстурой, рисунком или применить градиентную заливку.
  2. Изменение контуров элементов диаграммы. Для выделения элементов диаграммы можно изменить их цвет, стиль или толщину линий.
  3. Добавление специальных эффектов к элементам диаграммы. Для придания диаграмме завершенности к ее элементам можно применить специальные эффекты, например, тень, отражение, свечение, сглаживание, рельеф или объемное вращение.
  4. Форматирование текста и чисел. Текст и числа в названиях, подписях и надписях на диаграмме можно форматировать так же, как текст и числа на листе. Чтобы выделить текст или число, можно также применять стили WordArt.
Читайте также:  Как сделать анализ анкетирования пример

Изменение типа существующей диаграммы. Для большинства плоских диаграмм можно изменить тип всей диаграммы, придав ей совершенно другой вид, или выбрать другой тип диаграммы для любого одиночного ряда данных, превратив диаграмму в смешанную диаграмму.

Для создания диаграмм на рабочих столах имеются файлы приложения Excel с готовыми заданиями (Приложение 4).

При выполнении задания 1 обучающиеся определяют выделяемый диапазон ячеек, объясняют тип диаграммы, дополняют диаграмму подписями, заголовками. Готовую диаграмму форматируют. Анализируя данные диаграммы, обучающиеся должны ответить на вопрос: чем объясняется спад объема продаж в 90-х гг.

Задание 2 выполняется самостоятельно. Обучающиеся создают таблицу значений аргументов, вводят формулы и копируют их для вычисления значений функции. По имеющимся данным создают график, форматируют его. Определяют значения аргумента, при которых функция имеет отрицательные значения.

Задание 3 также выполняется обучающимися самостоятельно. Необходимо составить диаграмму, отражающую долю стоимости устройств компьютера в общей его стоимости. Заметно ли подорожает компьютер при приобретении более производительных схем процессора и оперативной памяти?

  1. Что такое диаграмма?
  2. В каких случаях возникает необходимость исследовать или отобразить данные с помощью диаграмм?
  3. Когда используют внедренные диаграммы?
  4. Когда создают диаграммы на отдельных листах?
  5. С чего начать построение диаграммы?
  6. Что такое категории и значения?
  7. Какие типы диаграмм вам известны?
  8. Что вы знаете о гистограмме?
  9. Когда используют линейчатые диаграммы?
  10. Что изображают графики?
  11. Если данные расположены в одном столбце или строке – используют…
  12. Перечислите еще известные вам типы диаграмм.
  13. Как создать диаграмму по имеющимся данным?
  14. Какие способы форматирования диаграмм вы знаете?

Создать таблицу зависимости средней температуры воздуха в зависимости от времени года (разбить по кварталам). Использовать данные, полученные на уроках биологии. Проанализировать результаты прогноза с помощью диаграмм.

Во время записи домашнего задания выставить оценки по результатам тестирования, проверить карточки, оценить работы за ЭВМ. Дать качественную оценку работ.

Обобщение материала. Устранение пробелов знаниях.

источник

При проведении анализа проблем и поиска решений так или иначе рассматриваются причины их возникновения. Для построения логической цепи и представления связей между событиями типа «причина-следствие” используется широкий набор инструментов. Одними из наиболее часто употребляемых из них являются: диаграмма рыбы, диаграмма связей и диаграмма сродства ( affinity diagram ).

Предназначена для анализа проблемы как единой и целостной системы событий, помогает отделить причины от следствий, классифицировать причины и построить логическую связь.

Названа диаграмма так потому, что в законченном виде напоминает скелет рыбы. Альтернативные названия: причинно-следственная диаграмма, диаграмма Ишикавы, ёлочная диаграмма, диаграмма рыбьего скелета, 5М.

Построение диаграммы начинается с формулировки проблемы – «голова рыбы”. От нее выстраивается горизонтальная линия к которой стрелками присоединяют основные причины (первопричины, первичные факторы) – «ребра”. Последние, в свою очередь являются следствием других причин – вторичных. Вторичные причины являются следствием третичных и т.д. Анализ не ограничен по глубине, но следует принят во внимание, что уже по достижении четвертого уровня комплексность схемы мешает ее пониманию.

В случае решения производственных задач рекомендуется выделять следующие первопричины:

  • Оборудование (Machine)
  • Материалы (Material)
  • Методы (Method)
  • Персонал (Man)
  • Окружающая среда ( Milieu )
  • Иногда добавляют измерительную систему ( Measurement System )

Все категории в английском языке начинаются с буквы » M ”, отсюда еще одно название метода – 5М (или 6М соответственно).

Предназначена для выявления логических связей между основными идеями/проблемами, причинами и различными дополнительными данными, наглядной иллюстрации исследуемого вопроса. Обеспечивает комплексное рассмотрение проблем, процессов, решений, ситуаций и т.д.

Построение диаграммы, как и в предыдущем случае, начинается с формулировки проблемы. Основная проблема вносится в квадрат посередине диаграммы, вокруг нее указываются причины – обозначаются эллипсом. Причины, в свою очередь, являются следствиями других причин или причин второго уровня. Из причин второго уровня образуется, своего рода, следующий концентрический круг. Корневые причины или причины, не рассматриваемые как результаты других причин, обозначаются прямоугольниками.

Для большей наглядности сильные связи и наиболее влияющие причины можно выделять более жирными линиями. Допускается использование фигур и линий связей разного цвета.

Рекомендуется размещать причины как можно ближе к следствиям, не допускать пересечения стрелок влияния и, в случае глубины анализа дальше 3-4 уровней, разбивать диаграмму на две и более.

Диаграмма сродства ( affinity diagram )

Предназначена для отображения большого количества информации (идей, мнений, проблем, фактов, результатов…), фиксации идей во время сессии мозгового штурма и организации полученных результатов в логическую структуру.

Рекомендуется использовать диаграмму сродства для организации и структурированного поиска решений в группе. Построение диаграммы начинается с описания темы (цели или проблемы) вверху листа. Затем, в рядах указываются подтемы (методы достижения целей или причины проблем, соответственно), каждая из которых может быть дополнена, объяснена, описана или детализирована – указывается блоками в столбик. При этом, ключевые идеи разрабатывают все члены команды по отдельности и фиксируют на карточках. После, карточки размещаются на доске или листе с указанием темы заседания (проблемы или цели) и обсуждаются всей группой. Всю ценную, по мнению группы, информацию фиксируют в столбцах под карточками.

Диаграмма может пересматриваться по нескольку раз, уточняться и изменяться. Допускается сравнение диаграммы сродства с диаграммами, сохраненными от предыдущих заседаний, других команд, похожих тем. Тем не менее, во время генерации идей рекомендуется спрятать все диаграммы и сосредоточиться на разрабатываемой.

Допускается выделение важнейших или основных идей на диаграмме утолщенными рамками или любыми понятными для группы символами.

Представленные подходы организации идей и логического построения связей типа «причина-следствие” хотя и преследуют схожие цели, тем не менее являются качественно разными инструментами. Знание и грамотный выбор того или иного инструмента позволит эффективно организовать интеллектуальную работу, получить требуемую информацию и достигнуть поставленной цели.

источник

Графические методы анализа данных

Краткий обзор типов графиков

2М графики
Столбцы
Отклонения
По левой оси Y
По правой оси Y
Столбцы сверху
Столбцы по X
Размах
Вероятностные с исключ. трендом
Полунорм. вероятностные
Висячие стобцы
Гистограммы
Линейные
Круговые диаграммы
Вероятностные
Вероят.-вероятн.
Квант.-квантиль
Диапазоны
Диаграммы рассеяния
Послед./Налож.
Диагр. Вороного

2М категоризованные графики
Вероятностные с исключ. трендом
Полунормальн. вероятностные
Норм. вероятн.
Вероят.-вероятн.
Квант.-квантиль

3М XYZ графики
Диаграммы рассеяния
Исходные данные
Тернарные графики
Трассировочные графики
График поверхности
Последовательная поверхность
Зонная карта
Карта линий
Карта линий уровня
Пространственный график
Спектральная диаграмма
Диаграмма всплесков
Диаграмма отклонений

3М Тернарные графики
График поверхности
Диаграмма отклонений
Зонная карта
Карта линий
Пространственный график
Трассировочный график

Матричные графики
Столбчатые диаграммы
Линейные графики
Диаграммы рассеяния

3М последовательные графики
Гистограммы двух переменных
Диаграмма размаха
Дискретная карта линий уровня
Карта линий уровня
График поверхности
Всплески
Диаграммы исходных данных
Блоковые
Всплески
График поверхности
Дискретная карта линий уровня
Карта линий уровня
Ленточные
Линейные
Столбчатые
3М диаграммы диапазонов
Диапазоны двойных лент
Диапазоны ошибок
Летящие блоки
Летящие ящики
Точечные диапазоны
3М диаграммы размаха
Диапазоны двойных лент
Граничные диапазоны
Столбцы ошибок
Летящие блоки
Летящие ящики
Точечные диапазоны

3М категоризованные графики
Карты линий
Диаграмма отклонений
Диаграмма рассеяния
Пространственный график
Спектральная диаграмма
График поверхности
Зонная карта

Тернарные категоризованные графики
Тернарная зонная карта
Тернарная карта линий
Тернарная диаграмма рассеяния
Тернарный график поверхности
Тернарный пространственный график
Тернарный трассировочный график

n-мерные пиктографики
Лица Чернова
Столбцы
Линии
Круг. диагр.
Многоугольн.
Профили
Звезды
Лучи

Типичные методы визуализации

Одним из наиболее мощных аналитических методов исследования является разделение («разбиение») данных на группы для сравнения структуры получившихся подмножеств. Эти методы широко применяются как в разведочном анализе данных, так и при проверке гипотез и известны под разными названиями (классификация, группировка, категоризация, разбиение, расслоение и пр.). Например, взаимосвязь между возрастом и риском инфаркта может отличаться для мужчин и женщин (для мужчин эта зависимость сильнее). Или например, зависимость между приемом лекарств и снижением уровня холестерина может наблюдаться только для женщин с пониженным давлением и в возрасте 30-40 лет. Производительность или гистограммы мощности могут различаться для временных промежутков, когда управление осуществляется разными операторами. Разным экспериментальным группам также могут соответствовать разные наклоны линий регрессии.

Для количественного описания различий между группами наблюдений разработаны многочисленные вычислительные методы, основанные на группировке данных (например, дисперсионный анализ). Однако графические средства (такие как рассматриваемые в этом разделе категоризованные графики) дают особые преимущества и позволяют выявить закономерности, которые трудно поддаются количественному описанию и которые весьма сложно обнаружить с помощью вычислительных процедур (например, сложные взаимосвязи, исключения или аномалии). В этих случаях графические методы предоставляют уникальные возможности многомерного аналитического исследования или «добычи» данных.

Что такое категоризованные графики

Термин «категоризованные графики» впервые был использован в программе STATISTICA компании StatSoft в 1990 году (кроме того, Becker, Cleveland и Clark из Bell Labs называют их графиками на решетке). Эти графики представляют собой наборы двумерных, трехмерных, тернарных или n-мерных графиков (таких как гистограммы, диаграммы рассеяния, линейные графики, поверхности, тернарные диаграммы рассеяния и пр.), по одному графику для каждой выбранной категории (подмножества) наблюдений, например, опрашиваемых из Нью-Йорка, Чикаго или Далласа. Эти «входящие» графики располагаются последовательно в одном графическом окне, позволяя сравнивать структуру данных для каждой из указанных подгрупп (например, городов).

Для выбора подгрупп можно использовать множество методов, самый простой из них — это введение категориальной переменной (например, переменной City с значениями New York, Chicago и Dallas). На следующем графике показаны гистограммы переменной, представляющей данные о самооценке стресса жителями каждого из трех городов.

На основе этих данных можно сделать вывод о том, что жители Далласа не очень подвержены стрессам, в то время как распределения уровня стресса в Нью-Йорке и Чикаго довольно похожи.

Некоторые программы (например, система STATISTICA) поддерживают двухвходовую или многомерную категоризацию, где для задания подгрупп используется не один (например, City), а два или более критериев (например, City и Time ). Двухвходовые категоризованные графики можно рассматривать как «таблицы графиков», где каждый входящий график находится на «пересечении» определенных значений первой (например, City) и второй (например, Time) группирующих переменных.

Добавление второго фактора показывает, что картины стрессовых нагрузок в Нью-Йорке и Чикаго в действительности сильно различаются, если учитывается время опроса, в то время как фактор времени практически ничего не меняет в Далласе.

Категоризованные и матричные графики. Матричные графики также состоят из нескольких графиков; однако здесь каждый из них основывается (или может основываться) на одном и том же множестве наблюдений, и графики строятся для всех комбинаций переменных из одного или двух списков. Для категоризованных графиков требуется такой же выбор переменных, как и для некатегоризованных графиков соответствующего типа (например, две переменных для диаграммы рассеяния). В то же время для категоризованных графиков необходимо указать по крайней мере одну группирующую переменную (или способ разбиения наблюдений на категории), где содержалась бы информация о принадлежности каждого наблюдения к определенной подгруппе (например, Chicago, Dallas). Группирующая переменная не будет непосредственно изображена на графике (т.е. не будет построена), однако она будет служить критерием для разделения всех анализируемых наблюдений на отдельные подгруппы. Как показано выше, для каждой группы (категории), определяемой группирующей переменной, будет построен один график.

Общие и независимые шкалы. Каждый элементарный график, входящий в состав категоризованного графика, может быть масштабирован в соответствии со своим собственным диапазоном значений (независимые шкалы).

Или все графики могут иметь общую шкалу, достаточно широкую, чтобы охватить весь диапазон значений.

Общий масштаб позволяет сравнивать диапазоны и распределения значений разных категорий. Однако, если эти диапазоны сильно различаются (что приводит к очень большой общей шкале), то исследование некоторых графиков может быть затруднено. Использование независимого масштаба может упростить выявление трендов и определенных закономерностей внутри категорий, но в то же время затруднить сравнение диапазонов значений разных подгрупп.

Существует пять основных методов категоризации значений, которые будут кратко описаны в этом разделе: целые числа, категории, границы, коды и сложные подгруппы. Обратите внимание, что одни и те же методы категоризации можно использовать как для разбиения наблюдений по входящим графикам, так и для категоризации наблюдений внутри входящих графиков ( например, на гистограммах или диаграммах размаха).

Целые числа. При использовании этого режима для определения категорий будут использованы целые значения выбранной группирующей переменной, и для всех наблюдений, принадлежащих каждой категории (заданной этими целыми числами), будет построено по одному графику. Если выбранная группирующая переменная содержит не целочисленные значения, то программа автоматически округлит каждое значение выделенной переменной до целого числа.

Категории. В этом режиме категоризации нужно указать желаемое число категорий. Программа разделит весь диапазон значений выбранной группирующей переменной (от минимального до максимального) на указанное число интервалов равной длины.

Границы. Метод границ также представляет собой интервальную категоризацию, однако в этом случае интервалы могут иметь произвольную (например, различную) длину, определяемую пользователем (например, «меньше -10», «больше или равно -10, но меньше 0», «больше или равно 0, но меньше 10» и «больше или равно 10»).

Коды. Этот метод следует использовать в том случае, если выбранная группирующая переменная содержит «коды » (т.е. особые смысловые значения, такие как Male, Female), по которым можно разбить данные на категории.

Сложные подгруппы. Этот метод дает возможность пользователю использовать для выделения подгрупп более одной переменной. Другими словами, категоризация, основанная на выделении сложных подгрупп, может представлять не распределения конкретных переменных, а распределения частот определенных «событий» при заданной комбинации значений любого числа переменных текущего набора данных. Например, можно указать шесть категорий, задаваемых комбинациями значений трех переменных Gender, Age и Employment.

Гистограммы используются для изучения распределений частот значений переменных. Такое частотное распределение показывает, какие именно конкретные значения или диапазоны значений исследуемой переменной встречаются наиболее часто, насколько различаются эти значения, расположено ли большинство наблюдений около среднего значения, является распределение симметричным или асимметричным, многомодальным (т.е. имеет две или более вершины) или одномодальным и т.д. Гистограммы также используются для сравнения наблюдаемых и теоретических или ожидаемых распределений.

Категоризованные гистограммы представляют собой наборы гистограмм, соответствующих различным значениям одной или нескольких категоризующих переменных или наборам логических условий категоризации (см. Методы категоризации).

Частотные распределения могут представлять интерес по двум основным причинам.

  • По форме распределения можно судить о природе исследуемой переменной (например, бимодальное распределение позволяет предположить, что выборка не является однородной и содержит наблюдения, принадлежащие двум различным множествам, которые в свою очередь нормально распределены).
  • Многие статистики основываются на определенных предположениях о распределениях анализируемых переменных; гистограммы позволяют проверить, выполняются ли эти предположения.

Как правило, работа с новым набором данных начинается с построения гистограмм всех переменных.

Гистограммы и группировка. Категоризованные гистограммы предоставляют такую же информацию о данных, как и группировка (например, среднее, медиану, минимум, максимум, разброс и т.п.; см. главу Основные статистики и таблицы). Хотя конкретные (числовые) значения описательных статистик легко увидеть в таблице, в то же время общую структуру и глобальные характеристики распределения проще изучать на графике. Более того, график дает качественную информацию о распределении, которую невозможно отразить с помощью какого-либо одного параметра. Например, по асимметрии распределения значений дохода можно сделать вывод о том, что большинство населения имеет низкий, а не высокий уровень доходов. Если помимо этого провести группировку данных по этническому и половому признакам, то можно обнаружить, что в некоторых подгруппах эта структура распределения станет еще более ярко выраженной. Хотя эта информация содержится в значении коэффициента асимметрии (для каждой подгруппы), но она легче воспринимается и запоминается, будучи графически представленной на гистограмме. Кроме того, на гистограмме можно наблюдать некоторые «впадины и выпуклости», которые могут свидетельствовать о социальном расслоении в исследуемой группе населения или об аномалиях в распределении дохода отдельных подгрупп, связанных с недавней налоговой реформой.

Категоризованные гистограммы и диаграммы рассеяния. Полезное применение категоризации для непрерывных переменных — это представление взаимосвязи трех переменных одновременно. Ниже показана диаграмма рассеяния для двух переменных Load 1 и Load 2.

Предположим, к ним нужно добавить третью переменную (Output) и исследовать ее распределение при различных значения совместного распределения переменных Load 1 и Load 2. Для этого можно построить следующий график:

На этом графике обе переменные Load 1 и Load 2 сгруппированы в 5 интервалов, и для каждой комбинации этих интервалов вычислено распределение переменной Output. Обратите внимание, что внутри «прямоугольника» (параллелограмма) находятся наблюдения, одинаковые для обоих показанных выше графиков.

Двумерные диаграммы рассеяния используются для визуализации взаимосвязей между двумя переменными X и Y (например, весом и ростом). На этих диаграммах отдельные точки данных представлены маркерами на плоскости, где оси соответствуют переменным. Две координаты (X и Y), определяющие положение точки, соответствуют значениям переменных. Если между переменными существует сильная взаимосвязь, то точки на графике образуют упорядоченную структуру (например, прямую линию или характерную кривую). Если переменные не взаимосвязаны, то точки образуют «облако».

Можно построить также категоризованные диаграммы рассеяния, сгруппированные по значениям одной или нескольких переменных, а с помощью метода сложных подгрупп (см. Методы категоризации) — диаграммы рассеяния, категоризованные по заданным логическим условиям выбора подгрупп наблюдений.

Категоризованные диаграммы рассеянияпредставляют собой мощный исследовательский и аналитический метод для изучения взаимосвязей между двумя и более переменными среди различных подгрупп.

Однородность двумерных распределений (форма взаимосвязей).Диаграммы рассеяния обычно используются для выявления природы взаимосвязи двух переменных (например, кровяного давления и уровня холестерина), поскольку они предоставляют гораздо больше информации, чем коэффициент корреляции.

Например, неоднородность выборки, по которой рассчитываются корреляции, может привести к искажению значений коэффициента корреляции. Предположим, коэффициент корреляции рассчитывается по данным, полученным в двух экспериментальных группах, но этот факт при вычислениях игнорируется. Пусть эксперимент в одной из подгрупп привел к увеличению значений обеих переменных, и на диаграмме рассеяния данные из каждой группы образуют отдельные «облака» (как показано на картинке).

В этом примере большое значение коэффициента корреляции целиком обусловлено распределением по группам и не отражает «истинную» взаимосвязь между двумя переменными, которая практически близка к 0 (это хорошо видно, если рассматривать каждую группу отдельно).

Если вы предполагаете, что подобная структура присутствует и в ваших данных, и знаете, каким образом выделить «подгруппы» наблюдений, то имеет смысл построить категоризованную диаграмму рассеяния.

Такой график поможет вам прояснить структуру взаимосвязей между переменными X и Y внутри каждой подгруппы (после соответствующего разбиения наблюдений).

Нелинейные зависимости. С помощью диаграмм рассеяния можно исследовать и нелинейные взаимосвязи между переменными. При этом не существует каких-либо «автоматических» или простых способов оценки нелинейности. Стандартный коэффициент корреляции Пирсона r позволяет оценить только линейность связи, а некоторые непараметрические корреляции, например, Спирмена R, дают возможность оценить нелинейность, но только для монотонных зависимостей. На диаграммах рассеяния можно изучить структуру взаимосвязей, чтобы затем с помощью преобразования привести данные к линейному виду или выбрать подходящую нелинейную подгонку.

Существует три типа категоризованных вероятностных графиков: нормальные, полунормальные и с исключенным трендом. Нормальные вероятностные графики — это быстрый способ визуальной проверки степени соответствия данных нормальному распределению.

В свою очередь категоризованные вероятностные графики дают возможность исследовать близость к нормальному распределению различных подгрупп данных .

Категоризованные нормальные вероятностные графики представляют собой эффективный инструмент для исследования однородности группы наблюдений с точки зрения соответствия нормальному распределению.

Категоризованные графики квантиль-квантиль (или К-К) используются для поиска в определенном семействе распределений того распределения, которое наилучшим образом описывает имеющиеся данные.

В случае категоризованных графиков К-К строится набор графиков квантиль-квантиль, по одному для каждого значения категориальных переменных (X или X и Y) или для заданных условий выбора сложных подгрупп (см. Методы категоризации). Для графиков К-К используются следующие семейства распределений: экспоненциальное, экстремальное, нормальное, Релея, бета-, гамма-, логнормальное и Вейбулла.

Категоризованные графики вероятность-вероятность (или В-В) используются для проверки соответствия конкретного теоретического распределения имеющимся исходным данным. На этих графиках для каждого значения категориальных переменных (X или X и Y) или для заданных условий выбора сложных подгрупп (см. Методы категоризации) создается по одному графику вероятность-вероятность.

На графиках В-В строится наблюдаемая функция распределения (доля непропущенных значений x) в зависимости от теоретической функции распределения, чтобы оценить соответствие этой теоретической функции наблюдаемым данным. Если все точки этого графика располагаются на диагонали (содержащей точку 0 и имеющей наклон 1), то можно заключить, что наблюдаемое распределение хорошо аппроксимируется данной теоретической функцией.

Если не все точки данных располагаются на диагональной линии, то на таком графике можно визуально выделить группы наблюдений, соответствующие и не соответствующие искомому распределению (если, к примеру, точки образуют кривую S-образной формы вокруг диагональной линии, то к ним можно применить определенное преобразование для приведения к нужной форме распределения).

Читайте также:  Медкнижка какие анализы сдавать 2017

На линейных графиках отдельные точки данных соединяются линиями. Это простой способ визуального представления последовательности значений (например, цены на фондовом рынке за несколько дней торгов). Категоризованные линейные графики строятся в том случае, если необходимо разбить данные на несколько групп (категоризовать) с помощью группирующей переменной (например, цены при закрытии рынка по понедельникам, вторникам и т.д.) или с помощью логических условий, составленных по нескольким переменным (например, цены при закрытии рынка в те дни, когда две другие акции и индекс Доу Джонса выросли по сравнению с другими ценами закрытия; см. Методы категоризации).

На диаграммах размаха (этот термин был впервые использован Тьюки в 1970 году) представлены диапазоны значений выбранной переменной (или переменных) для отдельных групп наблюдений. Для выделения этих групп используются от одной до трех категориальных (группирующих) переменных или набор логических условий выбора подгрупп.

Для каждой группы наблюдений вычисляется центральная тенденция (медиана или среднее), а также размах или изменчивость (квартили, стандартные ошибки или стандартные отклонения). Выбранные параметры отображаются на графике одним из пяти способов (Прямоугольники-Отрезки, Отрезки, Прямоугольники, Столбцы или Верхние-нижние засечки). На этом графике можно показать и выбросы (см. разделы о выбросах и крайних точках).

На следующем графике, например, выбор факторов можно было бы считать вполне удачным, если бы не «досадное» несоответствие, на которое указывают выделенные на рисунке выбросы (в данном случае это значения, попадающие за пределы 1,5 квартильных размахов):

А на следующем рисунке не показаны ни выбросы, ни крайние точки.

Можно выделить два основных направления использования диаграмм размаха: (a) отображение диапазонов значений отдельных элементов, наблюдений или выборок (например, типичные минимаксные графики цен на акции или товары или графики агрегированных данных с диапазонами), (б) отображение изменения значений в отдельных группах или выборках (например, когда точкой внутри прямоугольника представлено среднее значение для каждой выборки, сам прямоугольник соответствует значениям стандартной ошибки, а меньший прямоугольник или пара «отрезков» обозначает стандартное отклонение от среднего).

С помощью диаграмм размаха, на которых представлены характеристики изменчивости, можно быстро оценить и «интуитивно представить» силу связи между группирующей и зависимой переменной. Предположив, что зависимая переменная нормально распределена, и зная долю наблюдений, попадающих, к примеру, в интервал ±1 или ±2 стандартных отклонения от среднего (см. Элементарные понятия статистики), можно сделать, например, вывод о том, что 95% наблюдений из экспериментальной группы 1 попадают в другой диапазон значений, нежели 95% наблюдений из группы 2.

На этих графиках можно изобразить и так называемые усеченные средние (этот термин был впервые использован Тьюки в 1962 году), которые вычисляются после исключения заданного пользователем процента наблюдений с концов (хвостов) распределения.

Одним из наиболее широко используемых типов графического представления данных являются круговые диаграммы, на которых показаны пропорции или сами значения переменных. Категоризованные графики этого типа состоят из нескольких круговых диаграмм, где данные разделены по группам с помощью одной или нескольких группирующих переменных (например, gender) или категоризованы согласно логическим условиям выбора подгрупп (см. Методы категоризации).

В дальнейшем, говоря о категоризации этих графиков, мы будем иметь ввиду круговые диаграммы частот (в противоположность круговым диаграммам значений). Эти типы графиков, называемые также частотными круговыми диаграммами, представляют данные аналогично гистограммам. Все значения выбранной переменной категоризуются с помощью заданного метода категоризации, а затем относительные значения частот отображаются в виде сегментов круговой диаграммы пропорционального размера. Таким образом, эти графики являются альтернативным представлением гистограммы частот (см. раздел о категоризованных гистограммах).

Диаграммы рассеяния круговых диаграмм. Еще одно очень полезное применение категоризованных круговых диаграмм — это представление относительных частот значений какой-либо переменной в различных «местах» совместного распределения двух других переменных. Например:

Обратите внимание, что круговые диаграммы изображены только в тех «местах», где имеются данные. Показанный выше график напоминает диаграмму рассеяния (переменных L1 и L2), где маркерами точек являются круговые диаграммы. Однако помимо обычной информации, содержащейся в диаграмме рассеяния, здесь в каждой точке дополнительно показано относительное распределение третьей переменной (а именно, доля значений Low, Medium и High Quality).

Графики пропущенных значений и данных вне диапазона

На этих графиках можно наглядно представить структуру распределения точек данных, содержащих пропущенные значения или находящихся «вне диапазонов», заданных пользователем. При этом строится по одной двумерной диаграмме для каждой группы наблюдений, выделенной с помощью группирующих переменных или с помощью условий выбора сложных подгрупп (см. Методы категоризации).

Эти типы графиков используются в разведочном анализе данных, чтобы определить, является ли случайным распределение точек с пропущенными значениями, а также для оценки их диапазона.

Трехмерные диаграммы рассеяния (пространственные, спектральные, трассировочные и диаграммы отклонений), карты линий уровня и поверхности также можно построить для подгрупп наблюдений, заданных с помощью выбранной категориальной переменной или логических условий выбора (см. Методы категоризации). Основная задача этих графиков — упростить сравнение взаимосвязей между тремя и более переменными для различных групп или категорий наблюдений.

Применения. Трехмерные графики в координатах XYZ отображают взаимосвязи между тремя переменными. С помощью различных способов категоризации можно исследовать эти зависимости при различных условиях (т.е. в разных группах).

Изучая, например, показанный ниже категоризованный график поверхности, можно сделать вывод о том, что величина допуска прибора не влияет на измерения (переменные Depend1, Depend2 и Height), кроме случая, когда она 3.

Этот вывод становится еще более очевидным, если использовать вместо поверхности карту линий уровня.

Категоризованные тернарные графики используются для исследования взаимосвязей между тремя и более переменными, три из которых представляют собой компоненты смеси (т.е. для каждого наблюдения значения их суммы являются постоянной величиной), при этом отдельный график строится для каждого уровня группирующей переменной.

Для построения тернарных графиков используется треугольная система координат на плоскости или в пространстве и строится зависимость между четырьмя (или более) переменными (компонентами X, Y и Z и откликами V1, V2 и т.д.). При этом накладываются ограничения на относительные значения каждой из компонент, чтобы они в сумме давали одинаковую величину для каждого наблюдения (например, 1).

На категоризованных тернарных графиках строится по одному графику для каждого значения группирующей переменной (или заданного пользователем подмножества данных), и все они отображаются в одном графическом окне, чтобы можно было сравнивать различные подгруппы наблюдений.

Применения. Эти графики применяются для анализа результатов эксперимента, в котором измеряемый отклик зависит от относительного соотношения трех компонент (например, трех химических веществ при составлении смесей), которое варьируется с целью определения его оптимального значения. Эти типы графического представления можно использовать и в других случаях, когда взаимосвязь между переменными, на которые наложены определенные ограничения, необходимо исследовать для различных групп или категорий наблюдений.

Закрашивание является одним из первых и, по-видимому, наиболее широко распространенных методов, известных как графический разведочный анализ данных. Этот метод позволяет интерактивно выделять на экране отдельные точки или подмножества данных и задавать их характеристики, или исследовать их влияние на взаимосвязи между переменными (например, на матрицах диаграмм рассеяния) и идентифицировать выбросы(например, с помощью меток).

Связи между переменными можно наглядно представить с помощью аппроксимирующих функций (например, двумерных кривых или трехмерных поверхностей) и доверительных интервалов. Интерактивно удаляя или добавляя определенные подгруппы наблюдений, можно наблюдать за изменениями этих функций и их параметров. Одно из применений метода закрашивания — это, например, выделение на матричной диаграмме рассеяния всех точек данных, принадлежащих определенной категории (например, на показанном ниже рисунке на правом верхнем графике выделена группа наблюдений, соответствующих значению «среднего» уровня дохода).

Такое исследование помогает определить, как эти конкретные наблюдения влияют на связи между другими переменными того же набора данных (например, на корреляцию между «расходами» и «активами»).

В режиме «динамического закрашивания» (см. следующий пример) или «автоматического обновления функции подгонки» можно задать движение кисти по определенным последовательным диапазонам выбранной переменной (например, непрерывной, а не дискретной, как на показанном ранее примере) и исследовать динамику вклада этой переменной в связи между другими переменными этого набора данных.

Сглаживание двумерных распределений

Для наглядного представления таблицы значений двух переменных используются трехмерные гистограммы. Их можно рассматривать как объединение двух простых гистограмм для совместного анализа частот значений двух переменных. Чаще всего на этом графике для каждой «ячейки» таблицы нарисован один трехмерный столбец, а его высота соответствует частоте значений в этой ячейке. При построении трехмерной гистограммы для каждой из двух переменных можно использовать свой метод категоризации (см. ниже).

Когда предусмотрены процедуры сглаживания данных, то трехмерное представление частот значений можно аппроксимировать поверхностью. Такое сглаживание можно осуществить для любой трехмерной гистограммы. Для достаточно простой структуры данных (как на предыдущем рисунке) такое сглаживание не имеет особого смысла.

Однако, в случае более сложной картины распределения частот эта процедура может оказаться эффективным инструментом разведочного анализа данных

и позволит выявить особенности, которые трудно обнаружить на обычной трехмерной гистограмме (например, показанную выше «волновую структуру» поверхности).

На графиках этого типа за счет сокращения области основного графика освобождается место для графиков на полях, которые располагаются в правой и верхней части графического окна (включая маленький угловой график). Эти графики на полях представляют собой соответственно вертикально и горизонтально сжатые изображения основного графика.

Послойное сжатие двумерных графиков является методом разведочного анализа данных, который дает возможность скрытые тренды и структуры двумерных наборов данных. Рассмотрим следующий рисунок.

Здесь на примере, приведенном Кливландом (Cleveland, 1993), можно убедиться, что в каждом цикле солнечной активности число пятен уменьшается гораздо медленнее, чем нарастает в начале цикла. Такое поведение совершенно не очевидно при исследовании обычного линейного графика, в то время как сжатый график позволяет обнаружить эту скрытую картину.

Проекции трехмерных наборов данных

Полезным методом изучения и аналитического исследования структуры поверхности (созданной, как правило, по трехмерным наборам данных) является построение ее проекции на плоскость в виде карты линий уровня.

Эти графики менее эффективны для быстрого визуального анализа формы трехмерных структур по сравнению с графиками поверхности,

однако их преимущество заключается в возможности точного исследования формы поверхности —

на картах линий уровня отображается ряд не искаженных горизонтальных «сечений».

На пиктографиках каждое наблюдение представлено в виде многомерного символа, что позволяет использовать эти типы графического представления данных в качестве не очень простого, но мощного исследовательского инструмента. Главная идея такого метода анализа основана на человеческой способности «автоматически» фиксировать сложные связи между многими переменными, если они проявляются в последовательности элементов (в данном случае «пиктограмм»). Иногда понимание (или «чувство») того, что некоторые элементы «чем-то похожи» друг на друга, приходит раньше, чем наблюдатель (аналитик) может объяснить, какие именно переменные обусловливают это сходство (Lewicki, Hill, & Czyzewska, 1992). Конкретную природу проявившихся взаимосвязей между переменными позволяет выявить уже последующий анализ данных, основанный на изучении этого интуитивно обнаруженного сходства.

Основная идея пиктографиков заключается в представлении элементарных наблюдений как отдельных графических объектов, где значения переменных соответствуют определенным чертам или размерам объекта (обычно одно наблюдение = одному объекту). Это соответствие устанавливается таким образом, чтобы общий вид объекта менялся в зависимости от конфигурации значений.

Таким образом, объекты имеют определенный «внешний вид», который уникален для каждой конфигурации значений и может быть идентифицирован наблюдателем. Изучение таких пиктограмм помогает выявить как простые связи, так и сложные взаимодействия между переменными.

Целесообразно проводить анализ пиктографиков в пять этапов.

  1. Сначала выберите порядок анализируемых переменных. В большинстве случаев наилучшим вариантом оказывается случайная последовательность. Кроме того, можно попробовать расположить их в порядке, соответствующем полученному уравнению множественной регрессии, факторным нагрузкам или объясняемым факторам (см. главу Факторный анализ). Таким образом можно упростить и сделать более «однородным» общий вид пиктограмм, чтобы легче идентифицировать слабо выраженные различия. В то же время такой подход может затруднить идентификацию некоторых структур. На этом этапе можно дать только один универсальный совет: прежде чем использовать какие-либо сложные методы, попробуйте наиболее простой и быстрый вариант, а именно, случайную последовательность переменных.
  2. Попробуйте обнаружить какие-либо закономерности, например, сходства между группами пиктограмм, выбросы или определенные связи между элементами (например, » если первые два луча звезды длинные, то как правило, с другой стороны есть один или два коротких луча»). На этом этапе лучше использовать пиктографики кругового типа.
  3. При обнаружении закономерностей постарайтесь сформулировать их в терминах конкретных переменных.
  4. Измените соответствие переменных и элементов пиктограмм (или переключитесь на один из последовательных пиктографиков), чтобы проверить обнаруженную структуру взаимосвязей (например, попробуйте переместить ближе друг к другу элементы, между которыми обнаружена связь). В некоторых случаях в конце этого этапа целесообразно исключить из рассмотрения те переменные, которые не вносят явного вклада в обнаруженную структуру.
  5. И наконец, используйте один из численных методов (таких как регрессионный анализ, нелинейное оценивание, дискриминантный или кластерный анализ), чтобы проверить и попытаться количественно оценить обнаруженные закономерности или хотя бы их часть.

Большинство пиктографиков можно отнести к одной из двух групп: круговые и последовательные.

Круговые пиктографики. Круговые пиктографики (звезды, лучи, многоугольники) имеют вид «велосипедного колеса», на них значения переменных представлены расстояниями между центром пиктограммы («втулкой») и их концами.

Такие графики могут помочь в обнаружении связей между переменными, которые проявляются в общей структуре пиктограмм и зависят от конфигурации значений самих переменных.

Чтобы описать такую » общую картину» в терминах конкретных моделей или проверить имеющиеся предположения, имеет смысл использовать последовательные пиктографики, которые могут оказаться более эффективными, если уже известно, что именно требуется обнаружить.

Последовательные пиктографики. Последовательные пиктографики (столбцы, профили, линии) представляют собой набор картинок с маленькими последовательными графиками (различных типов).

Значения переменных представлены здесь расстояниями между основанием пиктограммы и последовательными точками (например, высотами показанных выше столбцов). Эти графики менее эффективны на начальной стадии разведочного анализа, поскольку пиктограммы очень похожи между собой. Однако, как уже упоминалось ранее, такое представление может быть весьма полезным для проверки уже сформулированной гипотезы.

Пиктограммы круговых диаграмм. Эти пиктографики нельзя однозначно отнести к одной из двух групп. Все они имеют круговую форму, но в то же время последовательно разделены в соответствии с значениями переменных.

Их можно отнести скорее к последовательным, чем к круговым пиктографикам, но можно использовать и в том, и в другом случае.

«Лица Чернова». Этот тип пиктографиков составляет отдельную группу. Здесь каждое наблюдение представляет собой схематичное изображение лица, определенным чертам которого соответствуют относительные значения выбранных переменных.

Некоторые исследователи рассматривают этот способ графического представления данных как уникальный многомерный метод разведочного анализа, позволяющий выявить такие скрытые картины взаимосвязей между переменными, которые не могут быть обнаружены другими методами. Вероятно, такое заявление можно считать преувеличением. Кроме того, следует заметить, что этот способ исследования весьма непрост в применении и требует большого опыта в том, что касается сопоставления переменных чертам лица. См. также раздел Методы «добычи данных» .

Как правило, при построении пиктографиков значения переменных должны быть стандартизованы, чтобы их можно было сравнивать в пределах одной пиктограммы. Исключения составляют те случаи, когда на пиктограммах необходимо отобразить глобальные различия диапазонов выбранных переменных. Поскольку масштаб пиктограммы определяется наибольшим значением, то на пиктограмме могут отсутствовать те переменные, которые имеют значения другого порядка малости, например, на пиктограмме звезды некоторые лучи могут оказаться настолько короткими, что совсем не будут видны..

Пиктографики обычно используются: (1) для обнаружения структур или кластеров наблюдений и (2) для исследования сложных взаимосвязей между несколькими переменными. Первый вариант соответствует кластерному анализу; т.е. процедуре классификации наблюдений.

Предположим, вы изучали характеры актеров и записали их ответы на вопросы анкеты. С помощью пиктографика можно определить, существуют ли группы артистов, которые отличаются по их ответам на заданные вопросы (можно, к примеру, обнаружить, что некоторые артисты являются творческими, недисциплинированными и независимыми личностями, в то время как другая группа состоит из умных, дисциплинированных людей, которые ценят свою популярность).

Другая область применений — изучение взаимосвязей между переменными — напоминает факторный анализ, который используется для исследования вопроса о зависимости переменных. Предположим, изучалось мнение группы людей о различных марках автомобилей. В файле данных записаны средние оценки по каждому из свойств (рассматриваемых как переменные) для каждого из автомобилей (рассматриваемых как наблюдения).

При изучении «лиц Чернова» (где каждое лицо представляет мнение об одном из автомобилей) может оказаться, что улыбающиеся лица обычно имеют большие уши; при этом, если цене соответствует «ширина» улыбки, а динамическим качествам — размер ушей, то это «открытие» означает, что быстрые машины являются более дорогими. Разумеется, это очень простой пример; однако при реальном анализе данных применение этого метода может сделать более очевидными сложные взаимосвязи между многими переменными.

Близкие способы графического представления

Связи между переменными из одного или двух списков могут быть представлены на матричных графиках. Использование матричных графиков одновременно с выделением подгрупп позволяет получить информацию, подобную той, которая отображается на пиктографиках.

Если использовать методы выделения подгрупп на диаграммах рассеяния, то для исследования взаимосвязей между двумя переменными можно использовать обычные 2М диаграммы рассеяния; а в случае трех переменных — 3Мдиаграммы рассеяния.

Существуют различные типы пиктографиков.

«Лица Чернова». Для каждого наблюдения рисуется отдельное «лицо»; при этом относительные значения выбранных переменных соответствуют форме и размерам определенных его черт (например, длине носа, изгибу бровей, ширине лица).

Звезды. Это пиктографики кругового типа. Для каждого наблюдения рисуется пиктограмма в виде звезды; относительные значения выбранных переменных соответствуют относительным длинам лучей каждой звезды (по часовой стрелке, начиная с 12:00). Концы лучей соединены линиями.

Лучи. Эти пиктографики также относятся к круговому типу. Для каждого наблюдения строится одна пиктограмма. Каждый луч соответствует одной из выбранных переменных (по часовой стрелке, начиная с 12:00), и на нем отложено значение соответствующей переменной. Эти значения соединены линиями.

Многоугольники. Это пиктографикикругового типа. Для каждого наблюдения рисуется отдельный многоугольник; относительные значения выбранных переменных соответствуют расстояниям вершин от центра многоугольника (по часовой стрелке, начиная с 12:00).

Круговые диаграммы. Это пиктографики кругового типа. Для каждого наблюдения рисуется круговая диаграмма; относительные значения выбранных переменных соответствуют размерам сегментов диаграммы (по часовой стрелке, начиная с 12:00).

Столбцы. Это пиктографики последовательного типа. Для каждого наблюдения строится столбчатая диаграмма; относительные значения выбранных переменных соответствуют высотам последовательных столбцов.

Для каждого наблюдения строится линейный график; относительные значения выбранных переменных соответствуют расстояниям точек излома линии от основания графика.

Профили. Это пиктографики последовательного типа. Для каждого наблюдения строится зонный график; относительные значения выбранных переменных соответствуют расстояниям последовательных пиков сечения над линией основания.

Если программа позволяет вам выделять подгруппы наблюдений, то это свойство можно использовать и для маркировки соответствующих пиктограмм. При этом вокруг выделенных пиктограмм будут нарисованы рамки.

Шаблоны рамок, идентифицирующих заданные подгруппы, будут показаны в условных обозначениях рядом с текстом соответствующих условий выбора наблюдений. На следующем графике показан пример маркированных подгрупп.

Все наблюдения, удовлетворяющие условию для подгруппы 1 (значение переменной Iristype равно значению переменной Setosa и номер наблюдения меньше 100), обозначены специальной рамкой вокруг пиктограммы.

А все наблюдения, которые удовлетворяют условию для подгруппы 2 (значение переменной Iristype равно значению переменной Virginic и номер наблюдения меньше 100), обозначены на графике рамкой другого цвета.

Иногда отображение на графике слишком большого числа точек данных затрудняет изучение их структуры (см. следующий рисунок). Если файл данных слишком большой, то имеет смысл показать на графике лишь подмножество наблюдений, чтобы общая картина не была скрыта маркерами точек.

Некоторые программы предлагают методы выборки (или оптимизации) данных, которые в ряде случаев могут оказаться весьма полезны. При этом пользователь может задать целое число n, меньшее числа наблюдений в файле данных, а программа случайным образом выберет из этого файла приблизительно n допустимых наблюдений и именно их построит на графике.

Заметим, что такие методы сокращения набора данных (или размера выборки) эффективно отображают случайную структуру этих данных. Очевидно, эти методы принципиально отличаются от методов выделения конкретного подмножества или подгруппы наблюдений с помощью определенных критериев (например, по полу, области или уровню холестерина). Последние можно применять интерактивно (например, в режиме динамического закрашивания) или каким-либо другим способом (например, на категоризованных графиках или с помощью условий выбора наблюдений). Все эти методы в равной мере могут помочь в идентификации сложной структуры большого набора данных.

Вращение (в трехмерном пространстве)

Изменение угла зрения при отображении трехмерной диаграммы рассеяния (простой, спектральной или пространственной) может оказаться эффективным средством для выявления некоторой структуры, которая видна только при определенном повороте «облака» точек (см. следующий рисунок).

Некоторые программы предоставляют полезный инструмент для интерактивного изменения перспективы и вращения изображения. Эти средства контроля изображения позволяют подобрать подходящий угол зрения и перспективу, чтобы найти наиболее удачное расположение «точки зрения» на график, а также дают возможность управлять его вращением в горизонтальной и вертикальной плоскости.

Эти инструменты могут оказаться весьма полезными не только при начальном разведочном анализе данных, но и при исследовании факторного пространства (см.Факторный анализ) или пространства размерностей (см. Многомерное шкалирование).

Все права на материалы электронного учебника принадлежат компании StatSoft

источник