Меню Рубрики

Как описывать корреляционный анализ по а

Термин «корреляция» активно используется в гуманитарных науках, медицине; часто мелькает в СМИ. Ключевую роль корреляции играют в психологии. В частности, расчет корреляций выступает важным этапом реализации эмпирического исследования при написании ВКР по психологии.

В этой статье мы простым языком объясним суть корреляционной связи, виды корреляций, способы расчета, особенности использования корреляции в психологических исследованиях, а также при написании дипломных работ по психологии.

Корреляция – это связь. Но не любая. В чем же ее особенность? Рассмотрим на примере.

Представьте, что вы едете на автомобиле. Вы нажимаете педаль газа – машина едет быстрее. Вы сбавляете газ – авто замедляет ход. Даже не знакомый с устройством автомобиля человек скажет: «Между педалью газа и скоростью машины есть прямая связь: чем сильнее нажата педаль, тем скорость выше».

Это зависимость функциональная – скорость выступает прямой функцией педали газа. Специалист объяснит, что педаль управляет подачей топлива в цилиндры, где происходит сжигание смеси, что ведет к повышению мощности на вал и т.д. Это связь жесткая, детерминированная, не допускающая исключений (при условии, что машина исправна).

Теперь представьте, что вы директор фирмы, сотрудники которой продают товары. Вы решаете повысить продажи за счет повышения окладов работников. Вы повышаете зарплату на 10%, и продажи в среднем по фирме растут. Через время повышаете еще на 10%, и опять рост. Затем еще на 5%, и опять есть эффект. Напрашивается вывод – между продажами фирмы и окладом сотрудников есть прямая зависимость – чем выше оклады, тем выше продажи организации. Такая же это связь, как между педалью газа и скоростью авто? В чем ключевое отличие?

Правильно, между окладом и продажами заисимость не жесткая. Это значит, что у кого-то из сотрудников продажи могли даже снизиться, невзирая на рост оклада. У кого-то остаться неизменными. Но в среднем по фирме продажи выросли, и мы говорим – связь продаж и оклада сотрудников есть, и она корреляционная.

В основе функциональной связи (педаль газа – скорость) лежит физический закон. В основе корреляционной связи (продажи – оклад) находится простая согласованность изменения двух показателей. Никакого закона (в физическом понимании этого слова) за корреляцией нет. Есть лишь вероятностная (стохастическая) закономерность.

Итак, корреляционная связь отражает зависимость между явлениями. Если эти явления можно измерить, то она получает численное выражение.

Например, изучается роль чтения в жизни людей. Исследователи взяли группу из 40 человек и измерили у каждого испытуемого два показателя: 1) сколько времени он читает в неделю; 2) в какой мере он считает себя благополучным (по шкале от 1 до 10). Ученые занесли эти данные в два столбика и с помощью статистической программы рассчитали корреляцию между чтением и благополучием. Предположим, они получили следующий результат -0,76. Но что значит это число? Как его проинтерпретировать? Давайте разбираться.

Полученное число называется коэффициентом корреляции. Для его правильной интерпретации важно учитывать следующее:

  1. Знак «+» или «-» отражает направление зависимости.
  2. Величина коэффициента отражает силу зависимости.

Знак плюс перед коэффициентом указывает на то, что связь между явлениями или показателями прямая. То есть, чем больше один показатель, тем больше и другой. Выше оклад — выше продажи. Такая корреляция называется прямой, или положительной.

Если коэффициент имеет знак минус, значит, корреляция обратная, или отрицательная. В этом случае чем выше один показатель, тем ниже другой. В примере с чтением и благополучием мы получили -0,76, и это значит, что, чем больше люди читают, тем ниже уровень их благополучия.

Корреляционная связь в численном выражении – это число в диапазоне от -1 до +1. Обозначается буквой «r». Чем выше число (без учета знака), тем корреляционная связь сильнее.

Чем ниже численное значение коэффициента, тем взаимосвязь между явлениями и показателями меньше.

Максимально возможная сила зависимости – это 1 или -1. Как это понять и представить?

Рассмотрим пример. Взяли 10 студентов и измерили у них уровень интеллекта (IQ) и успеваемость за семестр. Расположили эти данные в виде двух столбцов.

Успеваемость (баллы)

Посмотрите внимательно на данные в таблице. От 1 до 10 испытуемого растет уровень IQ. Но также растет и уровень успеваемости. Из любых двух студентов успеваемость будет выше у того, у кого выше IQ. И никаких исключений из этого правила не будет.

Перед нами пример полного, 100%-но согласованного изменения двух показателей в группе. И это пример максимально возможной положительной взаимосвязи. То есть, корреляционная зависимость между интеллектом и успеваемостью равна 1.

Рассмотрим другой пример. У этих же 10-ти студентов с помощью опроса оценили, в какой мере они ощущают себя успешными в общении с противоположным полом (по шкале от 1 до 10).

Успех в общении с противоположным полом (баллы)

Смотрим внимательно на данные в таблице. От 1 до 10 испытуемого растет уровень IQ. При этом в последнем столбце последовательно снижается уровень успешности общения с противоположным полом. Из любых двух студентов успех общения с противоположным полом будет выше у того, у кого IQ ниже. И никаких исключений из этого правила не будет.

Это пример полной согласованности изменения двух показателей в группе — максимально возможная отрицательная взаимосвязь. Корреляционная связь между IQ и успешностью общения с противоположным полом равна -1.

А как понять смысл корреляции равной нулю (0)? Это значит, связи между показателями нет. Еще раз вернемся к нашим студентам и рассмотрим еще один измеренный у них показатель – длину прыжка с места.

Длина прыжка с места (м)

Не наблюдается никакой согласованности между изменением IQ от человека к человеку и длинной прыжка. Это и свидетельствует об отсутствии корреляции. Коэффициент корреляции IQ и длины прыжка с места у студентов равен 0.

Мы рассмотрели крайние случаи. В реальных измерениях коэффициенты редко бывают равны точно 1 или 0. При этом принята следующая шкала:

  • если коэффициент больше 0,70 – связь между показателями сильная;
  • от 0,30 до 0,70 – связь умеренная,
  • меньше 0,30 – связь слабая.

Если оценить по этой шкале полученную нами выше корреляцию между чтением и благополучием, то окажется, что эта зависимость сильная и отрицательная -0,76. То есть, наблюдается сильная отрицательная связь между начитанностью и благополучием. Что еще раз подтверждает библейскую мудрость о соотношении мудрости и печали.

Приведенная градация дает очень приблизительные оценки и в таком виде редко используются в исследованиях.

Чаще используются градации коэффициентов по уровням значимости. В этом случае реально полученный коэффициент может быть значимым или не значимым. Определить это можно, сравнив его значение с критическим значением коэффициента корреляции, взятым из специальной таблицы. Причем эти критические значения зависят от численности выборки (чем больше объем, тем ниже критическое значение).

Корреляционный метод выступает одним из основных в психологических исследованиях. И это не случайно, ведь психология стремится быть точной наукой. Получается ли?

В чем особенность законов в точных науках. Например, закон тяготения в физике действует без исключений: чем больше масса тела, тем сильнее оно притягивает другие тела. Этот физический закон отражает связь массы тела и силы притяжения.

В психологии иная ситуация. Например, психологи публикуют данные о связи теплых отношений в детстве с родителями и уровня креативности во взрослом возрасте. Означает ли это, что любой из испытуемых с очень теплыми отношениями с родителями в детстве будет иметь очень высокие творческие способности? Ответ однозначный – нет. Здесь нет закона, подобного физическому. Нет механизма влияния детского опыта на креативность взрослых. Это наши фантазии! Есть согласованность данных (отношения – креативность), но за ними нет закона. А есть лишь корреляционная связь. Психологи часто называют выявляемые взаимосвязи психологическими закономерностями, подчеркивая их вероятностный характер — не жесткость.

Пример исследования на студентах из предыдущего раздела хорошо иллюстрирует использование корреляций в психологии:

  1. Анализ взаимосвязи между психологическими показателями. В нашем примере IQ и успешность общения с противоположным полом – это психологические параметры. Выявление корреляции между ними расширяет представления о психической организации человека, о взаимосвязях между различными сторонами его личности – в данном случае между интеллектом и сферой общения.
  2. Анализ взаимосвязей IQ с успеваемостью и прыжками – пример связи психологического параметра с непсихологическими. Полученные результаты раскрывают особенности влияния интеллекта на учебную и спортивную деятельность.

Вот как могли выглядеть краткие выводы по результатам придуманного исследования на студентах:

  1. Выявлена значимая положительная зависимость интеллекта студентов и их успеваемости.
  2. Существует отрицательная значимая взаимосвязь IQ с успешностью общения с противоположным полом.
  3. Не выявлено связи IQ студентов с умением прыгать с места.

Таким образом, уровень интеллекта студентов выступает позитивным фактором их академической успеваемости, в то же время негативно сказываясь на отношениях с противоположным полом и не оказывая значимого влияния на спортивные успехи, в частности, способность к прыгать с места.

Как видим, интеллект помогает студентам учиться, но мешает строить отношения с противоположным полом. При этом не влияет на их спортивные успехи.

Неоднозначное влияние интеллекта на личность и деятельность студентов отражает сложность этого феномена в структуре личностных особенностей и важность продолжения исследований в этом направлении. В частности, представляется важным провести анализ взаимосвязей интеллекта с психологическими особенностями и деятельностью студентов с учетом их пола.

Рассмотрим два метода расчета.

Коэффициент Пирсона – это особый метод расчета взаимосвязи показателей между выраженностью численных значений в одной группе. Очень упрощенно он сводится к следующему:

  1. Берутся значения двух параметров в группе испытуемых (например, агрессии и перфекционизма).
  2. Находятся средние значения каждого параметра в группе.
  3. Находятся разности параметров каждого испытуемого и среднего значения.
  4. Эти разности подставляются в специальную форму для расчета коэффициента Пирсона.

Коэффициент ранговой корреляции Спирмена рассчитывается похожим образом:

  1. Берутся значения двух индикаторов в группе испытуемых.
  2. Находятся ранги каждого фактора в группе, то есть место в списке по возрастанию.
  3. Находятся разности рангов, возводятся в квадрат и суммируются.
  4. Далее разности рангов подставляются в специальную форму для вычисления коэффициента Спирмена.

В случае Пирсона расчет шел с использованием среднего значения. Следовательно, случайные выбросы данных (существенное отличие от среднего), например, из-за ошибки обработки или недостоверных ответов могут существенно исказить результат.

В случае Спирмена абсолютные значения данных не играют роли, так как учитывается только их взаимное расположение по отношению друг к другу (ранги). То есть, выбросы данных или другие неточности не окажут серьезного влияния на конечный результат.

Если результаты тестирования корректны, то различия коэффициентов Пирсона и Спирмена незначительны, при этом коэффициент Пирсона показывает более точное значение взаимосвязи данных.

Коэффициенты Пирсона и Спирмена можно рассчитать вручную. Это может понадобиться при углубленном изучении статистических методов.

Однако в большинстве случаев при решении прикладных задач, в том числе и в психологии, можно проводить расчеты с помощью специальных программ.

Вернемся опять к примеру со студентами и рассмотрим данные об уровне их интеллекта и длине прыжка с места. Занесем эти данные (два столбца) в таблицу Excel.

Переместив курсор в пустую ячейку, нажмем опцию «Вставить функцию» и выберем «КОРРЕЛ» из раздела «Статистические».

Формат этой функции предполагает выделение двух массивов данных: КОРРЕЛ (массив 1; массив»). Выделяем соответственно столбик с IQ и длиной прыжков.

Далее нажимаем галочку (то есть, рассчитать) и получаем значение , в нашем случае 0,038. Как видим, коэффициент не равен нулю, хотя и очень близок к нему.

В таблицах Excel реализована формула расчета только коэффициента Пирсона.

Заносим данные по интеллекту и длине прыжка в поле исходных данных. Далее выбираем опцию «Непараметрические критерии», «Спирмена». Выделяем параметры для расчета и получаем следующий результат.

Как видно, расчет дал результат 0,024, что отличается от результата по Пирсону – 0,038, полученной выше с помощью Excel. Однако различия незначительны.

Большинство тем выпускных квалификационных работ по психологии (дипломов, курсовых, магистерских) предполагают проведение корреляционного исследования (остальные связаны с выявлением различий психологических показателей в разных группах).

Сам термин «корреляция» в названиях тем звучит редко – он скрывается за следующими формулировками:

  • «Взаимосвязь субъективного ощущения одиночества и самоактуализации у женщин зрелого возраста»;
  • «Особенности влияния жизнестойкости менеджеров на успешность их взаимодействия с клиентами в конфликтных ситуациях»;
  • «Личностные факторы стрессоустойчивости сотрудников МЧС».

Таким образом, слова «взаимосвязь», «влияние» и «факторы» — верные признаки того, что методом анализа данных в эмпирическом исследовании должен быть корреляционный анализ.

Рассмотрим кратко этапы его проведения при написании дипломной работы по психологии на тему: «Взаимосвязь личностной тревожности и агрессивности у подростков».

1. Для расчета необходимы сырые данные, в качестве которых обычно выступают результаты тестирования испытуемых. Они заносятся в сводную таблицу и помещаются в приложение. Эта таблица устроена следующим образом:

  • каждая строка содержит данные на одного испытуемого;
  • каждый столбец содержит показатели по одной шкале для всех испытуемых.

источник

  • КОРРЕЛЯЦИОННЫЕ ПОЛЯ
  • КОРРЕЛЯЦИЯ
  • КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
  • КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ

Исследователей нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых выборках. Например, такая связь может наблюдаться между погрешностью аппаратной обработки экспериментальных данных и величиной скачков сетевого напряжения. Другим примером может служить связь между пропускной способностью канала передачи данных и соотношением сигнал/шум.

В 1886 году английский естествоиспытатель Френсис Гальтон для обозначения характера подобного рода взаимодействий ввёл термин «корреляция». Позже его ученик Карл Пирсон разработал математическую формулу, позволяющую дать количественную оценку корреляционным связям признаков.

Зависимости между величинами (факторами, признаками) разделяют на два вида: функциональную и статистическую.

При функциональных зависимостях каждому значению одной переменной величины соответствует определенное значение другой переменной. Кроме того, функциональная связь двух факторов возможна только при условии, что вторая величина зависит только от первой и не зависит ни от каких других величин. В случае зависимости величины от множества факторов, функциональная связь возможна, если первая величина не зависит ни от каких других факторов, кроме входящих в указанное множество.

Читайте также:  Какие существуют анализы на сифилис

При статистической зависимости изменение одной из величин влечёт изменение распределения других величин, которые с определенными вероятностями принимают некоторые значения.

Значительно больший интерес представляет другой частный случай статистической зависимости, когда существует взаимосвязь значений одних случайных величин со средним значением других, при той особенности, что в каждом отдельном случае любая из взаимосвязанных величин может принимать различные значения.

Такого рода зависимость между переменными величинами называется корреляционной, или корреляцией.

Корреляционный анализ — метод, позволяющий обнаружить зависимость между несколькими случайными величинами.

Корреляционный анализ решает две основные задачи:

  • Первая задача заключается в определении формы связи, т.е. в установлении математической формы, в которой выражается данная связь. Это очень важно, так как от правильного выбора формы связи зависит конечный результат изучения взаимосвязи между признаками.
  • Вторая задача состоит в измерении тесноты, т.е. меры связи между признаками с целью установить степень влияния данного фактора на результат. Она решается математически путем определения параметров корреляционного уравнения.

Затем проводятся оценка и анализ полученных результатов при помощи специальных показателей корреляционного метода (коэффициентов детерминации, линейной и множественной корреляции и т.д.), а также проверка существенности связи между изучаемыми признаками.

Методами корреляционного анализа решаются следующие задачи:

  1. Взаимосвязь. Есть ли взаимосвязь между параметрами?
  2. Прогнозирование. Если известно поведение одного параметра, то можно предсказать поведение другого параметра, коррелирующего с первым.
  3. Классификация и идентификация объектов. Корреляционный анализ помогает подобрать набор независимых признаков для классификации.

Корреляция — статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). Суть ее заключается в том, что при изменении значения одной переменной происходит закономерное изменение (уменьшению или увеличению) другой переменной.

Для определения наличия взаимосвязи между двумя свойствами используется коэффициент корреляции.

Коэффициент корреляции р для генеральной совокупности, как правило, неизвестен, поэтому он оценивается по экспериментальным данным, представляющим собой выборку объема n пар значений (xi, yi), полученную при совместном измерении двух признаков Х и Y. Коэффициент корреляции, определяемый по выборочным данным, называется выборочным коэффициентом корреляции (или просто коэффициентом корреляции). Его принято обозначать символом r.

К основным свойствам коэффициента корреляции относятся:

  1. Коэффициенты корреляции способны характеризовать только линейные связи, т.е. такие, которые выражаются уравнением линейной функции. При наличии нелинейной зависимости между варьирующими признаками следует использовать другие показатели связи.
  2. Значения коэффициентов корреляции – это отвлеченные числа, лежащее в пределах от -1 до +1, т.е. -1 0 имеет место положительная корреляция (с увеличением x значения y в целом имеют тенденцию к возрастанию), при p 0,70);
  3. средняя (при 0,50
  1. Аблеева, А. М. Формирование фонда оценочных средств в условиях ФГОС [Текст] / А. М. Аблеева, Г. А. Салимова // Актуальные проблемы преподавания социально-гуманитарных, естественно — научных и технических дисциплин в условиях модернизации высшей школы : материалы международной научно-методической конференции, 4-5 апреля 2014 г. / Башкирский ГАУ, Факультет информационных технологий и управления. — Уфа, 2014. — С. 11-14.
  2. Ганиева, А.М. Статистический анализ занятости и безработицы [Текст] / А.М. Ганиева, Т.Н. Лубова // Актуальные вопросы экономико-статистического исследования и информационных технологий: сб. науч. ст.: посвящается к 40-летию создания кафедры «Статистики и информационных систем в экономике» / Башкирский ГАУ. — Уфа, 2011. — С. 315-316.
  3. Исмагилов, Р. Р. Творческая группа — эффективная форма организации научных исследований в высшей школе [Текст] / Р. Р. Исмагилов, М. Х. Уразлин, Д. Р. Исламгулов // Научно-технический и научно-образовательный комплексы региона : проблемы и перспективы развития : материалы научно-практической конференции / Академия наук РБ, УГАТУ. — Уфа, 1999. — С. 105-106.
  4. Исламгулов, Д.Р. Компетентностный подход в обучении: оценка качества образования [Текст] / Д.Р. Исламгулов, Т.Н. Лубова, И.Р. Исламгулова // Современный научный вестник. – 2015. – Т. 7. — № 1. – С. 62-69.
  5. Исламгулов, Д. Р. Научно-исследовательская работа студентов — важнейший элемент подготовки специалистов в аграрном вузе [Текст] / Д. Р. Исламгулов // Проблемы практической подготовки студентов в вузе на современном этапе и пути их решения : сб. материалов науч.-метод. конф., 24 апреля 2007 года / Башкирский ГАУ. — Уфа, 2007. — С. 20-22.
  6. Лубова, Т.Н. Основа реализации федерального государственного образовательного стандарта – компетентностный подход [Текст] / Т.Н. Лубова, Д.Р. Исламгулов, И.Р. Исламгулова// БЪДЕЩИТЕ ИЗСЛЕДОВАНИЯ – 2016: Материали за XII Международна научна практична конференция, 15-22 февруари 2016. – София: Бял ГРАД-БГ ООД, 2016. – Том 4 Педагогически науки. – C. 80-85.
  7. Лубова, Т.Н. Новые образовательные стандарты: особенности реализации [Текст] / Т.Н. Лубова, Д.Р. Исламгулов // Современный научный вестник. – 2015. – Т. 7. — № 1. – С. 79-84.
  8. Лубова, Т.Н. Организация самостоятельной работы обучающихся [Текст] / Т.Н. Лубова, Д.Р. Исламгулов // Реализация образовательных программ высшего образования в рамках ФГОС ВО: материалы Всероссийской научно-методической конференции в рамках выездного совещания НМС по природообустройству и водопользованию Федерального УМО в системе ВО. / Башкирский ГАУ. — Уфа, 2016. — С. 214-219.
  9. Лубова, Т.Н. Основа реализации федерального государственного образовательного стандарта – компетентностный подход [Текст] / Т.Н. Лубова, Д.Р. Исламгулов, И.Р. Исламгулова // Современный научный вестник. – 2015. – Т. 7. — № 1. – С. 85-93.
  10. Саубанова, Л.М. Уровень демографической нагрузки [Текст] / Л.М. Саубанова, Т.Н. Лубова // Актуальные вопросы экономико-статистического исследования и информационных технологий: сб. науч. ст.: посвящается к 40-летию создания кафедры «Статистики и информационных систем в экономике» / Башкирский ГАУ. — Уфа, 2011. — С. 321-322.
  11. Фахруллина, А.Р. Статистический анализ инфляции в России [Текст] / А.Р. Фахруллина, Т.Н. Лубова // Актуальные вопросы экономико-статистического исследования и информационных технологий: сб. науч. ст.: посвящается к 40-летию создания кафедры «Статистики и информационных систем в экономике» / Башкирский ГАУ. — Уфа, 2011. — С. 323-324.
  12. Фархутдинова, А.Т. Рынок труда в Республике Башкортостан в 2012 году [Электронный ресурс] / А.Т. Фархутдинова, Т.Н. Лубова // Студенческий научный форум. Материалы V Международной студенческой электронной научной конференции: электронная научная конференция (электронный сборник). Российская академия естествознания. 2013.

Электронное периодическое издание зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), свидетельство о регистрации СМИ — ЭЛ № ФС77-41429 от 23.07.2010 г.

Соучредители СМИ: Долганов А.А., Майоров Е.В.

источник

В научных исследованиях часто возникает необходимость в нахождении связи между результативными и факторными переменными (урожайностью какой-либо культуры и количеством осадков, ростом и весом человека в однородных группах по полу и возрасту, частотой пульса и температурой тела и т.д.).

Вторые представляют собой признаки, способствующие изменению таковых, связанных с ними (первыми).

Существует множество определений термина. Исходя из вышеизложенного, можно сказать, что корреляционный анализ — это метод, применяющийся с целью проверки гипотезы о статистической значимости двух и более переменных, если исследователь их может измерять, но не изменять.

Есть и другие определения рассматриваемого понятия. Корреляционный анализ — это метод обработки статистических данных, заключающийся в изучении коэффициентов корреляции между переменными. При этом сравниваются коэффициенты корреляции между одной парой или множеством пар признаков, для установления между ними статистических взаимосвязей. Корреляционный анализ — это метод по изучению статистической зависимости между случайными величинами с необязательным наличием строгого функционального характера, при которой динамика одной случайной величины приводит к динамике математического ожидания другой.

При проведении корреляционного анализа необходимо учитывать, что его можно провести по отношению к любой совокупности признаков, зачастую абсурдных по отношению друг к другу. Порой они не имеют никакой причинной связи друг с другом.

В этом случае говорят о ложной корреляции.

Исходя из приведенных выше определений, можно сформулировать следующие задачи описываемого метода: получить информацию об одной из искомых переменных с помощью другой; определить тесноту связи между исследуемыми переменными.

Корреляционный анализ предполагает определение зависимости между изучаемыми признаками, в связи с чем задачи корреляционного анализа можно дополнить следующими:

  • выявление факторов, оказывающих наибольшее влияние на результативный признак;
  • выявление неизученных ранее причин связей;
  • построение корреляционной модели с ее параметрическим анализом;
  • исследование значимости параметров связи и их интервальная оценка.

Результативные факторы зависят от одного до нескольких факторов. Метод корреляционного анализа может применяться в том случае, если имеется большое количество наблюдений о величине результативных и факторных показателей (факторов), при этом исследуемые факторы должны быть количественными и отражаться в конкретных источниках. Первое может определяться нормальным законом — в этом случае результатом корреляционного анализа выступают коэффициенты корреляции Пирсона, либо, в случае, если признаки не подчиняются этому закону, используется коэффициент ранговой корреляции Спирмена.

При применении данного метода необходимо определиться с факторами, оказывающими влияние на результативные показатели. Их отбирают с учетом того, что между показателями должны присутствовать причинно-следственные связи. В случае создания многофакторной корреляционной модели отбирают те из них, которые оказывают существенное влияние на результирующий показатель, при этом взаимозависимые факторы с коэффициентом парной корреляции более 0,85 в корреляционную модель предпочтительно не включать, как и такие, у которых связь с результативным параметром носит непрямолинейный или функциональный характер.

Результаты корреляционного анализа могут быть представлены в текстовом и графическом видах. В первом случае они представляются как коэффициент корреляции, во втором — в виде диаграммы разброса.

При отсутствии корреляции между параметрами точки на диаграмме расположены хаотично, средняя степень связи характеризуется большей степенью упорядоченности и характеризуется более-менее равномерной удаленностью нанесенных отметок от медианы. Сильная связь стремится к прямой и при r=1 точечный график представляет собой ровную линию. Обратная корреляция отличается направленностью графика из левого верхнего в нижний правый, прямая — из нижнего левого в верхний правый угол.

Помимо традиционного 2D-представления диаграммы разброса в настоящее время используется 3D-отображение графического представления корреляционного анализа.

Также используется матрица диаграммы рассеивания, которая отображает все парные графики на одном рисунке в матричном формате. Для n переменных матрица содержит n строк и n столбцов. Диаграмма, расположенная на пересечении i-ой строки и j-ого столбца, представляет собой график переменных Xi по сравнению с Xj. Таким образом, каждая строка и столбец являются одним измерением, отдельная ячейка отображает диаграмму рассеивания двух измерений.

Теснота корреляционной связи определяется по коэффициенту корреляции (r): сильная — r = ±0,7 до ±1, средняя — r = ±0,3 до ±0,699, слабая — r = 0 до ±0,299. Данная классификация не является строгой. На рисунке показана несколько иная схема.

В Великобритании было предпринято любопытное исследование. Оно посвящено связи курения с раком легких, и проводилось путем корреляционного анализа. Это наблюдение представлено ниже.

Исходные данные для корреляционного анализа

Шахтеры и работники карьеров

Производители газа, кокса и химических веществ

Изготовители стекла и керамики

Работники печей, кузнечных, литейных и прокатных станов

Работники электротехники и электроники

Инженерные и смежные профессии

Изготовители рабочей одежды

Работники пищевой, питьевой и табачной промышленности

Производители бумаги и печати

Производители других продуктов

Водители стационарных двигателей, кранов и т. д.

Рабочие, не включенные в другие места

Работники транспорта и связи

Складские рабочие, кладовщики, упаковщики и работники разливочных машин

Работники службы спорта и отдыха

Администраторы и менеджеры

Профессионалы, технические работники и художники

Начинаем корреляционный анализ. Решение лучше начинать для наглядности с графического метода, для чего построим диаграмму рассеивания (разброса).

Она демонстрирует прямую связь. Однако на основании только графического метода сделать однозначный вывод сложно. Поэтому продолжим выполнять корреляционный анализ. Пример расчета коэффициента корреляции представлен ниже.

С помощью программных средств (на примере MS Excel будет описано далее) определяем коэффициент корреляции, который составляет 0,716, что означает сильную связь между исследуемыми параметрами. Определим статистическую достоверность полученного значения по соответствующей таблице, для чего нам нужно вычесть из 25 пар значений 2, в результате чего получим 23 и по этой строке в таблице найдем r критическое для p=0,01 (поскольку это медицинские данные, здесь используется более строгая зависимость, в остальных случаях достаточно p=0,05), которое составляет 0,51 для данного корреляционного анализа. Пример продемонстрировал, что r расчетное больше r критического, значение коэффициента корреляции считается статистически достоверным.

Описываемый вид статистической обработки данных может осуществляться с помощью программного обеспечения, в частности, MS Excel. Корреляционный анализ в Excel предполагает вычисление следующих парамет­ров с использованием функций:

1. Коэффициент корреляции определяется с помощью функции КОРРЕЛ [CORREL](массив1; массив2). Массив1,2 — ячейка интервала значений результативных и факторных переменных.

Линейный коэффициент корреляции также называется коэффициентом корреляции Пирсона, в связи с чем, начиная с Excel 2007, можно использовать функцию ПИРСОН (PEARSON) с теми же массивами.

Графическое отображение корреляционного анализа в Excel производится с помощью панели «Диаграммы» с выбором «Точечная диаграмма».

После указания исходных данных получаем график.

2. Оценка значимости коэффициента парной корреляции с использованием t-критерия Стьюдента. Рассчитанное значение t-критерия сравнивается с табличной (критической) величиной данного показателя из соответствующей таблицы значений рассматриваемого параметра с учетом заданного уровня значимости и числа степеней свободы. Эта оценка осуществляется с использованием функции СТЬЮДРАСПОБР (вероятность; степени_свободы).

3. Матрица коэффициентов парной корреляции. Анализ осуществляется с помощью средства «Анализ данных», в котором выбирается «Корреляция». Статистическую оценку коэффициентов парной корреляции осуществляют при сравнении его абсолютной величины с табличным (критическим) значением. При превышении расчетного коэффициента парной корреляции над таковым критическим можно говорить, с учетом заданной степени вероятности, что нулевая гипотеза о значимости линейной связи не отвергается.

Использование в научных исследованиях метода корреляционного анализа позволяет определить связь между различными факторами и результативными показателями. При этом необходимо учитывать, что высокий коэффициент корреляции можно получить и из абсурдной пары или множества данных, в связи с чем данный вид анализа нужно осуществлять на достаточно большом массиве данных.

После получения расчетного значения r его желательно сравнить с r критическим для подтверждения статистической достоверности определенной величины. Корреляционный анализ может осуществляться вручную с использованием формул, либо с помощью программных средств, в частности MS Excel. Здесь же можно построить диаграмму разброса (рассеивания) с целью наглядного представления о связи между изучаемыми факторами корреляционного анализа и результативным признаком.

источник

На основе таблицы данных был проведен корреляционный анализ всей выборки в целом, а также экспериментальной и контрольной группы в отдельности. Полученные результаты корреляционного анализа позволяют говорить о существовании корреляционных взаимосвязей на 5% уровне значимости (со значением коэффициента r >0,28).

В экспериментальной группе пользователей Интернет с помощью корреляционного анализа были выявлены взаимосвязи между 30 признаками (рис.1). Выделим наиболее сильные и важные взаимосвязи для нашего исследования.

Наибольшее количество корреляций оказалось у признаков «Направленность на общение в Интернет»(35) и «Отношение к Интернет»(36).

Рис. 1 Корреляционная плеяда группы «Пользователи Интернет»

Показатель «Направленность на общение в Интернет»(35) имеет положительные взаимосвязи с показателями: «Потребность в психической саморегуляции»(8) (r=0,28), «Самопознание»(13) (r=0,31), «Общий уровень психологической культуры»(19) (r=0,37). Общение в среде Интернет развивает саморегуляцию во время диалога с собеседником. Как отмечалось нами ранее, отличительной особенностью общения посредством Интернет является тот факт, что существует время на обдумывание каждой своей фразы, на ее построение и эмоциональную окраску. Также этот показатель связан со следующими показателями: «Компромисс»(22) (r=0,3) и «Сотрудничающий стиль межличностных отношений»(31) (r=0,29). В Интернете перед человеком открываются широкие просторы завязыванию новых знакомств с людьми выше себя по социальному статусу и гораздо старше себя. Как известно, общение с разными по возрасту и статусу людьми способствует проигрыванию множества социальных ролей и лучшему узнаванию собственных способностей в коммуникации, оно стимулирует самопознание и рефлексию. Кроме того, для поддержания отношений с новыми знакомыми требуется умение быть гибким в конфликтных ситуациях, умение быть чутким и внимательным к окружающим. Сотрудничающий стиль отношений свойственен общительным и открытым людям.

«Отношение к Интернет»(36) имеет положительные взаимосвязи с показателями «Сотрудничающий стиль межличностных отношений»(31) (r=0,29) и «Общий уровень культурно-психологических потребностей»(12) (r=0,36). Общительный и гибкий в принятии решений человек чаще воспринимает Интернет как положительное явление в жизни общества, так как он дает возможность реализовываться многим потребностям личности, в том числе и психологическим, что способствует их развитию, осознанию и усилению.

Наиболее сильная корреляция наблюдается у показателя «Отношение к Интернет»(36) с показателем «Направленность на информацию в Интернет»(34) (r=0,73), что свидетельствует о большом значении глобальной сети для пользователей, как источника информации. Кроме материалов для общего образования в Сети можно получить справку почти по любому интересующему вопросу, например, в виде on-line консультаций специалистов. Вполне логично утверждение, что чем больше полезной информации получит человек в Сети, тем лучше он будет относиться к Интернет.

Показатель «Пол»(1) имеет отрицательную корреляцию с показателем «Уровень интернет-зависимости»(33) (r=-0,52), из чего мы можем сделать вывод о более выраженной тенденции к зависимости от Интернет у юношей. Это объясняется тем фактом, что юноши больше играют в компьютерные игры и быстрее осваивают компьютер, лучше владеют управлением сложной техники, а также больше времени проводят в сети, что приводит к риску психологической зависимости от Интернет.

Также этот показатель отрицательно взаимосвязан с показателями «Авторитарный стиль межличностных отношений»(25) (r=-0,29) и «Сотрудничающий стиль межличностных отношений»(31) (r= -0,32). У юношей ярче выражено стремление к доминированию и лидерству, но также им важно мнение окружающих и они ориентированы на кооперацию в отношениях при условии получения выгоды от этих отношений.

«Самооценка»(3) отрицательно коррелирует с показателем «Авторитарный стиль межличностных отношений»(25) (r=-0,39) в группе пользователей Интернет. Этот стиль отношений характеризуется легкостью и быстротой в принятии решений, выраженным мотивом достижения и общей оптимистичностью. Все это способствует формированию адекватной самооценки с тенденцией к ее завышению.

Отрицательная взаимосвязь была выявлена между показателями «Компромисс»(22) и «Готовность обращения к психологу»(4) (r=0,-28). Вероятно, неумение идти на уступки в конфликтной ситуации может быть одной из причин обращения к психологу, что может указывать на потребность человека в подборе оптимальной модели поведения в зависимости от складывающейся жизненной ситуации. Также, признак «Готовность обращения к психологу»(4) оказался связанным с показателем «Уровень интернет-зависимости»(33) (r=0,38), что можно объяснить следующим образом. В нашем исследовании участвовали студенты старших курсов 19-25 лет, люди зрелые, которые способны признавать наличие у себя слабостей и пороков, т.е. склонны к самокритике и самоанализу. Следовательно, можно предположить, что усиление некоторых недостатков, может спровоцировать обращение к специалисту-психологу по поводу личной проблемы, такой как зависимость от чего-либо, например от Интернет. Чем больше риск попасть в эту зависимость, тем выше шанс, что этот человек обратится за психологической помощью.

Кроме того, показатель «Уровень интернет-зависимости»(33) имеет отрицательную корреляцию с «Потребностью в конструктивном ведении дела»(10) (r=-0,38), что свидетельствует о необходимости осуществлять постоянный самоконтроль, за временем которое пользователь проводит в Сети. Поскольку количество времени потраченного на нахождение в Интернет прямо пропорционально достигнутым результатам за день, следовательно, отсутствие контроля над временем, проводимого в Сети, отрицательно сказывается как на распорядке дня в целом, так и на достигнутых результатах.

Как видно из анализа показатель «Потребность в конструктивном ведении дела»(10) также отрицательно коррелирует с показателем «Приспособление»(24) (r=-0,30). Данный результат указывает на то, что склонность к жертвованию своих интересов ради интересов другого человека является препятствующим фактором, так как для эффективного ведения дел требуется динамичность, в некоторых случаях даже определенная степень агрессивности, гибкость и адекватность действий в соответствии с требованиями ситуации, для выполнения запланированного.

Положительная корреляция была обнаружена между показателями «Сотрудничающий стиль межличностных отношений»(31) и «Самопознание»(13) (r=0,31). Глубокий самоанализ, стремление к конструктивному самоотношению и самооценке свойственен людям с эмоциональной неустойчивостью и высоким уровнем тревожности.

Показатель «Потребность в гармоничном саморазвитии»(11) имеет положительную корреляцию с показателем «Подчиняемый стиль межличностных отношений»(29) (r=0,31) и отрицательную с «Авторитарным стилем межличностных отношений»(25) (r=-0,28). Это указывает на то, что у неуверенных в себе людях, легко поддающихся влиянию извне, сила потребности в гармонизации и фиксировании личностных установок выше. Они нуждаются в поддержке, в выработке независимости от мнения окружающих и переориентации на свои ценности и суждения. Уверенным и напористым индивидам забота о самосовершенствовании и улучшении личностных качеств наименее свойственна.

Показатель «Сотрудничество»(21) был обнаружен со следующими важными корреляциями. Во-первых, он положительно коррелирует с «Потребностью в психической саморегуляции»(8) (r=0,33), с «Общим уровнем культурно-психологических потребностей»(12) (r=0,40) и с «Потребностью в конструктивном общении»(7) (r=0,54), во-вторых, он отрицательно коррелирует с показателем «Избежание»(23) (r=0,38). Данные результаты указывают на то, что сотрудничество, являясь наиболее эффективным способом разрешения конфликта, требует от человека достаточно высокой степени напряжения для контроля своих мыслей и поступков. Из этого следует, что у индивида усиливается потребность в психической саморегуляции. Способный к сотрудничеству человек редко использует стратегию ухода от решения сложных вопросов, хотя это требует меньших затрат психологических ресурсов человека. Кроме всего этого, сотрудничество мы рассматриваем как один из показателей высокого уровня психологической культуры личности.

С помощью корреляционного анализа в группе непользователей Интернет были выявлены взаимосвязи на 5%-ном уровне значимости между 29 показателями (со значением коэффициента r > 0,28) (рис. 2).

Как видно из корреляционной плеяды на Рис.2, были получены совершенно иные взаимосвязи на группе «Непользователи Интернет», чем на экспериментальной группе нашей выборки. Среди них выделим наиболее важные для нашего исследования показатели.

Были выявлены отрицательные корреляции показателя «Общий уровень культурно-психологических потребностей»(12) с показателями «Пол»(1) (r=-0,3) и «Агрессивный стиль межличностных отношений»(27) (r=-0,31). Получается, что среди непользователей Интернет тенденцию к более высокому уровню основных психологических потребностей имеют юноши.

Рис.2 Корреляционная плеяда группы «Непользователи»

Показатель «Агрессивный стиль межличностных отношений»(27) оказался связанным с «Общим уровнем психологической культуры»(19) (r=0,32). Данная взаимосвязь может объясняться тем фактом, что реальная ситуация в настоящее время складывается таким образом, что каждому человеку приходится испытывать сильную конкуренцию например при приеме на работу, что требует собранности, упорности, некоторой степени жесткости и умения доказывать свои способности.

«Готовность обращения к психологу»(4) отрицательно взаимосвязана с показателями «Самооценка»(3) (r=-0,31) и «Психологическая грамотность»(5) (r=-0,31). У непользователей обнаруживается склонность к переоценке своих психологических возможностей в жизнедеятельности. Высокая самооценка и высокая психологическая грамотность снижают вероятность обращения за психологической помощью, так как человек чаще полагается на свои собственные силы в решении проблем. «Возраст»(2) положительно коррелирует с показателем «Потребность в самопознании»(6) (r=0,35). Из этого мы можем сделать вывод о том, что склонность к самоанализу возрастает по мере того, как у человека появляется жизненный опыт, и он становится старше.

«Соперничество»(20) и «Авторитарный стиль межличностных отношений»(25) имеют положительную взаимосвязь умеренной силы (r=0,31). Человек с властно-лидирующим типом межличностных отношений в конфликтных ситуациях чаще прибегает к стратегии соперничества, стараясь отстоять, прежде всего, свои собственные интересы. Так проявляется его тенденция к доминированию, завоевательная позиция и стремление быть сильнее окружающих.

Была выявлена положительная корреляция между показателями «Альтруистический стиль тип межличностных отношений»(32) «Компромисс»(22) (r=0,30) и «Сотрудничающий стиль межличностных отношений»(31) (r=0,35). Как правило, в конфликтной ситуации первым на уступки идет тот человек, которому свойственны высокая восприимчивость и отзывчивость, дружелюбие и мягкость, зависимость от мнения значимых других и потребность нравиться окружающим. Для такого человека трудно отстаивать свои интересы, так как важнее оказывается производить приятное впечатление, чем вызвать отрицательные эмоции у собеседника. Взаимосвязь показателей «Гармоничное саморазвитие»(18) и «Самопознание»(13) (r=0,35) говорит о единстве этих аспектов психологической культуры человека. Позитивное самоотношение и адекватная самооценка являются неотъемлемым условием гармоничного развития человека, гармоничности его личностных установок, желаний, эмоций, представлений о себе, окружающем мире, людях и природе. Чтобы все стремления человека были в равновесии, а способности реализованы, необходима ежедневная работа над самим собой, над своим стилем мышления и поведения.

Корреляционный анализ был проведен на всей выборке в целом. На Рис. 3 изображены основные умеренно-сильные взаимосвязи на 5%-ном уровне значимости между 27 показателями (со значением коэффициента r >0,22).

Рис.3 Корреляционная плеяда всей выборки

Показатель «Пол»(1) имеет положительную корреляцию с «Потребностью в конструктивном общении»(7) (r=0,33) и отрицательную с «Самооценкой»(3) (r= -0,32). Это указывает на то, что девушки чаще, чем юноши этого же возраста имеют высокую потребность в налаживании и поддерживании контактов, в умении заводить знакомства и поддерживать отношения с большим количеством друзей и близких. Девушки склонны к высокому самомнению, позитивной самооценке с тенденцией к ее завышению.

«Потребность в самопознании»(6) положительно коррелирует с показателем «Возраст»(2) (r=0,27). Из этого мы можем сделать вывод о том, что с возрастом возрастает склонность к самоанализу. Развитие высших потребностей и способностей к саморефлексии человека прямо пропорционально его годам и жизненному опыту.

Сильная взаимосвязь была обнаружена между показателями «Самооценка»(3) и «Готовность обращения к психологу»(4) (r=0,58), из чего мы можем сделать вывод о том, что потенциальными клиентами психологов-консультантов являются люди с заниженной самооценкой, с проблемами внутриличностного плана. Высокий уровень тревожности, неуверенность в себе, зависимость от средовых воздействий мешают нормальной жизнедеятельности и вызывают желание изменить себя, прибегнув к помощи специалиста.

Кроме того, «Самооценка»(3) связана с показателями «Психологическая грамотность»(5) (r=0,25) и «Потребность в конструктивном общении»(7) (r=0,22). При общей эрудированности и знании основных психологических понятий представление о себе характеризуется адекватностью и позитивностью. Пониженная самооценка может быть как причиной, так и следствием проблем в общении человека, что мотивирует к повышению эффективности коммуникативной сферы.

«Готовность обращения к психологу»(4) и «Психологическая грамотность»(5) положительно коррелируют с показателем «Общий уровень культурно-психологических потребностей»(12) (r=0,28 и r=0,35). Высокие потребности человека в самосовершенствовании детерминированы общим интересом к психологии, открытостью к новому опыту и заботой о собственном здоровье. Понимание основных процессов в психике человека способствует психологической грамотности в целом.

«Общий уровень культурно-психологических потребностей»(12) взаимосвязан с показателем «Сотрудничество»(21) (r=0,22), что говорит о формировании высокой культуры человека при умении наиболее спокойно и эффективно вести себя в критических ситуациях, разрешать любой конфликт конструктивным способом, учитывая интересы всех сторон. Зрелая психологическая культура выражается в поведении и общении, особенно ярко ее уровень обнаруживается в трудных ситуациях взаимодействия с другими субъектами.

«Общий уровень психологической культуры»(19) и «Психологическая грамотность»(5) имеют положительную взаимосвязь (r=0,26). Психологическая грамотность, являясь начальным уровнем психологической культуры, определяет дальнейшее развитие специфических способностей и умений личности. Без знаний основ психологии невозможно развитие зрелой психологической культуры.

Достаточно сильная взаимосвязь выявлена между «Общим уровнем культурно-психологических потребностей»(12) и «Общим уровнем психологической культуры»(19) (r=0,41). Стремление к гармоничному развитию всех своих способностей обуславливает уровень психологической культуры личности.

Показатель «Сотрудничество»(21) коррелирует с показателями «Потребность в конструктивном общении»(7) (r=0,32) «Потребность в психической саморегуляции»(8) (r=0,29). Стратегия сотрудничества как наиболее эффективный способ урегулирования конфликта требует больших психических затрат на саморегуляцию. Конструктивное общение требует определенных усилий для реализации, так как окружающие могут вести себя прямо противоположно (например, агрессивно или деструктивно) и вызывать отрицательные эмоции.

«Общий уровень психологической культуры»(19) имеет отрицательную корреляцию с показателем «Авторитарный стиль межличностных отношений»(25) (r=-0,20). Психологическая культура как механизм социальной регуляции препятствует спонтанности в поведении человека. Прежде чем сказать что-либо или сделать, необходимо обдумать свое действие — это приводит к гармонизации отношений между людьми. Итак, мы рассмотрели результаты корреляционного анализа трех групп выборки. Следующим этапом нашего исследования стал факторный анализ.

источник

Тема: Корреляционный анализ

Задание: Рассчитать полным факторным экспериментом влияние давления, жирности и кислотности на качество продукции

1.1 Понятие корреляционной связи

1.2 Общая классификация корреляционных связей

1.3 Корреляционные поля и цель их построения

1.4 Этапы корреляционного анализа

1.5 Коэффициенты корреляции

1.6 Нормированный коэффициент корреляции Браве-Пирсона

1.7 Коэффициент ранговой корреляции Спирмена

1.8 Основные свойства коэффициентов корреляции

1.9 Проверка значимости коэффициентов корреляции

1.10 Критические значения коэффициента парной корреляции

2. Планирование многофакторного эксперимента

2.2 Определение центр плана (основной уровень) и уровня варьирования факторов

2.3 Построение матрицы планирования

2.4 Проверка однородности дисперсии и равноточности измерения в разных сериях

2.5 Коэффициенты уравнения регрессии

2.6 Дисперсия воспроизводимости

2.7 Проверка значимости коэффициентов уравнения регрессии

2.8 Проверка адекватности уравнения регрессии

Планирование эксперимента -математико-статистическая дисциплина, изучающая методы рациональной организации экспериментальных исследований — от оптимального выбора исследуемых факторов и определения собственно плана эксперимента в соответствии с его целью до методов анализа результатов. Начало планирования эксперимента положили труды английского статистика Р.Фишера (1935), подчеркнувшего, что рациональное планирование экспериментадаёт не менее существенный выигрыш в точности оценок, чем оптимальная обработка результатов измерений. В 60-х годах 20 века сложилась современная теория планирования эксперимента. Её методы тесно связаны с теорией приближения функций и математическим программированием. Построены оптимальные планы и исследованы их свойства для широкого класса моделей.

Планирование эксперимента – выбор плана эксперимента, удовлетворяющего заданным требованиям, совокупность действий направленных на разработку стратегии экспериментирования (от получения априорной информации до получения работоспособной математической модели или определения оптимальных условий). Это целенаправленное управление экспериментом, реализуемое в условиях неполного знания механизма изучаемого явления.

В процессе измерений, последующей обработки данных, а также формализации результатов в виде математической модели, возникают погрешности и теряется часть информации, содержащейся в исходных данных. Применение методов планирования эксперимента позволяет определить погрешность математической модели и судить о ее адекватности. Если точность модели оказывается недостаточной, то применение методов планирования эксперимента позволяет модернизировать математическую модель с проведением дополнительных опытов без потери предыдущей информации и с минимальными затратами.

Цель планирования эксперимента – нахождение таких условий и правил проведения опытов при которых удается получить надежную и достоверную информацию об объекте с наименьшей затратой труда, а также представить эту информацию в компактной и удобной форме с количественной оценкой точности.

Среди основных методов планирования, применяемых на разных этапах исследования, используют:

— планирование отсеивающего эксперимента, основное значение которого выделение из всей совокупности факторов группы существенных факторов, подлежащих дальнейшему детальному изучению;

— планирование эксперимента для дисперсионного анализа, т.е. составление планов для объектов с качественными факторами;

— планирование регрессионного эксперимента, позволяющего получать регрессионные модели (полиномиальные и иные);

— планирование экстремального эксперимента, в котором главная задача – экспериментальная оптимизация объекта исследования;

— планирование при изучении динамических процессов и т.д.

Целью изучения дисциплины является подготовка студентов к производственно-технической деятельности по специальности с применением методов теории планирования и современных информационных технологий.

Задачи дисциплины: изучение современных методов планирования, организации и оптимизации научного и промышленного эксперимента, проведения экспериментов и обработки полученных результатов.

1.1 Понятие корреляционной связи

Исследователя нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых выборках. Например, может ли рост влиять на вес человека или может ли давление влиять на качество продукции?

Такого рода зависимость между переменными величинами называется корреляционной, или корреляцией. Корреляционная связь — это согласованное изменение двух признаков, отражающее тот факт, что изменчивость одного признака находится в соответствии с изменчивостью другого.

Известно, например, что в среднем между ростом людей и их весом наблюдается положительная связь, и такая, что чем больше рост, тем больше вес человека. Однако из этого правила имеются исключения, когда относительно низкие люди имеют избыточный вес, и, наоборот, астеники, при высоком росте имеют малый вес. Причиной подобных исключений является то, что каждый биологический, физиологический или психологический признак определяется воздействием многих факторов: средовых, генетических, социальных, экологических и т.д.

Корреляционные связи — это вероятностные изменения, которые можно изучать только на представительных выборках методами математической статистики. Оба термина — корреляционная связь и корреляционная зависимость — часто используются как синонимы. Зависимость подразумевает влияние, связь — любые согласованные изменения, которые могут объясняться сотнями причин. Корреляционные связи не могут рассматриваться как свидетельство причинно-следственной зависимости, они свидетельствуют лишь о том, что изменениям одного признака, как правило, сопутствуют определенные изменения другого.

Корреляционная зависимость это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака.

Задача корреляционного анализа сводится к установлению направления (положительное или отрицательное) и формы (линейная, нелинейная) связи между варьирующими признаками, измерению ее тесноты, и, наконец, к проверке уровня значимости полученных коэффициентов корреляции.

Корреляционные связи различаютсяпо форме, направлению и степени (силе).

По форме корреляционная связь может быть прямолинейной или криволинейной. Прямолинейной может быть, например, связь между количеством тренировок на тренажере и количеством правильно решаемых задач в контрольной сессии. Криволинейной может быть, например, связь между уровнем мотивации и эффективностью выполнения задачи (рисунок 1). При повышении мотивации эффективность выполнения задачи сначала возрастает, затем достигается оптимальный уровень мотивации, которому соответствует максимальная эффективность выполнения задачи; дальнейшему повышению мотивации сопутствует уже снижение эффективности.

Рисунок 1 — Связь между эффективностью решения задачи и силой мотивационной тенденции

По направлению корреляционная связь может быть положительной («прямой») и отрицательной («обратной»). При положительной прямолинейной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака — низкие значения другого (рисунок 2). При отрицательной корреляции соотношения обратные (рисунок 3). При положительной корреляции коэффициент корреляции имеет положительный знак, при отрицательной корреляции — отрицательный знак[1].

Рисунок 2 – Прямая корреляция

Рисунок 3 – Обратная корреляция

Рисунок 4 – Отсутствие корреляции

Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции. Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции.

1.2 Общая классификация корреляционных связей

В зависимости от коэффициента корреляции различают следующие корреляционные связи:

— сильная, или тесная при коэффициенте корреляции r>0,70;

источник

Существенным моментом в статистических исследованиях является выявление зависимости между переменными, характеризующими различные свойства объектов.

Между случайными величинами и может существовать:

1. Функциональная взаимосвязь — зависимость, при которой каждому значению переменно соответствует точно определенной значение .

2. Стохастическая взаимосвязь — связь, при которой изменение значения одной переменной приводит к изменению закона распределения.

3. Статистическая взаимосвязь — зависимость, при которой значение одной переменной изменяется в среднем от того, какие значения принимает другая переменная.

Задачей корреляционного анализа является доказательство наличия этой связи и ее силы. Выявление характера (в аналитической форме) этой связи относится к классу задач регрессионного анализа.

Если совместное распределение и является нормальным, то статистические выводы основывают на выборочном коэффициенте линейной корреляции, в остальных случаях используют коэффициенты ранговой корреляции Кендалла и Спирмена, а для качественных признаков – критерий хи-квадрат.

Независимо от типа, две или более переменных связаны (зависимы) между собой, если наблюдаемые значения этих переменных распределены согласованным образом. Другими словами, мы говорим, что переменные зависимы, если их значения систематическим образом согласованы друг с другом в имеющихся у нас наблюдениях.

Рассмотрим способы измерения связи между двумя случайными переменными. Пусть исходными данными является набор случайных векторов

Выборочной ковариацией, или корреляционным моментом, называется величина

, (6.5)

где , – средние значения величин.

Ковариация описывает как степень разброса возможных значений случайных величин относительно своих средних значений, так и статистическую связь между ними. Для описания собственно степени статистической связи между случайными величинами используют безразмерную величину, называемую парным коэффициентом корреляции.

Выборочным линейным парным коэффициентом корреляции Пирсона называется величина :

(6.6)

Коэффициент корреляции Пирсона имеет четкий смысл как характеристика степени тесноты связи только для нормально распределенных величин. Значение
свидетельствует о наличии полной функциональной зависимости между этими величинами, в то время как значение говорит об их полной независимости.

Коэффициент корреляции Пирсона , средние и дисперсии нормально распределенных случайных величин и дают исчерпывающие сведения об их стохастической зависимости, так как однозначно определяют их двумерный закон распределения.

Статистическую связь между переменными и можно наглядно продемонстрировать с помощью диаграмм рассеяния. Точки данных на диаграмме изображаются точками в двумерном пространстве, где оси соответствуют переменным. Две координаты ( и ), которые определяют положение каждой точки, соответствуют значениям двух переменных для этой точки. Если две переменные сильно связаны, то множество точек данных принимает определенную форму (например, прямой линии или кривой). Если же переменные не связаны, то точки образуют «облако». На рис. 6.5 представлены примеры диаграмм рассеяния для различных значений коэффициента корреляции.

Рис. 6.5. Примеры диаграмм рассеяния для различных значений коэффициента корреляции

Предположим, что необходимо выполнить исследование зависимости между среднемесячными доходами X на семью (в тыс. руб.) и расходами Y на покупку кондитерских изделий (в руб.). Целями исследования зависимости между переменными являются доказательство наличия связи между ним и изучение этой связи. Для доказательства наличия связи между двумя случайными величинами и применяют корреляционный анализ. На основе данных наблюдений построена матрица корреляции и диаграмма размещения (рис.6.6) с использованием возможностей аналитической платформы Deductor.

Анализ рис. 6.6 позволяет сделать вывод о наличии сильной линейной статистической связи между среднемесячными доходами семьи и затратами на приобретение ею кондитерских изделий. При этом связь имеет положительную тенденцию, т.е. с ростом переменной наблюдается увеличение отклика .

Коэффициент корреляции Пирсона представляет собой меру линейной зависимости двух переменных. Если возвести его в квадрат, то полученное значение коэффициента детерминации представляет долю вариации, общую для двух переменных (иными словами, степень зависимости или связанности двух переменных). Чтобы оценить зависимость между переменными, нужно знать как «величину» корреляции, так и ее значимость.

Рис. 6.6. Результаты корреляционного анализа данных

Уровень значимости, вычисленный для каждой корреляции, представляет собой главный источник информации о надежности корреляции. Критерий значимости основывается на предположении, что распределение остатков (т.е. отклонений наблюдений от регрессионной прямой) для зависимой переменной является нормальным (с постоянной дисперсией для всех значений независимой переменной ). Исследования методом Монте-Карло показали, что нарушение этих условий не является абсолютно критичным, если размеры выборки не слишком малы, а отклонения от нормальности не очень большие.

Следует подчеркнуть, что при изучении зависимостей очень важным является построение и изучение диаграмм рассеяния. Основные проблемы могут быть связаны с выбросами (рис. 6.7), неоднородностью данных, нелинейной зависимостью. Обычно считается, что выбросы представляют собой случайную ошибку, которую следует контролировать. Очевидно, что выбросы могут не только искусственно увеличить значение коэффициента корреляции, но и уменьшить существующую корреляцию. В статистических исследованиях применяют различные численные методы удаления выбросов. Например, исключаются все значения, которые выходят за границы ±2 стандартных отклонений вокруг выборочного среднего.

Отсутствие однородности в выборке также является фактором, смещающим (в ту или иную сторону) выборочную корреляцию. Коэффициент корреляции может быть вычислен по данным, которые поступили из двух или нескольких групп, различающихся по коррелированности признаков. Таким образом, данные каждой группы сильно различаются на диаграмме рассеяния (рис. 6.8). В данном примере высокая корреляция вовсе не отражает «истинную» зависимость между двумя переменными, которая практически отсутствует (рис. 6.8 и рис. 6.9). Если разбиение данных на группы не очевидно, применяются многомерные методы разведочного анализа, например, кластерный анализ.

Рис. 6.7. Влияние выброса на значение коэффициента корреляции[9]

Рис. 6.8. Диаграмма рассеяния для неоднородных групп

Рис. 6.9. Коэффициенты корреляции, полученные для каждой группы в отдельности[10]

Коэффициент корреляция Пирсона хорошо подходит для описания линейной зависимости. Использование r как меры зависимости между произвольными и может привести к ошибочным выводам, так как может равняться нулю даже тогда, когда строго зависит от .

Для количественных переменных, не подчиняющихся нормальному распределению, а также для переменных, принадлежащих к порядковой шкале, вместо коэффициента Пирсона используются непараметрические коэффициенты корреляции. К ним относятся коэффициент ранговой корреляции Спирмена, коэффициент ранговой корреляции Кендалла и др.

Ранговые коэффициенты определяются не непосредственно через значения переменных, а через их ранги. Для этого отдельным значениям переменных присваиваются ранговые места, которые впоследствии обрабатываются с помощью соответствующих формул.

Для расчета непараметрического коэффициента ранговой корреляции Спирмена необходимо предварительно рассчитать ранги для всех значений вариационных рядов и , то есть для каждого рассчитать его ранг в вариационном ряду, построенном по выборке, для каждого рассчитать его ранг в вариационном ряду, построенном по выборке. Затем для набора из (i = 1, . n) пар рангов вычисляется линейный коэффициент корреляции.

Коэффициент ранговой корреляции Спирмена рассчитывается по формуле:

(6.7)

Для совпадающих ранжировок , а для противоположных он равен -1. Во всех остальных случаях .

Следует подчеркнуть, что коэффициент ранговой корреляции Спирмена остается постоянным при любом строго возрастающем преобразовании шкалы измерения результатов наблюдений. Другими словами, он является адекватным в порядковой шкале, как и другие ранговые статистики.

В качестве примера выявим взаимосвязь между уровнем развития предпринимательства и уровнем государственной поддержки в регионах России. Уровень развития предпринимательства будем оценивать по интегральному индексу развития малого и среднего предпринимательства , учитывающему следующие показатели оценки:

· количество субъектов малого и среднего предпринимательства в расчете на 100 тыс. жителей региона;

· доля среднесписочной численности занятых на малых и средних предприятиях в общей среднесписочной численности занятых в регионе;

· выручка от реализации товаров (работ, услуг) малых и средних предприятий в расчете на 1 занятого на малых и средних предприятиях;

· объем инвестиций в основной капитал малых и средних предприятий в расчете на 1 занятого на малых и средних предприятиях.

При расчете индекса учитывались результаты деятельности как малых (включая микро) и средних предприятий, так и индивидуальных предпринимателей. Результаты проведенной оценки и их ранжирование представлены в таблице 6.1.

Проведенные расчеты показывают фактическое отсутствие статистически значимой связи между объемами оказываемой государством поддержки и результатами деятельности субъектов малого и среднего предпринимательства в регионах. Так, согласованность рангов по двум индексам оказалась крайне низкой (значение коэффициента корреляции рангов Спирмена составило 0,123), что указывает на то, что в рамках модельных упрощений объемы оказанной государственной поддержки не значительно влияют на место региона по уровню развития малого и среднего предпринимательства среди других регионов.

Не нашли то, что искали? Воспользуйтесь поиском:

Лучшие изречения: Для студентов недели бывают четные, нечетные и зачетные. 9566 — | 7484 — или читать все.

источник