Tishanskiysdk.ru

Про кризис и деньги
4 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Корреляционный анализ пирсона

Корреляционный анализ пирсона

Рассчитываем эмпирическую величину коэффициента корреляции по формуле:

Определяем критические значения для полученного коэффициента корреляции по табл. 19 приложения 6.

Отметим, что в табл. 19 приложения 6 величины критических значений коэффициентов линейной корреляции Пирсона даны по абсолютной величине. Следовательно, при получении как положительного, так и отрицательного коэффициента корреляции по формуле оценка уровня значимости этого коэффициента проводится по той же таблице приложения без учета знака, а знак добавляется для дальнейшей интерпретации характера связи между переменными X и Y.

При нахождении критических значений для вычисленного коэффициента корреляции Пирсона число степеней свободы рассчитывается как .

В нашем случае k = 20, поэтому n — 2 = 20 — 2 = 18. В первом столбце табл. 19 приложения 6 в строке, обозначенной числом 18, находим :

0,44 для P 0,05

0,56 для P 0,01

Строим соответствующую «ось значимости»:

Ввиду того, что величина расчетного коэффициента корреляции попала в зону значимости — отвергается и принимается гипотеза . Иными словами, связь между временем решения наглядно-образных и вербальных задач статистически значима на 1% уровне и положительна. Полученная прямо пропорциональная зависимость говорит о том, что чем выше среднее время решения наглядно-образных задач, тем выше среднее время решения вербальных и наоборот.

Для применения коэффициента корреляции Пирсона, необходимо соблюдать следующие условия:

Сравниваемые переменные должны быть получены в интервальной шкале или шкале отношений.

Распределения переменных X и Y должны быть близки к нормальному.

Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым.

Таблицы уровней значимости для коэффициента корреляции Пирсона (таблица 19 приложения 6) рассчитаны от n = 5 до n = 1000. Оценка уровня значимости по таблицам осуществляется при числе степеней свободы k = n — 2.

Пример нахождения коэффициента корреляции

Другие варианты формул:
или

Кxy — корреляционный момент (коэффициент ковариации)

Для нахождения линейного коэффициента корреляции Пирсона необходимо найти выборочные средние x и y , и их среднеквадратические отклонения σx = S(x), σy = S(y):

Свойства коэффициента корреляции

  1. |rxy| ≤ 1;
  2. если X и Y независимы, то rxy=0, обратное не всегда верно;
  3. если |rxy|=1, то Y=aX+b, |rxy(X,aX+b)|=1, где a и b постоянные, а ≠ 0;
  4. |rxy(X,Y)|=|rxy(a1X+b1, a2X+b2)|, где a1, a2, b1, b2 – постоянные.

Поэтому для проверки направления связи выбирается проверка гипотезы при помощи коэффициента корреляции Пирсона с дальнейшей проверкой на достоверность при помощи t-критерия (пример см. ниже).

  • Решение онлайн
  • Видеоинструкция
  • Оформление Word
  • Типовые задачи

Вместе с этим калькулятором также используют следующие:
Уравнение множественной регрессии

Пример . На основе данных, приведенных в Приложении 1 и соответствующих Вашему варианту (таблица 2), требуется:

  1. Рассчитать коэффициент линейной парной корреляции и построить уравнение линейной парной регрессии одного признака от другого. Один из признаков, соответствующих Вашему варианту, будет играть роль факторного (х), другой – результативного (y). Причинно-следственные связи между признаками установить самим на основе экономического анализа. Пояснить смысл параметров уравнения.
  2. Определить теоретический коэффициент детерминации и остаточную (необъясненную уравнением регрессии) дисперсию. Сделать вывод.
  3. Оценить статистическую значимость уравнения регрессии в целом на пятипроцентном уровне с помощью F-критерия Фишера. Сделать вывод.
  4. Выполнить прогноз ожидаемого значения признака-результата y при прогнозном значении признака-фактора х, составляющим 105% от среднего уровня х. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал с вероятностью 0,95.

Решение. Уравнение имеет вид y = ax + b
Средние значения

Линейный коэффициент корреляции Пирсона

Обнаружение взаимосвязей между явлениями – одна из главных задач статистического анализа. На то есть две причины. Первая. Если известно, что один процесс зависит от другого, то на первый можно оказывать влияние через второй. Вторая. Даже если причинно-следственная связь отсутствует, то по изменению одного показателя можно предсказать изменение другого.

Взаимосвязь двух переменных проявляется в совместной вариации: при изменении одного показателя имеет место тенденция изменения другого. Такая взаимосвязь называется корреляцией, а раздел статистики, который занимается взаимосвязями – корреляционный анализ.

Корреляция – это, простыми словами, взаимосвязанное изменение показателей. Она характеризуется направлением, формой и теснотой. Ниже представлены примеры корреляционной связи.

Далее будет рассматриваться только линейная корреляция. На диаграмме рассеяния (график корреляции) изображена взаимосвязь двух переменных X и Y. Пунктиром показаны средние.

При положительном отклонении X от своей средней, Y также в большинстве случаев отклоняется в положительную сторону от своей средней. Для X меньше среднего, Y, как правило, тоже ниже среднего. Это прямая или положительная корреляция. Бывает обратная или отрицательная корреляция, когда положительное отклонение от средней X ассоциируется с отрицательным отклонением от средней Y или наоборот.

Линейность корреляции проявляется в том, что точки расположены вдоль прямой линии. Положительный или отрицательный наклон такой линии определяется направлением взаимосвязи.

Крайне важная характеристика корреляции – теснота. Чем теснее взаимосвязь, тем ближе к прямой точки на диаграмме. Как же ее измерить?

Складывать отклонения каждого показателя от своей средней нет смысла, получим нуль. Похожая проблема встречалась при измерении вариации, а точнее дисперсии. Там эту проблему обходят через возведение каждого отклонения в квадрат.

Квадрат отклонения от средней измеряет вариацию показателя как бы относительно самого себя. Если второй множитель в числителе заменить на отклонение от средней второго показателя, то получится совместная вариация двух переменных, которая называется ковариацией.

Чем больше пар имеют одинаковый знак отклонения от средней, тем больше сумма в числителе (произведение двух отрицательных чисел также дает положительное число). Большая положительная ковариация говорит о прямой взаимосвязи между переменными. Обратная взаимосвязь дает отрицательную ковариацию. Если количество совпадающих по знаку отклонений примерно равно количеству не совпадающих, то ковариация стремится к нулю, что говорит об отсутствии линейной взаимосвязи.

Таким образом, чем больше по модулю ковариация, тем теснее линейная взаимосвязь. Однако значение ковариации зависит от масштаба данных, поэтому невозможно сравнивать корреляцию для разных переменных. Можно определить только направление по знаку. Для получения стандартизованной величины тесноты взаимосвязи нужно избавиться от единиц измерения путем деления ковариации на произведение стандартных отклонений обеих переменных. В итоге получится формула коэффициента корреляции Пирсона.

Показатель имеет полное название линейный коэффициент корреляции Пирсона или просто коэффициент корреляции.

Читать еще:  Факторный анализ методом абсолютных разниц

Коэффициент корреляции показывает тесноту линейной взаимосвязи и изменяется в диапазоне от -1 до 1. -1 (минус один) означает полную (функциональную) линейную обратную взаимосвязь. 1 (один) – полную (функциональную) линейную положительную взаимосвязь. 0 – отсутствие линейной корреляции (но не обязательно взаимосвязи). На практике всегда получаются промежуточные значения. Для наглядности ниже представлены несколько примеров с разными значениями коэффициента корреляции.

Таким образом, ковариация и корреляция отражают тесноту линейной взаимосвязи. Последняя используется намного чаще, т.к. является относительным показателем и не имеет единиц измерения.

Диаграммы рассеяния дают наглядное представление, что измеряет коэффициент корреляции. Однако нужна более формальная интерпретация. Эту роль выполняет квадрат коэффициента корреляции r 2 , который называется коэффициентом детерминации, и обычно применяется при оценке качества регрессионных моделей. Снова представьте линию, вокруг которой расположены точки.

Линейная функция является моделью взаимосвязи между X иY и показывает ожидаемое значение Y при заданном X. Коэффициент детерминации – это соотношение дисперсии ожидаемых Y (точек на прямой линии) к общей дисперсии Y, или доля объясненной вариации Y. При r = 0,1 r 2 = 0,01 или 1%, при r = 0,5 r 2 = 0,25 или 25%.

Выборочный коэффициент корреляции

Коэффициент корреляции обычно рассчитывают по выборке. Значит, у аналитика в распоряжении не истинное значение, а оценка, которая всегда ошибочна. Если выборка была репрезентативной, то истинное значение коэффициента корреляции находится где-то относительно недалеко от оценки. Насколько далеко, можно определить через доверительные интервалы.

Согласно Центральное Предельной Теореме распределение оценки любого показателя стремится к нормальному с ростом выборки. Но есть проблемка. Распределение коэффициента корреляции вблизи придельных значений не является симметричным. Ниже пример распределения при истинном коэффициенте корреляции ρ = 0,86.

Предельное значение не дает выйти за 1 и, как бы «поджимает» распределение справа. Симметричная ситуация наблюдается, если коэффициент корреляции близок к -1.

В общем рассчитывать на свойства нормального распределения нельзя. Поэтому Фишер предложил провести преобразование выборочного коэффициента корреляции по формуле:

Распределение z для тех же r имеет следующий вид.

Намного ближе к нормальному. Стандартная ошибка z равна:

Далее исходя из свойств нормального распределения несложно найти верхнюю и нижнюю границы доверительного интервала для z. Определим квантиль стандартного нормального распределения для заданной доверительной вероятности, т.е. количество стандартных отклонений от центра распределения.

cγ – квантиль стандартного нормального распределения;
N -1 – функция обратного стандартного распределения;
γ – доверительная вероятность (часто 95%).
Затем рассчитаем границы доверительного интервала.

Нижняя граница z:

Верхняя граница z:

Теперь обратным преобразованием Фишера из z вернемся к r.
Нижняя граница r:

Верхняя граница r:

Это была теоретическая часть. Переходим к практике расчетов.

Как посчитать коэффициент корреляции в Excel

Корреляционный анализ в Excel лучше начинать с визуализации.

На диаграмме видна взаимосвязь двух переменных. Рассчитаем коэффициент парной корреляции с помощью функции Excel КОРРЕЛ. В аргументах нужно указать два диапазона.

Коэффициент корреляции 0,88 показывает довольно тесную взаимосвязь между двумя показателями. Но это лишь оценка, поэтому переходим к интервальному оцениванию.

Расчет доверительного интервала для коэффициента корреляции в Excel

В Эксель нет готовых функций для расчета доверительного интервала коэффициента корреляции, как для средней арифметической. Поэтому план такой:

— Делаем преобразование Фишера для r.
— На основе нормальной модели рассчитываем доверительный интервал для z.
— Делаем обратное преобразование Фишера из z в r.

Удивительно, но для преобразования Фишера в Excel есть специальная функция ФИШЕР.

Стандартная ошибка z легко подсчитывается с помощью формулы.

Используя функцию НОРМ.СТ.ОБР, определим квантиль нормального распределения. Доверительную вероятность возьмем 95%.

Значение 1,96 хорошо известно любому опытному аналитику. В пределах ±1,96σ от средней находится 95% нормально распределенных величин.

Используя z, стандартную ошибку и квантиль, легко определим доверительные границы z.

Последний шаг – обратное преобразование Фишера из z назад в r с помощью функции Excel ФИШЕРОБР. Получим доверительный интервал коэффициента корреляции.

Нижняя граница 95%-го доверительного интервала коэффициента корреляции – 0,724, верхняя граница – 0,953.

Надо пояснить, что значит значимая корреляция. Коэффициент корреляции статистически значим, если его доверительный интервал не включает 0, то есть истинное значение по генеральной совокупности наверняка имеет тот же знак, что и выборочная оценка.

Несколько важных замечаний

1. Коэффициент корреляции Пирсона чувствителен к выбросам. Одно аномальное значение может существенно исказить коэффициент. Поэтому перед проведением анализа следует проверить и при необходимости удалить выбросы. Другой вариант – перейти к ранговому коэффициенту корреляции Спирмена. Рассчитывается также, только не по исходным значениям, а по их рангам (пример показан в ролике под статьей).

2. Синоним корреляции – это взаимосвязь или совместная вариация. Поэтому наличие корреляции (r ≠ 0) еще не означает причинно-следственную связь между переменными. Вполне возможно, что совместная вариация обусловлена влиянием третьей переменной. Совместное изменение переменных без причинно-следственной связи называется ложная корреляция.

3. Отсутствие линейной корреляции (r = 0) не означает отсутствие взаимосвязи. Она может быть нелинейной. Частично эту проблему решает ранговая корреляция Спирмена, которая показывает совместный рост или снижение рангов, независимо от формы взаимосвязи.

В видео показан расчет коэффициента корреляции Пирсона с доверительными интервалами, ранговый коэффициент корреляции Спирмена.

Библиотека постов MEDSTATISTIC об анализе медицинских данных

Ещё больше полезной информации в нашем блоге в Инстаграм @medstatistic

Словарь статистических терминов

Обшие вопросы статистики

ЧТО ТАКОЕ МЕДИЦИНСКАЯ СТАТИСТИКА?

Статистикой называют количественное описание и измерение событий, явлений, предметов. Ее понимают как отрасль практической деятельности (сбор, обработка и анализ данных о массовых явлениях), как отрасль знания, т.е. специальную научную дисциплину, и, как совокупность сводных, итоговых цифровых показателей, собранных для характеристики какой-либо области общественных явлений.

Статистика – наука, изучающая закономерности массовых явлений методом обобщающих показателей.

Медицинская статистика – самостоятельная общественная наука, изучающая количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной, позволяющая методом обобщающих показателей изучить закономерности этих явлений, важнейших процессов в экономической, социальной жизни общества, его здоровье, системе организации медицинской помощи населению.

Статистические методы — это совокупность приемов обработки материалов массовых наблюдений, к которым относятся: группировка, сводка, получение показателей, их статистический анализ и т.д.

Статистические методы в медицине используются для:

  1. изучение состояния общественного здоровья населения в целом и его основных групп путем сбора и анализа статистических данных о численности и составе населения, его воспроизводстве, физическом развитии, распространенности и длительности различных заболеваний и т.д.;
  2. выявление и установление связей общего уровня заболеваемости и смертности от каких-либо отдельных болезней с различными факторами окружающей среды;
  3. сбор и изучение числовых данных о сети медицинских учреждений, их деятельности и кадрах для планирования медико-санитарных мероприятий, контроля над выполнением планов развития сети и деятельности учреждений здравоохранения и оценки качества работы отдельных медицинских учреждений;
  4. оценка эффективности мероприятий по предупреждению и лечению заболеваний;
  5. определение статистической значимости результатов исследования в клинике и эксперименте.
Читать еще:  В чем сущность корреляционного метода анализа

Разделы медицинской статистики:

  • общетеоретические и методические основы статистики,
  • статистика здоровья населения,
  • статистика здравоохранения.

СОЗДАНИЕ БАЗЫ ДАННЫХ В MS EXCEL

Для того, чтобы база данных была удобна для последующей обработки, следует придерживаться нехитрых принципов:

1) Оптимальной программой для создания базы данных является MS Excel. Данные из Excel в последующем могут без проблем переноситься в другие, специализированные статистические пакеты, такие как Statistica, SPSS и др. для более сложных манипуляций. Однако до 80-90% расчетов могут удобнейшим образом производиться в самой Excel с использованием надстройки «Анализ данных».

2) Верхняя строчка таблицы с базой данных оформляется как шапка, куда заносятся наименования тех показателей, которые учитываются в данном столбце. Нежелательно использовать слияние ячеек (это требование относится вообще ко всей базе), так как при этом многие операции станут недопустимы. Также не стоит создавать «двухэтажную» шапку, в которой верхняя строчка обозначает название группы однородных показателей, а нижняя — конкретные показатели. Для группировки однородных показателей лучше отметить их одноцветной заливкой или включить в их наименование группирующий признак в скобках.

Например, не так:

в последнем варианте обеспечена и «одноэтажность» шапки, и наглядная однородность данных (все они относятся к показателям ОАК).

3) В первом столбце следует размещать порядковый номер пациента в данной базе, не привязывая его ни к одному из исследуемых показателей. Это позволит в последующем обеспечить легкий откат к исходному порядку пациентов на любом этапе, даже после многочисленных сортировок списка.

4) Второй столбец обычно заполняется фамилиями (или Ф.И.О.) пациентов.

5) Количественные показатели (те, которые измеряются числами, например — рост, вес, артериальное давление, ЧСС и т.п.) вписываются в таблицу в числовом формате. Казалось бы это и так понятно, однако следует помнить, что в Excel, начиная с 2007 версии, дробные величины обозначаются через точку: 4.5. Если записать число через запятую, то оно будет воспринято как текст, и эти столбцы придется переписывать.

6) С качественными показателями сложнее. Те из них, которые имеют два варианта значения (так называемые, бинарные величины: Да-Нет, Имеется-Отсутствует, Мужской-Женский), лучше переводить в двоичную систему: 0 и 1. Значение 1 обычно присваивается положительному значению (Да, Имеется), 0 — отрицательному (Нет, Отсутствует).

7) Качественные показатели, имеющие несколько значений, различающихся по степени выраженности , уровню явления (Слабый-Средний-Сильный; Холодный-Теплый-Горячий) могут быть ранжированы и, соответственно, также переведены в числа. Наименьшему уровню явления присваивается наименьший ранг — 0 или 1, следующие степени обозначаются значениями рангов по порядку. Например: Заболевание отсутствует — 0, легкой степени тяжести -1, средней степени — 2, тяжелой степени — 3.

8) Иногда одному качественному показателю соответствуют несколько значений. Например, в графе «Сопутствующий диагноз» при наличии нескольких заболеваний мы хотим указать их через запятую. Делать так не следует, поскольку обработка таких данных весьма затруднена и не может быть автоматизирована. Поэтому лучше сделать несколько столбцов с конкретными группами заболеваний («заболевания ССС», «заболевания ЖКТ» и т.д.) или определенными нозологиями («хр.гастрит», «ИБС» и т.д.), в которые данные заносим в бинарном, двоичном виде: 1 (что означает «Есть данное заболевание») — 0 («Нет данного заболевания»).

9) Для разграничения отдельных групп показателей можно активно пользоваться цветом: например столбцы с показателями ОАК выделяем красным цветом, данные ОАМ — желтым и т.д.

10) Каждому пациенту должна соответствовать одна строка таблицы.

Подобное оформление базы данных позволяет не только значительно упростить процесс ее статистической обработки, но и облегчить ее заполнение на этапе сбора материала.

КАКОЙ МЕТОД ВЫБРАТЬ ДЛЯ СТАТИСТИЧЕСКОГО АНАЛИЗА?

После того, как собраны все данные, перед каждым исследователем встает вопрос выбора наиболее подходящего способа статистической обработки. И это неудивительно: современная статистика объединяет огромное количество всевозможных критериев и методов. Все они имеют свои особенности, могут подходить или не подходить для двух, казалось бы, схожих ситуаций. В этой статье мы постараемся систематизировать все основные, наиболее распространенные методы статистического анализа по их назначению.

Однако вначале несколько слов о том, какие бывают статистические данные, так как именно от этого зависит выбор наиболее подходящего метода анализа.

Шкала измерения

При проведении исследования у каждой единицы наблюдения определяются значения различных признаков. В зависимости от того, по какой шкале они измеряются, все признаки делятся на количественные и качественные. Качественные показатели в исследованиях распределяются по так называемой номинальной шкале. Кроме того, показатели могут быть представлены по ранговой шкале.

Например, проводится сравнение показателей сердечной деятельности у спортсменов и лиц, ведущих малоподвижный образ жизни.

При этом у исследуемых определялись следующие признаки:

  • пол — является номинальным показателем, принимающим два значения — мужской или женский.
  • возрастколичественный показатель,
  • занятия спортомноминальный показатель, принимающий два значения: занимается или не занимается,
  • частота сердечных сокращенийколичественный показатель,
  • систолическое артериальное давлениеколичественный показатель,
  • наличие жалоб на боли в грудной клетке — является качественным показателем, значения которого могут быть определены как по номинальной (есть жалобы — нет жалоб), так и по ранговой шкале в зависимости от частоты (например, если боль возникает несколько раз в день — показателю присваивается ранг 3, несколько раз в месяц — ранг 2, несколько раз в год — ранг 1, при отсутствии жалоб на боли в грудной клетке — ставится ранг 0).
Читать еще:  Экономический анализ является связующим звеном между

Количество сопоставляемых совокупностей

Следующий вопрос, который необходимо решить для выбора статистического метода, заключается в количестве совокупностей, сопоставляемых в рамках исследования.

  • В большинстве случаев, в клинических исследованиях мы имеем дело с двумя группами пациентов — основной и контрольной. Основной, или опытной, принято считать группу, в которой был применен изучаемый метод диагностики или лечения, или в которой пациенты страдают заболеванием, являющимся предметом данного исследования. Контрольную группу, напротив, составляют пациенты, получающие обычную медицинскую помощь, плацебо, или лица, у которых отсутствует изучаемое заболевание. Такие совокупности, представленные разными пациентами, называются несвязанными.
    Еще бывают связанные, или парные, совокупности, когда речь идет об одних и тех же людях, но сравниваются значения какого-либо признака, полученные до и после исследования. Число сравниваемых совокупностей при этом также равно 2, однако к ним применяются другие методики, нежели к несвязанным.
  • Другим вариантом является описание одной совокупности, что, надо признать, вообще лежит в основе любого исследования. Даже если основной целью работы является сравнение двух или более групп, каждую из них необходимо предварительно охарактеризовать. Для этого используются методы описательной статистики. Кроме того, для одной совокупности могут применяться методы корреляционного анализа, используемые для нахождения связи между двумя или несколькими изучаемыми признаками (например, зависимость роста от массы тела или зависимость частоты сердечных сокращений от температуры тела).
  • Наконец, сравниваемых совокупностей может быть несколько. Применительно к медицинским исследованиям это встречается очень часто. Пациенты могут быть сгруппированы в зависимости от применения различных препаратов (например, при сравнении эффективности антигипертензивных средств: 1 группа — ингибиторы АПФ, 2 — бета-адреноблокаторы, 3 — препараты центрального действия), по степени тяжести заболевания (1 группа — легкая степень, 2 — средняя, 3 — тяжелая) и т.д.

Важным также является вопрос нормальности распределения изучаемых совокупностей. От этого зависит, можно ли применять методы параметрического анализа или только непараметрического. Условиями, которые должны соблюдаться в нормально распределенных совокупностях, являются:

  1. максимальная близость или равенство значений средней арифметической, моды и медианы;
  2. соблюдение правила «трёх сигм» (в интервале М±1σ находятся не менее 68,3% вариант, в интервале М±2σ — не менее 95,5% вариант, в интервале М±3σ находятся не менее 99,7% вариант;
  3. показатели измерены в количественной шкале;
  4. положительные результаты проверки на нормальность распределения при помощи специальных критериев — Колмогорова-Смирнова или Шапиро-Уилка.

После определения всех указанных нами признаков изучаемых совокупностей, предлагаем воспользоваться следующей таблицей для выбора наиболее оптимального метода статистического анализа.

Коэффициент корреляции Пирсона

Коэффициент корреляции Пирсона в курсовых, дипломных и магистерских работах по психологии используется для выявления взаимосвязи двух переменных, измеренных на одной и той же выборке. Это могут быть как психологические показатели (тревожность, самооценка, самоактуализация, осмысленность жизни), так и не психологические (успешность учебной деятельности, возраст, стаж).

Для вычисления коэффициента корреляции Пирсона необходимо иметь:

  • Выборку испытуемых (желательно не менее 10 человек).
  • Результаты диагностики какого-либо показателя в этой группе испытуемых, например, эффективности профессиональной деятельности сотрудников.
  • Результаты тестирования другого показателя, например, уровня рефлективности сотрудников.
  • Таблицу исходных данных, в которой в двух столбцах приведены значения измеренных показателей (в нашем случае профессиональная эффективность и рефлективность). При этом количество строк соответствует числу испытуемых в группе.

Далее, используя данные из этой сводной таблицы результатов психодиагностики можно проверить гипотезу о том, есть ли между эффективностью сотрудников и рефлективностью взаимосвязь. Для решения этой задачи и проверки гипотезы можно использовать коэффициент корреляции Пирсона.

Коэффициент корреляции Пирсона относится к числу параметрических статистических критериев . Это означает, что для его использования в курсовой, дипломной или магистерской работе по психологии необходимо, чтобы психологические показатели удовлетворяли ряду условий, в частности, были распределены по нормальному закону. Если это условие не выполняется, то для анализа взаимосвязей между параметрами использовать коэффициент ранговой корреляции Спирмена.

В выпускных квалификационных работах по психологии чаще всего не проводится проверка нормальности распределения показателей, поэтому следует использовать коэффициент корреляции рангов Спимрмена. В то же время, если выборка испытуемых в дипломе по психологии достаточно большая (более 100 человек), можно использовать коэффициент корреляции Пирсона.

Расчёт коэффициента корреляции Пирсона

Вычислить коэффициент корреляции Пирсона можно вручную, а можно рассчитать при помощи статистических программ.

Логика расчета коэффициент корреляции Пирсона в самом общем и приближенном виде состоит в том, что анализируются знаки отклонений показателей двух величин от средних значений .

Например, для каждого испытуемого рассчитываются разности между его показателем по эффективности и рефлексивности и средним значением. Далее эти разности перемножаются для каждого испытуемого и суммируются для всей выборки.

Если знак полученного произведения отрицательный — корреляция обратная. Если знак произведения положительный – прямая. Величина произведения по модулю отражает величину корреляции, то есть силу взаимосвязи между показателями.

Анализ результатов расчета коэффициента корреляции Пирсона

Значение коэффициента корреляции Пирсона может располагаться в диапазоне значений от 1- до 1.

Отрицательные значения свидетельствуют об обратной взаимосвязи между показателями. Например, чем выше рефлексивность, тем ниже эффективность деятельности. Это справедливо для профессий, где погруженность в собственные проживания вредит делу. Работникам МЧС надо спасать людей, а не рефлексировать. Поэтому взаимосвязь между этим и показателями в данной выборке , скорее всего, оказалась бы отрицательной.

Положительные значения свидетельствуют о прямой взаимосвязи между показателями. Например, чем выше рефлексивность, тем выше эффективность деятельности. Это справедливо для профессий, где внимание к внутренней жизни помогает делу. Например, для психотерапевтов для проведения успешной работы с клиентами важно постоянно анализировать собственные переживания. Поэтому в группе практических психологов взаимосвязь между эффективностью и рефлексивностью, с большой долей вероятности, оказалась бы положительной.

Важно определить не только знак (направление) взаимосвязи, но и уровень ее значимости – силу связи между показателями. Чем выше численное значение коэффициента корреляции Пирсона по абсолютному значению (без учета знака), тем выше степень взаимосвязи между показателями.

Надеюсь, эта статья поможет вам написать работу по психологии самостоятельно. Если понадобится помощь, обращайтесь (все виды работ по психологии; статистические расчеты). Заказать

Ссылка на основную публикацию
Adblock
detector