Tishanskiysdk.ru

Про кризис и деньги
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Корреляционно регрессионный анализ это

Корреляционный и регрессионный анализ

Для принятия обоснованного управленческого решения, часто важны не столько данные об одной маркетинговой переменной, сколько информация о ее взаимосвязи с другими переменными.

Корреляционный анализ:позволяет сделать выводы о силе линейной связи между переменными.

Регрессионный анализ:помимо этого, позволяет также получить модель, отражающую наблюдаемую связь между зависимой и независимыми переменными (модель используется для прогнозирования значений зависимой переменной на основе известных значений независимых переменных).

Необходимо отметить, что методы регрессионного и параметрического корреляционного анализа корректны только если переменные измерены как минимум в интервальной шкале. Они работают и с порядковыми переменными, но тогда результаты анализа являются неточными, и, следовательно, доверять им можно в меньшей степени.

1. Парная корреляционная связь

Парная корреляция:при определении связи между двумя переменными не учитывают их связи с другими переменными, включенными в анализ.

Диаграмма рассеивания:визуальное отражение связи между двумя переменными (принято, что независимая переменная должна соответствовать горизонтальной оси диаграммы, а зависимая переменная — вертикальной).

Каждому наблюдению на диаграмме соответствует одна точка. Если в расположении точек не прослеживается никаких закономерностей, то две переменные не связаны. Однако, как правило, некоторая связь между переменными наблюдается и чаще всего эта связь близка по форме к линейной. В этом случае расположение точек на диаграмме рассеивания напоминает эллипс, вытянутый из левого нижнего угла в правый верхний в случае положительной корреляции переменных и из левого верхнего угла в правый нижний — в случае отрицательной корреляции. Чем более вытянут эллипс, чем более он отличается от окружности, тем более сильной является линейная корреляционная связь. Расположение точек может принимать также и другие упорядоченные формы, отличающиеся от эллипса, например, форму треугольника. Это означает, что связь между переменными является нелинейной, что затрудняет использование стандартных статистических методов.

Коэффициент корреляции:отражает силу линейной связи между двумя переменными.

Этот способ определения связи не является столь наглядным как диаграммы рассеивания, но зато позволяет точно оценить силу линейной связи. Коэффициент корреляции является нормированной величиной, он может меняться от -1 до 1. Значения, которые по модулю близки к 1, соответствуют сильной линейной связи, а значения, близкие к нулю, соответствуют отсутствию значимой линейной связи. Если коэффициент корреляции равен по модулю 1, то это означает, что связь между переменными является строго линейной, что практически невозможно для маркетинговых показателей.

Сила связи может определяться:

— как по самому коэффициенту корреляции;

— так и по соответствующему ему уровню значимости(если эмпирический уровень значимости меньше критических значений, то корреляция является статистически достоверной).

Параметрический коэффициент корреляции Пирсона —для переменных, измеренных в интервальной шкале или относительной шкале.

Непараметрический коэффициент корреляции Спирмена— для переменных, измеренных в порядковой шкале.

Существуют также коэффициенты корреляции для переменных, измеренных в шкале наименований, но их мы в данном разделе не рассматриваем.

Необходимо помнить о том, что различия между интервальной и порядковой шкалой зачастую являются нечеткими, к тому же коэффициент Спирмена, как правило, незначительно отличается от коэффициента Пирсона, рассчитанного для тех же данных.

Корреляционная матрица: состоит из коэффициентов корреляции для всех возможных пар переменных (так как в анализ часто включено одновременно более двух переменных).

Количество столбцов в корреляционной матрице равно количеству строк, причем каждый столбец, равно как и каждая строка, соответствует одной из переменных. Каждая ячейка корреляционной матрицы содержит коэффициент корреляции между двумя переменными. На главной диагонали матрицы находятся единицы, так как коэффициент корреляции переменной самой с собой равен 1.

2. Частная корреляционная связь

Частная корреляция:позволяет получить информацию о связи двух переменных с учетом влияния других переменных.

Частные коэффициенты корреляции:отражают связь между двумя переменными при контроле над третьей переменной. (т.е. при сохранении ее постоянной)

Этот метод имеет отношение к гипотезам о причинах изменения зависимой переменной. Изменение зависимой переменной в маркетинговых ситуациях всегда имеет не одну, а несколько причин.

Часто встречается ситуация — сильная связь между независимыми переменными:частная корреляция между двумя переменными значительно меньше парной (изменение зависимой переменной, которое мы в результате парной корреляции считали связанным только лишь с одной независимой переменной, в действительности связано одновременно с несколькими независимыми переменными).

3. Регрессионный анализ

Одно из главных назначений —построение модели, позволяющей прогнозировать значения зависимой переменной.

Рассмотрим наиболее простую из них -• линейную модель, описываемую уравнением

где Y зависимая переменная;

k — количество независимых переменных;

а свободный член уравнения (значение, которое принимает зависимая переменная при равенстве нулю всех независимых переменных);

е — ошибка прогноза.

Обучающая выборка— исходные данные для регрессионного анализа (значения независимых переменных и соответствующие им значения зависимой переменной для каждого наблюдения).

Следует различать теоретические и наблюдаемые значения зависимой переменной: — наблюдаемые значения обучающей выборки используются для построения модели, т.е. для подбора коэффициентов b1,b2,…bkи а.

(коэффициенты подбираются так, чтобы модель как можно лучше описывала закономерность, скрытую в обучающей выборке — чтобы теоретические значения зависимой переменной как можно меньше отличались от наблюдаемых).

Обычно уравнение записывают без указания ошибки е, ее наличие подразумевается. Однако величина ошибки является важной характеристикой построенной модели.

Качество регрессионной модели можно оценить:

по множественному коэффициенту детерминации(показывает долю дисперсии зависимой переменной, объясняемой моделью);

уровню значимости модели(позволяет судить о том, является ли эта доля статистически достоверной).

Статистические пакеты рассчитывают уровень значимости каждой независимой переменной (если уровень значимости меньше критических значений, то вклад данной переменной можно считать статистически значимым).

В регрессионном анализе, по возможности, необходимо использовать независимые переменные, которые слабо связаны между собой.

Однако если независимые переменные сильно коррелируют между собой, то регрессионный анализ не может отделить вклад одной переменной от вклада другой. Тогда в результате анализа вклады всех переменных оказываются незначимыми несмотря на высокую статистическую значимость всей модели в целом.

О наличии сильной корреляции между независимыми переменными может свидетельствовать, например, большая разница между их парными и частными корреляциями с зависимой переменной.

Корреляционно-регрессионный анализ

  • Предмет статистики
  • Основные методы и задачи статистики
  • Экономические индексы и индексный метод
  • Показатели вариации

Методы изучения взаимосвязи социально-экономических явлений с помощью корреляционно-регрессивного анализа

Общее представление о корреляционно-регрессивном анализе

Существующие между явлениями формы и виды связей весьма разнообразны по своей классификации. Предметом статистики являются только такие из них, которые имеют количественный характер и изучаются с помощью количественных методов. Рассмотрим метод корреляционно-регрессионного анализа, который является основным в изучении взаимосвязей явлений.

Данный метод содержит две свои составляющие части — корреляционный анализ и регрессионный анализ. Корреляционный анализ — это количественный метод определения тесноты и направления взаимосвязи между выборочными переменными величинами. Регрессионный анализ — это количественный метод определения вида математической функции в причинно-следственной зависимости между переменными величинами.

Для оценки силы связи в теории корреляции применяется шкала английского статистика Чеддока: слабая — от 0,1 до 0,3; умеренная — от 0,3 до 0,5; заметная — от 0,5 до 0,7; высокая — от 0,7 до 0,9; весьма высокая (сильная) — от 0,9 до 1,0. Она используется далее в примерах по теме.

Линейная корреляция

Данная корреляция характеризует линейную взаимосвязь в вариациях переменных. Она может быть парной (две коррелирующие переменные) или множественной (более двух переменных), прямой или обратной — положительной или отрицательной, когда переменные варьируют соответственно в одинаковых или разных направлениях.

Если переменные — количественные и равноценные в своих независимых наблюдениях при их общем количестве , то важнейшими эмпирическими мерами тесноты их линейной взаимосвязи являются коэффициент прямой корреляции знаков австрийского психолога Г.Т.Фехнера (1801-1887) и коэффициенты парной, чистой (частной) и множественной (совокупной) корреляции английского статистика-биометрика К.Пирсона (1857-1936).

Читать еще:  Метод графического анализа крестики нолики

Коэффициент парной корреляции знаков Фехнера определяет согласованность направлений в индивидуальных отклонениях переменных и от своих средних и . Он равен отношению разности сумм совпадающих ( ) и несовпадающих ( ) пар знаков в отклонениях и к сумме этих сумм:

Величина Кф изменяется от -1 до +1. Суммирование в (1) производится по наблюдениям , которые не указаны в суммах ради упрощения. Если какое-то одно отклонение или , то оно не входит в расчет. Если же сразу оба отклонения нулевые: , то такой случай считается совпадающим по знакам и входит в состав . В таблице 12.1. показана подготовка данных для расчета (1).

Таблица 12.1 Данные для расчета коэффициента Фехнера.

Число работников, тыс. чел.

Отклонение от средних

Сравнение знаков и

По (1) имеем Кф = (3 — 2)/(3 + 2) = 0,20. Направление взаимосвязи в вариациях !!Средняя численность работников|численности работников]] и объема товарооборота — положительное (прямолинейное): знаки в отклонениях и и в своем большинстве (в 3 случаях из 5) совпадают между собой. Теснота взаимосвязи переменных по шкале Чеддока — слабая.

Коэффициенты парной, чистой (частной) и множественной (совокупной) линейной корреляции Пирсона, в отличие от коэффициента Фехнера, учитывают не только знаки, но и величины отклонений переменных. Для их расчета используют разные методы. Так, согласно методу прямого счета по несгруппированным данным, коэффициент парной корреляции Пирсона имеет вид:

Этот коэффициент также изменяется от -1 до +1. При наличии нескольких переменных рассчитывается коэффициент множественной (совокупной) линейной корреляции Пирсона. Для трех переменных x, y, z он имеет вид

Этот коэффициент изменяется от 0 до 1. Если элиминировать (совсем исключить или зафиксировать на постоянном уровне) влияние на и , то их «общая» связь превратится в «чистую», образуя чистый (частный) коэффициент линейной корреляции Пирсона:

Этот коэффициент изменяется от -1 до +1. Квадраты коэффициентов корреляции (2)-(4) называются коэффициентами (индексами) детерминации — соответственно парной, чистой (частной), множественной (совокупной):

Каждый из коэффициентов детерминации изменяется от 0 до 1 и оценивает степень вариационной определенности в линейной взаимосвязи переменных, показывая долю вариации одной переменной (y), обусловленную вариацией другой (других) — x и y. Многомерный случай наличия более трех переменных здесь не рассматривается.

Согласно разработкам английского статистика Р.Э. Фишера (1890-1962), статистическая значимость парного и чистого (частного) коэффициентов корреляции Пирсона проверяется в случае нормальности их распределения, на основании -распределения английского статистика В.С. Госсета (псевдоним «Стьюдент»; 1876-1937) с заданным уровнем вероятностной значимости и имеющейся степени свободы , где — число связей (факторных переменных). Для парного коэффициента имеем его среднеквадратическую ошибку и фактическое значение -критерия Стьюдента:

Для чистого коэффициента корреляции при расчете его вместо (n-2) надо брать , т.к. в этом случае имеется m=2 (две факторные переменные x и z). При большом числе n>100 вместо (n-2) или (n-3) в (6) можно брать n, пренебрегая точностью расчета.

Если tr > tтабл. , то коэффициент парной корреляции — общий или чистый является статистически значимым, а при tr ≤ tтабл. — незначимым.

Значимость коэффициента множественной корреляции R проверяется по F — критерию Фишера путем расчета его фактического значения

При FR > Fтабл. коэффициент R считается значимым с заданным уровнем значимости a и имеющихся степенях свободы и , а при Fr≤ Fтабл — незначимым.

В совокупностях большого объема n > 100 для оценки значимости всех коэффициентов Пирсона вместо критериев t и F применяется непосредственно нормальный закон распределения (табулированная функция Лапласа-Шеппарда).

Наконец, если коэффициенты Пирсона не подчиняются нормальному закону, то в качестве критерия их значимости используется Z — критерий Фишера, который здесь не рассматривается.

Условный пример расчета (2) — (7) дан в табл. 12.2, где взяты исходные данные табл.12.1 с добавлением к ним третьей переменной z — размера общей площади магазина (в 100 кв. м).

Таблица 12.2. Подготовка данных для расчета коэффициентов корреляции Пирсона

Применение корреляционно-регрессионного анализа

В системе статистической обработки данных и аналитики часто используется сочетание методик корреляции и регрессии. Создателем корреляционно-регрессионного анализа считается Фрэнсис Гальтон, который разработал теоретическую основу методологии в 1795 году. В конце 19 века многие европейские ученые в области теории статистики углубили познания в вопросе использования количественных измерителей для отражения связей между явлениями.

Что такое корреляционно-регрессионный анализ (КРА) предприятия?

Корреляционно-регрессионный анализ (КРА) на предприятиях используется для выявления связей между несколькими факторами хозяйственной деятельности и оценки степени взаимозависимости выбранных для анализа критериев. Методика использует два алгоритма действий:

  1. Корреляция, которая направлена на построение моделей связей.
  2. Регрессия, используемая для прогнозирования событий на основе наиболее подходящей для ситуации модели связей.

Анализ проводится в несколько шагов:

  • постановка задач проведения исследования;
  • массовый сбор информации: систематизация статистических данных по конкретным показателям деятельности предприятия в динамике за несколько периодов;
  • этап создания модели связей;
  • анализ функционирования модели, оценка ее эффективности.

Для проведения КРА необходимо использовать показатели в едином измерителе, все они должны иметь числовое значение.

ОБРАТИТЕ ВНИМАНИЕ! Для достоверности данных и работоспособности модели сведения должны быть собраны за длительный отрезок времени.

Для полноты анализа надо устранить количественные ограничения на показатели модели, должно соблюдаться условие постоянной временной и территориальной структуры рассматриваемой совокупности элементов.

Где используется корреляционно-регрессионный анализ?

Основные ситуации применения КРА:

  1. Тестирование отношения между несколькими величинами: выявляется, что именно этот показатель является влияющим, а второй – зависимым.
  2. Определение связи между двумя переменными факторами без уточнения причинно-следственного блока сведений.
  3. Расчет показателя по изменению значения другого фактора.

Корреляционно-регрессионная методика анализа может применяться для подготовки данных о разных сторонах деятельности компании. В бизнесе построение моделей зависимости одного показателя от других факторов и дальнейшая эксплуатация выведенной математической формулы позволяют отслеживать оперативное изменение текущей ситуации в выбранном сегменте хозяйствования и быстро принимать управленческие решения.

Например, благодаря КРА можно постоянно отслеживать уровень рыночной стоимости предприятия. Для этого на начальных этапах проводится сбор информации о динамике изменения рыночной стоимости и статистических показателей всех возможных факторов влияния:

  • уровень выручки;
  • рентабельность;
  • размер активов;
  • сумма непогашенной дебиторской или кредиторской задолженности;
  • резерв сомнительных долгов и др.

Для каждого критерия строится модель, которая выявляет, насколько сильно фактор может влиять на рыночную стоимость бизнес-проекта. Когда все модели построены, оценивается их работоспособность и адекватность. Из комплекса данных выбирается тот тип взаимосвязей, который отвечает требованиям объективности и достоверности. На основе полученной схемы связей создается уравнение, которое позволит получать прогнозные данные об изменении рыночной стоимости при условии изменения значения конкретного фактора.

Методику можно применять при формировании ценовой политики, составлении бизнес-планов, проработке вопроса о расширении ассортиментного ряда и в других сегментах предпринимательства.

Задачи, виды и показатели корреляционно-регрессионного анализа

Задачи КРА заключаются в:

  • идентификации наиболее значимых факторов влияния на конкретный показатель деятельности предприятия;
  • количественном измерении тесноты выявленных связей между показателями;
  • определении неизвестных причин возникновения связей;
  • всесторонней оценке факторов, которые признаны наиболее важными для рассматриваемого показателя;
  • выведении формулы уравнения регрессии;
  • составлении прогноза возможного результата деятельности при изменении ключевых связанных факторов с учетом возможного влияния других факторных признаков.

КРА подразумевает использование нескольких видов корреляционных и регрессионных методов. Зависимости выявляются при помощи корреляций таких типов:

  • парная, если связь устанавливается с участием двух признаков;
  • частная – взаимосвязь оценивается между искомым показателем и одним из ключевых факторов, при этом условием задается постоянное значение комплекса других факторов (то есть числовое выражение всех остальных факторов в любых ситуациях будет приниматься за определенную неизменную величину);
  • множественная – основу исследования составляет влияние на показатель деятельности не одного фактора, а сразу нескольких критериев (двух и более).
Читать еще:  Схема проведения анализа

СПРАВОЧНО! Выявленные показатели степени тесноты связей отражаются коэффициентом корреляции.

На выбор коэффициента влияет шкала измерения признаков:

  1. Шкала номинальная, которая предназначена для приведения описательных характеристик объектов.
  2. Шкала ординальная нужна для вычисления степени упорядоченности объектов в привязке к одному и более признакам.
  3. Шкала количественная используется для отражения количественных значений показателей.

Регрессионный анализ пользуется методом наименьших квадратов. Регрессия может быть линейной и множественной. Линейный тип предполагает модель из связей между двумя параметрами. Например, при наличии таких двух критериев, как урожайность клубники и полив, понятно, что именно объем поступающей влаги будет влиять на объем выращенной и собранной клубники. Если полив будет чрезмерным, то урожай пропадет. Урожайность же клубники никак не может воздействовать на систему полива.

Множественная регрессия учитывает более двух факторов одновременно. В случае с клубникой при оценке ее урожайности могут использоваться факторы полива, плодородности почвы, температурного режима, отсутствия слизняков, сортовые особенности, своевременность внесения удобрений. Все перечисленные показатели в совокупности оказывают комплексное воздействие на искомое значение – урожайность ягод.

Система показателей анализа формируется критериями классификации. Например, при экстенсивном типе развития бизнеса в качестве показателей могут выступать такие факторы:

  • количество сотрудников;
  • число заключенных договоров за отчетный период;
  • посевные площади;
  • прирост поголовья скота;
  • расширение дилерской сети;
  • объем основных фондов.

При интенсивном типе развития могут применяться следующие показатели:

  • производительность труда;
  • рентабельность;
  • урожайность;
  • фондоотдача;
  • ликвидность;
  • средний объем поставок в отчетном периоде по одному договору.

Оценка

Для оценки достоверности и эффективности модели связей необходимо построить матрицу коэффициентов. Коэффициент в случае парной корреляции вычисляется по формуле:

Диапазон значений коэффициента ограничивается показателями от -1 до +1. Если итоговое значение было получено со знаком плюс, то между рассматриваемыми переменными имеется прямая связь. Если в результате расчетов значение оказалось отрицательным, то связь будет обратной, то есть при увеличении одного из показателей другой связанный с ним фактор будет уменьшаться. Пример прямой связи – увеличение посевных площадей будет способствовать росту объема собираемой с полей продукции. Пример обратной связи – увеличение посевных площадей сопровождается снижением урожайности.

Качественный аспект тесноты связи между рассматриваемыми в аналитических расчетах показателями можно оценивать, основываясь на шкале Чеддока.

В соответствии с ее нормами связь будет расцениваться как сильная при значении коэффициента корреляции по абсолютным данным величины выше 0,7. Положительный или отрицательный знак сопровождает числовое значение – неважно, ориентироваться необходимо только на число. Если коэффициент после вычислений оказался ниже 0,3, то связь можно считать слабой.

Для дальнейших этапов анализа выбираются факторы с высокой степенью связанности. Все остальные критерии, для которых установлена слабая связь, отбрасываются. На основании полученных сведений определяется вид математического уравнения регрессии. Рассчитывается численное значение оценки параметров регрессии, определяются качества полученной модели регрессии.

АНАЛИЗ ПРЕДПРИЯТИЯ ОНЛАЙН

Корреляционно-регрессионный анализ

Корреляционно-регрессионный анализ: «Влияние внутренних и внешних факторов на цену»

Цель: определить влияние внутренних и внешних факторов на цены, то есть изменение цен в зависимости от сезона продаж.

Метод корреляционно регрессионного анализа

В качестве факторов для анализа выбраны:

  • — количество упаковок;
  • — количество отгруженных единиц;
  • — цена продажи;
  • — затраты на продажи;
  • — скидки с продажи;
  • — потери по отсрочке платежа;
  • — цены конкурентов;
  • — спрос на товар.

Используются данные по наиболее распространенному сезонному антивирусному лекарственному средству «Лекарство» (Приложение 1). Для данного товара сезонным является период с октября по март месяцы (в таблице выделено серым цветом), а не сезонными соответственно с апреля по сентябрь.

Приложение 1

Сводная таблица факторов по одному клиенту за период 12 месяцев (октябрь 2018 – сентябрь 2019 г.)

Цена продажи, руб.

Количество упаковок, шт.

Количество отгруженных единиц, шт.

Затраты на продажи, руб.

Скидки с продаж, руб.

Потери по отсрочке платежа, руб.

Цены конкурентов, руб.

Метод: множественный корреляционно-регрессионный анализ по t-критерию Стьюдента (с использованием табличного процессора Microsoft Exsel).

Сущность корреляционно регрессионного анализа

При множественной корреляции изучается зависимость результативного признака от двух или более независимых факторов, что позволяет учесть разнообразные причины, влияющие на результативный показатель, более полно оценить его вариацию. Анализ проводят по примерно той же схеме, что и при изучении парных связей. На первом этапе проводят отбор факторных признаков. Прежде всего путем логического анализа выявляют факторы, которые могут непосредственно воздействовать на результативный показатель. При этом необходимо исключать факторы, которые можно рассчитать на основе других, уже включенных в анализ.

Необходимо также учитывать корреляционную зависимость факторов между собой. В идеале они должны быть полностью независимыми; при высокой межфакторной корреляции возникает так называемая мультиколлинеарность, приводящая к искажению коэффициентов регрессии и затрудняющая их интерпретацию. Во избежание такого эффекта производят отсев факторов с помощью таблицы парных коэффициентов корреляции. Если два фактора теснее связаны между собой, чем каждый из них с результативным показателем, один из этих двух факторов исключают из анализа.

Показатели корреляционно регрессионного анализа

Отсев факторов производят также и при оценке значимости коэффициентов регрессии. Важное значение, как и в случае парной корреляции, имеет выбор формы связи. Задача это довольно сложная, поскольку факторы не только влияют на результативный показатель, но и взаимодействуют между собой. В настоящее время вопросы выбора формы связи при множественной корреляции отработаны недостаточно. В большинстве случаев используют уравнение множественной линейной регрессии:


где — результативный признак;
х1 х2,… хт – факторные признаки;
а0 — точка начала отсчета;
а1 а2, ат — коэффициенты регрессии.

Параметры уравнения, как и при парной корреляции, обычно определяют методом наименьших квадратов. Для этого нужно решить систему нормальных уравнений:

Коэффициенты регрессии множественной связи показывают, на сколько изменится величина результативного показателя при изменении значения фактора на единицу при неизменном значении остальных факторов.

Оценка корреляционно регрессионный анализ

Общая оценка полученного уравнения проводится с помощью индекса корреляции, который при множественной линейной связи называют также коэффициентом множественной корреляции:

где — общая дисперсия результативного признака;

— его факторная дисперсия;
— его остаточная дисперсия.

Величина R показывает степень зависимости результативного показателя от всей совокупности факторных признаков. Как и индекс корреляции при парной зависимости, она меняется в пределах от 0 до 1. Квадрат коэффициента множественной корреляции называют коэффициентом множественной детерминации. Он показывает долю общей вариации результативного признака, определяемую совокупным действием факторных признаков.

Корреляционный регрессионный анализ примеры

Существенность коэффициента множественной корреляции и всего уравнения регрессии в целом оценивают с помощью F-критерия Фишера или t-критерия Стьюдента. Фактические их значения рассчитывают по формулам:

где n — численность выборочной совокупности;

k число параметров в уравнении регрессии.

Многофакторный корреляционно регрессионный анализ

Полученные значения F-критерия и t-критерия сравнивают с табличными. Число степеней свободы вариации для F-критерия , для t-критерия v = n — k. Если фактические значения превышают табличные, связь между признаками считается достоверной, а уравнение регрессии — существенным.
Оценку значимости коэффициентов регрессии проводят с помощью t-критерия по формуле:


Ее применяют при шаговом регрессионном анализе, когда поочередно отсеивают факторы, имеющие незначимый коэффициент регрессии. При этом первыми отбрасывают факторы, которые имеют наименьшее фактическое значение t-критерия.

Задача корреляционного регрессионного анализа

Анализ данных коэффициентов регрессии показывает, что все факторные признаки (x) имеют тесную связь с результативным (y) (Приложение 2). Наибольшая сила связи с результативным у шестого фактора (цены конкурентов – парный коэффициент корреляции равен 1,000). При этом, однако, наблюдается и высокая мультиколлинеарость: большинство факторов имеет достоверную связь друг с другом. Однако сравнение парных коэффициентов корреляции показывает, что только между первым и вторым факторами зависимость (0,999380) выше, чем зависимость между первым и результативным показателем (0,854832). Поэтому первый фактор необходимо исключить из уравнения регрессии.

Читать еще:  Анализ результатов деятельности предприятия

Приложение 2

Результаты корреляционного анализа

Корреляционно-регрессионный анализ: области применения, основные этапы

Понятие корреляционно-регрессионного анализа подразумевает проведение ряда операций, а именно: определение тесноты связи, ее направления и установление уравнения, описывающего форму связи. Этот вид анализа содержит две отдельные составляющие: корреляционный и регрессионный анализ.

Значение и основные этапы процесса корреляционно-регрессионного анализа экономических явлений

Корреляционно-регрессионный анализ – это один из способов решения задач и поиска информации. Он позволяет определить совместное влияние множества взаимосвязанных и единовременно действующих признаков, а также отдельное влияние каждого признака на экономическое явление (процесс). Благодаря этому типу анализа можно оценить степень взаимосвязи между несколькими признаками, между признаками и полученным результатом, а также смоделировать уравнение регрессии, описывающие форму взаимосвязи.

Этапы анализа

Корреляционно-регрессионный анализ экономических процессов разделяется на несколько этапов:

  1. Определение аргументов и предварительная обработка условной информации.
  2. Определение тесноты и формы взаимосвязи между несколькими признаками.
  3. Моделирование представленного экономического процесса и анализ полученной модели.
  4. Применение конечных результатов для усовершенствования планирования и менеджмента модели.

Статистическую однородность информации можно определить с помощью двух приемов. Для начала необходимо определить и откинуть значение факторов, резко отличающихся от всех величин. Потом осуществляется статистическое исследование однородности с помощью проверки независимости выборки и ее принадлежности к единственной совокупности с нормальным распределением.

Модель регрессии определяется через метод наименьших квадратов, благодаря которому обеспечивается самое лучшее приближение оценки результата, определенного через уравнение регрессии, к его факторам.

Корреляционно-регрессионный анализ: параметры созданной модели

Самыми главными факторами, определяющими характеристики модели, принято считать:

  • Коэффициенты парной корреляции (демонстрируют силу взаимосвязи двух факторов).
  • Коэффициент множественной корреляции (определяет взаимосвязь результата и факторов).
  • Коэффициенты частной детерминации (показывают влияние вариации аргумента на вариацию искомого признака).
  • Коэффициент множественной детерминации (показывает удельный вес всех аргументов на вариацию искомого признака).
  • Частные коэффициенты эластичности (характеризуют влияние факторов на результат, выраженное в едином масштабе в процентах).

Цель анализа

Основные задачи корреляционно-регрессионного анализа – это выявление факторов, существенно влияющих на экономический результат явления или процесса, и использование полученной информации для усовершенствования планирования экономического процесса или явления.

Параметрические методы анализа

Все производственные процессы находятся в тесной взаимосвязи. Эта взаимосвязь бывает стохастической (результат зависит от множества факторов) и функциональной (результат изменяться на такую же величину, как и фактор). Стохастическая зависимость чаще всего имеет корреляционный характер, то есть значению фактора одновременно соответствует несколько значений результата, имеющих абсолютно разные направления.

Корреляционная решетка

Корреляционная взаимосвязь может иметь один или несколько факторов-признаков, обладать положительной или отрицательной направленностью, быть прямолинейной или криволинейной (в зависимости от выражения). Определить, к какому именно типу относится связь, можно с помощью корреляционной решетки. Ее строят в пределах прямоугольных осей координат.

Частоты, размещенные близко к диагоналям, свидетельствуют о высокой взаимосвязи признаков. Частоты, размещенные близко к диагонали, проходящей через левый нижний и правый верхний углы, говорят о положительном направлении, а проходящие через верхний левый и правый нижний угол – о противоположном направлении. Частоты, расположенные в форме дуги, свидетельствуют о криволинейной взаимосвязи, а беспорядочно разбросанные – об отсутствии взаимосвязи вообще.

Основной метод корреляционного анализа – это линейный коэффициент корреляции. Он может принимать значение от -1 до +1. Чем ближе значение к 1, тем сильнее связь между фактором и результатом. Положительные значения говорят о прямой взаимосвязи, а отрицательные – об обратной. Коэффициент принимает значение «ноль» в том случае, если между признаками отсутствует взаимосвязь.

Непараметрические методы анализа

Ряд методов позволяет оценить взаимосвязь явлений без количественного выражения признака и, соответственно, параметров распределения. Их называют непараметрическими. Среди них выделяют:

  • Коэффициент ранговой корреляции Кендалла (определяет взаимосвязь количественных и качественных значений показателей, в случае если они подлежат ранжированию).
  • Коэффициент ранговой корреляции Спирмена (присваивает ранги каждому аргументу и результату, на основе которых определяются разности и вычисляется показатель).
  • Коэффициент корреляции знаков Фехнера (определяет количество совпадений и несовпадений отклонений аргументов и результатов от их среднего значения).
  • Еще один немаловажный метод корреляционно-регрессионного анализа — Метод наименьших квадратов, позволяющий определить аналитическое выражение взаимосвязи результативного признака и его фактора. Он заключается в построении системы уравнений и определении параметров этих уравнений.

Корреляционно-регрессионный анализ: пример

В статистике и экономике применяются самые разнообразные виды и объекты анализа. Статистические методы анализа направлены на изучение повторяющихся процессов, для того чтобы составить длительные прогнозы поведения экономических явлений.

Например, для того чтобы проанализировать социально-экономическое развитие территории, необходимо изучить показатели уровня жизни населения. Корреляционно-регрессионный анализ в статистике позволяет создать уравнение регрессии и определить коэффициенты корреляции, демонстрирующие взаимосвязь между уровнем жизни и развитием территории. Уровень жизни определяется доходами, а основной источник доходов – зарплата. В таком случае фактором выступает уровень зарплаты, а результатом — численность населения с невысокими доходами.

Программное обеспечение анализа

Для облегчения расчетов можно проводить корреляционный анализ в Excel. В данной программе существует ряд инструментов, помогающих облегчить расчеты. Среди них функция «Корреляция», позволяющая сформировать матрицу из коэффициентов и разных параметров. Она изображается в форме таблицы. В качестве столбцов и строк используются корреляционные коэффициенты. На основе полученных данных таблицы необходимо будет провести корреляционный анализ. Пример последовательности проведения анализа:

  1. В команде «Сервис» выбрать пункт «Анализ данных».
  2. В качестве инструмента анализа выбрать пункт «Корреляция».
  3. В появившемся окне в строке «Входной интервал» указать диапазон анализируемых данных, выбрать пункт «Группировка» в строке «Параметры вывода», ввести диапазон вывода результатов и нажать «ОК».

В результате получится корреляционная матрица, расположенная в диапазоне вывода. Внутри будет указан коэффициент линейной корреляции, оценивающий тесноту и форму связи между показателями.

Проведение анализа в Excel

В MS Excel используется функция «Корреляция» для того, чтобы провести корреляционно-регрессионный анализ. Пример расчета коэффициентов рассмотрим далее. Эта функция формирует матрицу с коэффициентами тесноты взаимосвязи между разными параметрами. В итоге формируется квадратная таблица, содержащая коэффициенты корреляции на пересечении строк и столбцов.

Для проведения анализа необходимо будет выполнить ряд определенных действий:

  1. Открыть команду «Сервис», а в ней пункт «Анализ данных».
  2. В появившемся окне указать в перечне «Инструменты анализа» пункт «Корреляция».
  3. В раскрывшемся окне «Корреляция» указать входной интервал в виде диапазона ячеек, содержащих анализируемую информацию (он должен быть не менее двух столбцов), поставить галочку в пункте «Группировка», а в поле «Параметры вывода» выбрать верхнюю левую ячейку, где будет начинаться корреляционная матрица.
  4. Нажать на кнопку ОК.

В результате вычислений появится квадратная таблица с коэффициентами корреляции.

Регрессионный анализ в MS Excel

Для того чтобы вычислить уравнение линейной регрессии, описывающие взаимосвязь между факторами и результатом, в MS Excel применяется статистическая функция «Линейн». Для того чтобы ее использовать, необходимо:

  1. Выделить пустую область, в которую будут выведены результаты анализа.
  2. Открыть «Мастер функций», в нем найти категорию «Статистические», а в ней функцию «Линейн» и нажать ОК.
  3. В поле «Известные значения у» ввести диапазон анализируемых результатов, в поле «Известные значения х» – диапазон анализируемых факторов.
  4. В поле «Константа» указывается присутствие свободного члена уравнения (1 – да, 0 – нет), а в поле «Статистика» – необходимость вывода дополнительных сведений (1 – появится дополнительная информация, 0 – появятся только оценки параметров). По умолчанию можно указывать в обоих полях 1.
  5. Нажать кнопку ОК.

Вверху ранее выделенной области появится начальный элемент таблицы. Для того чтобы раскрыть все данные, необходимо нажать F2, а потом одновременно комбинацию клавиш Ctrl + Shift + Enter.

В итоге регрессионная информация будет изображаться в качестве таблицы из двух столбцов и пяти строк:

Ссылка на основную публикацию
Adblock
detector