МИНИСТЕРСТВО СПОРТА РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ
ОБРАЗОВАТЕЛЬНОЕ
УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«ВЕЛИКОЛУКСКАЯ ГОСУДАРСТВЕННАЯ АКАДЕМИЯ
ФИЗИЧЕСКОЙ КУЛЬТУРЫ И СПОРТА»
КАФЕДРА ЕСТЕСТВЕННО-НАУЧНЫХ ДИСЦИПЛИН
И.В. Алексеева
КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗЫ В
ФИЗИЧЕСКОЙ КУЛЬТУРЕ И СПОРТЕ
Учебно-методическое пособие
Великие Луки 2023
Стр.1
Рецензенты:
доктор биологический наук, профессор А.А.Челноков ФГБОУ ВО «ВЛГАФК»,
кандидат экономических наук, доцент Е.О.Марденская ФГБОУ ВО Великолукская
ГСХА
Печатается по решению Ученого совета
Великолукской Государственной Академии Физической Культуры и Спорта протокол
№ 04 от 28.11.2023
Алексеева И.В.
Корреляционный и регрессионный анализы в физической культуре и спорте. Учебнометодическое
пособие для бакалавров учреждений высшего образования - Великие Луки,
2023. - 72 стр.
В учебно-методическом пособии на основе реальных результатов исследования в
физической культуре и спорте рассматриваются корреляционный и регрессионный
анализы. Представлены теоретические положения, подробные примеры решения задач,
набор задач для аудиторной работы, вопросы для контроля знаний, математические
таблицы.
Пособие может быть использовано обучающимися бакалавриата по направлениям
подготовки 49.03.01 – Физическая культура, 49.03.04 – Спорт, 49.03.02 - Физическая
культура для лиц с отклонениями в состоянии здоровья, преподавателями вузов, а также
всеми интересующимися вопросами исследований в физической культуре и спорте.
2
Стр.2
СОДЕРЖАНИЕ
ВВЕДЕНИЕ .......................................................................................................... 4
1. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ................................................................. …5
1.1 КОРРЕЛЯЦИЯ. ЗАДАЧИ КОРРЕЛЯЦИОННОГО АНАЛИЗА ................................... 5
1.2 ПОСТРОЕНИЕ КОРРЕЛЯЦИОННОГО ПОЛЯ: ОПРЕДЕЛЕНИЕ ФОРМЫ,
НАПРАВЛЕНИЯ И СТЕПЕНИ ВЗАИМОСВЯЗИ ..................................................... 6
1.3 КЛАССИФИКАЦИЯ КОЭФФИЦИЕНТОВ КОРРЕЛЯЦИИ ....................................... 7
1.4 КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ. ОШИБКА КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ ... 9
1.5 ЛИНЕЙНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ПИРСОНА ................................... 10
1.6 РАНГОВЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ СПИРМЕНА .................................. 13
1.7 КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ КЕНДАЛЛА. ................................................... 16
1.8 КОРРЕЛЯЦИОННЫЙ АНАЛИЗ НОМИНАТИВНЫХ ПРИЗНАКОВ ......................... 19
1.9 ТОЧЕЧНЫЙ БИСЕРИАЛЬНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ........................... 22
1.10 РАНГОВО-БИСЕРИАЛЬНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ............................. 24
1.11 ИНТЕРПРЕТАЦИЯ И ПРЕДСТАВЛЕНИЕ РЕЗУЛЬТАТОВ КОРРЕЛЯЦИОННОГО
АНАЛИЗА В НАУЧНЫХ ПУБЛИКАЦИЯХ ......................................................... 26
2. РЕГРЕССИОННЫЙ АНАЛИЗ ...................................................................... 28
2.1 ОСНОВЫ РЕГРЕССИОННОГО АНАЛИЗА ............................................................ 28
2.2 ЛИНЕЙНАЯ РЕГРЕССИЯ. РАСЧЕТ КОЭФФИЦИЕНТОВ УРАВНЕНИЙ ЛИНЕЙНОЙ
РЕГРЕССИИ .................................................................................................. 30
2.3 ТЕОРЕТИЧЕСКАЯ ЛИНИЯ РЕГРЕССИИ ............................................................... 32
2.4 КРИТЕРИЙ ФИШЕРА ПРОВЕРКИ АДЕКВАТНОСТИ МОДЕЛИ ............................... 33
2.5 ОЦЕНКА ЗНАЧИМОСТИ ПАРАМЕТРОВ РЕГРЕССИИ ............................................ 34
2.6 НАДЕЖНОСТЬ ПРОГНОЗА ................................................................................ 35
КОНТРОЛЬНЫЕ ВОПРОСЫ ............................................................................ 46
ПЕРЕЧЕНЬ СИТУАЦИОННЫХ ЗАДАЧ ДЛЯ САМОСТОЯТЕЛЬНОГО
РЕШЕНИЯ .......................................................................................................... 48
ТЕСТОВЫЕ ЗАДАНИЯ ПО ТЕМЕ «КОРРЕЛЯЦИОННЫЙ И
РЕГРЕССИОННЫЙ АНАЛИЗЫ» ................................................................. 52
СЛОВАРЬ ТЕРМИНОВ ..................................................................................... 58
ЛИТЕРАТУРА .................................................................................................... 64
ПРИЛОЖЕНИЕ .................................................................................................. 66
3
Стр.3
ВВЕДЕНИЕ
Математическая статистика представляет собой универсальный
аппарат для сбора, обработки и анализа результатов педагогических
наблюдений, измерений, обоснования инновационных методик физического
воспитания.
Курс математической статистики является частью учебного плана
обучающихся по направлениям подготовки 49.03.01 – Физическая культура,
49.03.04 – Спорт, 49.03.02 - Физическая культура для лиц с отклонениями в
состоянии здоровья очной и заочной форм обучения.
Задачами данного курса является формирование у обучающихся
логического мышления, основ теоретических знаний в области
математической статистики.
Корреляционный и регрессионный анализы являются смежными
разделами математической статистики, которые занимают заметное место
среди других формализованных методов исследования степени тесноты и
направления взаимосвязей в физической культуре и спорте.
В учебно-методическом пособии представлен понятийный аппарат
корреляционного и регрессионного
анализов. Приведены
способы вычисления и проверки значимости коэффициентов корреляции
Пирсона, Спирмена, Кендалла, коэффициентов ассоциации и контингенции,
точечного бисериального и рангово-бисериального коэффициентов
корреляции, а также получение эмпирических уравнений регрессии,
проверка адекватности моделей и интервальный прогноз на основе
линейного уравнения регрессии.
Теоретические положения иллюстрируются примерами.
Предложены контрольные вопросы по изложенным темам,
ситуационные задачи для самостоятельного решения и тесты для
контроля знаний.
В приложении представлены основные таблицы критических значений
для сопоставления полученных результатов расчета и их интерпретации, что
дает возможность правильно делать статистические и педагогические
выводы.
Методическое пособие предназначено для
самоподготовки
обучающихся бакалавриата по направлениям подготовки 49.03.01 –
Физическая культура, 49.03.04 – Спорт, 49.03.02 - Физическая культура для
лиц с отклонениями в состоянии здоровья, преподавателей вузов, а также
всех интересующихся вопросами исследований в физической культуре и
спорте.
4
Стр.4
1. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
1.1 Корреляция. Задачи корреляционного анализа
В спортивных исследованиях между изучаемыми показателями часто
обнаруживается взаимосвязь. Виды ее бывают различными. Например,
определение ускорения по известным данным скорости в биомеханике, закон
Хилла в физиологии и другие характеризуют так называемую
функциональную взаимосвязь, или зависимость, при которой каждому
значению одного показателя соответствует строго определенное значение
другого.
К другому виду взаимосвязи относят, например, зависимость веса от
длины тела. Одному значению длины тела может соответствовать несколько
значений веса, и наоборот. В таких случаях, когда одному значению одного
показателя соответствует несколько значений другого, взаимосвязь называют
статистической.
Изучению статистической взаимосвязи между различными
показателями в спортивных исследованиях уделяют большое внимание,
поскольку это позволяет выявить некоторые закономерности и в дальнейшем
описать их как словесно, так и математически с целью использования в
практической работе тренера и педагога.
Среди статистических взаимосвязей наиболее важны корреляционные
(лат. correlatio — соотношение, соответствие). Корреляция заключается в
том, что средняя величина одного показателя изменяется в зависимости от
значения другого. Статистический метод, который используется для
исследования взаимосвязей между парой признаков или факторами,
называется корреляционным анализом.
Основные задачи корреляционного анализа:
- определение формы связи (линейная, нелинейная);
- определение направления связи (положительная связь или
отрицательная);
- определение степени или тесноты взаимосвязи (слабая, средняя,
сильная);
- проверка значимости коэффициента корреляции, который выступает
мерой связи между случайными величинами.
Он широко используется в теории тестов для оценки надежности и
информативности. Различные шкалы измерений требуют разных вариантов
корреляционного анализа (табл.1).
5
Стр.5
Таблица 1
Типы шкал
Переменная X
Интервальная
или отношений
Ранговая, интервальная
или отношений
Ранговая
Дихотомическая
Дихотомическая
Дихотомическая
Типы шкал и меры связи
Переменная Y
Интервальная
или отношений
Ранговая, интервальная
или отношений
Ранговая
Дихотомическая
Ранговая
Интервальная
или отношений
Мера связи
Коэффициент Пирсона
Коэффициент Спирмена
Коэффициент Кендалла
Коэффициент φ,
четырёхполевая
корреляция
Рангово-бисериальный
коэффициент
Бисериальный
коэффициент
1.2 Построение корреляционного поля: определение формы,
направления и степени взаимосвязи
Анализ взаимосвязи начинается с графического представления
результатов измерений в прямоугольной системе координат.
Предположим, что у шести испытуемых зарегистрирован такой
показатель, как число подтягиваний на перекладине, до начала
подготовительного периода тренировки (xi) и после его окончания (yi).
Запишем результат измерений, далее для этих результатов построим график,
на оси абсцисс которого отложим результаты xi, а на оси ординат —
результаты yi. Таким образом, каждая пара результатов в прямоугольной
системе координат будет отображаться точкой. Такая графическая
зависимость называется диаграммой рассеяния или корреляционным полем
(рис.1). Визуальный анализ графика позволяет выявить форму зависимости
(например, о том, что одна величина в среднем возрастает или убывает при
возрастании другой). Если эта форма близка к обычной геометрической
фигуре — эллипсу, то она называется линейной зависимостью или линейной
формой взаимосвязи. Однако на практике можно встретить и иную форму
взаимосвязи, когда на рисунке отображается фигура, отличная от эллипса,
тогда зависимость называется нелинейной (или нелинейной формой
взаимосвязи).
6
Стр.6
Таким образом, визуальный анализ корреляционного поля позволяет
выявить форму статистической зависимости — линейную или нелинейную.
Это имеет существенное значение для следующего шага в анализе — выбора
и вычисления соответствующего коэффициента корреляции.
Рисунок 1 – Корреляционное поле
1.3 Классификация коэффициентов корреляции
Коэффициенты корреляции характеризуются силой и значимостью.
Классификация коэффициентов корреляции по силе.
Для оценки тесноты взаимосвязи в корреляционном анализе
используется значение (абсолютная величина) специального показателя —
коэффициента корреляции.
Свойство коэффициента корреляции в том, что он по абсолютному
значению не превышает единицы. Его значения лежат в пределах от −1 до +1
(−1 ≤ r ≤ 1).
Интерпретируют значение этого коэффициента следующим образом
(рис.2):
r = 0 - между изучаемыми признаками нет линейной корреляционной
зависимости
r < 0,3 – очень слабая связь;
0,3 ≤ r < 0,5 - слабая связь;
0,5 ≤ r < 0,7 - средняя связь;
0,7 ≤ r < 0,9 - высокая связь;
0,9 ≤ r < 1 – очень высокая связь;
r = 1 – функциональная связь.
7
Стр.7
Рисунок 2 – Типы корреляционных связей и соответствующие им
коэффициенты корреляции
а) варианты положительных связей и соответствующие им
коэффициенты корреляции
б) варианты отрицательных связей и соответствующие им
коэффициенты корреляции
Диаграмма рассеяния, например, показателей результата в толкании
ядра весом 3 кг и результата в толкании ядра весом 5 кг, кроме сильной
статистической взаимосвязи, имеет еще одну особенность — прямо
пропорциональную тенденцию зависимости.
Это значит, что улучшение одного показателя вызывает улучшение
другого. Диаграмма обратно пропорциональной зависимости получится в
случае, когда увеличение одного показателя связано с уменьшением другого
(в среднем). Направленность зависимости отражается в знаке коэффициента
корреляции. Знак «+» (плюс) указывает на прямую, или положительную
взаимосвязь; знак «-» (минус) говорит об обратной, или отрицательной
взаимосвязи.
Классификация коэффициентов корреляции по значимости.
1) Незначимая корреляция, при r, не достигающем уровня
статистической значимости.
2) Тенденция достоверной связи, при r, соответствующем уровню
статистической значимости 0,05≤ р ≤ 0,10.
3) Значимая корреляция, при r, соответствующем уровню
статистической значимости р ≤ 0,05.
4) Высокая значимая корреляция, при r, соответствующем уровню
статистической значимости р ≤ 0,01.
8
Стр.8
Не следует путать эти две классификации, так как они определяют
разные характеристики. Классификация коэффициентов корреляции по силе
ориентирована только на его величину.
Классификация коэффициентов корреляции по значимости определяет,
какого уровня значимости достигает данная величина при данном объеме
выборки. Чем больше объем выборки, тем меньшей величины коэффициента
корреляции оказывается достаточно, чтобы корреляция была признана
достоверной. В результате при малом объеме выборки может оказаться так,
что сильная корреляция может оказаться случайной и, стало быть,
недостоверной. В то же время при больших объемах выборки даже слабая
корреляция может оказаться достоверной.
1.4 Коэффициент детерминации. Ошибка коэффициента
корреляции
коэффициента детерминации (D), который вычисляют по формуле:
D = r2· 100 %,
В некоторых случаях тесноту взаимосвязи определяют на основании
(1)
где r - коэффициент корреляции.
Этот коэффициент определяет часть общей вариации одного
показателя, которая объясняется вариацией другого показателя.
Так, например, для вычисленного значения r = − 0,68 между
результатом в беге на 30 м и прыжком в длину с разбега коэффициент
детерминации определится как:
D = (–0,68)2 · 100 % = 46,2 % .
Следовательно, только 46,2 % взаимосвязи спортивных результатов
объясняется их взаимовлиянием. Остальная часть вариации (коэффициент
недетерминации):
100 % − 46,2 % = 53,8 %
объясняется влиянием других неучтенных факторов.
Коэффициент корреляции является выборочным, потому что он
определен для ограниченной совокупности, которая является выборкой из
генеральной совокупности. Поэтому существует ошибка при расчете
коэффициента корреляции. Эта ошибка – расхождение между
коэффициентом корреляции для генеральной совокупности и коэффициентом
для выборки. Эта ошибка определяется:
,
где r- коэффициент корреляции,
n – число пар измерений.
9
(2)
Стр.9
1.5 Линейный коэффициент корреляции Пирсона
Назначение. Для оценки взаимосвязи, когда измерения производят в
шкале отношений или интервалов, и форма взаимосвязи линейная,
используется коэффициент корреляции Пирсона. Обозначается он латинской
буквой . Вычисление значения
производят по формуле:
,
где и - средние арифметические значения показателей X и Y;
σx и σy - средние квадратические отклонения показателей X и Y;
n – число пар измерений.
Условия применения:
1) сравниваемые переменные должны быть получены в интервальной
шкале или шкале отношений;
2) распределения x и y должны быть близки к нормальному;
3) число варьирующих признаков в сравниваемых переменных X и Y
должно быть одинаковым;
Основная статистическая гипотеза, которая проверяется
корреляционным анализом, является ненаправленной и содержит
утверждение о равенстве корреляции нулю в генеральной совокупности H0:
rxy = 0 (отсутствие линейной корреляционной зависимости). При ее
отклонении принимается альтернативная гипотеза H1: rxy ≠ 0 о наличии
положительной или отрицательной корреляции – в зависимости от знака
вычисленного коэффициента корреляции.
Критические значения коэффициентов корреляции r-Пирсона даны в
Таблице 4 Приложения по абсолютной величине. Таблицы уровней
значимости для коэффициента корреляции Пирсона рассчитаны от n = 5 до
n = 1000. При получении как положительного, так и отрицательного
коэффициента корреляции по формуле оценка уровня значимости этого
коэффициента проводится по той же таблице приложения без учета знака, а
знак добавляется для дальнейшей интерпретации характера связи между
переменными X и Y.
Поиск критических значений ведется по числу пар измерений. По оси
значимости определяется зона попадания rxy. Формулируются выводы.
Достоверность также можно определить по формуле:
10
(3)
Стр.10