Фехнер коефіцієнт кореляції знак рік видання. Коефіцієнт Фехнера (коефіцієнт кореляції знаків). Загальне уявлення про кореляційно-регресивний аналіз

При кореляційному зв'язку разом з досліджуваним фактором або декількома факторами при множинній кореляції на результативну ознаку впливають інші фактори, які не враховуються або не можуть бути точно враховані. При цьому дія їх може бути спрямована як у бік підвищення результативної ознаки, так і її зниження. Отже, дослідження зв'язку відбувається в умовах, коли цей зв'язок більшою чи меншою мірою загасається суперечливою дією інших причин. Тому одне із завдань кореляційного аналізу полягає у визначенні тісноти зв'язку між ознаками, у визначенні сили впливу досліджуваного фактора (факторів) на результативну ознаку.

Тіснота зв'язку в кореляційному аналізі характеризується за допомогою спеціального відносного показника, який отримав назву коефіцієнта кореляції

При парній лінійній залежності тіснота зв'язку визначається за допомогою лінійного коефіцієнтакореляції

Коефіцієнт кореляції знаходиться в межах від 0 до±1. Якщо коефіцієнт кореляції дорівнює нулю, то зв'язок відсутній, а якщо одиниці, то зв'язок функціональна. Знак при коефіцієнті кореляції вказує на напрямок зв'язку ("+" - прямий"-" - зворотний). Що ближче коефіцієнт кореляції до одиниці, то зв'язок між ознаками тісніше.

Квадрат коефіцієнта кореляції називається коефіцієнтом детермінації (г2). Він показує, яка частка загальної варіації результативної ознаки визначається фактором, що досліджується. Якщо коефіцієнт детермінації виражений у відсотках, його слід читати так: варіація (коливання) залежної змінної стільки-то відсотків обумовлена ​​варіацією чинника.

Між лінійним коефіцієнтом кореляції (г) та коефіцієнтом повної регресії(Ь) зв'язок:

Отже, знаючи коефіцієнт кореляції (г) та значення середніх квадратичних відхилень пох івможна визначити коефіцієнт регресії (Ь) і навпаки, знаючи коефіцієнт регресії (Ь) та відповідні середні квадратичні відхилення можна обчислити коефіцієнт кореляції (г).

При парній лінійній залежності коефіцієнт кореляції та коефіцієнт повної регресії мають однакові знаки (плюс, мінус).

Лінійний коефіцієнт кореляції призначений з метою оцінки ступеня тісноти зв'язку при лінійній залежності. Для випадків нелінійного зв'язку між ознаками використовується інша формула коефіцієнта кореляції, яка випливає із правила складання дисперсій:

Із наведеної рівності видно, що чим більший вплив фактора на результативну ознаку, тим більшою мірою її значення дисперсії ("м.гр.) наближається до значення загальної дисперсії результативної ознаки.

Відповідно, чим більше "м.гРі менше ае.гртим зв'язок між ознаками буде вже й навпаки. Отже, відношення міжгрупової (факторної) та загальної дисперсій використовується для оцінки тісноти зв'язку між ознаками. Формула коефіцієнта кореляції має вигляд:

Враховуючи, щосг2я = о-а-вугілля!>, формулу коефіцієнта кореляції можна представити як

Обидві формули коефіцієнта кореляції застосовуються для розрахунку тісноти зв'язку за будь-якої форми зв'язку.

З правила додавання дисперсій видно, що значення коефіцієнта кореляції знаходиться в межах від 0 до 1. Знак коефіцієнта кореляції з формули не виводиться. Якщо вивчається зв'язок між двома ознаками (парна проста кореляція), напрям зв'язку (знак перед г) визначається безпосередньо за знаком перед коефіцієнтом регресії лінійного рівняння.

При парній криволінійній залежності, тіснота зв'язку при лінійній залежності визначається за допомогою спеціального показника, аналогічного розглянутому вище коефіцієнта кореляції р.

Цей показник (щоб підкреслити його приналежність до криволінійного зв'язку) позначають символом іг і називають індексом кореляції:

Числове значення індексу кореляції аналогічне коефіцієнту кореляції: якщо іг= 1 - зв'язок функціональний, якщо іг= 0 – зв'язок відсутній; чим іг ближче до одиниці, тим зв'язок між ознаками тісніше.

Якщо відомі коефіцієнти регресії рівняння зв'язку, то індекс кореляції можна визначити за іншою, більш простою формулою. Так, при параболічній залежності формула індексу кореляції може бути представлена ​​як

Тіснота зв'язку при множинній кореляції визначається за допомогою коефіцієнта множинної кореляції (її) та коефіцієнта множинної детермінації (ї2).За змістом вони аналогічні коефіцієнтам кореляції та детермінації при парному зв'язку. їх обчислення ґрунтується на порівнянні міжгрупової (факторної) та загальної дисперсій:

Ця формула може бути застосована для визначення тісноти зв'язку за будь-якої форми зв'язку.

Розмір рч. змінюється від 0 до 1 і розглядається як позитивна, оскільки при множинних залежностях зв'язок результативної ознаки з одними факторами може бути позитивним, а з іншими негативним.

Для випадку залежності результативної ознаки від двох факторів формула коефіцієнта множинної кореляції має вигляд

де Гі – парні лінійні коефіцієнти кореляції.

Наведена формула застосовується визначення тісноти зв'язку при лінійної залежності.

Для визначення тісноти зв'язку між результативною ознакою і кожним фактором при виключенні впливу інших факторів визначають приватні коефіцієнти кореляції, які характеризують "чистий" вплив фактора на результативну ознаку. Для розрахунку використовуються парні коефіцієнти кореляції.

У разі залежності результативної ознаки від двох факторів (х1 та х2) можна розрахувати три коефіцієнти часткової кореляції:

1) між ві х1 за винятком впливу х2:

Коефіцієнти кореляції при парних та множинних зв'язків, а також індекс кореляції - це відносні величини, тому вони можуть бути використані для зіставлення тісноти зв'язку за декількома явищами, що аналізуються.

Слід пам'ятати, що показники тісноти зв'язку залежить від розмаху варіювання досліджуваних ознак. Що більше варіація змінних, то вище буде величина показників тісноти зв'язку.

Визначимо тісноту зв'язку між досліджуваними ознаками нашого прикладу. Оскільки між продуктивністю корів та рівнем годівлі має місце лінійний зв'язок, тісноту зв'язку визначимо за допомогою лінійного коефіцієнта кореляції.

Коефіцієнт кореляції показує, що між продуктивністю корів та рівнем годівлі має місце тісний (сильний) зв'язок.

p align="justify"> Коефіцієнт детермінації г2 = 0,93442 = 0,8731 показує, що 87,31% загального коливання продуктивності корів обумовлено відмінностями в рівні годування, а решта 12,69% (100 - 87,31) - іншими факторами, які в даному випадку не було враховано.

Коефіцієнт кореляції можна знайти і за іншими формулами.

Коефіцієнт кореляції, запропонований у ІІ-й половині ХІХ століття Г. Т. Фехнером, є найпростішим заходом зв'язку між двома змінними. Він заснований на зіставленні двох психологічних ознак x iі y i, Виміряні на одній і тій же вибірці, в порівнянні знаків відхилень індивідуальних значень від середнього: і
. Висновок кореляції між двома змінними робиться виходячи з підрахунку числа збігів і розбіжностей цих символів.

Приклад

Нехай x iі y i– дві ознаки, виміряні однією і тієї ж вибірці піддослідних. Для обчислення коефіцієнта Фехнера необхідно обчислити середні значення кожної ознаки, і навіть кожного значення змінної – знак відхилення від середнього (табл. 8.1):

Таблиця 8.1

x i

y i

Позначення

В таблиці: а- Збіги знаків, b- Розбіжності знаків; n a – кількість збігів, n b – число розбіжностей (у разі n a = 4, n b = 6).

Коефіцієнт кореляції Фехнера обчислюється за такою формулою:

(8.1)

У цьому випадку:

Висновок

Між досліджуваними змінними існує слабкий негативний зв'язок.

Необхідно відзначити, що коефіцієнт кореляції Фехнера не є досить суворим критерієм, тому його можна використовувати лише на початковому етапі обробки даних та для формулювання попередніх висновків.

8. 4. Коефіцієнт кореляції Пірсона

Вихідний принцип коефіцієнта кореляції Пірсона - використання добутку моментів (відхилень значення змінної від середнього значення):

Якщо сума творів моментів велика та позитивна, то хі упов'язані прямою залежністю; якщо сума велика та негативна, то хі усильно пов'язані зворотною залежністю; нарешті, у разі відсутності зв'язку між xі усума добутків моментів близька до нуля.

Щоб статистика не залежала від обсягу вибірки, береться не сума творів моментів, а середнє значення. Проте розподіл проводиться не так на обсяг вибірки, але в число ступенів свободи n - 1.

Величина
є мірою зв'язку між хі уі називається коваріацією хі у.

У багатьох завданнях природничих та технічних наук коваріація є цілком задовільною мірою зв'язку. Її недоліком є ​​те, що діапазон її значень не фіксований, тобто вона може змінюватись у невизначених межах.

Для того, щоб стандартизувати міру зв'язку, необхідно позбавити коваріацію впливу стандартних відхилень. Для цього треба поділити S xyна s x і s y:

(8.3)

де r xy- Коефіцієнт кореляції, або добуток моментів Пірсона.

Загальна формула для обчислення коефіцієнта кореляції виглядає так:

(деякі перетворення)

(8.4)

Вплив перетворення даних на r xy:

1. Лінійні перетворення xі yтипу bx + aі dy + cне змінять величину кореляції між xі y.

2. Лінійні перетворення xі yпри b < 0, d> 0, а також за b> 0 та d < 0 изменяют знак коэффициента корреляции, не меняя его величины.

Достовірність (або, інакше, статистична значущість) коефіцієнта кореляції Пірсона може бути визначена у різний спосіб:

За таблицями критичних значень коефіцієнтів кореляції Пірсона та Спірмена (див. Додаток, табл. XIII). Якщо отримане у розрахунках значення r xy перевищує критичне (табличне) значення для цієї вибірки, коефіцієнт Пірсона вважається статистично значущим. Число ступенів свободи у цьому випадку відповідає n- 2, де n- Число пар порівнюваних значень (обсяг вибірки).

За таблицею XV Додатків, яка має назву «Кількість пар значень, необхідне статистичної значущості коефіцієнта кореляції». У разі необхідно орієнтуватися на коефіцієнт кореляції, отриманий у обчисленнях. Він вважається статистично значущим, якщо обсяг вибірки дорівнює або перевищує табличне число пар значень даного коефіцієнта.

За коефіцієнтом Стьюдента, який обчислюється як відношення коефіцієнта кореляції до його помилки:

(8.5)

Помилка коефіцієнта кореляції обчислюється за такою формулою:

де m r - помилка коефіцієнта кореляції, r- Коефіцієнт кореляції; n- Число порівнюваних пар.

Розглянемо порядок обчислень та визначення статистичної значущості коефіцієнта кореляції Пірсона на прикладі вирішення наступного завдання.

Умова задачі

22 старшокласники були протестовані за двома тестами: УСК (рівень суб'єктивного контролю) та МКУ (мотивація до успіху). Отримано такі результати (табл. 8.2):

Таблиця 8.2

УСК ( x i)

МКУ ( y i)

УСК ( x i)

МКУ ( y i)

Завдання

Перевірити гіпотезу у тому, що з людей із високим рівнем інтернальності (бал УСК) характерний високий рівень мотивації до успіху.

Рішення

1. Використовуємо коефіцієнт кореляції Пірсона у наступній модифікації (див. формулу 8.4):

Для зручності обробки даних на мікрокалькуляторі (у разі відсутності необхідної комп'ютерної програми) рекомендується оформлення проміжної робочої таблиці наступного виду (табл. 8.3):

Таблиця 8.3

x i y i

x 1 y 1

x 2 y 2

x 3 y 3

x n y n

Σ x i y i

2. Проводимо обчислення та підставляємо значення у формулу:

3. Визначаємо статистичну значимість коефіцієнта кореляції Пірсона трьома способами:

1-й спосіб:

У табл. XIII Додатків знаходимо критичні значення коефіцієнта для 1-го та 2-го рівнів значимості: r кр.= 0,42; 0,54 (ν = n – 2 = 20).

Робимо висновок про те, r xy > rкр . , тобто кореляція є статистично значущою для обох рівнів.

2-й спосіб:

Скористаємось табл. XV, у якій визначаємо число пар значень (число піддослідних), достатнє для статистичної значущості коефіцієнта кореляції Пірсона, рівного 0,58: для 1-го, 2-го та 3-го рівнів значущості воно становить відповідно 12, 18 і 28 .

Звідси робимо висновок у тому, що коефіцієнт кореляції є значним для 1-го і 2-го рівня, але «не дотягує» до 3-го рівня значимості.

3-й спосіб:

Обчислюємо помилку коефіцієнта кореляції та коефіцієнт Стьюдента як відношення коефіцієнта Пірсона до помилки:

У табл. X знаходимо стандартні значення коефіцієнта Стьюдента для 1-го, 2-го та 3-го рівнів значущості при числі ступенів свободи ν = n – 2 = 20: t кр. = 2,09; 2,85; 3,85.

Загальний висновок

Кореляція між показниками тестів УСК та МКУ є статистично значущою для 1-го та 2-го рівнів значущості.

Примітка:

При інтерпретації коефіцієнта кореляції Пірсон необхідно враховувати наступні моменти:

    p align="justify"> Коефіцієнт Пірсона може використовуватися для різних шкал (шкала відносин, інтервальна або порядкова) за винятком дихотомічної шкали.

    Кореляційний зв'язок далеко не завжди означає зв'язок причинно-наслідковий. Іншими словами, якщо ми знайшли, припустимо, позитивну кореляцію між зростанням і вагою у групи піддослідних, це зовсім не означає, що зростання залежить від ваги або навпаки (обидві ці ознаки залежать від третьої (зовнішньої) змінної, яка в даному випадку пов'язана з генетичними конституційними особливостями людини).

    r xu » 0 може спостерігатися не тільки за відсутності зв'язку між xі y, а й у разі сильного нелінійного зв'язку (рис. 8.2 а). У разі негативна і позитивна кореляції врівноважуються й у результаті створюється ілюзія відсутності зв'язку.

    r xyможе бути досить малий, якщо сильний зв'язок між хі успостерігається у вужчому діапазоні значень, ніж досліджуваний (рис. 8.2 б).

    Об'єднання вибірок із різними середніми значеннями може створювати ілюзію досить високої кореляції (рис. 8.2).

y i y i y i

+ + . .

x i x i x i

Рис. 8.2. Можливі джерела помилок при інтерпретації величини коефіцієнта кореляції (пояснення у тексті (пункти 3 – 5 примітки))

Коефіцієнт кореляції, запропонований у ІІ-й половині ХІХ століття Г. Т. Фехнером, є найпростішим заходом зв'язку між двома змінними. Він заснований на зіставленні двох психологічних ознак x iі y i, Виміряні на одній і тій же вибірці, в порівнянні знаків відхилень індивідуальних значень від середнього: і
. Висновок кореляції між двома змінними робиться виходячи з підрахунку числа збігів і розбіжностей цих символів.

Приклад

Нехай x iі y i– дві ознаки, виміряні однією і тієї ж вибірці піддослідних. Для обчислення коефіцієнта Фехнера необхідно обчислити середні значення кожної ознаки, і навіть кожного значення змінної – знак відхилення від середнього (табл. 8.1):

Таблиця 8.1

x i

y i

Позначення

В таблиці: а- Збіги знаків, b- Розбіжності знаків; n a – кількість збігів, n b – число розбіжностей (у разі n a = 4, n b = 6).

Коефіцієнт кореляції Фехнера обчислюється за такою формулою:

(8.1)

У цьому випадку:

Висновок

Між досліджуваними змінними існує слабкий негативний зв'язок.

Необхідно відзначити, що коефіцієнт кореляції Фехнера не є досить суворим критерієм, тому його можна використовувати лише на початковому етапі обробки даних та для формулювання попередніх висновків.

8. 4. Коефіцієнт кореляції Пірсона

Вихідний принцип коефіцієнта кореляції Пірсона - використання добутку моментів (відхилень значення змінної від середнього значення):

Якщо сума творів моментів велика та позитивна, то хі упов'язані прямою залежністю; якщо сума велика та негативна, то хі усильно пов'язані зворотною залежністю; нарешті, у разі відсутності зв'язку між xі усума добутків моментів близька до нуля.

Щоб статистика не залежала від обсягу вибірки, береться не сума творів моментів, а середнє значення. Проте розподіл проводиться не так на обсяг вибірки, але в число ступенів свободи n - 1.

Величина
є мірою зв'язку між хі уі називається коваріацією хі у.

У багатьох завданнях природничих та технічних наук коваріація є цілком задовільною мірою зв'язку. Її недоліком є ​​те, що діапазон її значень не фіксований, тобто вона може змінюватись у невизначених межах.

Для того, щоб стандартизувати міру зв'язку, необхідно позбавити коваріацію впливу стандартних відхилень. Для цього треба поділити S xyна s x і s y:

(8.3)

де r xy- Коефіцієнт кореляції, або добуток моментів Пірсона.

Загальна формула для обчислення коефіцієнта кореляції виглядає так:

(деякі перетворення)

(8.4)

Вплив перетворення даних на r xy:

1. Лінійні перетворення xі yтипу bx + aі dy + cне змінять величину кореляції між xі y.

2. Лінійні перетворення xі yпри b < 0, d> 0, а також за b> 0 та d < 0 изменяют знак коэффициента корреляции, не меняя его величины.

Достовірність (або, інакше, статистична значущість) коефіцієнта кореляції Пірсона може бути визначена у різний спосіб:

За таблицями критичних значень коефіцієнтів кореляції Пірсона та Спірмена (див. Додаток, табл. XIII). Якщо отримане у розрахунках значення r xy перевищує критичне (табличне) значення для цієї вибірки, коефіцієнт Пірсона вважається статистично значущим. Число ступенів свободи у цьому випадку відповідає n- 2, де n- Число пар порівнюваних значень (обсяг вибірки).

За таблицею XV Додатків, яка має назву «Кількість пар значень, необхідне статистичної значущості коефіцієнта кореляції». У разі необхідно орієнтуватися на коефіцієнт кореляції, отриманий у обчисленнях. Він вважається статистично значущим, якщо обсяг вибірки дорівнює або перевищує табличне число пар значень даного коефіцієнта.

За коефіцієнтом Стьюдента, який обчислюється як відношення коефіцієнта кореляції до його помилки:

(8.5)

Помилка коефіцієнта кореляції обчислюється за такою формулою:

де m r - помилка коефіцієнта кореляції, r- Коефіцієнт кореляції; n- Число порівнюваних пар.

Розглянемо порядок обчислень та визначення статистичної значущості коефіцієнта кореляції Пірсона на прикладі вирішення наступного завдання.

Умова задачі

22 старшокласники були протестовані за двома тестами: УСК (рівень суб'єктивного контролю) та МКУ (мотивація до успіху). Отримано такі результати (табл. 8.2):

Таблиця 8.2

УСК ( x i)

МКУ ( y i)

УСК ( x i)

МКУ ( y i)

Завдання

Перевірити гіпотезу у тому, що з людей із високим рівнем інтернальності (бал УСК) характерний високий рівень мотивації до успіху.

Рішення

1. Використовуємо коефіцієнт кореляції Пірсона у наступній модифікації (див. формулу 8.4):

Для зручності обробки даних на мікрокалькуляторі (у разі відсутності необхідної комп'ютерної програми) рекомендується оформлення проміжної робочої таблиці наступного виду (табл. 8.3):

Таблиця 8.3

x i y i

x 1 y 1

x 2 y 2

x 3 y 3

x n y n

Σ x i y i

2. Проводимо обчислення та підставляємо значення у формулу:

3. Визначаємо статистичну значимість коефіцієнта кореляції Пірсона трьома способами:

1-й спосіб:

У табл. XIII Додатків знаходимо критичні значення коефіцієнта для 1-го та 2-го рівнів значимості: r кр.= 0,42; 0,54 (ν = n – 2 = 20).

Робимо висновок про те, r xy > rкр . , тобто кореляція є статистично значущою для обох рівнів.

2-й спосіб:

Скористаємось табл. XV, у якій визначаємо число пар значень (число піддослідних), достатнє для статистичної значущості коефіцієнта кореляції Пірсона, рівного 0,58: для 1-го, 2-го та 3-го рівнів значущості воно становить відповідно 12, 18 і 28 .

Звідси робимо висновок у тому, що коефіцієнт кореляції є значним для 1-го і 2-го рівня, але «не дотягує» до 3-го рівня значимості.

3-й спосіб:

Обчислюємо помилку коефіцієнта кореляції та коефіцієнт Стьюдента як відношення коефіцієнта Пірсона до помилки:

У табл. X знаходимо стандартні значення коефіцієнта Стьюдента для 1-го, 2-го та 3-го рівнів значущості при числі ступенів свободи ν = n – 2 = 20: t кр. = 2,09; 2,85; 3,85.

Загальний висновок

Кореляція між показниками тестів УСК та МКУ є статистично значущою для 1-го та 2-го рівнів значущості.

Примітка:

При інтерпретації коефіцієнта кореляції Пірсон необхідно враховувати наступні моменти:

    p align="justify"> Коефіцієнт Пірсона може використовуватися для різних шкал (шкала відносин, інтервальна або порядкова) за винятком дихотомічної шкали.

    Кореляційний зв'язок далеко не завжди означає зв'язок причинно-наслідковий. Іншими словами, якщо ми знайшли, припустимо, позитивну кореляцію між зростанням і вагою у групи піддослідних, це зовсім не означає, що зростання залежить від ваги або навпаки (обидві ці ознаки залежать від третьої (зовнішньої) змінної, яка в даному випадку пов'язана з генетичними конституційними особливостями людини).

    r xu » 0 може спостерігатися не тільки за відсутності зв'язку між xі y, а й у разі сильного нелінійного зв'язку (рис. 8.2 а). У разі негативна і позитивна кореляції врівноважуються й у результаті створюється ілюзія відсутності зв'язку.

    r xyможе бути досить малий, якщо сильний зв'язок між хі успостерігається у вужчому діапазоні значень, ніж досліджуваний (рис. 8.2 б).

    Об'єднання вибірок із різними середніми значеннями може створювати ілюзію досить високої кореляції (рис. 8.2).

y i y i y i

+ + . .

x i x i x i

Рис. 8.2. Можливі джерела помилок при інтерпретації величини коефіцієнта кореляції (пояснення у тексті (пункти 3 – 5 примітки))

Різні ознаки можуть бути пов'язані між собою.

Виділяють 2 види зв'язку між ними:

  • функціональна;
  • кореляційна.

Кореляціяу перекладі російською – нічим іншим, як зв'язок.
У разі кореляційного зв'язку простежується відповідність кількох значень однієї ознаки кільком значенням іншої ознаки. Як приклади можна розглянути встановлені кореляційні зв'язки між:

  • довжиною лап, шиї, дзьоба у таких птахів як чаплі, журавлі, лелеки;
  • показниками температури тіла та частоти серцевих скорочень.

Більшість медико-биологических процесів статистично доведено присутність цього зв'язку.

Статистичні методи дають змогу встановити факт існування взаємозалежності ознак. Використання цього спеціальних розрахунків призводить до встановлення коефіцієнтів кореляції (заходи пов'язаності).

Такі розрахунки дістали назву кореляційного аналізу.Він проводиться на підтвердження залежності друг від друга 2-х змінних (випадкових величин), що виражається коефіцієнтом кореляції.

Використання кореляційного методу дозволяє вирішити декілька завдань:

  • виявити наявність взаємозв'язку між аналізованими параметрами;
  • знання наявності кореляційного зв'язку дозволяє вирішувати проблеми прогнозування. Так, існує реальна можливість передбачати поведінку параметра на основі аналізу поведінки іншого параметра, що корелює;
  • проведення класифікації з урахуванням підбору незалежних друг від друга ознак.

Для змінних величин:

  • що належать до порядкової шкали, розраховується коефіцієнт Спірмена;
  • що відносяться до інтервальної шкали - коефіцієнт Пірсона.

Це найчастіше використовувані параметри, крім них є інші.

Значення коефіцієнта може бути як позитивним, і негативними.

У першому випадку зі збільшенням значення однієї змінної спостерігається збільшення другої. За негативного коефіцієнта – закономірність зворотна.

Навіщо потрібен коефіцієнт кореляції?

Випадкові величини, Пов'язані між собою, можуть мати зовсім різну природу цього зв'язку. Не обов'язково вона буде функціональною, випадок коли простежується пряма залежність між величинами. Найчастіше на обидві величини діє ціла сукупність різноманітних факторів, у випадках, коли є загальними для обох величин, спостерігається формування пов'язаних закономірностей.

Це означає, що доведений статистично факт наявності зв'язку між величинами не є підтвердженням того, що встановлено причину змін, що спостерігаються. Як правило, дослідник робить висновок про наявність двох взаємозалежних наслідків.

Властивості коефіцієнта кореляції

Цій статистичній характеристиці притаманні такі властивості:

  • значення коефіцієнта знаходиться в діапазоні від -1 до +1. Чим ближче до крайніх значень, тим сильнішим є позитивний або негативний зв'язок між лінійними параметрами. У разі нульового значення йдеться про відсутність кореляції між ознаками;
  • позитивне значення коефіцієнта свідчить у тому, що разі збільшення значення однієї ознаки спостерігається збільшення другого (позитивна кореляція);
  • негативне значення – у разі збільшення значення однієї ознаки спостерігається зменшення другої (негативна кореляція);
  • наближення значення показника до крайніх точок (або -1 або +1) свідчить про наявність дуже сильного лінійного зв'язку;
  • показники ознаки можуть змінюватись при незмінному значенні коефіцієнта;
  • кореляційний коефіцієнт є безрозмірною величиною;
  • наявність кореляційного зв'язку перестав бути обов'язковим підтвердженням причинно-наслідкового зв'язку.

Значення коефіцієнта кореляції

Охарактеризувати силу кореляційного зв'язку можна вдавшись до шкали Челдока, у якій певному числовому значенню відповідає якісна характеристика.

У разі позитивної кореляції при значенні:

  • 0-0,3 - кореляційний зв'язок дуже слабкий;
  • 0,3-0,5 – слабка;
  • 0,5-0,7 – середньої сили;
  • 0,7-0,9 – висока;
  • 0,9-1 – дуже висока силакореляції.

Шкала може використовуватись і для негативної кореляції. І тут якісні характеристики замінюються на протилежні.

Можна скористатися спрощеною шкалою Челдока, в якій виділяється лише 3 градації сили кореляційного зв'язку:

  • дуже сильна – показники ±0,7 – ±1;
  • середня – показники ±0,3 – ±0,699;
  • дуже слабка – показники 0 – ±0,299.

Цей статистичний показник дозволяє як перевірити припущення про існування лінійної взаємозв'язку між ознаками, а й встановити її силу.

Види коефіцієнта кореляції

Коефіцієнти кореляції можна класифікувати за знаком і значенням:

  • позитивний;
  • нульовий;
  • негативний.

Залежно від аналізованих значень розраховується коефіцієнт:

  • Пірсона;
  • Спірмена;
  • Кендалу;
  • знаків Фехнера;
  • конкордації або множинної рангової кореляції.

Кореляційний коефіцієнт Пірсона використовується встановлення прямих зв'язків між абсолютними значеннями змінних. При цьому розподіл обох рядів змінних має наближатися до нормального. Порівнювані змінні повинні відрізнятися однаковим числом ознак, що варіюють. Шкала, що представляє змінні, має бути інтервальної чи шкалою відносин.

  • точного встановлення кореляційної сили;
  • порівняння кількісних ознак.

Недоліків використання лінійного кореляційного коефіцієнта Пірсона небагато:

  • метод нестійкий у разі викидів числових значень;
  • за допомогою цього методу можливе визначення кореляційної сили тільки для лінійного взаємозв'язку, за інших видів взаємних зв'язків змінних слід використовувати методи регресійного аналізу.

Рангова кореляція визначається за методом Спірмена, що дозволяє статистично вивчити зв'язок між явищами. Завдяки цьому коефіцієнту обчислюється фактично існуючий рівень паралелізму двох кількісно виражених рядів ознак, і навіть оцінюється тіснота, виявленої зв'язку.

  • що не потребують точного визначення значення кореляційної сили;
  • порівнювані показники мають як кількісні, і атрибутивні значення;
  • рівняння рядів ознак із відкритими варіантами значень.

Метод Спірмена належить до методів непараметричного аналізу, тому не потрібно перевіряти нормальність розподілу ознаки. До того ж, він дозволяє порівнювати показники, виражені в різних шкалах. Наприклад, порівняння значень кількості еритроцитів у певному обсязі крові (безперервна шкала) та експертної оцінки, що виражається в балах (порядкова шкала).

На ефективність методу негативно впливає велика різниця між значеннями порівнюваних величин. Не ефективний метод і у випадках, коли вимірювана величина характеризується нерівномірним розподілом значень.

Покроковий розрахунок коефіцієнта кореляції в Excel

Розрахунок кореляційного коефіцієнта передбачає послідовне виконання низки математичних операцій.

Наведена вище формула розрахунку коефіцієнта Пірсона, показує наскільки трудомісткий цей процес, якщо виконувати його вручну.
Використання можливостей Excell прискорює процес знаходження коефіцієнта у рази.

Достатньо дотримати нескладний алгоритм дій:

  • запровадження базової інформації – стовпець значень х та стовпець значень у;
  • в інструментах вибирається та відкривається вкладка «Формули»;
  • у вкладці вибирається «Вставка функції fx»;
  • у діалоговому вікні, що відкрилося, вибирається статистична функція «Коррел», що дозволяє виконати розрахунок кореляційного коефіцієнта між 2 масивами даних;
  • вікно, що відкрилося, вносяться дані: масив 1 - діапазон значень стовпця х (дані необхідно виділити), масив 2 - діапазон значень стовпця у;
  • натискається клавіша "ок", у рядку "значення" з'являється результат розрахунку коефіцієнта;
  • висновок щодо наявності кореляційного зв'язку між 2 масивами даних та її силою.