T-критерій Стьюдента

t-критерій Стьюдента/Ст'юдента — загальна назва для класу методів статистичної перевірки гіпотез (статистичних критеріїв), заснованих на порівнянні з розподілом Стьюдента. Найчастіші випадки застосування t-критерію пов'язані з перевіркою рівності середніх значень у двох вибірках^[1].

Історія

Цей критерій розробив був Вільям Ґоссет для оцінки якості пива в компанії Гіннес. У зв'язку із зобов'язаннями перед компанією не розголошувати комерційної таємниці (якою керівництво Гіннесу вважало таке використання статистичного апарату в своїй роботі), стаття Ґоссета вийшла в 1908 році в журналі «Біометрика» під псевдонімом «Student» (Студент).^[2]

Вимоги до даних

Для застосування названого критерію потрібно аби початкові дані мали нормальний розподіл. У разі застосування двовибіркового критерію для незалежних вибірок також потрібно дотримуватися умови рівности дисперсій. Існують, проте, альтернативи критерію Стьюдента для ситуації з нерівними дисперсіями.

Двовибірковий t-критерій для незалежних вибірок

У разі якщо розміри вибірок відрізняються мало, застосовують спрощену формулу наближених розрахунків:

t={\frac {|M_{1}-M_{2}|}{\sqrt {{\frac {\sigma _{1}^{2}}{N_{1}}}+{\frac {\sigma _{2}^{2}}{N_{2}}}}}}

Коли розміри вибірок відрізняються значно, застосовується складніша і точніша формула:

t={\frac {|M_{1}-M_{2}|}{\sqrt {{\frac {(N_{1}-1)\sigma _{1}^{2}+(N_{2}-1)\sigma _{2}^{2}}{N_{1}+N_{2}-2}}({\frac {1}{N_{1}}}+{\frac {1}{N_{2}}})}}}

Де $M_{1},M_{2}$ — середнє арифметичне, $\sigma _{1},\sigma _{2}$ — стандартне відхилення, а $N_{1},N_{2}$ — розміри вибірок.

Кількість ступенів свободи розраховують як

\,df=N_{1}+N_{2}-2

Двовибірковий t-критерій для залежних вибірок

Для обчислення емпіричного значення t-критерію в ситуації перевірки гіпотези про відмінності між двома залежними вибірками (наприклад, двома пробами одного і того ж тесту з часовим інтервалом) застосовують таку формулу:

t={\frac {|M_{d}|}{\sigma _{d}/{\sqrt {N}}}}

де $M_{d}$ — середня різниця значень, а $\sigma _{d}$ — стандартне відхилення різниць.

Кількість ступенів свободи розраховують як

\,df=N-1

Одновибірковий t-критерій

Застосовується для перевірки гіпотези про відмінність середнього значення $\,M_{x}$ від деякого відомого значення $\,A$ :

$t={\frac {|M_{x}-A|}{\sigma /{\sqrt {N}}}}$

Кількість ступенів свободи розраховують як

\,df=N-1

Непараметричні аналоги

Аналогом двостороннього критерію для незалежних вибірок є U-критерій Манна-Уітні. Для ситуації із залежними вибірками аналогами є критерій знаків і T-критерій Вілкоксона.

Див. також

Статистичний критерій

Посилання

↑ Ромакін В. В. Комп'ютерний аналіз даних — 6.2.1. Застосування критерію Стьюдента для порівняння середніх^{[недоступне посилання з червня 2019]}
↑ Mankiewicz, Richard (2004). The Story of Mathematics (вид. Paperback). Princeton, NJ: Princeton University Press. с. 158. ISBN 9780691120461. Архів оригіналу за 11 травня 2017. Процитовано 13 листопада 2018.

Інтернет посилання

Ромакін В. В. Комп'ютерний аналіз даних: Навчальний посібник. — Миколаїв: Вид-во МДГУ ім. Петра Могили, 2006. — 144 с.

Статистика

Нарис
Індекс^[en]

Описова статистика

Неперервні дані

Центр	Середнє арифметичне геометричне гармонійне середні зважені Медіана Мода

Розкид	Дисперсія Стандартне відхилення Коефіцієнт варіації Перцентиль Розмах Міжквартильний розмах

Форма	Центральна гранична теорема Момент Асиметрія Ексцес L-момент

Чисельні дані

Індекс дисперсії

Підсумкові таблиці

Залежність

Графіки

Збирання даних

Планування дослідження	Генеральна сукупність Статистика Розмір ефекту^[en] Статистична потужність Оптимальний план Вибірка Визначення розмірів вибірки Реплікація^[en] Пропущені дані^[en]

Методологія дослідження	Відбір вибірки стратифікований кластерний Стандартне відхилення середнього арифметичного Опитування Анкетування

Активні експерименти	Науковий контроль Рандомізований експеримент Контрольоване дослідження Випадкове призначування^[en] Групування Взаємодія (статистика) Повний факторний експеримент

Адаптивне планування	Адаптивне клінічне випробування^[en] Збільшувально-зменшувальні плани^[en] Стохастичне наближення^[en]

Пасивні дослідження	Поперечне дослідження Когортне дослідження Природний експеримент Квазі-експеримент

Статистичне висновування

Теорія статистики

Генеральна сукупність
Статистика
Розподіл імовірності
Вибірковий розподіл
- порядкова статистика
Емпіричний розподіл
- оцінка густини
Статистична модель
- визначення моделі^[en]
- простір L^p
Параметр
Параметричне сімейство^[en]
- правдоподібність (монотонна)^[en]
- зсувно-масштабне сімейство^[en]
- експоненційне сімейство^[en]
Повнота^[en]
Достатність
Статистичний функціонал^[en]
- натяжка
- U^[en]
- V^[en]
Оптимальне рішення
- функція втрат
Ефективність^[en]
Статистична відстань^[en]
- розходження^[en]
Асимптотика^[en]
Робастність

Частотницьке висновування

Точкова оцінка	Оцінні рівняння^[en] максимальна правдоподібність метод моментів M-оцінювач^[en] мінімальна відстань^[en] Незміщені оцінки усереднено-незміщена мінімально-дисперсійна^[en] Рао — Блеквелізування теорема Леманна — Шеффе^[en] Медіана Замінна^[en]

Інтервальне оцінювання^[en]	Довірчий інтервал Центральна величина^[en] Інтервал правдоподібності Прогнозний інтервал^[en] Толерантний інтервал^[en] Перевибірка^[en] натяжка складаний ніж

Перевірка гіпотез	1- та 2-бічна^[en] Потужність рівномірно найпотужніший критерій^[en] Критерій перестановок критерій рандомізації^[en] Множинні порівняння

Параметричні критерії^[en]	Відношення правдоподібностей Множники Лагранжа^[en] Вальд^[en]

Спеціальні критерії

Z-критерій (нормальний) t-критерій Стьюдента F-критерій

Допасованість	Хі-квадрат G-критерій^[en] Колмогорова-Смирнова Андерсона–Дарлінга Ліллієфорса^[en] Харке–Бера^[en] Нормальність (Шапіро–Вілка)^[en] Перевірка відношенням правдоподібностей Обирання моделі Перехресне затверджування ІКА БІК

Ранжувальні статистики	Знаків^[en] вибіркова медіана^[en] Знаковий ранг (Уілкоксона)^[en] оцінювач Ходжеса–Лемана^[en] Рангова сума (Манна–Уітні) Непараметричний^[en] дисперсійний аналіз 1-бічний (Краскела–Уоліса)^[en] 2-бічний (Фрідмана) впорядкована альтернатива (Джонкгіра–Терпстра)^[en]

Баєсове висновування

Кореляційний та регресійний аналіз

Кореляція	Коефіцієнт кореляції Пірсона Часткова кореляція Змішувальна змінна Коефіцієнт детермінації

Регресійний аналіз	Похибки та залишки Регресійне затверджування^[en] Моделі змішаних впливів Система одночасних рівнянь^[en] Сплайни багатовимірної адаптивної регресії (MARS)^[en]

Лінійна регресія	Проста лінійна регресія Звичайний метод найменших квадратів^[en] Загальна лінійна модель Баєсова лінійна регресія

Нестандартні передбачувачі	Нелінійна регресія^[en] Непараметрична^[en] Напівпараметрична^[en] Ізотонічна^[en] Робастна^[en] Гетероскедастичність Гомоскедастичність

Узагальнена лінійна модель^[en]	Експоненційні сімейства^[en] Логістична (Бернуллі) / Біноміальна регресія^[en] / Регресія Пуассона

Розбиття дисперсії^[en]	Дисперсійний аналіз (ANOVA) Коваріаційний аналіз Багатовимірний дисперсійний аналіз (MANOVA)^[en] Ступені вільності

Категорійний / багатовимірний аналіз / аналіз часових рядів / виживаності

Категорійний

Каппа Коена^[en]
Таблиця спряженості
Графова модель
Логарифмічна модель
Критерій МакНімара^[en]

Багатовимірний

Регресія
Багатовимірний дисперсійний аналіз (MANOVA)^[en]
Головні компоненти
Канонічна кореляція
Дискримінантний аналіз
Кластерний аналіз
Класифікація
Модель структурних рівнянь^[en]
- факторний аналіз
Багатовимірні розподіли
- еліптичні розподіли
  - нормальний

Часові ряди

Загальне	Розклад Тенденції Стаціонарність Сезонне пристосування^[en] Експоненційне згладжування Коінтеграція^[en] Структурний розрив^[en] Причинність за Грейнджером^[en]

Спеціальні критерії	Дікі–Фуллера Йохансена^[en] Q-статистика (Льюнга-Бокса) Дарбіна–Уотсона Бройша–Годфрі^[en]

Часова область	Автокореляція (ACF) Частинна автокореляція (PACF)^[en] Взаємна кореляція (XCF) Авторегресійне ковзне середнє (ARMA) Метод Бокса–Дженкінса (ARIMA)^[en] Авторегресивна умовна гетероскедастичність (ARCH) Векторна авторегресія (VAR)

Частотна область	Оцінка^[en] спектральної густини Аналіз Фур'є Вейвлет Уіттлівська правдоподібність^[en]

Виживаність

Функція виживаності^[en]	Оцінювач Каплана–Меєра (границі добутку)^[en] Модель пропорційних ризиків^[en] Модель прискореного часу до відмови^[en] Момент першого влучання^[en]

Інтенсивність відмов	Оцінювач Нельсона–Аалена^[en]

Критерій	Логарифмічний ранговий критерій^[en]

Застосування

Біологічна статистика	Біоінформатика Клінічні випробування / дослідження^[en] Епідеміологія Медична статистика

Інженерна статистика	Хемометрія Інженерія методів^[en] Імовірнісне проєктування^[en] Керування процесами / якістю Теорія надійності Ідентифікація систем^[en]

Соціальна статистика^[en]	Актуарна математика Перепис населення Правова статистика Демографічна статистика Економетрія Юриметрія^[en] Національне рахівництво Офіційна статистика^[en] Психометрія

Просторова статистика	Картографія Екологічна статистика^[en] Геоінформаційні системи Геостатистика Кригінг