Статистическа проверка на хипотези

Същност на статистическата проверка на хипотези

СПХ е методология за проверка на предварително издигната статистическа хипотеза. Това е едно от двете основни направления в статистическия анализ за изводи и заключение

Особености на СПХ

  • Направените изводи и заключения винаги имат вероятностен характер
  • Предварително може да се определи вероятността, с която гарантираме достоверността на направеното заключение и риска за грешка в изводите

Условия за приложение на СПХ

  • Информацията въз основа на която се прави проверката на хипотези трябва да бъде осигурена от представителна извадка
  • Трябва да се изпълни контретните изисквания на приложение на съответния статистически критерий

Видове СПХ

  • Класически СПХ
  • Последователен анализ

Статистическа хипотеза

Статистическа хипотеза е предположение отностно стойността на даден параметър или формата на емпиричното разпределение на генералната съвкупност

Видове статистически хипотези

  • Проста хиотеза- хипотеза, при която благоприятния изход а само един
  • Сложна хипотеза – хипотеза, при която благоприятните изходи са повече от един

Нулева хипотеза(H0) – нарича се още основна хипотеза тъй като това е предположението, чиято истинност се проверява, т.е. при прилагане на статистическата процедура се достига до заключение относно достоверността на предположението. Нулевата хипотеза винаги се формулира като проста хипотеза

Алтернативна хипотеза(Hi) – хипотеза която се противопоставя на твърдението в нулевата хипотеза. Тази хипотеза обикновено e съставна хипотеза. Според характера и възможностите на статистическия критерий, в нейното твърдение може да се включва всички възможни алтернативни изходи на твърдението в нулевата хипотеза или да се включват само част от тези алтернативни изходи.

Грешка от първи род – да отхвърлите H0, когато е вярна. Измерва се с вероятността това да се случи, която се нарича равнище на значимост

Грешка от втори род – да примем H0 не е вярна. Измерва се с вероятността за това. Вероятността да отхвърлим H0, когато тя не е вярна се нарича мощност на критерия.

Метод на СПХ

  • Методи на СПХ се определят съобразно това, дали познаваме стохастичното разпределение на статистическата харакеристика или не
  • Параметричен метод – прилага се когато познаваме стохастичното разределение на статистическата характеристика. Такива са t теста F – теста, z- теста
  • Непараметричен метод – прилага се когато не познаваме стохастичното разпределение на стандартизираната характеристика най-често прилагаме X – теста.

Статистически критерий(тест)

Чрез статистически критерии се извърша самата проверка на нулева хипотеза. Вида на теста зависи от вида на стохастичното разпределение на статистическата характеристика. Ако характеристиката има t – разпределение използваме t – теста, ако не ползваме стохастично разпределение на статистическата характеристика, използваме обикновенно X – теста= статистическия критерий има j

  • Статистическа характеристика
  • Равнище на значимост
  • Критична област

Статистическа характеристика

Статистическа характеристика представлява математическа функция на проверяваните параметри. Тя има два елемента – емпирична характеристика и теоретична характеристика

  • Емпиричната характеристика е математически израз в който участват оценките на проверяваните параметри, параметрите на стохастичното разпределение и някои специфични обобщаващи величини. Тя отразява комплексното действие на закономерните и случайните фактори, формиращи стойностите на проверяваните параметри
  • Теоретична характеристика е функцията на стохастичното разпределение на статистическата характеристика. Нейнаста стойност отразява само влиянието на случайните фактори, формиращи стойностите на проверяваните параметри

Сравняването на двете характеристики – емперичната и теоретичната, позволява да се разграничи действието на случайните от това на закономерните фактори. Въз основа на това сравнение се взима и конкретното решение на изхода от процедурата на СПХ.

Критична област

При процедура на СПХ областта от значение на емпиричната харастеристика разделя на 2 области:

  • Област на приемане на нулевата хипотеза – това е тази област от значения на емпиричната характеристика, за които се приема H0
  • Критична област(w) – това е областта от значения на емпиричната харакнеристика, за които нулевата хипотеза се отхвърля

Размерът на критичната област се измерва като относителен дял на значенията, които и принадлежат, спрямо всички възможни значения на емпиричната характеристика. Следователно като размер критичната област е равна точно на равнището на значимостта.

Двустранна ктирична област – областта от значения на емпирината характеристика за които нулевата хипозеса се отхвръля, се намират от двете страни на зоната за приемане на H0, като се разделят на две равни части. Тъй като общият размер на критичната зона е равна на alfa, то всяка от двете части при двустранна област ще бъде равна тоно на alfa/2.

Едностранна критична област – област от значение на емпиричната характеристика, за които нулевата хипотеза се отхвърля се намират от едната страна на зоната за приемане на H0. Според посоката на разположение едностранна критична област бива съответно дясностранна и лявостранна. И в двата случая едностранна критична зона е  равна на алфа.

Етап на процедура на СПХ

  • Дефиниране на нулевата H0 и алтернативната Hi хипотеза. Нулевата от хипотеза винаги се дефинира като проста хипотеза. Начина на дефиниране на алтернативната хипотеза зависи от чувствителността на използвания статистически критерий. Някои критерии позволяват различни варианти на дефиниция на H други не.
  • Фиксиране на равнище на значимост. Изследователя определя какво да бъде равнището на значимост според степента на отговорност на резултатите. Обикновено се работи с няколко равнища на значимост(α=0.05; α=0.01; α=0.001)
  • Определяне на статистическия метод за проверка. Вида на теста се избира според вида на стохастичното разпределение на емпиричната характеристика
  • Набиране на представителна информация. Осъществява се чрез извадково представително изучаване
  • Изчисляване на емпиричната характеристика на критерия. Въз основа на данните от извадката / извадките се изчислява стойност на Х с помощта на съответния математически израз
  • Определяне характера на критичната област(ако има необходимост). Вида на критинчната област може да бъде различен при някои от статистическите критерии(t – тест(при големи извадни(над 30)), z-тест(при малки извадки(под 30 единици)) При относителни дялове се използва 50 единици)
  • В тези случаи вида на критичната област зависи изключително начина на дифиниране на При някои статистически критерии критичната област остава една и съща по вид, тъй като….(слайда е отрязан)
  • Определяне на теоретичната характеристика. Теоретичната характеристика се определя от съответната статистическа таблица. Статистическите таблици са разработени за различните вероятностни разпределения, които са в основата на статистическите тестове. Те са разработени за практически нужди и съдържат стойностите на функцията на съответното разределение при допустими сотйности на неговите параметри.
  • Взимане на решение относно проверяваната хипотеза. Вземането на решение се осъществява въз основа на правило за вземане на решение, базирано на сравнението на емпиричната и теоретичната характеристика. В най-общия случай правилото за вземане на решение
    • При ϴ<= ϴ се приема нулева хипотеза H0 – Ако емперичната характеристика е по-малка от теоретичната то Н0 се потвърждава
    • При ϴ> ϴ се отхвърля нулева хипотеза Н0 – Ако емпиричната характеристика е по-голяма от теоретичната, то Н0 се отхвърля.

Във втория случай за практически цели се приема, че е вярна алтернативната хипотеза

  • Заключение от направената статистиеска проверка. Формулира се заключение, в което се упоменава равнището на значимост и (слайда е отрязан)