Статистическа групировка и сводка

Статистическа групировка – целенасочено систематизиране, подреждане и обобщаване на статистически данни в качествено еднородни групи.

Цели на статистическата групировка

  • Да се получи обобщена количествена характеристика на изследваното явление
  • Да се разкрие вътрешната структура на явлението
  • Да се установят вътрешни закономерности за изследваното явление

Видове статистически групировки:

  • Според вида на признака
    • Категориен признак
    • По метриран признак
  • Според начина на оформяне на групите
    • Дискретни – такава групировка в която групите в които разпределяме единиците на изучаваната съвкупност съдържат само по едно значение на признака – прави се само когато признака е неметриран (номенклатура) или е метриран прекъснат признак
    • Интервални – групите в които разпределяме единиците съдържат по повече от едно значение на признака(например ако изследваме дохода взимаме интервали до 100лв, от 100-200 и т.н.)
  • Според броя на признаците
    • Едномерни
    • Двумерни(крос таблици)
    • Многомерни

 

Процедура на статистическо групиране

Съставяне на групите за групиране. Групите трябва:

  • Да отразяват вътрешната структура на явлението
  • Да осигуряват обхващането на всички единици в съвкупността
  • Да осигуряват едновременно разпределението на единиците

Отнасяне на единиците по групи

  • Разпределение на единиците по групите съобразно значенията им по съответния признак

Определяне и изчисляване на описателните характеристики на получено разпреселение

  • Абсолютна честота(fi)
  • Относителна честота(pi) – класически и коригирани

                   pi =                                                          pi ` =

  • Кумулативни честоти(ci) – абсолютни и относителни

                                  ci – ci-1 +fi

Особености при едномерните групировки. Техника за определяне групировката при интервалната групировка:

  • Целеви признаци – ширините на интервала в отледните групи и броя на групите се определят експертно, съобразно определени цели на групировка. Обикновено това са групировките с различна ширина на интервалите
  • Метод на Стърджес – само групировките с равни ширини на интервалите
  • Аритметичен метод – само за групировките с равни ширини на интервала
  • Най-често на практика се прилага аритметичния метод. При него предварително се определя броя на групите(k) и след това се изчислява ширината на интервала(h) с помощта на следната формула:

h = (Хмах – Хmin)/k

Графично представяне на резултатите:

  • Тази диаграма се прилага най-често при категорийни признаци
  • Полигон на едномерно емпирично разпределение – линейна диаграма, която представя съотвествието между значенията на статистическия признак и абсолютните или относителните честоти. Използва се за графично представяне на емпирично разпределение само по метриран признак.
  • Хистограма на едномерно емпирично разпределение – правоъгълна плоскостна диаграма, която представя съотвествието между значениеята на статистически признак и абсолютните или относителните честоти. Изпозва се за графично представяне на емпиричното разпределение само по метриран признак.

Същност на едномерни емпирични разпределения

Форма на представяне на едномерните емпирични разпределения

  • Статистически ред на разпределение. Емпиричното разпределение се представя в таблиен вид
  • Полигон на разпределението. Графично представяне на емпиричните едномерни разпределения по количествени признаци под формата на линейна графика
  • Хистограма

Видове едномерни емпирични разпределения

  • Според вида на признака, по който са получени
    • По категориен признак
    • По количествен признак
  • Според единиците, които обхващат
    • Разпределение на генерелната съвкупност
    • Разпределение на извадка
  • Според формата на полигона
    • Симетрично, асиметрично
    • Според броя на върховете – Едномодално, бимодално, полимодално

Видове едномерни емпирични разпределения

  • Симетрично разпределение(камбановидно)
  • Асиметрично разпределение(дясно и ляво асиметрично разпределение)
  • L-разределение и J-разпределение(крайни форми на разпределение)
  • U – разпределение

Обобщаващи статистически характеристики на еднометрични разпределения

  • Център на разпределението(център на тежеста- х) – или Е(x) – стойност на признака спрямо която сумата от отклонението на всички индивидуални значения на признака по-малко от тази стойност е равна на сумата от отклоненията на всички индивидуални значения на признака по-големи от нея
  • Центъра на разпределенеито показва къде е фиксирано разпределението от значения на признака спрямо началото на скалата на измерване
  • В статистика центъра на разпределение се изчисляа чрез средни величини – средна аритметична, средна хармонична, средна квадратична, средна кубична, медиана, мода и други.

Степен на разсейване – степента на отдалеченост на индивидуалните значения на признака от определена характерна стойност(обикновено от центъра на разпределение). Степента на разсейване показва в обобщен вид какви са отклоненията на индивидуалните значения на признака от определена стойност. В статистиката степента на разсейване се измерва с подходящи показатели за разсейване – размах, средно аридметично отклонение, средно квадратично(стандартно) отклонение.

Форма на разпределение – формата на емпирично разпределение се определя чрез сравнение на формата на полигона на разпределението спрямо полигона на симетричното разпредленетие

Симетрично разпределение – честотно разпределение, чиито рамена на полигона по отношение на перпендикуляра, построен през центъра на разпределение са огледално еднакви, т.е. ако прегънем кривата на полигона на разределението по перпендикуляра, построен през центъра му , то двете рамена ще съвпадат напълно

Сравяването на полигона на едно емпирично разпределение е полигона на симетрично се осъществява като центрове на двете разпределения съвпадат