Open
Close

Среднее значение и вариация альтернативного признака. Показатели вариации Предельное значение дисперсии

6. Дисперсия альтернативного признака

Частный случай атрибутивного (неколичественного) признака – признак альтернативный. Когда единицы совокупности либо имеют данный изучаемый признак, либо не имеют его. Примером таких признаков является: наличие бракованной продукции, ученая степень у преподавателей вуза, работа по полученной специальности, превышение среднедушевых денежных доходов их общероссийского уровня, наличие детей в семье и т.д.

В случае наличия альтернативного признака единице совокупности присваивается значение «1». В случае отсутствия – «0».

Весами в расчетах служат:

Доля единиц обладающих данным признаком;

Доля единиц, не обладающих данным признаком

Тогда средняя величина альтернативного признака равна:

дисперсия примет вид:

Дисперсия альтернативного признака изменяется в пределах от 0 до 0,25. Максимального значения 0,25 достигает при 0,5

Пример 4.11. При выборочном опросе 300 жителей Курска 60 из них высказались положительно по поводу хранения личных денежных сбережений в коммерческих банках города

Определить средний уровень, дисперсию и среднее квадратическое отклонение признака

Практическое применение вариации альтернативного признака в основном состоит в построении доверительных интервалов при проведении выборочного наблюдения.

7. Изучение формы распределения признака. Основные характеристики закономерностей распределения

Непременным условием успешности построений, исчислений и выводов на основе вариационных рядов является однородность обобщаемых в них совокупностей, устанавливаемая на базе глубокого теоретического анализа.

Четко выраженный порядок изменения частот в соответствии с изменением величины признака называют закономерностью распределения.

Знание типа закономерности распределения, (а следовательно, и формы кривой) необходимо прежде всего:

1. Для выяснения типичности условий получения первичного статистического материала. Так, появление многовершинной или существенно асимметричной кривой говорит о разнотипном составе совокупности и о необходимости перегруппировки данных с целью выявления более однородных групп.

2. Для обеспечения правильности выполнения практических расчетов и прогнозов. Так, применение формулы Г. Стерджесса для расчета оптимального числа групп интервального ряда, правила «трех сигм», коэффициента вариации Vσ в качестве индикатора однородности совокупности, метода наименьших квадратов при моделировании корреляционной связи явлений, методов дисперсионного анализа и других правомочно лишь в условиях нормального и близких к нему распределений.

Закономерности вариационных рядов, выражающие в типе распределения их частот, наглядно выступают на графиках – гистограмме и полигоне распределения частот. Их рассмотрение показывает, что в гистограмме наблюдается большая скачкообразность распределения, а в полигоне обнаруживается постепенность перехода от одной группы к другой. Ломаная линия полигона частично сглаживает скачкообразность гистограммы, является более обобщенным приемом анализа распределения.

При увеличении строк интервального вариационного ряда и соответственном уменьшении величины его интервалов число сторон полигона распределения будет расти и ломаной линии будет присуща тенденция превратиться в пределе в некую кривую. Такая кривая называется кривой распределения. В ней происходит наибольшее освобождение данных от влияния случайных факторов. Она выявляет и показывает в максимально обобщенном виде характер вариации, закономерность распределения частот внутри однокачественной совокупности явлений.

Кривые распределения могут быть разных типов. В практике социально-экономических исследований широко применяется кривая нормального распределения. Она представляет собой одновершинную симметричную колоколообразную фигуру, правая и левая ветви которой равномерно и симметрично убывают, асимптотически приближаясь к оси абсцисс.

Отличительной особенностью этой кривой является совпадение в ней средней арифметической, моды и медианы. Если всю площадь между кривой и осью абсцисс принять за 100%, то в пределах заключено 68,3% частот, в пределах - 95,4%, в пределах 99,7% («правило трех сигм»).

Хотя нормальное, или симметричное, распределение соответствует природе ряда явлений, однако для общественных явлений оно нехарактерно, так как в нем отражаются различия, вызванные внешними воздействиями, присущие не развивающейся, а лишь колеблющейся совокупности единиц. Для социальных явлений характерно развитие, динамизм. Поэтому ряды и кривые распределения частот общественных явлений, как правило, асимметричны, в них частоты возрастают до максимума и убывают от него неравномерно. Именно наличие асимметрии, или скошенности, в рядах однородных совокупностей служит косвенным указанием на то, что исследуемый процесс проходит активную стадию развития.

Асимметричные ряды и соответствующие кривые имеют различные формы распределений, исследованные математической статистикой. Такими формами являются распределение Пуассона, распределение Максвелла, распределение Пирсона и др. Здесь асимметричность рассматривается в целом как единый тип распределения. При этом различают правостороннюю и левостороннюю асимметрии (скошенность).

Если длинная ветвь кривой расположена правее вершины, то асимметрия называется правосторонней, если эта ветвь расположена левее вершины – левосторонней. При правосторонней асимметрии при левосторонней . Поэтому разность между ними, отнесенную к , называют коэффициентом К. Пирсона и используют в качестве коэффициента асимметрии:

. (20)

При правосторонней асимметрии этот коэффициент положителен, при левосторонней – отрицателен. Если = 0, вариационный ряд симметричен. Чем больше абсолютная величина коэффициента, тем больше степень скошенности.

Наиболее точным показателем асимметрии распределения является коэффициент асимметрии , вычисляемый по формуле

(21)

где n – число единиц совокупности. Как и в случае коэффициента Пирсона, при > 0 имеет место правосторонняя асимметрия, при < 0 левосторонняя. В симметричных распределениях = 0.

Чем больше величина ||, тем более асимметрично распределение. Установлена следующая оценочная шкала асимметричности:

|| - асимметрия незначительная;

0,25 < || - асимметрия заметная (умеренная);

|| > 0,5 - асимметрия существенная.

Поскольку коэффициенты и являются относительными безразмерными величинами, они часто применяются для сравнительного анализа асимметричности различных рядов распределения.

Характер асимметрии иногда указывает на направление развития. При исследовании вариации признаков, в отношении которых имеется заинтересованность в их увеличении (выполнение норм, выпуск продукции и т.д.), правосторонняя асимметрия свидетельствует о прогрессивности развития, о том, что оно идет в сторону увеличения показателя, а левосторонняя асимметрия указывает на наличие большого числа отстающих участков.

При исследовании вариации признаков, в отношении которых имеется заинтересованность в их уменьшении (себестоимость, трудоемкость, расход сырья на единицу продукции и т.п.), правосторонняя асимметрия свидетельствует о недостатках в развитии изучаемого процесса, левосторонняя – о прогрессивности его развития, о том, что последнее идет в сторону уменьшения показателя. В распределении работников по стажу (см. пример 4.9 = 5,75 ) наблюдается правосторонняя асимметрия, так как коэффициент асимметрии положителен: (5,955-5,75):2,47=0,095. Такая асимметрия для данного ряда прогрессивна, она свидетельствует о развитии ряда в сторону увеличения исследуемого показателя.

Форму распределения можно ориентировочно определить непосредственно рассмотрением эмпирических данных ряда, особенно если они изображены гистограммой и полигоном. Чтобы убедиться в правильности ориентировочного определения формы распределения, эмпирические данные ряда исследуются на их близость к теоретическому распределению, устанавливаемому с помощью построения соответствующей кривой распределения. Однако во многих случаях ни теория, ни непосредственное рассмотрение эмпирических данных не дают ответов на вопрос о форме распределения. Тогда обычно ведется исследование на близость эмпирических данных к нормальному распределению, так как распределения с небольшой или умеренной асимметричностью в большинстве случаев по своему типу относятся к нормальным.

Для объективного суждения о степени соответствия эмпирического распределения нормальному в статистике используется ряд критериев, называемых критериями согласия или соответствия.

К ним относятся критерии Пирсона, Романовского, Ястремского, Колмогорова, основанные на использовании различных теоретических представлений.

Например, наиболее используемый критерий согласия Пирсона («хи-квадрат») определяется по формуле:

, (22)

где - эмпирические частоты (частости)

Теоретические частоты (частости)

Для оценки близости эмпирического распределения к теоретическому определяется вероятность достижения этим критерием данной величины. Если эта вероятность превышает 0,05, то отклонения фактических частот от теоретических считаются случайными, несущественными. Если же , то отклонения считаются существенными, а эмпирическое распределение – принципиально отличным от теоретического.

Для характеристики степени отклонения симметричного распределения от нормального рассчитывается показатель эксцесса. Он приближенно может быть определен с помощью коэффициента Линдберга.


, (23)

где - доля (в%) количества вариант, лежащих в интервале равном половине среднего квадратического отклонения (в ту и другую сторону от величины средней) в общем количестве вариант данного ряда;

38,29 – доля (в %) количества вариант, лежащих в интервале, равном половине среднего квадратического отклонения (в ту и другую сторону от величины средней) в общем количестве вариант ряда нормального распределения

Эксцесс может быть положительным, отрицательным и равным нулю.

У высоковершинных кривых показатель эксцесса имеет положительный знак, у низковершинных кривых – отрицательный знак. Для кривой нормального распределения его величина равна нулю.

Для более точной характеристики степени отклонения симметричного распределения от нормального рассчитывается показатель островершинности (показатель эксцесса) (Ek) по формуле:

(24)

Он, как и коэффициент Линдберга, может быть положительным, отрицательным и равным нулю. Показатель эксцесса, как и показатель асимметрии, - число отвлеченное. Предельным значением отрицательного эксцесса является значение Ek= -2; величина же положительного эксцесса является величиной бесконечной.

Определение показателей асимметрии и эксцесса имеет не только описательное значение, часто их величины дают определенные указания для дальнейшего исследования изучаемых явлений. Так, например, появление значительного отрицательного эксцесса может указывать на качественную неоднородность исследуемой совокупности.

Современные компьютерные технологии открывают широкие возможности для выполнения громоздких вычислительных операций по анализу вариационных рядов. Если материал теоретически осмыслен и выдвинута разумная гипотеза о форме распределения (последнее, кстати, ЭВМ тоже в состоянии проверить), вычислительные устройства могут быстро исчислить различные обобщающие показатели и критерии, построить графики и т.д. Это тем более возможно, так как показатели вариации сравнительно несложны и хорошо формализованы.


Список использованной литературы

1. Виноградова Н.М., Евдокимова В.Т., Хитарова Е.М. и др. Общая теория статистики: Учебное пособие /Под ред. И.Г. Венецкого/ – М.: Статистика, 1968г- 380с

2. Гусаров Виктор Максимович. Статистика: Учеб. пособие для студентов вузов обучающихся по экономическим специальностям/ В.М. Гусаров, Е.И. Кузнецова.- 2-е изд., перераб. и доп. – М.: ЮНИТИ-ДАНА, 2007.- 479с

3. Гусаров, Виктор Максимович. Обшая теория статистики: Учеб. пособие для студентов вузов обучающихся по экономическим специальностям/ В.М. Гусаров, С.М. Проява.- 2-е изд., перераб. и доп. – М.: ЮНИТИ-ДАНА, 2008.- 207с

4. Ильишев Анатолий Михайлович. Общая теория статистики: учебник для студентов вузов, обучающихся по специальностям экономики и управления / А.М. Ильишев, - М.: ЮНИТИ- ДАНА, 2008. – 535с

5. Ряузов Н.Н. Общая теория статистики: Учебник для студ. экон. спец. вузов – 4-е изд. перераб. и доп. – М.: Финансы и статистика, 1984.- 343с

6. Салин В.Н., Чурилова Э.Ю. Курс теории статистики для подготовки специалистов финансово-экономического профиля: Учебник. – М.: Финансы и статистика, 2006- 480с

7. Статистические методы анализа факторов повышения эффективности общественного производства. Учебное пособие. Под ред. Ряузова Н.Н. Акиншиной М.К.- М. ВЗФЭИ. 1980-88с

8. Статистика: Учеб. пособие / А.В. Багат, М.М. Конкина, В.М. Симчера и др.; Под ред. В.М. Симчеры. – М.: Финансы и статистика, 2005.- 368с

9. Статистика. Компьютерные лабораторные работы: Методические указания к лабораторной работе №1 « Автоматизированный априорный анализ статистической совокупности в среде MS Excel». / Г.П. Кожевникова, А.В. Голикова, А.М. Каманина, А.М. Бобров. Под ред. проф. Г.П. Кожевниковой- М.: Вузовский учебник, 2005.-72с.

10. Теория статистики: Учебник / Под ред. проф. Р.А. Шмойловой – 3-е изд., перераб. – М.: Финансы и статистика, 1999.- 560с.


ения – отчетность и специально организованное наблюдение. Отчетность – это такая форма наблюдения, при которой предприятия, организации представляют в статистические и вышестоящие органы постоянные сведения, характеризующие их деятельность. Отчетность предоставляется по заранее определенной программе в строго определенные сроки и содержит важнейшие показатели, необходимые в процессе ежедневной...

С каждым годом увеличивается, за счет внедрения новых технологий, научного подхода к делу с помощью Иркутской Сельскохозяйственной Академии. 3. Экономико-статистический анализ себестоимости яиц 3.1. Статистическое наблюдение Статистическое наблюдение представляет собой планомерное, научно организованное и, как правило, систематическое собирание данных о явлениях и процессах общественной...

Показатели вариации

Показатели вариации характеризует колеблемость индивидуальных значений признака по отношению к среднему значению, что не менее важно, чем определение самой средней. Средняя не показывает строения совокупности, как располагаются около нее варианты осредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина признака в двух совокупностях может быть одинаковой, но в одном случае все индивидуальные значения отличаются от нее мало, а в другом эти отличия велики, т.е. в одном случае вариация признака мала, а в другом велика.
Это можно показать на таком примере. Предположим, что две бригады из 3-х человек каждая выполняют одинаковую работу. Количество деталей, изготовленных за смену отдельными рабочими, составило:
в первой бригаде- 95, 100, 105;
во второй бригаде- 75, 100, 125.
Средняя выработка на одного рабочего в бригадах составила

, .
Средняя выработка одинакова, но колеблемость выработки отдельных рабочих в первой бригаде значительно меньше, чем во второй.
Следовательно, чем больше варианты отдельных единиц совокупности различаются между собой, тем больше они отличаются от своей средней, и наоборот – варианты, мало отличающиеся друг от друга, более близки по значению к средней, которая в таком случае будет более реально представлять всю совокупность.

Поэтому для характеристики и измерения вариации признака в совокупности кроме средней используют следующие показатели:

  • абсолютные - вариационный размах, среднее линейное и среднее квадратическое отклонение, дисперсию;
  • относительные - коэффициенты вариации.

Вариационный размах (или размах вариации) - это разница между максимальным и минимальным значениями признака:

В нашем примере размах вариации сменной выработки рабочих составляет: в первой бригаде R=105-95=10 дет., во второй бригаде R=125-75=50 дет. (в 5 раз больше). Это говорит о том, что выработка 1-й бригады более «устойчива», но резервов роста выработки больше у второй бригады, т.к. в случае достижения всеми рабочими максимальной для этой бригады выработки, ею может быть изготовлено 3*125=375 деталей, а в 1-й бригаде только 105*3=315 деталей.
Недостатком показателя вариационного размаха является то, что его величина не отражает все колебания признака.
Простейшим обобщающим показателем, отражающим все колебания признака, является среднее линейное отклонение , представляющее собой среднюю арифметическую абсолютных отклонений отдельных вариант от их средней величины:
для несгруппированных данных
,
для сгруппированных данных
,
где хi – значение признака в дискретном ряду или середина интервала в интервальном распределении.
В вышеприведенных формулах разности в числителе взяты по модулю, иначе, согласно свойству средней арифметической, числитель всегда будет равен нулю. Поэтому среднее линейное отклонение в статистической практике применяют редко, только в тех случаях, когда суммирование показателей без учета знака имеет экономический смысл. С его помощью, например, анализируется состав работающих, рентабельность производства, оборот внешней торговли.
Дисперсия признака – это средний квадрат отклонений вариант от их средней величины:
простая дисперсия
,
взвешенная дисперсия
.
Формулу для расчета дисперсии можно упростить:

Таким образом, дисперсия равна разности средней из квадратов вариант и квадрата средней из вариант совокупности:
.
Однако, вследствие суммирования квадратов отклонений дисперсия дает искаженное представление об отклонениях, поэтому ее на основе рассчитывают среднее квадратическое отклонение , которое показывает, на сколько в среднем отклоняются конкретные варианты признака от их среднего значения. Вычисляется путем извлечения квадратного корня из дисперсии:
для несгруппированных данных
,
для вариационного ряда

Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее совокупность, тем более надежной (типичной) будет средняя величина.
Среднее линейное и среднее квадратичное отклонение - именованные числа, т. е. выражаются в единицах измерения признака, идентичны по содержанию и близки по значению.
Рассчитывать абсолютные показатели вариации рекомендуется с помощью таблиц.
Таблица 3 – Расчет характеристик вариации (на примере срока данных о сменной выработке рабочих бригады)

Группы рабочих по выработке, шт.

Число рабочих,

Середина интервала,

Расчетные значения

170-190 10 180 1800 -36 360 1296 12960
190-210 20 200 4000 -16 320 256 5120
210-230 50 220 11000 4 200 16 800
230-250 20 240 4800 24 480 576 11520
Итого: 100 - 21600 - 1360 - 30400

Среднесменная выработка рабочих:

Среднее линейное отклонение:

Дисперсия выработки:

Среднее квадратическое отклонение выработки отдельных рабочих от средней выработки:
.

Вычисление дисперсий связано с громоздкими расчетами (особенно если средняя величина выражена большим числом с несколькими десятичными знаками). Расчеты можно упростить, если использовать упрощенную формулу и свойства дисперсии.
Дисперсия обладает следующими свойствами (доказываемые в математической статистике):

1. если все значения признака уменьшить или увеличить на одну и ту же величину А, то дисперсия от этого не уменьшится,


Расчет дисперсии альтернативного признака

Среди признаков, изучаемых статистикой, есть и такие, которым свойственны лишь два взаимно исключающих значения. Это альтернативные признаки. Им придается соответственно два количественных значения: варианты 1 и 0. Частостью варианты 1, которая обозначается p, является доля единиц, обладающих данным признаком. Разность 1-р=q является частостью варианты 0. Таким образом,

хi wi
1 p
0 q

Средняя арифметическая альтернативного признака
, т. к. p+q=1.

Дисперсия альтернативного признака
, т.к. 1-р=q
Таким образом, дисперсия альтернативного признака равна произведению доли единиц, обладающих данным признаком, и доли единиц, не обладающих этим признаком.
Если значения 1 и 0 встречаются одинаково часто, т. е. p=q, дисперсия достигает своего максимума pq=0,25.
Дисперсия альтернативного признака используется в выборочных обследованиях, например, качества продукции.

Подст-в в формулу дисперсии q = 1 - р, получим

Среднее квад-ое отклонение альтерн-ого признака

Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:: V= σ / X‾ *100

Общая дисперсия σ 2 измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдель­ных значений признака х от общей средней х и может быть вычислена как простая дисперсия

Межгрупповая дисперсия δ 2 характеризует систематиче­скую вариацию результативного признака, обусловленную влия­нием признака-фактора, положенного в основание группиров­ки. Она равна среднему квадрату отклонений групповых (част­ных) средних X‾iот общей средней X‾:

Внутригрупповая (частная) дисперсия σ 2 i отражает случай­ную вариацию, т.е. часть вариации, обусловленную влиянием не­учтенных факторов и не зависящую от признака-фактора, поло­женного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы х от средней арифметической этой группы х) (групповой средней) и может быть исчислена как простая дисперсия или как взвешенная дисперсия по формулам, соответственно:

На основании внутригрупповой дисперсии по каждой груп­пе, т.е. на основании σ 2 i можно определить общую среднюю извнутригрупповых дисперсий:

Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:

Внутригрупповые дисперсии показывают вариации выработ­ки в каждой группе, вызванные всеми возможными фактора­ми (техническое состояние оборудования, обеспеченность ин­струментами и материалами, возраст рабочих, интенсивность труда и т.д.) , кроме различий в квалификационном разряд. Средняя из внутригрупповых дисперсий отражает вариацию выработки, обусловленную всеми факторами, кроме квалифика­ции рабочих, но в среднем по всей совокупности. Межгрупповая дисперсия характеризует вариацию групповых средних, обусловленную различиями групп рабочих по квали­фикационному разряду. Общая дисперсия отражает суммарное влияние всех возмож­ных факторов на общую вариацию среднечасовой выработки изделий всеми рабочими цеха.

Поэтому в статистическом анализе широко используется эм­пирический коэффициент детерминации (ή 2) - показатель, пред­ставляющий собой долю межгрупповой дисперсии в общей дис­персии результативного признака и характеризующий силу влия­ния группировочного признака на образование общей вариации:

ή 2 =δ 2 / σ 2 Эмпирический коэффициент детерминации показывает долю вариации результативного признака у под влиянием факторного признака х (остальная часть общей вариации у обуславливается вариацией прочих факторов). При отсутствии связи эмпирический коэф равен 0, а при функциональной связи – единице.Эмпирическое корреляционное отношение - это корень квад­ратный из эмпирического коэффициента детерминации: v

ή=√ δ 2 / σ 2 оно показывает тесноту связи между группировочным и ре­зультативным признаками.

Эмпирическое корреляционное отношение ή , как и ή 2 , может принимать значения от 0 до 1. Если связь отсутствует, то корреляционное отношение равно нулю, т.е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный при­знак никак не влияет на образование общей вариации. Если связь функциональная, то корреляционное отношение будет равно единице. В этом случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком оп­ределяет вариацию изучаемого результативного признака.

Чем значение корреляционного отношения ближе к еди­нице, тем теснее, ближе к функциональной зависимости связь между признаками.

Ряды динамики

Одной из важнейших задач статистики является изучение изменений анализируемых показателей во времени, то есть их динамика . Эта задача решается при помощи анализа рядов динамики (временных рядов).

Ряд динамики (или временной ряд) – это числовые значения определенного статистического показателя в последовательные моменты или периоды времени (т.е. расположенные в хронологическом порядке).

Числовые значения того или иного статистического показателя, составляющего ряд динамики, называют уровнями ряда и обычно обозначают буквой y . Первый член ряда y 1 называют начальным или базисным уровнем , а последний y n конечным . Моменты или периоды времени, к которым относятся уровни, обозначают через t .

Ряды динамики, как правило, представляют в виде таблицы или графика, причем по оси абсцисс строится шкала времени t , а по оси ординат – шкала уровней ряда y .

Понятие вариации

Средняя дает обобщающую характеристику всей совокупности изучаемого явления.

Вариацией признака называется различие индивидуальных значений признака внутри изучаемой совокупности.

Средняя величина является абстрактной, обобщающей характеристикой признака изучаемой совокупности, но она не показывает строение совокупности.

Средняя величина не дает представления о том, как отдельные значения изучаемого признака группируются вокруг средней, сосредоточены ли они вблизи или значительно отклоняются от неё.

Если отдельные значения признака близки к средней арифметической, то в этом случае средняя хорошо представляет всю совокупность. И наоборот.

Колеблемость отдельных значений характеризуют показатели вариации.

Термин «вариация» произошел от латинского variatio – изменение, колеблемость, различие. Однако не всякие различия принято называть вариацией.

Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Различают вариацию признака в абсолютных и относительных величинах. Абсолютная – R, L, σ, σ 2 .

Показатели вариации

1 совокупность 2 совокупность
n=5 80, 100, 120, 200, 300 n=8 145, 150, 155, 160, 160, 162, 168, 180

80 100 120 x 200 300

Поэтому в этом случае возникает необходимость определить вариацию признака, т.е. соотношение отдельных значений ряда относительно друг друга.

Показатели вариации

1. Размах вариации, представляет собой разность между максимальным и минимальным значением признака.

R = X max - X min

R 1 = 300-80=220 R 2 =180-145=35

Практика: для однородной совокупности, для контроля качества продукции.

2. Показатели, учитывающие отклонения всех вариантов от средней арифметической.

а) Среднее линейное отклонение

б) Среднее квадратическое отклонение

Среднее линейное отклонение представляет собой среднее арифметическое из абсолютных значений отклонений отдельных вариантов от средней.

для не сгруппированных:

;

для сгруппированных:

Практика: с его помощью анализируется:

1. Состав работающих

2. Ритмичность производства

3. Равномерность поставок материалов

Недостаток: этот показатель усложняет расчеты вероятного типа, затрудняет применение методов математической статистики

Среднее квадратическое отклонение (стандартное) – это

для не сгруппированных данных

для сгруппированных данных

Для умеренно асимметричных распределений

Среднее квадратическое отклонение, как и среднее линейное отклонение – это абсолютный показатель, выражается в тех же единицах, что и среднее арифметическое.

Показатели среднего квадратического или среднего линейного отклонений для двух совокупностей оказываются несопоставимыми, если сами признака у этих совокупностей неодинаковы. Несопоставляются эти показатели и для разных признаков одной совокупности. Т.е. когда средние в обеих совокупностях выражены в одних и тех же единицах измерения и одинаковы, сопоставление возможно и отразит различия в вариации признака.

Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше σ, тем лучше среднее арифметическое отражает собой всю представляемую совокупность.

3. Дисперсия используется для измерения колеблемости признака. Этот показатель более объективно отражает меру вариации

для не сгруппированных

для сгруппированных

Отличительной особенностью данного показатели является то, что при возведении в квадрат удельный вес малых отклонений падает, а больших увеличивается в общей сумме отклонений.

Это тоже абсолютный показатель

Дисперсия обладает рядом свойств, некоторые из них позволяют упростить её вычисление:

1. Дисперсия постоянной величины равна 0

2. Если все варианты значений признака (x) ↓ на одно и то же число, то дисперсия не уменьшается

3. Если все варианты ↓ в одно и то же число раз (K раз), то дисперсия ↓ в К 2 раз

x f x "

x в 100 раз

Дисперсия σ равна 0,909*10000=9090

Выше был рассмотрен расчет показателей вариации для количественных признаков, но может ставиться задача оценки вариации качественных признаков . Например, при изучении качества изготовленной продукции можно разделить на годную и бракованную.

В таком случае речь идет об альтернативных признаках.

Дисперсия альтернативного признака

Альтернативными признаками называются такие, которыми одни единицы совокупности обладают, а другие нет. Например, наличие производственного стажа у абитуриентов, ученая степень у преподавателей ВУЗов и т.д. Наличие признака у единиц совокупности условно обозначаем через 1, а отсутствие – 0. х 1 =1, х 2 =0. Долю единиц, обладающих признаком (в общей совокупности) обозначаем через р, а долю единиц, не обладающих – через q. Т.е. p+q=1, q=1-p.

Рассчитаем среднее значение альтернативного признака

; ;

Т.е. среднее значение альтернативного признака равно доли единиц, обладающих данными признаками, на долю единиц, не обладающих данными признаками.

Среднее квадратическое отклонение равно Б p =

Проверяется качество: 1000 готовых изделий, 20 бракованных.

Находим долю брака: (20/1000)*100%=0,02%

Дисперсия обладает рядом свойств , которые позволяют упростить расчет.

1. Если из всех значений вариант отнять какое-то постоянное число А, то среднее квадратическое отклонение от этого не изменится.

Если данные представлены в виде аналитической группировки, то можно вычислить дисперсию общую, межгрупповую и внутригрупповую (табл. 11).

Таблица 11

Виды дисперсий и правило сложения дисперсий

Наименование дисперсии

Формула расчета

простая (незвешенная)

взвешенная

Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов

Межгрупповая дисперсия измеряет систематическую вариацию, возникшую под влиянием группировочного признака

Средняя по -той группе; - средняя по всей совокупности; - число единиц совокупности- число единиц в -той группе

Внутригрупповая (частная) дисперсия, рассчитывается отдельно для каждой группы

Индивидуальные значения признака в -той группе; - средняя -той группы; - число единиц в совокупности; - число единиц в -той группе

Средняя внутригрупповая дисперсия измеряет случайную вариацию, возникающую под влиянием всех факторов, кроме группировочного признака

Правило сложения дисперсий

На основании правила сложения дисперсий рассчитывают:

1) эмпирический коэффициент детерминации показывает долю вариации результативного признака, обусловленную вариацией группировочного признака:

2) эмпирическое корреляционное отношение показывает тесноту связи между группировочным и результативным признаками:

Эмпирическое корреляционное отношение варьирует от 0 до 1. При связи нет, при - связь полная.

Промежуточные значения оцениваются по шкале Чэддока:

Дисперсия альтернативного признака

Альтернативный признак - качественный признак, который может принимать только одно значение из двух. Например, пол - мужской или женский; семейное положение - состоит в браке или нет; продукция - годная или бракованная. Одна часть совокупности обладает альтернативным признаком, другая нет. Доля единиц обладающих альтернативным (изучаемым) признаком обозначается - р, необладающих - q. Наличие альтернативного признака у единиц совокупности обозначается 1, отсутствие - 0.