Предельная ошибка выборки. Генеральная совокупность и выборочный метод Предельная и средняя ошибки выборочного наблюдения

Понятие о выборочном наблюдении.

Выборочным называется такое наблюдение, при котором характеристика всей совокупности единиц дается по некоторой их части, отобранной в случайном порядке.

Причины применения выборочного наблюдения:

1. Экономия материальных, трудовых, финансовых ресурсов и времени.

2. Выбранное наблюдение часто приводит к повышению точности данных, т.к. уменьшение числа единиц наблюдения резко снижает ошибки регистрации величин признака (описки, недоучет, двойной счет…).

3. Выборочное наблюдение является единственно возможным, если наблюдение сопровождается полной или частичной порчей наблюдаемых объектов (качество партий яиц, прочность тканей и т.д.).

Ту часть единиц, которые отобраны для наблюдения, принято называть выборочной совокупностью или просто выборкой , а всю совокупность единиц, из которых производится отбор, - генеральной совокупностью .

Принята следующая система обозначения показателей для выбранной и генеральной совокупности.

В зависимости от применения техники отбора разделяют выборку серийную (гнездовую) и типологическую.

· В случае типологической выборки генеральная совокупность разделяется на типы (группы, районы), а затем производится случайный отбор единиц из каждого типа.

· При серийной выборке выбирают не единицы, а определенные серии, группы, районы, внутри которых производится сплошное наблюдение.

Существуют два способа отбора единиц в выборочную совокупность:

- повторный отбор

каждая попавшая в выборку единица возвращается в генеральную совокупность и имеет шанс вторично попасть в выборку.

- бесповторный отбор

отобранная единица не возвращается в генеральную совокупность, а для оставшихся единиц вероятность попасть в выборку увеличивается. Бесповторный отбор дает более точные результаты, но иногда его провести нельзя (исследование потребительского спроса).

Качество результатов выборочного наблюдения зависит от того, насколько состав выборки представляет генеральную совокупность, иначе говоря, от того, на сколько выборка репрезентативна (представительна). Для обеспечения репрезентативности выборки необходимо соблюдение принципа случайности отбора единиц.

Ошибка выборки

Понятие и виды ошибок выборки

Поскольку изучаемая статистическая совокупность состоит из единиц с варьирующими признаками, то состав выборочной совокупности может в той или иной мере отличаться от состава генеральной совокупности.

Расхождение между характеристиками выборки и генеральной совокупности составляет ошибку выборки .

Виды ошибок выборки

Основная задача выборочного метода – изучение случайных ошибок репрезентативности.

Средняя ошибка выборки

Случайная ошибка репрезентативности зависит от следующих фактов (при этом считается, что ошибок регистрации нет):

1. Чем больше численность выборки при прочих равных условиях, тем меньше величина ошибки выборки, т.е. ошибка выборки обратно пропорциональна ее численности.

2. Чем меньше варьирование признака, тем меньше ошибка выборки. Если признак совсем не варьирует, а, следовательно, величина дисперсии равна нулю, то ошибки выборки не будет, т.к. любая единица совокупности будет совершенно точно характеризовать всю совокупность по этому признаку. Таким образом, ошибка выборки прямо пропорциональна величине дисперсии.

В математической статистике доказывается, что величина средней ошибки случайной повторной выборки может быть определена по формуле

Однако следует иметь в виду, что величина дисперсии в генеральной совокупности s 2 нам не известна, т.к. наблюдение выборочное. Мы можем рассчитать лишь дисперсию в выборочной совокупности S 2 . Соотношение между дисперсиями генеральной и выборочной совокупности выражается формулой:

(6.2)

Если n велико, следовательно

s 2 = S 2

И формула средней ошибки повторной выборки (6.1.) примет вид:

Но здесь мы рассмотрели только ошибку выборки для средней величины интересующего признака. Существует также показатель доли единиц с интересующим признаком. Расчет ошибки этого показателя имеет свои особенности.

Дисперсия для показателя доли признака определяется по формуле:

S 2 =w(1-w) (6.4)

Тогда средняя ошибка повтора выборки для показателя доли признака будет равна:

(6.5)

Доказательство формул (6.3) и (6.5) исходит из схемы повторной выборки. Обычно же выборку организуют бесповторным способом. Т.к. при бесповторном отборе численность генеральной совокупности N в коде выборки сокращается, то в формулы ошибки выборки включают дополнительный множитель , и формулы принимают вид:

(6.6)

(6.7)

Пример 1. Определим, на сколько отличаются выборочные и генеральные показатели по данным 10%-ной бесповторной выборки успеваемости студентов.

Расчет ошибки бесповторной выборки для средней величины:

n = 100 N = 1000

Найдем выборочную дисперсию по формуле:

Здесь не известна величина , которую можно найти как обычную среднюю взвешенную величину:

Таким образом,

Т.е. можно сказать, что средний балл всех студентов () равен 3,65±0,07

Теперь рассчитаем долю студентов в генеральной совокупности, обучающихся на «4» и «5».

Найдем по выборке долю студентов, получивших оценки «4» и «5».

(или 64%)

Расчет ошибки бесповторной выборки для доли производится по формуле:

(или 4,5%)

Таким образом, доля студентов, обучающихся на «4» и «5» по генеральной совокупности (P )составляет 0,64±0,045 (или 64%±4,5%).

Предельная ошибка выборки

То, что генеральная средняя и генеральная доля не выйдут за определенные пределы можно утверждать не с абсолютной достоверностью, а лишь с определенной степенью вероятности.

В математической статистике доказано, что генеральные характеристики отклоняются от выборочных на величину ошибки выборки (±m) , лишь с вероятностью 0,683. Применительно к выборочным исследованиям это понимается так, что значения пределов можно гарантировать лишь в 683 случаях из 1000. В остальных же 317 случаях значения этих пределов будут иными.

Вероятность суждения можно повысить, если расширить пределы отклонений, приняв в качестве меры среднюю ошибку выборки, увеличенную в t раз.

Т.е. с определенной степенью вероятности мы можем утверждать, что отклонения выборочных характеристик от генеральных не превысят некоторой величины, которая называется предельной ошибкой выборки D (дельта):

где t – коэффициент доверия (коэффициент кратности ошибки), определяемый в зависимости от того, с какой доверительной вероятностью надо гарантировать результаты выборочного исследования.

На практике пользуются таблицами, где вычислены вероятности для различных значений t . Приведем некоторые из них.

t Вероятность t Вероятность
0,5 0,383 2,0 0,954
1,0 0,683 2,5 0,988
1,5 0,866 3,0 0,997

Например, если в нашем примере мы хотим увеличить вероятность суждения до 0,954, то мы берем t = 2 и таким образом изменяем пределы отклонений среднего балла всех студентов и доли студентов, обучающихся на «4» и «5».

То есть, (6.9)

То есть, (6.10)

Расхождения между величиной какого-либо показателя, найденного посредством статистического наблюдения, и действительными его размерами называются ошибками наблюдения . В зависимости от причин возникновения различают ошибки регистрации и ошибки репрезентативности.

Ошибки регистрации возникают в результате неправильного установления фактов или ошибочной записи в процессе наблюдения или опроса. Они бывают случайными или систематическими. Случайные ошибки регистрации могут быть допущены как опрашиваемыми в их ответах, так и регистраторами. Систематические ошибки могут быть и преднамеренными, и непреднамеренными. Преднамеренные – сознательные, тенденциозные искажения действительного положения дела. Непреднамеренные вызываются различными случайными причинами (небрежность, невнимательность).

Ошибки репрезентативности (представительности) возникают в результате неполного обследования и в случае, если обследуемая совокупность недостаточно полно воспроизводит генеральную совокупность. Они могут быть случайными и систематическими. Случайные ошибки репрезентативности – это отклонения, возникающие при несплошном наблюдении из-за того, что совокупность отобранных единиц наблюдения (выборка) неполно воспроизводит всю совокупность в целом. Систематические ошибки репрезентативности – это отклонения, возникающие вследствие нарушения принципов случайного отбора единиц. Ошибки репрезентативности органически присущи выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную. Избежать ошибок репрезентативности нельзя, однако, пользуясь методами теории вероятностей, основанными на использовании предельных теорем закона больших чисел, эти ошибки можно свести к минимальным значениям, границы которых устанавливаются с достаточно большой точностью.

Ошибки выборки – разность между характеристиками выборочной и генеральной совокупности. Для среднего значения ошибка будет определяться по формуле

где

Величина
называетсяпредельной ошибкой выборки.

Предельная ошибка выборки – величина случайная. Исследованию закономерностей случайных ошибок выборки посвящены предельные теоремы закона больших чисел. Наиболее полно эти закономерности раскрыты в теоремах П. Л. Чебышева и А. М. Ляпунова.

Теорему П. Л. Чебышева применительно к рассматриваемому методу можно сформулировать следующим образом: при достаточно большом числе независимых наблюдений можно с вероятностью, близкой к единице (т. е. почти с достоверностью), утверждать, что отклонение выборочной средней от генеральной будет сколько угодно малым. В теореме П. Л. Чебышева доказано, что величина ошибки не должна превышать. В свою очередь величина, выражающая среднее квадратическое отклонение выборочной средней от генеральной средней, зависит от колеблемости признака в генеральной совокупностии числа отобранных единицn . Эта зависимость выражается формулой

, (7.2)

где зависит также от способа производства выборки.

Величину =называютсредней ошибкой выборки. В этом выражении– генеральная дисперсия,n – объем выборочной совокупности.

Рассмотрим, как влияет на величину средней ошибки число отбираемых единиц n . Логически нетрудно убедиться, что при отборе большого числа единиц расхождения между средними будут меньше, т. е. существует обратная связь между средней ошибкой выборки и числом отобранных единиц. При этом здесь образуется не просто обратная математическая зависимость, а такая зависимость, которая показывает, что квадрат расхождения между средними обратно пропорционален числу отобранных единиц.

Увеличение колеблемости признака влечет за собой увеличение среднего квадратического отклонения, а следовательно, и ошибки. Если предположить, что все единицы будут иметь одинаковую величину признака, то среднее квадратическое отклонение станет равно нулю и ошибка выборки также исчезнет. Тогда нет необходимости применять выборку. Однако следует иметь в виду, что величина колеблемости признака в генеральной совокупности неизвестна, поскольку неизвестны размеры единиц в ней. Можно рассчитать лишь колеблемость признака в выборочной совокупности. Соотношение между дисперсиями генеральной и выборочной совокупности выражается формулой

Поскольку величина при достаточно большихn близка к единице, можно приближенно считать, что выборочная дисперсия равна генеральной дисперсии, т. е.

Следовательно, средняя ошибка выборки показывает, какие возможны отклонения характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности. Однако о величине этой ошибки можно судить с определенной вероятностью. На величину вероятности указывает множитель

Теорема А. М. Ляпунова . А. М. Ляпунов доказал, что распределение выборочных средних (следовательно, и их отклонений от генеральной средней) при достаточно большом числе независимых наблюдений приближенно нормально при условии, что генеральная совокупность обладает конечной средней и ограниченной дисперсией.

Математически теорему Ляпунова можно записать так:

(7.3)

где
, (7.4)

где
– математическая постоянная;

предельная ошибка выборки , которая дает возможность выяснить, в каких пределах находится величина генеральной средней.

Значения этого интеграла для различных значений коэффициента доверия t вычислены и приводятся в специальных математических таблицах. В частности, при:

Поскольку t указывает на вероятность расхождения
, т. е. на вероятность того, на какую величину генеральная средняя будет отличаться от выборочной средней, то это может быть прочитано так: с вероятностью 0,683 можно утверждать, что разность между выборочной и генеральной средними не превышает одной величины средней ошибки выборки. Другими словами, в 68,3 % случаев ошибка репрезентативности не выйдет за пределы
С вероятностью 0,954 можно утверждать, что ошибка репрезентативности не превышает
(т. е. в 95 % случаев). С вероятностью 0,997, т. е. довольно близкой к единице, можно ожидать, что разность между выборочной и генеральной средней не превзойдет трехкратной средней ошибки выборки и т. д.

Логически связь здесь выглядит довольно ясно: чем больше пределы, в которых допускается возможная ошибка, тем с большей вероятностью судят о ее величине.

Зная выборочную среднюю величину признака
и предельную ошибку выборки
, можно определить границы (пределы), в которых заключена генеральная средняя

1 . Собственно-случайная выборка – этот способ ориентирован на выборку единиц из генеральной совокупности без всякого расчленения на части или группы. При этом для соблюдения основного принципа выборки – равной возможности всем единицам генеральной совокупности быть отобранным – используются схема случайного извлечения единиц путем жеребьевки (лотереи) или таблицы случайных чисел. Возможен повторный и бесповторный отбор единиц

Средняя ошибка собственно-случайной выборкипредставляет собойсреднеквадратическое отклонение возможных значений выборочной средней от генеральной средней. Средние ошибки выборки при собственно-случайном методе отбора представлены в табл. 7.2.

Таблица 7.2

Средняя ошибка выборки μ

При отборе

повторном

бесповторном

Для средней

В таблице использованы следующие обозначения:

– дисперсия выборочной совокупности;

– численность выборки;

– численность генеральной совокупности;

– выборочная доля единиц, обладающих изучаемым признаком;

– число единиц, обладающих изучаемым признаком;

– численность выборки.

Для увеличения точности вместо множителя следует брать множитель
, но при большой численностиN различие между этими выражениями практического значения не имеет.

Предельная ошибка собственно-случайной выборки
рассчитывается по формуле

, (7.6)

где t – коэффициент доверия зависит от значения вероятности.

Пример. При обследовании ста образцов изделий, отобранных из партии в случайном порядке, 20 оказалось нестандартными. С вероятностью 0,954 определите пределы, в которых находится доля нестандартной продукции в партии.

Решение . Вычислим генеральную долю (Р ):
.

Доля нестандартной продукции:
.

Предельная ошибка выборочной доли с вероятностью 0,954 рассчитывается по формуле (7.6) с применением формулы табл. 7.2 для доли:

С вероятностью 0,954 можно утверждать, что доля нестандартной продукции в партии товара находится в пределах 12 % ≤ P ≤ 28 %.

В практике проектирования выборочного наблюдения возникает потребность определения численности выборки, которая необходима для обеспечения определенной точности расчета генеральных средних. Предельная ошибка выборки и ее вероятность при этом являются заданными. Из формулы
и формул средних ошибок выборки устанавливается необходимая численность выборки. Формулы для определения численности выборки (n ) зависят от способа отбора. Расчет численности выборки для собственно-случайной выборки приведен в табл. 7.3.

Таблица 7.3

Предполагаемый отбор

для средней

Повторный

Бесповторный

2 . Механическая выборка – при этом методе исходят из учета некоторых особенностей расположения объектов в генеральной совокупности, их упорядоченности (по списку, номеру, алфавиту). Механическая выборка осуществляется путем отбора отдельных объектов генеральной совокупности через определенный интервал (каждый 10-й или 20-й). Интервал рассчитывается по отношению, гдеn – численность выборки,N – численность генеральной совокупности. Так, если из совокупности в 500 000 единиц предполагается получить 2 %-ную выборку, т. е. отобрать 10 000 единиц, то пропорция отбора составит
Отбор единиц осуществляется в соответствии с установленной пропорцией через равные интервалы. Если расположение объектов в генеральной совокупности носит случайный характер, то механическая выборка по содержанию аналогична случайному отбору. При механическом отборе применяется только бесповторная выборка .

Средняя ошибка и численность выборки при механическом отборе подсчитывается по формулам собственно-случайной выборки (см. табл. 7.2 и 7.3).

3 . Типическая выборка , при котрой генеральная совокупность делится по некоторым существенным признакам на типические группы; отбор единиц производится из типических групп. При этом способе отбора генеральная совокупность расчленяется на однородные в некотором отношении группы, которые имеют свои характеристики, и вопрос сводится к определению объема выборок из каждой группы. Может бытьравномерная выборка – при этом способе из каждой типической группы отбирается одинаковое число единиц
Такой подход оправдан лишь при равенстве численностей исходных типических групп. При типическом отборе, непропорциональном объему групп, общее число отбираемых единиц делится на число типических групп, полученная величина дает численность отбора из каждой типической группы.

Более совершенной формой отбора является пропорциональная выборка . Пропорциональной называется такая схема формирования выборочной совокупности, когда численность выборок, взятых из каждой типической группы в генеральной совокупности, пропорциональна численностям, дисперсиям (или комбинированно и численностям, и дисперсиям). Условно определяем численность выборки в 100 единиц и отбираем единицы из групп:

пропорционально численности их генеральной совокупности (табл. 7.4). В таблице обозначено:

N i – численность типической группы;

d j – доля (N i /N );

N – численность генеральной совокупности;

n i – численность выборки из типической группы вычисляется:

, (7.7)

n – численность выборки из генеральной совокупности.

Таблица 7.4

N i

d j

n i

пропорционально среднему квадратическому отклонению (табл. 7.5).

здесь  i – среднее квадратическое отклонение типических групп;

n i – численность выборки из типической группы вычисляется по формуле

(7.8)

Таблица 7.5

N i

n i

комбинированно (табл. 7.6).

Численность выборки вычисляется по формуле

. (7.9)

Таблица 7.6

i N i

При проведении типической выборки непосредственный отбор из каждой группы проводится методом случайного отбора.

Средние ошибки выборки рассчитываются по формулам табл. 7.7 в зависимости от способа отбора из типических групп.

Таблица 7.7

Способ отбора

Повторный

Бесповторный

для средней

для доли

для средней

для доли

Непропорциональный объему групп

Пропорциональный объему групп

Пропорциональный колеблемости в группах (является наивыгоднейшим)

здесь
– средняя из внутригрупповых дисперсий типических групп;

– доля единиц, обладающих изучаемым признаком;

– средняя из внутригрупповых дисперсий для доли;

– среднее квадратическое отклонение в выборке изi -й типической группы;

– объем выборки из типической группы;

– общий объем выборки;

– объем типической группы;

– объем генеральной совокупности.

Численность выборки из каждой типической группы должна быть пропорциональна среднему квадратическому отклонению в этой группе
.Расчет численности
производится по формулам, приведенным в табл. 7.8.

Таблица 7.8

4 . Серийная выборка – удобена в тех случаях, когда единицы совокупности объединены в небольшие группы или серии. При серийной выборке генеральную совокупность делят на одинаковые по объему группы – серии. В выборочную совокупность отбираются серии. Сущность серийной выборки заключается в случайном или механическом отборе серий, внутри которых производится сплошное обследование единиц. Средняя ошибка серийной выборки с равновеликими сериями зависит от величины только межгрупповой дисперсии. Средние ошибки сведены в табл. 7.9.

Таблица 7.9

Способ отбора серии

для средней

для доли

Повторный

Бесповторный

Здесь R – число серий в генеральной совокупности;

r – число отобранных серий;

– межсерийная (межгрупповая) дисперсия средних;

– межсерийная (межгрупповая) дисперсия доли.

При серийном отборе необходимую численность отбираемых серий определяют так же, как и при собственно-случайном методе отбора.

Расчет численности серийной выборки производится по формулам, приведенным в табл. 7.10.

Таблица 7.10

Пример. В механическом цехе завода в десяти бригадах работает 100 рабочих. В целях изучения квалификации рабочих была произведена 20 %-ная серийная бесповторная выборка, в которую вошли две бригады. Получено следующее распределение обследованных рабочих по разрядам:

Разряды рабочих в бригаде 1

Разряды рабочих в бригаде 2

Разряды рабочих в бригаде 1

Разряды рабочих в бригаде 2

Необходимо определить с вероятностью 0,997 пределы, в которых находится средний разряд рабочих механического цеха.

Решение. Определим выборочные средние по бригадам и общую среднюю как среднюю взвешенную из групповых средних:

Определим межсерийную дисперсию по формулам (5.25):

Рассчитаем среднюю ошибку выборки по формуле табл. 7.9:

Вычислим предельную ошибку выборки с вероятностью 0,997:

С вероятностью 0,997 можно утверждать, что средний разряд рабочих механического цеха находится в пределах

При выборочном наблюдении должна быть обеспечена слу-чайность отбора единиц. Каждая единица должна иметь равную с другими возможность быть отобранной. Именно на этом основывается собственно-случайная выборка.

К собственно-случайной выборке относится отбор единиц из всей генеральной совокупности (без предварительного рас-членения ее на какие-либо группы) посредством жеребьевки (преимущественно) или какого-либо иного подобного спосо-ба, например, с помощью таблицы случайных чисел. Случай-ный отбор -- это отбор не беспорядочный. Принцип случай-ности предполагает, что на включение или исключение объ-екта из выборки не может повлиять какой-либо фактор, кро-ме случая. Примером собственно-случайного отбора могут служить тиражи выигрышей: из общего количества выпущен-ных билетов наугад отбирается определенная часть номеров, на которые приходятся выигрыши. Причем всем номерам обеспечивается равная возможность попадания в выборку. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки.

Доля выборки есть отношение числа единиц выборочной со-вокупности к числу единиц генеральной совокупности:

Так, при 5%-ной выборке из партии деталей в 1000 ед. объ-ём выборки п составляет 50 ед., а при 10%-ной выборке -- 100 ед. и т.д. При правильной научной организации выборки ошибки репрезентативности можно свести к минимальным значениям, в результате -- выборочное наблюдение становится достаточно точным.

Собственно-случайный отбор «в чистом виде» применяет-ся в практике выборочного наблюдения редко, но он является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного наблюдения.

Рассмотрим некоторые вопросы теории выборочного метода и формулы ошибок для простой случайной выборки.

Применяя выборочный метод в статистике, обычно используют два основных вида обобщающих показателей: среднюю величину ко-личественного признака и относительную величину альтернативного признака (долю или удельный вес единиц в статистической совокупности, которые отличаются от всех других единиц этой сово-купности только наличием изучаемого признака).

Выборочная доля (w), или частость, определяется отношением числа единиц, обладающих изучаемым признаком т, к общему числу единиц выборочной совокупности п:

Например, если из 100 деталей выборки (n =100), 95 деталей оказались стандартными =95), то выборочная доля

w =95/100=0,95 .

Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.

Ошибка выборки ? или, иначе говоря, ошибка репрезента-тивности представляет собой разность соответствующих выбо-рочных и генеральных характеристик:

*

*

Ошибка выборки свойственна только выборочным наблюде-ниям. Чем больше значение этой ошибки, тем в большей степе-ни выборочные показатели отличаются от соответствующих генеральных показателей.

Выборочная средняя и выборочная доля по своей сути яв-ляются случайными величинами, которые могут принимать раз-личные значения в зависимости от того, какие единицы сово-купности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возмож-ных ошибок -- среднюю ошибку выборки.

От чего зависит средняя ошибка выборки? При соблюдении принципа случайного отбора средняя ошибка выборки определя-ется прежде всего объемом выборки: чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки. Охватывая выборочным обследованием все большее количество единиц генеральной совокупности, всё более точно характеризуем всю генеральную совокупность.

Средняя ошибка выборки также зависит от степени варьи-рования изучаемого признака. Степень варьирования, как из-вестно, характеризуется дисперсией? 2 или w(1-w) -- для альтернативного признака. Чем меньше вариация признака, а следовательно, и дисперсия, тем меньше средняя ошибка вы-борки, и наоборот. При нулевой дисперсии (признак не варь-ирует) средняя ошибка выборки равна нулю, т. е. любая еди-ница генеральной совокупности будет совершенно точно ха-рактеризовать всю совокупность по этому признаку.

Зависимость средней ошибки выборки от ее объема и степе-ни варьирования признака отражена в формулах, с помощью которых можно рассчитать среднюю ошибку выборки в условиях выборочного наблюдения, когда генеральные характеристики (х,p) неизвестны, и следовательно, не представляется возмож-ным нахождение реальной ошибки выборки непосредственно по формулам (форм. 1), (форм. 2).

Ш При случайном повторном отборе средние ошибки теоретически рассчитывают по следующим формулам:

* для средней количественного признака

* для доли (альтернативного признака)

Поскольку практически дисперсия признака в генеральной совокупности? 2 точно неизвестна, на практике пользуются значением дисперсии S 2 , рассчитанным для выборочной сово-купности на основании закона больших чисел, согласно кото-рому выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики гене-ральной совокупности.

Таким образом, расчетные формулы средней ошиб-ки выборки при случайном повторном отборе будут следующие:

* для средней количественного признака

* для доли (альтернативного признака)

Однако дисперсия выборочной совокупности не равна диспер-сии генеральной совокупности, и следовательно, средние ошибки выборки, рассчитанные по формулам (форм. 5) и (форм. 6), будут прибли-женными. Но в теории вероятностей доказано, что генеральная дисперсия выражается через выборную следующим соотношением:

Так как п/ (n -1) при достаточно больших п -- величина, близкая к единице, то можно принять, что, а следова-тельно, в практических расчетах средних ошибок выборки мож-но использовать формулы (форм. 5) и (форм. 6). И только в случаях ма-лой выборки (когда объем выборки не превышает 30) необхо-димо учитывать коэффициент п /(n -1) и исчислять среднюю ошибку малой выборки по формуле:

Ш X При случайном бесповторном отборе в приведенные выше формулы расчета средних ошибок выборки необходимо подко-ренное выражение умножить на 1-(n/N), поскольку в процес-се бесповторной выборки сокращается численность единиц генеральной совокупности. Следовательно, для бесповторной вы-борки расчетные формулы средней ошибки выборки примут такой вид:

* для средней количественного признака

* для доли (альтернативного признака)

. (форм. 10)

Так как п всегда меньше N , то дополнительный множи-тель 1-(n/N ) всегда будет меньше единицы. Отсюда следу-ет, что средняя ошибка при бесповторном отборе всегда будет меньше, чем при повторном. В то же время при сравнительно небольшом проценте выборки этот множитель близок к еди-нице (например, при 5%-ной выборке он равен 0,95; при 2%-ной -- 0,98 и т.д.). Поэтому иногда на практике пользуются для определения средней ошибки выборки формулами (форм. 5) и (форм. 6) без указанного множителя, хотя выборку и организуют как бесповторную. Это имеет место в тех случаях, когда число единиц генеральной совокупности N неизвестно или безгра-нично, или когда п очень мало по сравнению с N , и по су-ществу, введение дополнительного множителя, близкого по значению к единице, практически не повлияет на значение средней ошибки выборки.

Механическая выборка состоит в том, что отбор единиц в выборочную совокупность из генеральной, разбитой по ней-тральному признаку на равные интервалы (группы), произво-дится таким образом, что из каждой такой группы в выборку отбирается лишь одна единица. Чтобы избежать систематиче-ской ошибки, отбираться должна единица, которая находится в середине каждой группы.

При организации механического отбора единицы совокуп-ности предварительно располагают (обычно в списке) в опре-деленном порядке (например, по алфавиту, местоположению, в порядке возрастания или убывания значений какого-либо по-казателя, не связанного с изучаемым свойством, и т.д.), после чего отбирают заданное число единиц механически, через оп-ределенный интервал. При этом размер интервала в генеральной совокупности равен обратному значению доли выборки. Так, при 2%-ной выборке отбирается и проверяется каждая 50-я единица (1: 0,02), при 5%-ной выборке -- каждая 20-я едини-ца (1: 0,05), например, сходящая со станка деталь.

При достаточно большой совокупности механический отбор по точности результатов близок к собственно-случайному. По-этому для определения средней ошибки механической выборки используют формулы собственно-случайной бесповторной вы-борки (форм. 9), (форм. 10).

Для отбора единиц из неоднородной совокупности применя-ется, так называемая типическая выборка , которая используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных, однотипных групп по признакам, влияющим на изучаемые показатели.

При обследовании предприятий такими группами могут быть, например, отрасль и подотрасль, формы собственности. Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.

Типическая выборка обычно применяется при изучении слож-ных статистических совокупностей. Например, при выборочном обследовании семейных бюджетов рабочих и служащих в отдель-ных отраслях экономики, производительности труда рабочих пред-приятия, представленных отдельными группами по квалификации.

Типическая выборка дает более точные результаты по сравнению с другими способами отбора единиц в выбороч-ную совокупность. Типизация генеральной совокупности обеспечивает репрезентативность такой выборки, представи-тельство в ней каждой типологической группы, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки.

При определении средней ошибки типической выборки в ка-честве показателя вариации выступает средняя из внутригрупповых дисперсий.

Среднюю ошибку выборки находят по формулам:

* для средней количественного признака

(повторный отбор); (форм. 11)

(бесповоротный отбор); (форм. 12)

* для доли (альтернативного признака)

(повторный отбор); (форм.13)

(бесповторный отбор), (форм. 14)

где - средняя из внутригрупповых дисперсий по вы-борочной совокупности;

Средняя из внутригрупповых дисперсий доли (альтернативного признака) по выборочной совокупности.

Серийная выборка предполагает случайный отбор из генераль-ной совокупности не отдельных единиц, а их равновеликих групп (гнезд, серий) с тем, чтобы в таких группах подвергать наблюде-нию все без исключения единицы.

Применение серийной выборки обусловлено тем, что многие товары для их транспортировки, хранения и продажи упаковываются в пачки, ящики и т.п. Поэтому при контроле качества упакованного товара рациональнее проверить не-сколько упаковок (серий), чем из всех упаковок отбирать необходимое количество товара.

Поскольку внутри групп (серий) обследуются все без исключе-ния единицы, средняя ошибка выборки (при отборе равновеликих серий) зависит только от межгрупповой (межсерийной) дисперсии.

Ш Среднюю ошибку выборки для средней количественного признака при серийном отборе находят по формулам:

(повторный отбор); (форм.15)

(бесповторный отбор), (форм. 16)

где r - число отобранных серий; R - общее число серий.

Межгрупповую дисперсию серийной выборки вычисляют сле-дующим образом:

где - средняя i - й серии; - общая средняя по всей выбо-рочной совокупности.

Ш Средняя ошибка выборки для доли (альтернативного при-знака) при серийном отборе:

(повторный отбор); (форм. 17)

(бесповторный отбор). (форм. 18)

Межгрупповую (межсерийную) дисперсию доли серийной вы-борки определяют по формуле:

, (форм. 19)

где - доля признака в i -й серии; - общая доля признака во всей выборочной совокупности.

В практике статистических обследований помимо рассмот-ренных ранее способов отбора применяется их комбинация (комбинированный отбор).

Расхождение между значениями показателей, полученных по выборке, и соответствующими параметрами генеральной совокупности называют ошибкой репрезентативности. Различают систематические и случайные ошибки выборки.

Случайные ошибки объясняются недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности.

Систематические ошибки могут быть связаны с нарушением правил отбора или условий реализации выборки.

Так, при обследовании бюджетов домашних хозяйств выборочную совокупность на протяжении более 40 лет строили на основе территориально-отраслевого принципа отбора, что было обусловлено основной целью бюджетного обследования – дать характеристику уровня жизни рабочих, служащих и колхозников. Выборочная совокупность распределялась по регионам и отраслям экономики РСФСР пропорционально общей численности занятых; для создания отраслевой выборки применяли типическую выборку с механическим отбором единиц внутри групп.

Главным критерием отбора была среднемесячная оплата труда. Принцип отбора обеспечивал пропорциональную представительность в выборочной совокупности работающих с различным уровнем заработной платы.

С появлением новых социальных групп (предпринимателей, фермеров, безработных) репрезентативность выборки нарушалась не только в силу различий со структурой генеральной совокупности, но и в связи с систематической ошибкой, которая возникала из-за несовпадения единицы отбора (работник) и единицы наблюдения (домохозяйство). Домохозяйство, имеющее более одного работающего члена семьи, имело и бо́льшую вероятность быть отобранным, чем домохозяйство, в составе которого был один работающий. Семьи, не имеющие занятых в обследуемых отраслях, выпадали из круга отбираемых единиц (домохозяйства пенсионеров, домохозяйства, существующие за счет индивидуальной трудовой деятельности, и т.п.). Оценка точности полученных результатов (границы доверительных интервалов, ошибки выборки) была затруднена, так как при построении выборки не использовались вероятностные модели.

В 1996–1997 гг. был внедрен принципиально новый подход к формированию выборки домашних хозяйств. В качестве основы для ее проведения использовали данные микропереписи населения 1994 г. Генеральную совокупность при отборе составили все типы домашних хозяйств, за исключением коллективных. А выборочную совокупность стали организовывать с учетом представительности состава и типов домашних хозяйств в пределах каждого субъекта РФ.

Измерение ошибок репрезентативности выборочных показателей основано на предположении о случайном характере их распределения при бесконечно большом числе выборок.

Количественную оценку надежности выборочного показателя используют, чтобы составить представление о генеральной характеристике. Это осуществляют либо на основе выборочного показателя с учетом его случайной ошибки, либо на основе выдвижения некоторой гипотезы (о величине средней дисперсии, характере распределения, связи) в отношении свойств генеральной совокупности.

Для проверки гипотезы оценивают согласованность эмпирических данных с гипотетическими.

Величина случайной ошибки репрезентативности зависит:

  • 1) от объема выборки;
  • 2) степени вариации изучаемого признака в генеральной совокупности;
  • 3) принятого способа формирования выборочной совокупности.

Различают среднюю (стандартную) и предельную ошибки выборки.

Средняя ошибка характеризует меру отклонений выборочных показателей от аналогичных показателей генеральной совокупности.

Предельной ошибкой принято считать максимально возможное расхождение выборочной и генеральной характеристик, т.е. максимум ошибки при заданной вероятности ее появления.

По данным выборочной совокупности можно оценить различные показатели (параметры) генеральной совокупности. Наиболее часто используют оценку:

  • – генеральной средней величины изучаемого признака (для многозначного количественного признака);
  • – генеральной доли (для альтернативного признака).

Основным принципом применения выборочного метода является обеспечение равной возможности для всех единиц генеральной совокупности быть отобранными в выборочную совокупность. При таком подходе соблюдается требование случайного, объективного отбора и, следовательно, ошибка выборки определяется прежде всего ее объемом (п ). С увеличением последнего величина средней ошибки уменьшается, характеристики выборочной совокупности приближаются к характеристикам генеральной совокупности.

При одинаковой численности выборочных совокупностей и прочих равных условиях ошибка выборки будет меньше в гой из них, которая отобрана из генеральной совокупности с меньшей вариацией изучаемого признака. Уменьшение вариации признака означает снижение величины дисперсии (– для количественного признака или – для альтернативного признака).

Зависимость величины ошибки выборки от способов формирования выборочной совокупности определяется по формулам средней ошибки выборки (табл. 5.2).

Дополним показатели табл. 5.2 следующими пояснениями.

Выборочная дисперсия несколько меньше генеральной, в математической статистике доказано, что

Таблица 5.2

Формулы расчета средней ошибки выборки мри различных способах отбора

Вид выборки

повторный для

бесповторный для

Собственно

случайная

(простая)

Серийная

(с равновеликими

Типическая (пропорционально объему групп)

Если выборочная совокупность имеет большой объем (т.е. п достаточно велико), то соотношение приближается к единице и выборочная дисперсия практически совпадает с генеральной.

Выборку считают безусловно большой при п > 100 и безусловно малой при п < 30. При оценке результатов малой выборки указанное соотношение выборочной и генеральной дисперсии следует принимать во внимание.

Они могут быть рассчитаны по следующим формулам:

где – средняя i -й серии; – общая средняя по всей выборочной совокупности;

где – доля единиц определенной категории в i -й серии; – доля единиц этой категории во всей выборочной совокупности; r – число отобранных серий.

4. Для определения средней ошибки типической выборки в случае отбора единиц пропорционально численности каждой группы в качестве показателя вариации выступает средняя из внутригрупповых дисперсий (– для количественного признака, для альтернативного признака). По правилу сложения дисперсий величина средней из внутригрупповых дисперсий меньше, чем величина общей дисперсии. Значение средней возможной ошибки типической выборки меньше, чем ошибка простой собственно-случайной выборки.

Часто используют комбинированный отбор: индивидуальный отбор единиц сочетают с групповым, типический отбор – с отбором сериями. При любом способе отбора с определенной вероятностью можно утверждать, что отклонение выборочной средней (или доли) от генеральной средней (или доли) не превысит некоторую величину, которую называют предельной ошибкой выборки.

Соотношение между пределом ошибки выборки (∆), гарантируемым с некоторой вероятностью F(t), и средней ошибкой выборки имеет вид: или , где t – коэффициент доверия, определяемый в зависимости от уровня вероятности F(t).

Значения функции F(t) и t определяются на основе специально составленных математических таблиц. Приведем некоторые из них, применяемые наиболее часто:

т

Таким образом, предельная ошибка выборки отвечает на вопрос о точности выборки с определенной вероятностью, величина которой зависит от значения коэффициента доверия t. Так, при t = 1 вероятность F(t ) отклонения выборочных характеристик от генеральных на величину однократной средней ошибки равна 0,683. Следовательно, в среднем из каждой 1000 выборок 683 дадут обобщающие показатели (среднюю, долю), которые будут отличаться от генеральных не более чем на величину однократной средней ошибки. При t = 2 вероятность F(t) равна 0,954, это означает, что из каждой 1000 выборок 954 дадут обобщающие показатели, которые будут отличаться от генеральных не более чем на двукратную среднюю ошибку выборки, и т.д.

Наряду с абсолютной величиной предельной ошибки выборки рассчитывают и относительную ошибку, которая определяется как процентное отношение предельной ошибки выборки к соответствующей характеристике выборочной совокупности:

На практике принято задавать величину ∆, как правило, в пределах 10% предполагаемого среднего уровня признака.

Расчет средней и предельной ошибок выборки позволяет определить пределы, в которых будут находиться характеристики генеральной совокупности:

Пределы, в которых с данной степенью вероятности будет заключена неизвестная величина изучаемого показателя в генеральной совокупности, называют доверительным интервалом, а вероятность F(t) доверительной вероятностью. Чем выше значение ∆, тем больше величина доверительного интервала и, следовательно, ниже точность оценки.

Рассмотрим следующий пример. Для определения среднего размера вклада в банке методом повторной случайной выборки было отобрано 200 валютных счетов вкладчиков. В результате установили, что средний размер вклада – 60 тыс. руб., дисперсия составила 32. При этом 40 счетов оказались до востребования. Необходимо с вероятностью 0,954 определить пределы, в которых находятся средний размер вклада на валютных счетах в банке и доля счетов до востребования.

Рассчитаем среднюю ошибку выборочной средней по формуле для повторного отбора

Предельная ошибка выборочной средней с вероятностью 0,954 составит

Следовательно, средний размер вклада на валютных счетах в банке находится в пределах тыс. руб.:

С вероятностью 0,954 можно утверждать, что средний размер вклада на валютных счетах в банке составляет от 59 200 до 60 800 руб.

Определим долю вкладов до востребования в выборочной совокупности:

Средняя ошибка выборочной доли

Предельная ошибка доли с вероятностью 0,954 составит

Таким образом, доля счетов до востребования в генеральной совокупности находится в пределах w :

С вероятностью 0,954 можно утверждать, что доля счетов до востребования в общем числе валютных счетов в банке составляет от 14,4 до 25,6%.

При конкретных исследованиях важно установить оптимальное соотношение между мерой надежности полученных результатов и величиной допустимой ошибки выборки. В связи с этим при организации выборочного наблюдения возникает вопрос, связанный с определением объема выборки, необходимого для получения требуемой точности результатов с заданной вероятностью. Расчет необходимого объема выборки проводится на основе формул предельной ошибки выборки в соответствии с видом и способом отбора (табл. 5.3).

Таблица 5.3

Формулы расчета численности выборки при собственно-случайном способе отбора

Продолжим пример, в котором представлены результаты выборочного обследования лицевых счетов вкладчиков банка.

Требуется установить, сколько необходимо обследовать счетов, чтобы с вероятностью 0,977 ошибка при определении среднего размера вклада не превысила 1,5 тыс. руб. Выразим из формулы предельной ошибки выборки для повторного отбора показатель численности выборки:

При определении необходимого объема выборки по приведенным формулам возникает трудность в нахождении значений σ2 и да, так как эти величины можно получить только после проведения выборочного обследования. В связи с этим вместо фактических значений данных показателей подставляют приближенные, которые могли быть определены на основе каких-либо пробных выборочных наблюдений или из аналитических предыдущих обследований.

В тех случаях, когда статистик знает среднее значение изучаемых признаков (например, из инструкций, законодательных актов и т.п.) или пределы, в которых этот признак варьируется, можно применить следующий расчет по приближенным формулам:

а произведение w(1 – w) заменить значением 0,25 (w = 0,5).

Чтобы получить более точный результат, принимают максимально возможное значение этих показателей. Если распределение признака в генеральной совокупности подчиняется нормальному закону, то размах вариации примерно равен 6σ (крайние значения отстоят в ту и другую сторону от средней на расстоянии 3σ). Отсюда , но если распределение заведомо асимметрично, то .

При любом виде выборки ее объем начинают рассчитывать по формуле повторного отбора

Если в результате расчета доля отбора (n ) превысит 5%, то проводят расчет по формуле бесповторного отбора.

Для типической выборки необходимо общий объем выборочной совокупности разделить между выделенными типами единиц. Расчет числа наблюдений из каждой группы зависит от названных ранее организационных форм типической выборки.

При типическом отборе единиц непропорционально численности групп общее число отбираемых единиц делят на число групп, полученная величина дает численность отбора из каждой типической группы:

где k – число выделенных типических групп.

При отборе единиц пропорционально численности типических групп число наблюдений по каждой группе определяют по формуле

где – объем выборки из i -й группы; – объем i -й группы.

При отборе с учетом вариации признака процент выборки из каждой группы должен быть пропорционален среднему квадратическому отклонению в этой группе (). Расчет численности () производят по формулам

При серийном отборе необходимую численность отбираемых серий определяют так же, как и при собственно-случайном отборе:

Повторный отбор

Бесповторный отбор

При этом дисперсии и ошибки выборки могут быть рассчитаны для средней величины или доли признака.

При использовании выборочного наблюдения характеристика его результатов возможна на основе сопоставления полученных пределов ошибок выборочных показателей с величиной допустимой погрешности.

В связи с этим возникает задача определения вероятности того, что ошибка выборки не превысит допустимой погрешности. Решение этой задачи сводится к расчету на основе формулы предельной ошибки выборки величины t.

Продолжая рассмотрение примера выборочного обследования лицевых счетов клиентов банка, найдем вероятность, с которой можно утверждать, что ошибка при определении среднего размера вклада не превысит 785 руб.:

соответствующая доверительная вероятность составит 0,95.

В настоящее время практика выборочного наблюдения включает статистические наблюдения, осуществляемые:

  • – органами Росстата;
  • – другими министерствами и ведомствами (например, мониторинг предприятий в системе Банка России).

Известное обобщение опыта по организации выборочных обследований малых предприятий, населения и домашних хозяйств представлено в Методологических положениях по статистике. В них дано более широкое понятие выборочного наблюдения, чем это рассмотрено выше (табл. 5.4).

В статистической практике используют все четыре типа выборок, представленных в табл. 5.4. Однако обычно отдают предпочтение описанным выше вероятностным (случайным) выборкам, являющимся наиболее объективными, так как по ним можно оценить точность получаемых результатов по данным самой выборки.

Таблица 5.4

Типы выборок

В выборках квазислучайного типа предполагается наличие вероятностного отбора на том основании, что специалист, рассматривающий выборку, считает его допустимым. Примером использования квазислучайной выборки в статистической практике является "Выборочное обследование малых предприятий по изучению социальных процессов в малом предпринимательстве", проведенное в 1996 г. в некоторых регионах России. Единицы наблюдения (малые предприятия) отбирались экспертно с учетом представительства отраслей экономики из уже сформированной выборки обследования финансово-хозяйственной деятельности малых предприятий (форма "Сведения об основных показателях финансово-хозяйственной деятельности малого предприятия"). При обобщении выборочных данных предполагалось, что выборочная совокупность сформирована методом простого случайного отбора.

Прямое использование суждения эксперта является наиболее общим методом намеренного включения единиц в выборку. Примером такого способа отбора является монографический метод, предполагающий получение информации только от одной единицы наблюдения, являющейся типичной, по мнению организатора обследования – эксперта.

Выборки, сформированные на основе направленного отбора, реализуются с помощью объективной процедуры, но без использования вероятностного механизма. Широко известен метод основного массива, при котором в выборку включают наиболее крупные (существенные) единицы наблюдения, обеспечивающие основной вклад в показатель, например суммарное значение признака, представляющего основную цель обследования.

В статистической практике часто применяют комбинированный метод статистического наблюдения. Сочетание сплошного и выборочного методов наблюдения имеет два аспекта:

  • чередование во времени;
  • одновременное их использование (часть совокупности наблюдают на сплошной основе, а часть – выборочно).

Чередование периодических выборочных со сравнительно редкими сплошными обследованиями или переписями необходимо для уточнения состава исследуемой совокупности. В дальнейшем эту информацию используют как статистическую основу выборочного наблюдения. Примерами могут служить переписи населения и выборочные обследования домашних хозяйств в промежутках времени между их проведениями.

В данном случае требуется решать следующие задачи:

  • – определение состава признаков сплошного наблюдения, обеспечивающих организацию выборки;
  • – обоснование периодов чередования, т.е. когда сплошные данные теряют актуальность и нужны затраты на их обновление.

Одновременное использование в рамках одного обследования сплошного и выборочного наблюдений обусловлено неоднородностью встречающихся в статистической практике совокупностей. В особенности это справедливо для обследований экономической деятельности совокупности предприятий, для которой характерны скошенные распределения изучаемых признаков, когда некоторое число единиц имеет характеристики, сильно отличающиеся от основной массы значений. В этом случае такие единицы наблюдают на сплошной основе, а другую часть совокупности – выборочно.

При данной организации наблюдений основными задачами выступают:

  • – установление их оптимальной пропорции;
  • – разработка способов оценки точности результатов.

Типичным примером, иллюстрирующим данный аспект применения комбинированного метода, является общий принцип проведения обследований совокупности предприятий, в соответствии с которым обследования совокупности крупных и средних предприятий проводят преимущественно сплошным методом, а малых – выборочным.

Дальнейшее развитие методологии выборочного наблюдения осуществляют как в сочетании с организацией сплошного наблюдения, так и через организацию специальных обследований, проведение которых диктуется необходимостью получения дополнительной информации для решения конкретных задач. Так, организация обследований в области условий и уровня жизни населения предусмотрена в двух аспектах:

  • – обязательные компоненты;
  • – дополнительные модули в рамках комплексной системы показателей.

Обязательными компонентами могут стать ежегодные исследования доходов, расходов и потребления (аналог обследования бюджетов домашних хозяйств), включающие также базовые показатели условий жизни населения. Ежегодно по специальному плану обязательные компоненты должны дополняться единовременными обследованиями (модулями) условий жизни населения, направленными на углубленное изучение какой-либо выбранной социальной темы из их общего числа (например, активы домашних хозяйств, здоровье, питание, образование, условия труда, жилищные условия, досуг, социальная мобильность, безопасность и др.) с различной периодичностью, определяемой потребностью в показателях и ресурсными возможностями.

На основании зарегистрированных в соответствии с программой статистического наблюдения значений признаков единиц выборочной совокупности рассчитываются обобщающие выборочные характеристики: выборочная средняя () и выборочная доля единиц, обладающих каким-либо интересующим исследователей признаком, в общей их численности (w ).

Разность между показателями выборочной и генеральной совокупности называется ошибкой выборки .

Ошибки выборки, как ошибки любого другого вида статистического наблюдения, подразделяются на ошибки регистрации и ошибки репрезентативности. Основной задачей выборочного метода является изучение и измерение случайных ошибок репрезентативности.

Выборочная средняя и выборочная доля являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок.

Средняя ошибка выборки (µ - мю) равна:

для средней ; для доли ,

где р - доля определенного признака в генеральной совокупности.

В этих формулах σ х 2 и р (1-р ) являются характеристиками генеральной совокупности, которые при выборочном наблюдении неизвестны. На практике их заменяют аналогичными характеристиками выборочной совокупности на основании закона больших чисел, по которому выборочная совокупность при достаточно большом объеме достаточно точно воспроизводит характеристики генеральной совокупности. Методы расчета средних ошибок выборки для средней и для доли при повторном и бесповторном отборах приведены в табл. 6.1.

Таблица 6.1.

Формулы расчета средней ошибки выборки для средней и для доли

Величина всегда меньше единицы, поэтому величина средней ошибки выборки при бесповторном отборе оказывается меньше, чем при повторном. В тех случаях, когда доля выборки незначительна и множитель близок к единице, поправкой можно пренебречь.

Утверждать, что генеральная средняя значения показателя или генеральная доля не выйдет за границы средней ошибки выборки можно лишь с определенной степенью вероятности. Поэтому, для характеристики ошибки выборки кроме средней ошибки рассчитывают предельную ошибку выборки (Δ), которая связана с гарантирующим ее уровнем вероятности.

Уровень вероятности (Р ) определяет величина нормированного отклонения (t ), и наоборот. Значения t даются в таблицах нормального распределения вероятностей. Наиболее часто используемые сочетания t и Р приведены в табл. 6.2.


Таблица 6.2

Значения нормированного отклонения t при соответствующих значениях уровней вероятности Р

t 1,0 1,5 2,0 2,5 3,0 3,5
Р 0,683 0,866 0,954 0,988 0,997 0,999

t - коэффициент доверия, зависящий от вероятности, с которой можно гарантировать, что предельная ошибка не превысит t -кратную среднюю ошибку. Он показывает, сколько средних ошибок содержится в предельной ошибке . Так, если t = 1, то с вероятностью 0,683 можно утверждать, что разность между выборочными и генеральными показателями не превысит одной средней ошибки.

Формулы для расчета предельных ошибок выборки приведены в табл. 6.3.

Таблица 6.3.

Формулы расчета предельной ошибки выборки для средней и для доли

После исчисления предельных ошибок выборки находят доверительные интервалы для генеральных показателей . Вероятность, которая принимается при расчете ошибки выборочной характеристики, называется доверительной. Доверительный уровень вероятности 0,95 означает, что только в 5 случаях из 100 ошибка может выйти за установленные границы; вероятности 0,954 - в 46 случаях из 1000, а при 0,999 - в 1 случае из 1000.

Для генеральной средней наиболее вероятные границы, в которых она будет находится с учетом предельной ошибки репрезентативности, будут иметь вид:

Наиболее вероятные границы, в которых будет находится генеральная доля, будут иметь вид:

Отсюда, генеральная средняя , генеральная доля .

Приведенные в табл. 6.3. формулы используются при определении ошибок выборки, осуществляемой собственно случайным и механическим методами.

При стратифицированном отборе в выборку обязательно попадают представители всех групп и обычно в тех же пропорциях, что и в генеральной совокупности. Поэтому ошибка выборки в данном случае зависит главным образом от средней из внутригрупповых дисперсий. Исходя из правила сложения дисперсий можно сделать вывод, что ошибка выборки для стратифицированного отбора всегда будет меньше, чем для собственно случайного.

При серийном (гнездовом) отборе мерой колеблемости будет межгрупповая дисперсия.

Публикации по теме

  • Газета «Социальная политика Газета «Социальная политика

    Как у женщин проверить мочевой пузырь знают немногие, потому, столкнувшись с потребностью пройти цистоскопию или эндоскопическое...

  • Освобождение от физкультуры Освобождение от физкультуры

    Стоит выйти побегать на лыжах - и готов бронхит. Пара кувырков - и у ребенка жестокое головокружение, вплоть до тошноты. Любой удар по мячу...