Tishanskiysdk.ru

Про кризис и деньги
2 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Выборочный метод анализа

Выборочный метод

Выборочный метод — статистический метод исследования общих свойств совокупности каких-либо объектов на основе изучения свойств лишь части этих объектов, взятых на выборку.

Хорошо изученным примером использования зависимых наблюдений может служить оценка эмпирического распределения или его параметров в «генеральной совокупности» из N объектов по произведённой из неё «выборке», содержащей n

Необходимость выборочного метода может быть вызвана объективными причинами:

— объект исследования очень обширный, например, исследование потребительских предпочтений на рынке продукта, прогноз результатов голосования на выборах и т.д.

— необходимость в сборе первичной информации в «пилотных» исследованиях.

Ключевые вопросы выборочного обследования:

— количественная характеристика выборки или определение минимального количества наблюдений (объема выборки) для проведения исследования;

— качественная характеристика выборки или способы и методы формирования выборочной совокупности.

Главная задача выборочного обследования – с минимальным объемом выборки получить как можно более точное описание интересующей генеральной совокупности на основе выборочных данных. Добиться этого можно только на основе репрезентативной выборки, т.е. выборки объективно отражающей свойства генеральной совокупности.

Точность результатов выборочных обследований достигается за счет использования сложных методов формирования выборки (кластерного отбора, задания расслоения, использования вероятностно-пропорционального отбора, простого случайного или случайного отбора, повторного или бесповторного отбора).

Минимальный объем выборки зависит от многих параметров исследования (оцениваемого показателя или системы показателей, способа и методов формирования выборки, вариации исследуемых данных, заданной надежности получаемых результатов, максимально допустимой ошибки в оценки показателей) и определяется на основе формул математической статистики или экспертным путем.

Выборочный метод используют, прежде всего, в социологии, маркетинге, клинических исследованиях. Но фактически при статистическом анализе данных в любой области исследователь работает, как правило, не с генеральной совокупностью, а с выборкой. Ошибка многих исследователей, что они не придают этому значение, не задумываются, какими методами была получена анализируемая информация и насколько соблюдена методология выборочного обследования. Из-за этого получаемые результаты не соответствуют реально объективно существующим закономерностям, т.к. анализируется нерепрезентативная выборка.

В теории выборочного метода разработаны различные способы отбора и виды выборки, обеспечивающие репрезентативность. Под способом отборапонимают порядок отбора единиц из генеральной совокупности. Различают два способа отбора: повторный и бесповторный. При повторном отборе каждая отобранная в случайном порядке единица после ее обследования возвращается в генеральную совокупность и при последующем отборе может снова попасть в выборку.

Этот способ отбора построен по схеме «возвращенного шара»: вероятность попасть в выборку для каждой единицы генеральной совокупности не меняется независимо от числа отбираемых единиц. При бесповторномотборе каждая единица, отобранная в случайном порядке, после ее обследования в генеральную совокупность не возвращается. Этот способ отбора построен по схеме «невозвращенного шара»: вероятность попасть в выборку для каждой единицы генеральной совокупности увеличивается по мере производства отбора.

Выборочное наблюдение применяется, когда применение сплошного наблюдения физически невозможно из-за большого массива данных или экономически нецелесообразно. Физическая невозможность имеет место, например, при изучении пассажиропотоков, рыночных цен, семейных бюджетов. Экономическая нецелесообразность имеет место при оценке качества товаров, связанной с их уничтожением, например, дегустация, испытание кирпичей на прочность и т.п.

Статистические единицы, отобранные для наблюдения, составляют выборочную совокупность или выборку, а весь их массив — генеральную совокупность (ГС). При этом число единиц в выборке обозначают n, а во всей ГС — N. Отношение n/N называется относительный размер или доля выборки.

Качество результатов выборочного наблюдения зависит от репрезентативности выборки, то есть от того, насколько она представительна в ГС. Для обеспечения репрезентативности выборки необходимо соблюдать принцип случайности отбора единиц, который предполагает, что на включение единицы ГС в выборку не может повлиять какой-либо иной фактор кроме случая.

Существует 4 способа случайного отбора в выборку:

1. Собственно случайный отбор или «метод лото», когда статистическим величинам присваиваются порядковые номера, заносимые на определенные предметы (например, бочонки), которые затем перемешиваются в некоторой емкости (например, в мешке) и выбираются наугад. На практике этот способ осуществляют с помощью генератора случайных чисел или математических таблиц случайных чисел.

2. Механический отбор, согласно которому отбирается каждая (N/n)-я величина генеральной совокупности. Например, если она содержит 100 000 величин, а требуется выбрать 1 000, то в выборку попадет каждая 100 000 / 1000 = 100-я величина. Причем, если они не ранжированы, то первая выбирается наугад из первой сотни, а номера других будут на сотню больше. Например, если первой оказалась единица № 19, то следующей должна быть № 119, затем № 219, затем № 319 и т.д. Если единицы генеральной совокупности ранжированы, то первой выбирается № 50, затем № 150, затем № 250 и так далее.

3. Отбор величин из неоднородного массива данных ведется стратифицированным (расслоенным) способом, когда генеральная совокупность предварительно разбивается на однородные группы, к которым применяется случайный или механический отбор.

4. Особый способ составления выборки представляет собой серийный отбор, при котором случайно или механически выбирают не отдельные величины, а их серии (последовательности с какого-то номера по какой-то подряд), внутри которых ведут сплошное наблюдение.

Качество выборочных наблюдений зависит и от типа выборки: повторная или бесповторная.

При повторном отборе попавшие в выборку статистические величины или их серии после использования возвращаются в генеральную совокупность, имея шанс попасть в новую выборку. При этом у всех величин генеральной совокупности одинаковая вероятность включения в выборку.

Бесповторный отбор означает, что попавшие в выборку статистические величины или их серии после использования не возвращаются в генеральную совокупность, а потому для остальных величин последней повышается вероятность попадания в следующую выборку.

Бесповторный отбор дает более точные результаты, поэтому применяется чаще. Но есть ситуации, когда его применить нельзя (изучение пассажиропотоков, потребительского спроса и т.п.) и тогда ведется повторный отбор.

Индексные методы в статистических исследованиях

Индекс — это обобщающий относительный показатель, характеризующий изменение уровня общественного явления во времени, по сравнению с программой развития, планом, прогнозом или его соотношение в пространстве.

Наиболее распространена сравнительная характеристика во времени. В этом случае индексы выступают какотносительные величины динамики.

Индексный метод является также важнейшим аналитическим средством выявления связей между явлениями. При этом применяются уже не отдельные индексы, а их системы.

В статистической практике индексы применяются при анализе развития всех отраслей экономики, на всех этапах экономической работы. В условиях рыночной экономики особенно возросла роль индексов цен, доходов населения, фондового рынка и территориальных индексов.

Статистика осуществляет классификацию индексов по следующим признакам:

1. В зависимости от объекта исследования:

— индексы объемных (количественных) показателей (индексы физического объема: товарооборота, продукции, потребления)

— индексы качественных показателей (индексы цен, себестоимости, заработной плата)

К индексам объемных показателей относятся индексы физического объема: товарооборота, продукции, потребления материальных благ и услуг; а также других показателей, имеющих количественный характер: численности работников, посевных площадей и т.п. К индексам качественных показателей относятся индексы: цен, себестоимости продукции, заработной платы, производительности труда, урожайности и т.п.;

2. По степени охвата элементов совокупности:

— индивидуальные индексы (дают сравнительную характеристику отдельных элементов явления)

— общие индексы (характеризуют изменение совокупности элементов или всего явления в целом)

3. В зависимости от методологии исчисления общие индексы подразделяются на:

— агрегатные (агрегатные индексы являются основной формой индексов и строятся как агрегаты путем взвешивания индексируемого показателя с помощью неизменной величины другого, взаимосвязанного с ним показателя).

— средние (являются производными от агрегатных)

4. В зависимости от базы сравнения различают:

— базисные (если при исчислении индексов за несколько периодов времени база сравнения остается постоянной)

— цепные (если база сравнения постоянно меняется)

ВЫБОРОЧНЫЙ МЕТОД

ВЫБОРОЧНЫЙ МЕТОД (син.: выборочное наблюдение, выборка) — статистический метод, позволяющий получить характеристику всей изучаемой совокупности в целом (генеральной совокупности) на основе специального отбора и изучения части составляющих ее единиц (выборочной совокупности).

В. м., основанный на законе больших чисел и теории вероятностей (см. Больших чисел закон, Вероятностей теория), теоретически был разработан русскими математиками П. Л. Чебышевым, А. М. Ляпуновым, А. А. Марковым и др. В. м. широко применялся в статистических исследованиях отечественными врачами в 90-е годы 19 в. Теория и практика В. м. получила дальнейшее развитие в советской статистике, в т. ч. санитарной.

В советском здравоохранении В. м. применяется наряду со сплошным исследованием при изучении различных вопросов состояния здоровья населения и деятельности мед. учреждений. Сплошное наблюдение производят при необходимости иметь краткую информацию обо всех без исключения единицах наблюдения исследуемой совокупности (напр., при переписях населения, изучении заболеваемости, смертности и др.). В. м. используют для получения углубленных сведений или для проверки данных, полученных сплошным методом, путем более детального и строгого изучения части объектов, а также для проведения пробных, поисковых работ. В. м. обеспечивает экономию сил, средств, сокращение сроков работы при расширении и углублении программы исследования.

Читать еще:  Использование корреляционного анализа

Для обеспечения статистически достоверных результатов предъявляют особые требования к выборочной совокупности. Она должна быть репрезентативной (представительной) по отношению к генеральной совокупности. Это означает, что выборочная совокупность должна быть достаточно представительной по численности отобранных единиц, а также должна соответствовать качественному составу генеральной совокупности.

Применение В.м. включает следующие этапы: 1) определение объема выборочной совокупности; 2) специальный отбор необходимой численности единиц из генеральной совокупности; 3) расчет выборочных статистических величин и оценка их репрезентативности; 4) распространение результатов исследования с выборочной совокупности на всю генеральную совокупность.

Основным условием применения В. м. является определение достаточного объема выборочной совокупности, обеспечивающей получение статистически достоверных результатов, и репрезентативность ее. По мере увеличения объема выборки уменьшается ошибка выборки, т. е. возрастает ее точность. Для определения объема выборочной совокупности используют специальные формулы. С целью обеспечения качественного соответствия состава выборочной совокупности составу генеральной совокупности применяют следующие способы отбора необходимой численности единиц из генеральной совокупности (или способы выборочного наблюдения): случайный, механический, типологический, серийный.

Случайный способ — выборку производят с помощью жеребьевки (рендомизации) или с помощью специальных таблиц случайных чисел; каждая единица генеральной совокупности имеет равную возможность стать единицей выборочной совокупности. Механический способ — единицы генеральной совокупности располагают в определенном порядке (по номерам, алфавиту и т. д.), а затем механически производят отбор единиц через какой-либо интервал (напр., 5, 10, 15 и т. д.). Типологический способ — генеральную совокупность предварительно расчленяют на отдельные качественно однородные группы (типы) по какому-либо изучаемому признаку, напр, население по возрасту, проживанию в различных географических районах (горных, приморских, степных и др.)» по профессии (занимающиеся полеводством, животноводством, рыболовством и т. д.). После предварительного расчленения генеральной совокупности на группы производят отбор части единиц внутри каждой типологической группы. Отбор осуществляют механическим путем. При этом необходимо, чтобы объем выборки из каждой типологической группы был пропорционален удельному весу данной группы в составе изучаемой генеральной совокупности. Серийный (гнездовой) способ — выборочную совокупность образуют путем отбора не отдельных единиц, а сразу целых серий (гнезд) из генеральной совокупности. Для этой цели всю генеральную совокупность предварительно разбивают на относительно однородные серии (гнезда). Отбор серий осуществляют методом случайной или механической выборки. Отбор должен производиться так, чтобы каждой серии генеральной совокупности была обеспечена одинаковая возможность быть отобранной в выборочную совокупность. Такой принцип выборочного наблюдения обеспечивает репрезентативность выборочной совокупности по отношению к генеральной. В каждой отобранной серии изучаются все составляющие ее единицы.

После отбора всех единиц выборочной совокупности приступают к расчету различных (в зависимости от необходимости) статистических величин: средних арифметических, относительных величин, коэффициентов корреляции и др.

Важным этапом В. м. является оценка репрезентативности выборочных статистических величин: средних арифметических, относительных величин, коэффициентов корреляции и т. д.

Для оценки репрезентативности этих величин используется ошибка репрезентативности (m). Она показывает, насколько результаты, полученные при выборочном наблюдении, отличаются от результатов, к-рые были бы получены при сплошном изучении всей генеральной совокупности.

Ошибка репрезентативности (m) средней арифметической рассчитывается по формуле: m =σ/√n , где σ — среднее квадратическое отклонение, n — число наблюдений. Ошибка репрезентативности для показателя рассчитывается по формуле:

m =√(p×q/n) , где р — величина показателя в процентах, а q=100—р (если p выражено в промилле, то q=1000—p).

В. м. предусматривает определение меры различия (ошибку) статистических величин выборочной совокупности от статистических величин генеральной совокупности и тем самым обеспечивает возможность перенесения выводов с выборочной совокупности на всю генеральную совокупность.

Заключительным этапом при применении В. м. является распространение результатов выборочного исследования на всю генеральную совокупность.

Статистические величины выборочной совокупности несколько отличаются от величин генеральной совокупности. Статистика позволяет определить эти пределы колебаний выборочных величин, к-рые не должны выходить за пределы доверительных границ статистических величин генеральной совокупности. Используя ошибку репрезентативности m с заданной мерой вероятности безошибочного прогноза р, можно установить доверительные границы, в пределах к-рых будет находиться средняя арифметическая величина (или показатель) того или иного признака в генеральной совокупности.

Для этого используют формулу: M=m±tm, где М — доверительные границы средней арифметической генеральной совокупности; m — средняя арифметическая, полученная в выборочной совокупности; t — критерий точности, к-рый зависит от заранее заданной вероятности безошибочного прогноза p.

Математически доказано, что при р = = 95% t=2, при р = 99,7% t=3. Такое соотношение закономерно при числе наблюдений n>30. При меньшем числе наблюдений соотношение величин p и t находят по специальной статистической таблице «критерия t» (критерий Стьюдента). Напр., для определения среднего роста мужчин в возрасте 25 лет в генеральной совокупности можно измерить рост мужчин 25 лет в выборочной совокупности. Так, если средний рост мужчин 25 лет в выборочной совокупности составил 173 см, а ошибка репрезентативности средней величины роста m=±0,3 см, то при вероятности безошибочного прогноза р=95,0% критерий t=2, М=173±(2х0,3 мм) или 172,4-173,6. Это означает, что при любом увеличении числа обследованных лиц аналогичного пола и возраста их средний рост не окажется (с вероятностью в 95%) ниже 172,4 см и выше 173,6 см. Если, по мнению исследователя, доверительные границы слишком велики и тем самым полученная средняя величина (показатель) является ненадежной, следует принять меры к увеличению числа наблюдений.

При сравнении двух выборочных средних величин В. м. предусматривает определение существенности различия между ними по формуле

где М1 и М2 — сравниваемые средние арифметические, а m1 и m2 — соответствующие ошибки репрезентативности. Если t= 2, то можно будет утверждать (с вероятностью безошибочного прогноза р = 95%), что сравниваемые величины действительно существенно различны между собой. Если же t = 3, то р=99,7%, т. е. различие еще более существенно.

Такое статистическое доказательство достоверности различия результатов исследования широко применяется при выводах об эффективности тех или иных оздоровительных мероприятий, сравнении методов лечения, при доказательстве различия сравниваемых групп по каким-либо иным признакам и т. д. При этом необходимо иметь в виду, что количественный результат оценок существенности различия должен сопровождаться глубоким качественным анализом, напр, изучением в сравнительном плане особенностей распространения того или иного заболевания в зависимости от пола, возраста, профессии, социальных условий и т. д.

«Малыми выборками» называются группы, состоящие из 30 и менее единиц наблюдения, по результатам к-рых оценивается вся генеральная совокупность. В этих случаях предъявляются повышенные требования к обработке и оценке выборочных статистических величин. Видоизменяются расчеты среднего квадратического отклонения (а) и критерия точности t. Оценка существенности различий двух выборочных статистических величин осуществляется также путем расчета критерия t, но полученного двумя разными путями, в зависимости от того, связаны или не связаны между собой сравниваемые совокупности (пример связанных между собой совокупностей: уровень кровяного давления до лечения и после лечения одних и тех же лиц; пример не связанных между собой совокупностей: уровень кровяного давления у мужчин и женщин).

Библиогр.: Йейтс Ф. Выборочный метод в переписях и обследованиях, пер. с англ., М., 1965, библиогр.; Крылов В. Н. Выборочный метод в статистике, М., 1957; Мерков А. М. и Поляков Л. М. Санитарная статистика, Л., 1974, библиогр.; Сeпeтлиeв Д. Статистические методы в научных медицинских исследованиях, пер. с болг., М., 1968; Статистические методы исследования в медицине и здравоохранении, под ред. Л. Е. Полякова, Л., 19 71, библиогр.

Выборочный метод анализа

1. Задачи математической статистики.

3. Способы отбора.

4. Статистическое распределение выборки.

5. Эмпирическая функция распределения.

6. Полигон и гистограмма.

7. Числовые характеристики вариационного ряда.

8. Статистические оценки параметров распределения.

9. Интервальные оценки параметров распределения.

1. Задачи и методы математической статистики

Математическая статистика — это раздел математики, посвященный методам сбора, анализа и обработки результатов статистических данных наблюдений для научных и практических целей.

Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, если имеется партия деталей, то качественным признаком может служить стандартность детали, а количественным- контролируемый размер детали.

Читать еще:  Анализ информационных ресурсов сети интернет

Иногда проводят сплошное исследование, т.е. обследуют каждый объект относительно нужного признака. На практике сплошное обследование применяется редко. Например, если совокупность содержит очень большое число объектов, то провести сплошное обследование физически невозможно. Если обследование объекта связано с его уничтожением или требует больших материальных затрат, то проводить сплошное обследование не имеет смысла. В таких случаях случайно отбирают из всей совокупности ограниченное число объектов (выборочную совокупность) и подвергают их изучению.

Основная задача математической статистики заключается в исследовании всей совокупности по выборочным данным в зависимости от поставленной цели, т.е. изучение вероятностных свойств совокупности: закона распределения, числовых характеристик и т.д. для принятия управленческих решений в условиях неопределенности.

Генеральная совокупность – это совокупность объектов, из которой производится выборка.

Выборочная совокупность (выборка) – это совокупность случайно отобранных объектов.

Объем совокупности – это число объектов этой совокупности. Объем генеральной совокупности обозначается N , выборочной – n .

Если из 1000 деталей отобрано для обследования 100 деталей, то объем генеральной совокупности N = 1000, а объем выборки n = 100.

При составлении выборки можно поступить двумя способами: после того, как объект отобран и над ним произведено наблюдение, он может быть возвращен либо не возвращен в генеральную совокупность. Т.о. выборки делятся на повторные и бесповторные.

Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.

Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается.

На практике обычно пользуются бесповторным случайным отбором.

Для того, чтобы по данным выборки можно было достаточно уверенно судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли. Выборка должна правильно представлять пропорции генеральной совокупности. Выборка должна быть репрезентативной (представительной).

В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществлять случайно.

Если объем генеральной совокупности достаточно велик, а выборка составляет лишь незначительную часть этой совокупности, то различие между повторной и бесповторной выборками стирается; в предельном случае, когда рассматривается бесконечная генеральная совокупность, а выборка имеет конечный объем, это различие исчезает.

В американском журнале «Литературное обозрение» с помощью статистических методов было проведено исследование прогнозов относительно исхода предстоящих выборов президента США в 1936 году. Претендентами на этот пост были Ф.Д. Рузвельт и А. М. Ландон. В качестве источника для генеральной совокупности исследуемых американцев были взяты справочники телефонных абонентов. Из них случайным образом были выбраны 4 миллиона адресов., по которым редакция журнала разослала открытки с просьбой высказать свое отношение к кандидатам на пост президента. Обработав результаты опроса, журнал опубликовал социологический прогноз о том, что на предстоящих выборах с большим перевесом победит Ландон. И … ошибся: победу одержал Рузвельт.
Этот пример можно рассматривать, как пример нерепрезентативной выборки. Дело в том, что в США в первой половине двадцатого века телефоны имела лишь зажиточная часть населения, которые поддерживали взгляды Ландона.

На практике применяются различные способы отбора, которые можно разделить на 2 вида:

1. Отбор не требует расчленения генеральной совокупности на части (а) простой случайный бесповторный; б) простой случайный повторный).

2. Отбор, при котором генеральная совокупность разбивается на части. (а) типичный отбор; б) механический отбор; в) серийный отбор).

Простым случайным называют такой отбор, при котором объекты извлекаются по одному из всей генеральной совокупности (случайно).

Типичным называют отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой ее «типичной» части. Например, если деталь изготавливают на нескольких станках, то отбор производят не из всей совокупности деталей, произведенных всеми станками, а из продукции каждого станка в отдельности. Таким отбором пользуются тогда, когда обследуемый признак заметно колеблется в различных «типичных» частях генеральной совокупности.

Механическим называют отбор, при котором генеральную совокупность «механически» делят на столько групп, сколько объектов должно войти в выборку, а из каждой группы отбирают один объект. Например, если нужно отобрать 20 % изготовленных станком деталей, то отбирают каждую 5-ую деталь; если требуется отобрать 5 % деталей- каждую 20-ую и т.д. Иногда такой отбор может не обеспечивать репрезентативность выборки (если отбирают каждый 20-ый обтачиваемый валик, причем сразу же после отбора производится замена резца, то отобранными окажутся все валики, обточенные затупленными резцами).

Серийным называют отбор, при котором объекты отбирают из генеральной совокупности не по одному, а «сериями», которые подвергают сплошному обследованию. Например, если изделия изготавливаются большой группой станков-автоматов, то подвергают сплошному обследованию продукцию только нескольких станков.

На практике часто применяют комбинированный отбор, при котором сочетаются указанные выше способы.

4. Статистическое распределение выборки

Пусть из генеральной совокупности извлечена выборка, причем значение x1 –наблюдалось раз, x2-n2 раз,… xk — nk раз. n = n1+n2+. +nk– объем выборки. Наблюдаемые значения называются вариантами, а последовательность вариант, записанных в возрастающем порядке- вариационным рядом. Числа наблюдений называются частотами (абсолютными частотами), а их отношения к объему выборки — относительными частотами или статистическими вероятностями.

Если количество вариант велико или выборка производится из непрерывной генеральной совокупности, то вариационный ряд составляется не по отдельным точечным значениям, а по интервалам значений генеральной совокупности. Такой вариационный ряд называется интервальным. Длины интервалов при этом должны быть равны.

Статистическим распределением выборки называется перечень вариант и соответствующих им частот или относительных частот.

Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (суммы частот, попавших в этот интервал значений)

Точечный вариационный ряд частот может быть представлен таблицей:

Электронная библиотека

Объектом социального исследования являются, как правило, большие совокупности людей, дифференцированные по различным социально-демографическим признакам и рассредоточенные по большой территории. Вследствие этого организация их сплошного опроса затруднительна. Поэтому прибегают к несплошным опросам. Это делают при помощи выборочного метода, который обеспечивает выбор оптимальной численности лиц для опроса с как можно меньшими ошибками выборки и с как можно большей надежностью полученных эмпирических данных о статистическом распределении опрашиваемых лиц и его параметрах (долей, средних арифметических, дисперсий и др.).

Достоверность выводов о закономерностях социальных явлений зависит от качества проведенной выборки. Задача состоит в том, чтобы на основании выборочного опроса ограниченного числа лиц полученные выводы распространить на генеральную совокупность по изучаемой социальной проблеме.

Выборочный метод позволяет делать заключения о характере распределения изучаемых признаков генеральной совокупности на основании рассмотрения некоторой ее части – выборочной совокупности; предполагает различные способы ее формирования, обеспечивающие возможность распространения выводов, полученных при ее рассмотрении, на изучаемую (генеральную) совокупность.

Основное назначение выборочного метода. Метод применяется для того, чтобы, изучив характеристики минимума объектов, произвести по ним оценку параметров генеральной совокупности. Он значительно сокращает затраты труда, времени, средств на решение той или иной проблемы; повышает качество и надежность процедур сбора и обработки данных; позволяет изучать объекты, сплошное исследование которых невозможно из-за больших затрат.

Область применения выборочного метода. Метод применяется для изучения объектов, элементы которых не обладают качественной однородностью признаков, значимых с точки зрения целей исследования.

Основные нормативные требования к выборочному методу. Каждый элемент генеральной совокупности должен иметь определенную, принципиально задаваемую вероятность попасть в выборку. Предполагает наличие необходимой системы показателей генеральной совокупности, отражающих ее качественные и количественные характеристики.

Программа применения выборочного метода является составной частью программы социального исследования; основными задачами при этом являются:

1) предварительный сбор информации об исследуемой совокупности с целью составления основы выборки, выделения единиц отбора и анализа;

2) выбор и обоснование схемы выборки;

3) организация извлечения единиц отбора из генеральной совокупности по выбранной схеме отбора;

4) расчет характеристик выборочной совокупности;

5) оценка параметров генеральной совокупности по результатам измерения признаков выборочной совокупности.

На чем же базируются идеи выборочного метода? Дадим некоторые определения.

Генеральная совокупность – множество объектов, являющихся предметом изучения в пределах, очерченных программой социального исследования и территориально-временными границами.

Выборочная совокупность, или выборка, представляет собой модель генеральной совокупности, результат определенным образом построенного извлечения части элементов генеральной совокупности, выступающих в качестве объектов наблюдения.

Основа выборки – перечень элементов генеральной совокупности, в случае, если он удовлетворяет требованиям полноценности, точности, адекватности, удобства работы с ним, отсутствия дублирования единиц анализа.

Единицы отбора – элементы генеральной совокупности, отбираемые на каждом этапе выборки.

Единицы анализа – элементы сформированной выборочной совокупности, подвергающиеся непосредственному исследованию.

Объем выборки – число элементов, включенных в выборочную совокупность. Объем выборки определяется: а) задачами исследования; б) степенью однородности генеральной совокупности, которую данная выборка репрезентирует; в) величиной доверительной вероятности (Р), при которой гарантируется достоверность результатов исследований; д) требуемой точностью результатов, т.е. величиной допускаемой ошибки репрезентативности. При определении объема выборки учитывается совокупность технических приемов, применяемых для ее качественного и статистического анализа. Объем выборки определяется с помощью статистических таблиц больших чисел, а также с помощью специальных расчетов.

Читать еще:  Анализ основных производственных фондов

Дисперсия – разброс (отклонения) отдельных значений признаков элементов генеральной или выборочной совокупности от средней величины признака. При нулевой дисперсии все единицы отбора имели бы одинаковое, равное среднему значению распределение признаков, и для выборки достаточно было бы одной единицы, чтобы обеспечить репрезентативность данных. Чем больше дисперсия, тем больший объем выборочной совокупности потребуется для дальнейшего исследования.

Репрезентативность – свойство выборочной совокупности представлять параметры генеральной совокупности, значимые с точки зрения задач исследования. Она означает, что с некоторой заданной заранее или вычисленной погрешностью можно отождествить установленное на выборочной совокупности распределение изучаемых признаков с их действительным распределением в генеральной совокупности. Оценка репрезентативности выводится на основе анализа и расчета ошибок: процедурных (допущенных при регистрации признаков) и случайных (зависящих от степени изменчивости изучаемого признака).

ВЫБОРОЧНЫЙ МЕТОД

ВЫБОРОЧНЫЙ МЕТОД — статистический метод исследования общих свойств совокупности к.-л. объектов на основе изучения свойств лишь части этих объектов, взятых на выборку. Математич. теория В. м. опирается на два важных раздела математич. статистики -теорию выбора из конечной совокупности и теорию выбора из бесконечной совокупности. Основное отличие В. м. для конечной и бесконечной совокупностей заключается в том, что в первом случае В. м. применяется, как правило, к объектам неслучайной, детерминированной природы (напр., число дефектных изделий в данной партии готовой продукции не является случайной величиной: это число — неизвестная постоянная, к-рую и надлежит оценить по выборочным данным). Во втором случае В. м. обычно применяется для изучения свойств случайных объектов (напр., для исследования свойств непрерывно распределенных случайных ошибок измерений, каждое из к-рых теоретически может быть истолковано как реализация одного из бесконечного множества возможных результатов).

Выбор из конечной совокупности и его теория являются основой статистич. методов контроля качества и часто применяются в социология, исследованиях. Согласно теории вероятностей выборка будет правильно отражать свойства всей совокупности, если выбор производится случайно, т. е. так, что любая из возможных выборок заданного объема n из совокупности объема А (число таких выборок равно N!/n!(N — n)!) имеет одинаковую вероятность быть фактически выбранной.

На практике наиболее часто используется выбор без возвращения (бесповторная выборка), когда каждый отобранный объект перед выбором следующих объектов в исследуемую совокупность не возвращается (такой выбор применяется, напр., для определения выигрышных лотерейных билетов, при статистич. контроле качества, а также при демографии, исследованиях). Выбор с возвращением (выборка с повторением) рассматривается обычно лишь в теоретических исследованиях (примером выбора с возвращением их является регистрация числа частиц, коснувшихся в течение данного времени стенок сосуда, внутри которого совершается броуновское движение). Если n 〈〈 N, то повторный n бесповторный выборы дают практически эквивалентные результаты.

Свойства совокупности, исследуемые В. м., могут быть качественными и количественными. В первом случае задача выборочного обследования заключается в определении количества М объектов совокупности, обладающих к.-л. признаками (напр., при статистич. контроле часто интересуются количеством М дефектных изделий в партии объема N). Оценкой для М служит отношение mN/n, где m — число объектов с данным признаком в выборке объема n. В случае количественного признака имеют дело с определением среднего значения совокупности x̄ = (x1 + x2 + . + xN). Оценкой для х̄ является выборочное среднее

где Х1, Х2, . Хn — те значения из исследуемой совокупности х1, х2, . xN, к-рые принадлежат выборке. С математич. точки зрения первый случай — частная разновидность второго, к-рая имеет место, когда М величин xi равны 1, а остальные (N — M) равны 0; в этой ситуации x̄ = M/N и Х̄ = m/n.

В математич. теории В. м. оценка среднего значения занимает центральное место потому, что она служит основой количественного описания изменчивости признака внутри совокупности, т. к. за характеристику изменчивости обычно принимают дисперсию

представляющую собой среднее значение квадратов отклонений xi от их среднего значения х̄. В случае изучения качественного признака

О точности оценок m/n и X̄ судят по их дисперсиям

к-рые в терминах дисперсии конечной совокупности σ 2 выражаются в виде отношений σ 2 /n (в случае выборок с повторением) и σ 2 (N — n)/n(N — 1) (в случае бесповторных выборок). Т. к. во многих практически интересных задачах случайные величины m/n и X̄ при n ≥ 30 приближенно подчиняются нормальному распределению, то отклонения m/n от M/N и Х̄ от x̄, превышающие по абсолютной величине 2σm/n и 2σ соответственно, могут при n ≥ 30 осуществиться в среднем приблизительно в одном случае из двадцати.

Более полную информацию о распределении количественного признака в данной совокупности можно получить с помощью эмпирического распределения этого признака в выборке.

Выбор из бесконечной совокупности. В математич. статистике результаты к.-л. однородных наблюдений (чаще всего независимых) принято наз. выборкой даже в том случае, когда эти результаты не соответствуют понятию выборки с повторениями или без повторений из конечной совокупности. Напр., результаты измерений углов на местности, подверженные независимым непрерывно распределенным случайным ошибкам, часто наз. выборкой из бесконечной совокупности. Предполагается, что принципиально можно осуществить любое число таких наблюдений. Полученные фактически результаты считают выборкой из бесконечного множества возможных результатов, наз. генеральной совокупностью. Понятие генеральной совокупности не является логически безупречным и необходимым. Для решения практич. задач нужна не сама бесконечная генеральная совокупность, а лишь те или иные характеристики, к-рые ей ставятся в соответствие. Эти характеристики с точки зрения теории вероятностей являются числовыми или функциональными характеристиками нек-рого распределения вероятностей, а элементы выборки — случайными величинами, подчиняющимися этому распределению. Такое истолкование позволяет распространить на выборочные оценки общую теорию статистич. оценок (см. Оценка статистическая). По этой причине, напр., в вероятностной теории обработки наблюдений понятие бесконечной генеральной совокупности заменяется понятием распределения вероятностей, содержащего неизвестные параметры. Результаты наблюдений трактуются как экспериментально наблюдаемые значения случайных величин, подчиняющихся этому распределению. Цель обработки -вычисление по результатам наблюдений в том или ином смысле оптимальных статистич. оценок для неизвестных параметров распределения.

Выше речь шла о выборочном обследовании одной совокупности к.-л. объектов. Однако практическое применение В. м. часто осуществляется во многих однородных совокупностях (напр., при оценке доли бракованных изделий в нескольких партиях готовой продукции). В этой ситуации объектом изучения является не одно число М, а несколько неизвестных чисел М1, М2, . . Пусть, напр., все обследуемые партии готовой продукции содержат N изделий, причем М1, М2, . — количества дефектных изделий в этих партиях, а m1, m2, . — соответствующие количества дефектных изделий, обнаруженные в выборках объема n. Согласно условию так наз. бездефектной приемки партия с номером r передается потребителю, если mi = 0, в противном случае она бракуется. Предположим, что контроль изделий сопряжен с их уничтожением, и поэтому потребитель либо получает партию объема Ri = 0 (при mi > 0), либо партию объема Ri = N — n с количеством дефектных изделий Di = Mi (при mi = 0), причем значения R1, R2, . (а, значит, и их сумма) известны, а значение D1 + D2 + . неизвестно. Отношение (D1 + D2 + . )/(R1 + R2 + . ) называют долей пропущенного брака, а его математич. ожидание q — средней долей пропущенного брака. Задача математич. статистики заключается в оценке q по значениям R1, R2, . зафиксированным в результате применения В. м. Если значения М1, М2, . можно трактовать как реализации независимых одинаково распределенных случайных величин с известным законом распределения Рi = r> = рr, то согласно Бейеса формуле статистич. оценка среднего числа пропущенных дефектных изделий в принятых партиях выражается формулой

средней доли пропущенного брака в принятых партиях удовлетворяет неравенству

где s — число принятых партий, a s1 — количество тех забракованных партий, в выборках из к-рых обнаружено ровно одно дефектное изделие.

Лит.: [1] Дупин-Барковский И. В., Смирнов Н. В., Теория вероятностей и математическая статистика в технике (Общая часть), M., 1955, гл. 5; [2] Беляев Ю. К., Вероятностные методы выборочного контроля, М., 1975; [3] Кендалл М., Стьюарт А., Теория распределений, пер. с англ., М., 1966.

  1. Математическая Энциклопедия. Т. 1 (А — Г). Ред. коллегия: И. М. Виноградов (глав ред) [и др.] — М., «Советская Энциклопедия», 1977, 1152 стб. с илл.
Ссылка на основную публикацию
Adblock
detector