ГЛОССАРИЙ

 

Глава 2. Сбор и первичная обработка данных

(Primary Data Collection and Processing)

 

2.1. Выборочное наблюдение

(Sample Observation)

 

Бесповторный отбор (non-repeated selection) - отбор по схеме не возвращаемого шара. При таком отборе каждая отобранная единица не возвращается в генеральную совокупность, а, следовательно, вероятность попадания в выборку оставшихся единиц все время меняется.

Вероятностные методы выборки (probability sampling methods) – методы выборочного наблюдения, в которых предполагается, что каждый элемент генеральной совокупности известен и имеет определенную вероятность попасть в обследование. К вероятностным методам относятся случайная, механическая (систематизированная), типическая (стратифицированная), серийная (кластерная) выборки.

Выборка (или выборочная совокупность) (sampling) – часть единиц генеральной совокупности, подлежащей непосредственному наблюдению.

Выборка мнений (суждений) (judgment samples) - это невероятностная выборка, в которой критерии отбора базируются на мнении отдельных индивидов, что конкретный элемент представляет изучаемую совокупность. Формирование такой выборки основано на использовании мнений квалифицированных специалистов (экспертов) относительно состава выборки.

Выборка снежного кома (snowball sampling) – невероятностная выборка, при проведении которой предполагается, что отбор дополнительных (последующих) респондентов производится после ссылки на них первоначально отобранных. Такая процедура используется при изучении особенных, редких, неслучайных совокупностей

Выборочное наблюдение (sample observation) – один из наиболее широко применяемых видов несплошного наблюдения, при проведении которого обследуются не все единицы генеральной совокупности, а лишь некоторая, отобранная по определенным принципам, часть этих единиц. Однако наблюдение организовано таким образом, что эта часть отобранных единиц в уменьшенном масштабе представляет всю совокупность. Различают вероятностные и невероятностные методы выборочного наблюдения.

Генеральная совокупность (population) – вся совокупность реально существующих объектов, из которых тем или иным способом извлекается выборочная совокупность.

Доверительная вероятность (confidence level) – вероятность того, что оцениваемый параметр в генеральной совокупности будет находиться в установленном интервале.

Интервальные оценки (interval estimations) – оценки параметра в генеральной совокупности; пределы, в которых с данной степенью вероятности будет заключена неизвестная величина оцениваемого параметра. Нижняя граница будет равна разности между средней выборочной величиной и предельной ошибкой, а верхняя граница – сумме этих двух величин.

Квотная выборка (quota sampling) - – это невероятностная выборка, сконструированная из единиц определенных категорий (квот), которые должны быть представлены в заданных пропорциях.

Кластерная (серийная) выборка (cluster sampling) один из методов вероятностной выборки , при котором сплошному обследованию подвергаются группы (серии, гнезда) единиц, отобранные первоначально в случайном порядке. Серийная выборка широко используется там, где генеральная совокупность состоит из обособленных групп единиц. Такая выборка часто производится внутри уже сложившихся территориальных образований (районов, городов, кварталов), когда степень однородности выделенных групп не поддается регулировке со стороны исследователя.

Механическая выборка (systematic sampling) – вероятностный метод выборки, при котором наблюдению подвергаются единицы, находящиеся на равном расстоянии в определенной последовательности расположения единиц генеральной совокупности. При проведении механической выборки нужно установить:

  1. шаг отсчета (т.е. расстояние между отбираемыми единицами) как отношение размера совокупности к размеру выборки;
  2. начало отсчета, т.е. номер той единицы, которая должна быть обследована первой.

 

Невероятностные методы выборки (non-probability sampling methods)- методы выборочного наблюдения, которые предусматривают отбор специфических единиц из генеральной совокупности в неслучайном порядке. При применении невероятностных методов отбора формирование выборки осуществляется без использования понятий теории вероятности, а следовательно, невозможно рассчитать вероятность включения в выбору конкретных единиц совокупности. К невероятностным методам относятся удобная, квотная выборки, выборка снежного кома и выборка мнений (суждений).

Нормальное распределение (normal distribution) – непрерывное, симметричное распределение, имеющее форму колокола, в котором средняя, мода и медиана равны одной и той же величине. 68 % наблюдений попадают в интервал Х+ s ; около 95 % наблюдений – в интервал Х + 2s ; а 99 % - в интервал Х + 3s

Относительная ошибка выборки (relative sampling error) – величина относительной погрешности, выраженной в процентах к средней.

Ошибка выборки (sampling error) – ошибка репрезентативности (представительности) – расхождение между значениями изучаемого признака в выборочной и генеральной совокупности. Различают случайные и систематические ошибки выборки. Случайная ошибка возникает в силу того, наблюдение является несплошным, т.е. выборочная совокупность недостаточно точно воспроизводит генеральную совокупность. Систематическая ошибка возникает вследствие нарушения правил отбора.

Повторный отбор (repeated selection) – отбор по схеме возвращенного шара. При таком отборе вероятность попадания каждой отдельной единицы в выборку остается постоянной, так как отобранная единица после обследования снова возвращается в генеральную совокупность и снова может быть выбранной.

Предел ошибки выборки (allowable sampling error) – величина возможных отклонений показателей генеральной совокупности от показателей выборочной совокупности. Предельная ошибка (D ) зависит от средней ошибки выборки (m ) и от величины вероятности, с которой гарантируется результат выборочного наблюдения. Обычно вероятность принимается равная 0,954 или 0,997, которой соответствуют коэффициенты (t) , равные 2 или 3. Между названными показателями существует взаимосвязь: D = tm .

Размер выборки (sample size) – число единиц, образующих выборочную совокупность. Необходимый размер (объем) выборки рассчитывается по особым формулам, различающимся в зависимости от способа отбора и метода выборки.

Репрезентативность выборки (sample reliability) – представительность результатов выборочного наблюдения; зависит от объема выборки. Чем больше объем выборки, тем меньше ошибка репрезентативности, точнее данные выборочного наблюдения.

Случайная выборка (simple random sampling) - вероятностный метод выборки, при котором отбор производится из всей массы единиц генеральной совокупности без предварительного расчленения ее на какие-либо группы, и каждый элемент имеет одинаковую вероятность попадания в выборку (Р), которую можно рассчитать как отношение размера выборки к размеру генеральной совокупности.

Средняя ошибка выборки (mean sampling error) – среднее квадратическое отклонение выборочных средних от генеральной средней. Средняя ошибка выборки тем больше, чем больше вариация в генеральной совокупности, и тем меньше, чем больше объем выборки.

Типическая (стратифицированная) выборка (stratified sampling)это вероятностная выборка, обеспечивающая равномерное представительство в выборочной совокупности различных частей (типов) явлений.

Точечные оценки (point estimations) - приближенное значение неизвестного параметра генеральной совокупности, исчисляемое как функция выборки. Оценка получается вычислением только одного значения этой функции.

Удобная выборка (convenience samples) – один из методов невероятностной выборки, при котором отбор респондентов для маркетингового обследования производится исходя из соображений удобства проведения выборки. Чаще всего исследователь подходит к формированию такой выборки с позиций минимальных затрат времени и усилий, доступности респондентов и т.п., отсюда и происходит ее название.

 

 

2.2. Группировка исходной маркетинговой информации

(Grouping of initial marketing information)

 

Группировка данных (grouped data) – один из основных методов обработки первичной статистической информации, представляющий собой процесс образования групп единиц совокупности, однородных в каком-либо отношении, а также имеющих одинаковые или близкие значения изучаемого признака.

Группировочные признаки (grouping variables) – признаки, принимаемые за основу образования групп в процессе статистической группировки. В маркетинговых исследованиях в основе группировок лежит деление признаков на 2 группы: характеристики потребителей и оценка их отношения к товару. Разграничение сегментов обычно требует комбинирования этих групп.

Дендрограмма (tree diagram) - графическое изображение результатов кластеризации; имеет вид иерархического агломеративного дерева, в котором каждый последующий класс разбиения является объединением одного кластера с другим, а последнее разбиение содержит один класс.

Евклидово расстояние (Euclidean distances) - самая распространенная мера близости, “метрика”, на основе которой осуществляется разбиение объектов на группы:

p

d e ( X i , X j ) = [ å ( X k i - X k j ) 2 ] 1/2

k=1

где X k i , X k j – значения к-го признака соответственно i –го и j – го объектов.

Иерархические алгоритмы (hierarchical algorithms)алгоритмы, используемые в процессе формирования кластеров. Их смысл состоит в последовательном объединении объектов, сначала наиболее близких, а затем все более отдаленных друг от друга. На каждом шаге работы алгоритма происходит объединение двух самых близких кластеров и соответственно преобразуется матрица расстояний. Работа алгоритма заканчивается, когда все объекты будут объединены в один кластер.

Интервалы группировок (grouping intervals) – разность между верхней и нижней границами интервалов; могут быть равными и неравными, закрытыми и открытыми.

Кластерный анализ (Cluster Analysis) - группа технических процедур, используемых для объединения объектов или людей, похожих между собой по 2 и более классификационным признакам. Цель кластерного анализа состоит в классификации объектов или людей по нескольким общим группам так, чтобы те, кто попал в одну группу, были похожи друг на друга насколько это возможно: все единицы, попавшие в один кластер, должны быть однородны, и существенно отличаться от тех единиц, которые попали в другой кластер.

Критерии (меры) близости (closeness measures) – статистические показатели, используемые для измерения сходства объектов и надежности их группировки. Различают следующие меры близости (сходства): коэффициенты корреляции, меры расстояния, коэффициенты ассоциативности, вероятностные коэффициенты сходства.

Многомерная группировка (multi-way grouping) – один из приемов образования сходных в определенном смысле групп единиц совокупности, если у каждой единицы изучаются несколько признаков одновременно.

Многомерная средняя (multiple grouping) - средняя величина нескольких признаков для одной единицы совокупности. Поскольку нельзя рассчитать среднюю величину по абсолютным значениям разных признаков (выраженных в разных единицах измерения), то многомерная средняя вычисляется из относительных величин, как правило, - из отношений абсолютных значений признаков для единицы совокупности к средним значениям этих признаков:

Число группировочных признаков (number of grouping variables)абсолютное число, показывающее, сколько признаков используется при проведении многомерной группировки. Число группировочных признаков не может быть очень большим, так как существует зависимость между объемом исходной совокупности и количеством группировочных признаков:

L max < [ log n / log 2 ]

L max – максимальное количество группировочных признаков.

 

 

2.3. Дескриптивный анализ (Descriptive analysis)

 

Вариация (dispersion) – колеблемость, изменение величины признака в статистической совокупности, т.е. принятие единицами совокупности разных значений признака. Вариация измеряется системой показателей вариации, к которым относятся: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия, коэффициент вариации.

Дисперсия (variance) – средняя из квадратов отклонений значений признака от их средней величины.

Коэффициент вариации (variation) – отношение среднего квадратического отклонения к величине соответствующей ему средней.

Мода (mode) – величина признака, которая встречается в изучаемой совокупности чаще, чем другие величины данного признака.

Медиана (median) – величина варьирующего признака, делящая совокупность на две равные части, со значениями больше и меньше медианы.

Среднее квадратическое отклонение (standard deviation) – один из показателей вариации, представляющий собой корень второй степени из среднего квадрата отклонений значений признака от их средней величины (дисперсии). Имеет ту же размерность, что и признак, для которого оно вычисляется.

Среднее линейное отклонение (mean linear deviation) – один из показателей вариации, представляющий собой среднее значение отклонение вариантов признака от их средней величины.

Средняя (mean) –обобщенная характеристика центральной тенденции; она выражает характерную, типичную величину признака в статистической совокупности, образующуюся в данных условиях места и времени под влиянием всех факторов. В средней величине совокупности погашаются индивидуальные различия единиц совокупности, обусловленные действием случайных обстоятельств.

Размах вариации (range) – один из показателей вариации, характеризующий пределы колеблемости индивидуальных значений признака в статистической совокупности. Он представляет собой разность между наибольшим и наименьшим значениями признака в вариационном ряду.

Центральной тенденции оценки (measures of Central Tendency) – статистические показатели, которые описывают центр ряда распределения (вариационного ряда), к ним относятся: средняя, мода и медиана.


Комментарии

Пока нет ни одного комментария
*Имя:
Email:
Отсылать мне другие комментарии на этой странице
Скрыть мой email
*Текст: