Thursday, 4 July 2024, 04:17
Сайт: Электронный университет КГЭУ - виртуальная образовательная среда
Курс: Анализ данных в маркетинге-2023 (для направлений 39.03.01 Социология, 42.03.01 Реклама и связи с общественностью) (АДвМ)
Глоссарий: Глоссарий курса
А

Анализ

(от греческого analysis -разложение):

1) расчленение (мысленное или реальное) объекта на элементы; противоположные синтезу;

2) научное исследование.

Анализ временного (динамического) ряда

 - метод анализа данных, основанный на построении регресси

Анализ данных

 - совокупность действий осуществляемых исследователем в процессе изучения полученных тем или иным образом данных с целью формирования определенных представлений о характере явления, описываемого этими данными.

Анализ детерминационный

 - система методов анализа социологических и социально-экономических данных, в которой задачи обработки и интерпретации ставиться как задачи анализа детерминации.

Анализ документов

 - совокупность методических приемов, применяемых для извлечения из документальных источников социологической информации, необходимой для решения исследовательских задач. Выделяются два основных метода анализа документов: неформализованный (традиционный) и формализованный (контент-анализ, от английского content-analysis - анализ содержания).

Анализ многомерный

 - раздел математической статистики, посвященный математическим методам, направленным на выявление характера и структуры взаимосвязей между компонентами исследуемого многомерного признака и предназначенным для получения научных и практических выводов.

Анкета

 (от франц. Enquete - расследование) - упорядоченный по последовательности, содержанию, содержанию и форме набор вопросительных суждений, воплощенный в виде опросного листа и предназначенный для сбора эмпирической социологической информации в форме письменных ответов опрашиваемых (респондентов) по сформулированной исследовательской проблеме.

Б

Бинарные данные

Данные, выражаемые только двумя допустимыми альтернативными значениями (например; «есть» - «нет», «здоров» - «болен»).


Биноминальное распределение 

- распределение количества «успехов» в последовательности из n независимых случайных экспериментов, таких что вероятность «успеха» в каждом из них равна p.

Бланк интервью

- вопросник, используемый в очных интервью.

В

Валидность

- мера пригодности применяемых в прикладной социологии методики для решения определенных исследовательских задач, степень соответствия переменных и индикаторов эмпирическим данным, позволяющая получать надежные, репрезентативные и достоверные результаты социологического исследования, избегать систематических ошибок.

Верификация

(от фр. Verification < лат.verus - истинный + facere - делать) - проверка истинности, установление достоверности. - проверка, эмпирическое подтверждение теоретических положений науки путем их сопоставления с наблюдаемыми объектами.

Взвешенный индекс

- индекс, в котором оценки, выставляемые в рамках одной переменной, стандартизируются относительно оценок, выставляемых в рамках какой-то другой переменной, что позволяет проводить обоснованное сравнение между оценками данного индекса для различных случаев.

Внешняя валидность (обоснованность)

- вид теоретической валидности, выражающийся в корреляции некоторого показателя (меры) исходного понятия с показателями (мерами) других понятий, согласно теории связанных с исходным.

Внутренняя валидность (обоснованность)

 - вид теоретической валидности, выражающийся в корреляции нескольких показателей (мер) одного и того же понятия.

Вторичный анализ

- анализ данных, собранных когда-то в прошлом другим исследователем.

Г

Гамма-коэффициент

 - коэффициент связи между двумя порядковыми переменными.

Генерализуемость

 - возможность распространения результатов анализа ограниченного числа случаев (признаков) на большее количество случаев (признаков).

Генеральная совокупность

 - полная совокупность объектов, имеющих отношение к изучаемой проблеме.

Гипотеза

 - научное предположение о структуре объектов, характере и сущности связей между ними, факторах, обуславливающих эти связи.

Гистограмма

- столбиковая диаграмма, на которой показано распределение значений некоторой переменной.

Д

Данные

 - результаты наблюдений или информация, о действительности получаемая в ходе исследования.

Данные исследования

 - структурированная и формализованная информация, собранная в результате исследования.

Двумерная статистика

 - статистика, обобщенно отражающая зависимость между двумя переменными.

Двусторонняя столбиковая диаграмма

 - график, на котором столбики изображают варьирование переменной выше или ниже некоторой нормы.

Диаграмма рассеяния

 - график, в суммарном виде отражающий распределение признаков относительно двух переменных с использованием пунктира для обозначения результатов наблюдений.

Дискриминантная валидность (обоснованность)

 - свойство некоторого показателя (меры) обладать валидностью по отношению лишь к какому-то одному понятию в противовес к другим понятиям.

Дискриминантный анализ

Дискриминантный анализ - статистический метод, используемый для прогнозирования вероятности какого-либо события. Относится к методам классификации с обучением. Используется для разделения респондентов в различающиеся между собой группы на основе некоторых характеристик. Обычно зависимая переменная номинальная или порядковая, а независимые переменные (предикторы) - метрические (интервальные).

Дисперсионный анализ

 - метод статистического анализа, позволяющий определить достоверность гипотезы о различиях в средних значениях на основании сравнения дисперсий распределений. Этот метод имеет смысл только лишь для интервальных переменных с наложенными дополнительными ограничениями.

Дисперсия

 - разброс (отклонения) отдельных значений признаков элементов генеральной или выборочной совокупности (от средней величины признака).

Е

Единицы анализа

- единицы, элементы объекта исследования, которые подлежат эмпирическому обоснованию.

Единицы счета

 - количественная характеристика единицы анализа, фиксируют регулярность, с которой встречается в обследуемом массиве та или иная смысловая единица.

З

Зависимая переменная

- переменная, меняющая свое значение в соответствии с изменениями значений другой переменной.

Значение

 - характеристика или оценка определенного признака в пределах данной переменной.

И

Измерение

 - применение инструментария для подсчета или любого другого способа количественной характеристики результатов наблюдений над действительностью.

Измерение надежности

 - устойчивость и воспроизводимость измерения.

Измерение разброса (дисперсии)

 - показатель того, как колеблются (варьируют) значения признаков вокруг средней тенденции, т.е. показатель ее репрезентативности.

Измерительная шкала

- основной инструмент социального измерения; в качестве эталона служит средством фиксации той или иной совокупности значений, интересующих исследователя.

Имитационная модель

- математическая компьютерная модель, в которую введены определенные динамические элементы.

Индекс

- специально созданный показатель, который выражает связь, комбинацию индикаторов, служит обоснованию и проверке определенной частной гипотезы.

Индикатор

 - доступная наблюдению и измерению характеристика изучаемого объекта.

Инструментарий

- система методических и технических приемов осуществления исследования, воплощенная в соответствующих операциях и процедурах и представленная в форме разнообразных документов.

Интервальное измерение

 - измерение, классифицирующее и упорядочивающее объекты, после того как они измерены на интервальном уровне, а также показывающее, насколько большим или меньшим количеством измеряемого свойства по сравнению с другими объектами они характеризуются.

Интервью

 (от англ. interview - беседа с глазу на глаз) - один из основных методов опроса, использующий в качестве источника информации непосредственное вербальное взаимодействие исследователя с респондентом в соответствии с исследовательской программой.

Исследование аналитическое 

- самый углубленный вид социологического исследования, ориентированного на выявление причин, обусловливающих сущность, структуру и особенности изучаемого социального объекта и носящее, как правило, комплексный характер, в процессе его осуществления применяются различные социологические методы: включенное наблюдение, контент-анализ документов, массовый опрос, интервьюирование экспериментов.

К

Казуальность 

- причинность, причинный характер связи между явлениями, процессами, событиями.

Категория анализа

 - единицы, выражающие смысловые признаки объекта исследования или его отдельных элементов (единиц анализа).

Каузальная модель

 - модель, графически изображающая множество зависимостей между понятиями (или переменными), когда изменение в одном (или более) из них предшествует или вызывает изменение в другом (других).

Качественные методы

 - методы, которые предполагают получение глубинных ответов. Они нацелены не столько на фиксацию количественных параметров изучаемых явлений, сколько на познание их качества. Часто эти методы определяют как "мягкие", в отличие от "жестких", количественных.

Квазиэкспериментальное исследование 

- исследование, в котором методы сбора и анализа данных по степени контроля максимально приближены к экспериментальному исследованию.



Квантиль

- показатель (мера) позиции внутри распределения.

Квантильный ранг

 - показатель (мера) дисперсии для порядковых переменных.

Кластерный анализ

- это совокупность методов, позволяющих классифицировать многомерные наблюдения, каждое из которых описывается неким набором переменных. Целью кластерного анализа является образование групп схожих между собой объектов, которые принято называть кластерами. Слова кластер английского происхождения (cluster), переводится как сгусток, пучок, группа. Родственные понятия, используемые в литературе, - класс, таксон, сгущение. В отличие от комбинационных группировок кластерный анализ приводит к разбиению на группы с учетом всех группировочных признаков одновременно.

Книга кодов

- перечень переменных и других величин с указанием кодов, приписанных им в данном исследовании.

Конвергентная валидность (обоснованность)

 - свойство нескольких показателей (мер) одного м того же понятия приводить к одному и тому же результату.

Контент-анализ

 - это перевод в количественные показатели массовый текст (или записанный на пленку) информации с последующей статистической ее обработкой.

Корреляция

- показатель наличия линейной зависимости двух переменных. Может быть использован только для интервальных переменных и не может быть интерпретирован как "степень взаимосвязи" переменных.

Коэффициент вариации 

- мера (показатель) дисперсии для номинальных переменных.



Коэффициент детерминации

 - квадрат коэффициента линейной корреляции Пирсона, интерпретируется как доля дисперсии зависимой переменной, объясненной посредством независимой переменной.



Коэффициент корреляции

 - коэффициент связи между двумя интервальными переменными, служащий показателем точности подбора экспериментальных точек относительно линии регрессии.

Л

Линейная диаграмма

 - график, на котором соответствующие результатам наблюдений точки соединены между собой линиями, что позволяет отражать направление развития или другую зависимость.



Линейная корреляция 

- связь между двумя переменными, которая может быть описана посредством прямой линии.

Линия регрессии

 - линия, которая точнее всего отражает распределение экспериментальных точек на диаграмме рассеяния и крутизна наклона которой характеризует зависимость между двумя интервальными переменными.



М

Маргинальное распределение

 - распределение частот в том виде. в каком оно появляется в итоговых колонках таблицы взаимной сопряженности признаков.



Математическая модель

 - упрощенное описание процесса или ситуации в математических выражениях.



Матрица данных

 - средство представления данных исследования; квадратная таблица, строки которой предназначены для информации об обследованных объектах, столбцы - для измеряемых переменных: на пересечении строки и столбца указывается значение переменой для конкретного объекта.


Матрица корреляционная

 - средство представления структуры связей между переменными, квадратная таблица, в которой указываются коэффициенты между каждой парой переменных.




Медиана

 - мера средней тенденции для порядковых переменных.

Множественная обусловленность

 - обычное положение в социальных науках, когда некоторое следствие является результатом более чем одной причины.




Множественная регрессия

 - статистическая процедура изучения зависимости, существующей между зависимой переменной и несколькими независимыми переменными.


Множественные показатели 

- две и более меры одной и той же переменной, используемые для усиления валидности показателей.


Мода 

- мера средней тенденции для номинальных переменных.

Н

Надежность интеркодирования 

- соответствие, достигнутое относительно значений, приписываемых одному и тому же или сходным признакам разными независимыми наблюдателями.

Независимая переменная

 - переменная, изменение значений которой влияет на значения некоторой другой переменной.



Необработанные данные 

- результаты нестандартизованных или еще не обработанных наблюдений.

Номинальное измерение

 - измерение, которое просто классифицирует случаи безотносительно к их рангу или к расстояниям между ними.

Нормальное распределение

 - симметричное одновершинное распределение с максимумом в середине, в котором мода, медиана и средняя принимают одно и то же значение.

О

Одномерная статистика 

- статистика, относящаяся к/или описывающая одну переменную.



Омнибус 

(англ. omnibus - охватывающий несколько разделов) - социологический инструментарий, предназначенный для сбора информации по нескольким темам.



Операционализация

 - процесс преобразования абстрактных понятий в конкретные термины.



Описательное исследование

 - исследование, занимающееся измерением какого-либо аспекта действительности, скорее ради него самого, нежели ради развития или проверки некоторой теории.

Ошибка выборки 

- несоответствие между признаками выборки и признаками генеральной совокупности.

П

Параметр 

- любой признак совокупности (в отличие от признака выборки).

Пат-анализ

 - статистический метод, позволяющий оценить степень взаимовлияния переменных в причинно-следственной модели.



Перекрестное обследование

 - обследование, при котором сравниваются единовременно полученные данные различных случаев.



Переменная

 - статистическое название измеряемого показателя, признака.


Перечневая таблица

 - простой перечень данных исследований в виде таблицы.

Показатель 

- обобщенные по заданным логическим и математическим правилам данные исследования.

Р

Рабочая гипотеза

 - утверждение, предсказывающее существование некоторой зависимости между показателями.


Рандомизация

 - такая процедура отбора признаков для исследования (или получения сопоставимых групп в эксперименте), когда каждый признак из некоторой совокупности и каждая комбинация признаков заданного размера имеет равные с другими шансы на попадание в выборку.

Регрессионный анализ

 - статистический метод установления зависимости между независимыми и зависимыми переменными. Регрессионный анализ на основе построенного уравнения регрессии определяет вклад каждой независимой переменной в изменение изучаемой (прогнозируемой) зависимой переменной величины. Выделяют два вида регрессионного анализа - парный регрессионный анализ и анализ на основе множественной регрессии.

Репрезентативность

 - это свойство выборки отражать характер изучаемой генеральной совокупности, ее представительность.

Респондент 

- лицо, участвующее в опросе в качестве источника или коммуникатора социальной информации.

С

Сводные данные 

- данные, относящиеся к целому ряду признаков или совокупностей.



Секторная диаграмма

 - график, на котором результаты наблюдений представлены в виде кругов, разбитых на сектора.

Системный показатель 

- мера какого-либо свойства или признака группы в целом.

Среднее арифметическое

 - мера средней тенденции для интервальных переменных.



Среднее квадратическое отклонение

 - мера разброса данных, корень квадратный из дисперсии.



Средняя тенденция

 - способ определения такой средней величины или оценки, которая лучше всего представляет некоторое множество признаков данной переменной.


Стандартизовать

 - измерять в единой или в сравнимых единицах измерения.




Стандартная оценка

 - мера расположения в интервальном распределении, выражаемая в единицах стандартного отклонения относительно средней.


Стандартная оценка гаммы

 - критерий статистической значимости связи между двумя порядковыми переменными.




Стандартное отклонение

- мера дисперсии для интервальных переменных.

Статистическая независимость

 - соотношение между двумя переменными, характеризующееся отсутствием статистической связи.


Статистическая связь 

- соотношение между двумя переменными, при котором изменение значения одной переменной влечет изменение распределения другой переменной.

Суммарный показатель 

- мера группового признака, образуемая посредством объединения индивидуальных признаков членов группы.

Т

Таблица взаимной сопряженности признаков

 - обобщенное изображение зависимости (зависимостей) между двумя и более переменными в виде таблицы.



Таблица сопряженности

 - средство представления совместного распределения двух признаков, таблица, строки которой предназначены для значений одной переменной, столбцы - для значений другой переменной, на пересечении строки и столбца указывается частота совместного появления значений двух переменных.

Таблица 

- отображение данных в виде рядов распределения с поясняющими заголовками.



У

Уровень измерения

 - количество или качество получаемой информации, обеспечиваемое данным инструментарием.

Ф

Фокус-группа 

- качественный метод сбора социологической информации, способ выявить различие в понимании некоторой проблемы, события, явлений жизни определенными группами людей.


Фокусированное интервью 

- вид интервью, сконцентрированного на определенной проблеме. Предметом изучения являются субъективные переживания. Восприятия респондента. Чаще всего бывает нестандартизированным или полустандартизированным.




Формальная модель 

- модель, заданная на математическом или любом другом формализованном языке.

Х

Хи-квадрат (χ2)

- критерий статистической значимости связи между двумя номинальными переменными.



Холл-тест

 (англ. hall-test - испытание, проба в помещении) - метод, предназначенный для выявления реакции потенциальных потребителей на новые виды продуктов, предусматривает их дегустацию.

Ц

Цель

 - модель ожидаемого конечного результата, который может быть достигнут только с помощью проведения исследования.

Ч

Частный коэффициент регрессии

 - статистическая мера, обозначающая степень влияния независимой переменной на зависимую в ситуации, когда взаимовлияние всех остальных переменных в модели находится под контролем исследователя.



Частота абсолютная 

- количество объектов, обладающих данным значением признака.




Частота накопленная 

- сумма частот значений, не превосходящих данное значение.


Частота относительная

 - доля или процент объектов, обладающих данным значением признака, по отношению к объему выборки.

Частотное распределение 

- упорядоченный подсчет количества признаков по каждому значению переменной.


Ш

Шкала

 - ряд показателей, которые можно упорядочить таким образом, чтобы экспериментальные случаи оказались расположенными в порядке, соответствующем степени выраженности в них измеряемого понятия.



Шкала интервалов

 - измерительная шкала, пункты которой расположены на одинаковом расстоянии друг от друга; содержательный нуль отсутствует.




Шкала Лайкерта

 - метод одномерного шкалирования, предложенный Лайкертом. Заслугой Лайкерта явилось то, что он:

а) предложил некий критерий, который показывает, насколько правдоподобно предположение о самом существовании измеряемой однородной латентной переменной;

б) дал основания отобрать именно те наблюдаемые признаки (суждения), которые имеют отношение к тому, что мы измеряем;

в) показал, что пятибалльная шкала приемлема для измерения этих признаков;

г) дал обоснование применению суммы значений наблюдаемых значений в качестве значения латентной переменной и порядковый характер получающейся в результате шкалы.


Шкала наименований 

- измерительная шкала, предназначенная для классификации объектов; градации шкалы не упорядочены.



Шкала отношений

 - измерительная шкала, пункты которой расположены на одинаковом расстоянии друг от друга; имеется содержательный нуль.



Шкала порядка

 - измерительная шкала, упорядочивающая объекты по некоторому критерию; расстояние между объектами или классами объектов неизвестно.


Шкалирование путем парного сравнения

 - метод, используемый в контент-анализе для измерения силы оценочных суждений.




Шкальная оценка

 - единая мера того количества измеряемого данной шкалой признака, которым обладает тот или иной субъект.

Э

Эквивалентность (равнозначность)

 - сопоставимость групп (в эксперименте); сопоставимость мер в разных культурах (в сравнительном исследовании). Эквивалентная мера - использование одних и тех же понятий для исследования различных объектов.

Эмпирический

 - относящийся к/или характеризуемый наблюдениями над реальной действительностью или ее описаниями.



Эмпирический индикатор 

- элемент или характеристика объекта, которые доступны наблюдению и измерению.


Эмпирический референт 

- наблюдаемый объект (или событие), соответствующий некоторому понятию.



Эмпирическое социологическое знание 

- знание об объектах, процессах и явлениях социальной действительности, полученное при помощи эмпирических методов исследования - наблюдения, изучения документов, интервьюирования, массовых опросов населения и его различных групп, социальных экспериментов.




Этапы социологического исследования

 - комплекс процедур, составляющих стадии реализации его целей и задач.

Я

Ядерные функции

 - функции известного типа (как правило, гауссовы), которые размещаются в известных точках данных и затем суммируются, и таким образом строится аппроксимация выборочного распределения.