Психологическая помощь

Психологическая помощь

Запишитесь на индивидуальную онлайн консультацию к психологу.

Библиотека

Читайте статьи, книги по популярной и научной психологии, пройдите тесты.

Блоги психологов

О человеческой душе и отношениях читайте в психологических блогах.

Вопросы психологу

Задайте вопрос психологу и получите бесплатную консультацию специалиста.

Вход | Поиск | Правила форума

 
Задать вопрос психологу

FAQ по расчету критерия Пирсона

сообщение 22.7.2008, 10:28
#1



FAQ по расчету критерия Пирсона


Автоматический расчет можно произвести на странице критерия Пирсона


О скрипте Х2 критерий Пирсона

Шаг 1. Необходимо выбрать от 1 до 10 эмпирических распределений.
Шаг 2. Нужно внести эмпирические данные в колонки эмпирических распределений (колонок будет столько, сколько Вы выбрали эмпирических распределений в шаге 1). Вводятся только положительные числа по одному на строку. Пробелы и пропуски строк не допустимы (скрипт выдаст ошибку). После ввода, нажимаете «Шаг 3» и получаете ответ.
Шаг 3. Есть вывод расчетов и ответ. Для большей наглядности и проверке расчетов, рисуется таблица, в которой произведены все необходимые расчеты. Также рисуется таблица критических значений и выдается ответ.


Теперь несколько слов о самом Х2 - критерии Пирсона.

Назначение критерия Пирсона

Критерий X2 применяется в двух целях:
1) для сопоставления эмпирического распределения признака с теоретическим - равномерным, нормальным или каким-то иным;
2) для сопоставления двух, трех или более эмпирических распределений одного и того же признака (в скрипте до 10).


Описание критерия Пирсона

Критерий X2 отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях.
Преимущество метода состоит в том, что он позволяет сопоставлять распределения признаков, представленных в любой шкале, начиная от шкалы наименований. В самом простом случае альтернативного распределения "да - нет", "допустил брак - не допустил брака", "решил задачу - не решил задачу" и т. п. мы уже можем применить критерий X2.
Допустим, некий наблюдатель фиксирует количество пешеходов, выбравших правую или левую из двух симметричных дорожек на пути из точки А в точку Б.
Допустим, в результате 70 наблюдений установлено, что 51 человек выбрали правую дорожку, и лишь 19 - левую. С помощью критерия X2 мы можем определить, отличается ли данное распределение выборов от равномерного распределения, при котором обе дорожки выбирались бы с одинаковой частотой. Это вариант сопоставления полученного эмпирического распределения с теоретическим. Такая задача может стоять, например, в прикладных психологических исследованиях, связанных с проектированием в архитектуре, системах сообщения и др.
Но представим себе, что наблюдатель решает совершенно другую задачу: он занят проблемами билатерального регулирования. Совпадение полученного распределения с равномерным его интересует гораздо в меньшей степени, чем совпадение или несовпадение его данных с данными других исследователей. Ему известно, что люди с преобладанием правой ноги склонны делать круг против часовой стрелки, а люди с преобладанием левой ноги - круг по ходу часовой стрелки, и что в исследовании коллег преобладание левой ноги было обнаружено у 26 человек из 100 обследованных.
С помощью метода X2 он может сопоставить два эмпирических распределения: соотношение 51:19 в собственной выборке и соотношение 74:26 в выборке других исследователей.
Это вариант сопоставления двух эмпирических распределений по простейшему альтернативному признаку (конечно, простейшему с математической точки зрения, а отнюдь не психологической).
Аналогичным образом мы можем сопоставлять распределения выборов из трех и более альтернатив. Например, если в выборке из 50 человек 30 выбрали ответ (а), 15 человек - ответ (б) и 5 человек - ответ (в), то мы можем с помощью метода Х2 проверить, отличается ли это распределение от равномерного распределения или от распределения ответов в другой выборке, где ответ (а) выбрали 10 человек, ответ (б) - 25 человек, ответ (в) - 15 человек.
В тех случаях, если признак измеряется количественно, скажем, в баллах, секундах или миллиметрах, нам, быть может, придется объединить все обилие значений признака в несколько разрядов. Например, если время решения задачи варьирует от 10 до 300 секунд, то мы можем ввести 10 или 5 разрядов, в зависимости от объема выборки. Например, это будут разряды: 0-50 секунд; 51-100 секунд; 101-150 секунд и т. д. Затем мы с помощью метода Х2 будет сопоставлять частоты встречаемости разных разрядов признака, но в остальном принципиальная схема не меняется.
При сопоставлении эмпирического распределения с теоретическим мы определяем степень расхождения между эмпирическими и теоретическими частотами.
При сопоставлении двух эмпирических распределений мы определяем степень расхождения между эмпирическими частотами и теоретическими частотами, которые наблюдались бы в случае совпадения двух этих эмпирических распределений.
Чем больше расхождение между двумя сопоставляемыми распределениями, тем больше эмпирическое значение Х2.


Гипотезы

Возможны несколько вариантов гипотез, в зависимости от задач, которые мы перед собой ставим.
Первый вариант:
Н0: Полученное эмпирическое распределение признака не отличается от теоретического (например, равномерного) распределения.
H1: Полученное эмпирическое распределение признака отличается от теоретического распределения.

Второй вариант:
Н0: Эмпирическое распределение 1 не отличается от эмпирического распределения 2.
H1: Эмпирическое распределение 1 отличается от эмпирического распределения 2.

Третий вариант:
Н0: Эмпирические распределения 1, 2, 3, (в скрипте до 10). не различаются между собой.
H1: Эмпирические распределения 1, 2, 3, . различаются между собой.
Критерий Х2 позволяет проверить все три варианта гипотез.


Ограничения критерия Пирсона

1. Объем выборки должен быть достаточно большим: n>=30. При n<30 критерий X2 дает весьма приближенные значения. Точность критерия повышается при больших n.
2. Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5: f>=5. Это означает, что если число разрядов задано заранее и не может быть изменено, то мы не можем применять метод Х2, не накопив определенного минимального числа наблюдений. Если, например, мы хотим проверить наши предположения о том, что частота обращений в телефонную службу Доверия неравномерно распределяются по 7 дням недели, то нам потребуется 5*7=35 обращений. Таким образом, если количество разрядов (k) задано заранее, как в данном случае, минимальное число наблюдений (nmin) определяется по формуле: nmin=k*5.
3. Выбранные разряды должны "вычерпывать" все распределение, то есть охватывать весь диапазон вариативности признаков. При этом группировка на разряды должна быть одинаковой во всех сопоставляемых распределениях.
4. Необходимо вносить "поправку на непрерывность" при сопоставлении распределений признаков, которые принимают всего 2 значения. При внесении поправки значение X2 уменьшается.
5. Разряды должны быть неперекрещивающимися: если наблюдение отнесено к одному разряду, то оно уже не может быть отнесено ни к какому другому разряду.
Сумма наблюдений по разрядам всегда должна быть равна общему количеству наблюдений.
сообщение 25.9.2011, 1:18
#2
Участник



Немного непонятен момент минимального показателя теоретической частоты - не менее 5(то есть от 5 и больше), или больше 5? по указанному первоисточнику НЕ МЕНЕЕ 5 (стр. 117). Прошу внести комментарии по данному вопросу, поскольку это влияет на необходимость укрупнения разрядов, и снижает точность полученного результата вплоть до принятия вместо альтернативной гипотезы - нулевой. Заранее спасибо за ответ.
сообщение 25.9.2011, 9:22
#3



Здравствуйте!
Благодарю за замечание. Действительно, в описании была допущена неточность. Именно от пяти и более. Сам скрипт считает также от пяти и более.
Сейчас описание исправлено.
сообщение 18.10.2011, 9:41
#4
Участник



Цитата(psychol-ok @ 25.9.2011, 9:22) *
Здравствуйте!
Благодарю за замечание. Действительно, в описании была допущена неточность. Именно от пяти и более. Сам скрипт считает также от пяти и более.
Сейчас описание исправлено.


Не очень понятно происхождение этого ограничения. При обсчете реальных данных при сравнительно небольших объемах выборок (20) с числом интервалов 4-5 это ограничение никогда не будет выполнено. Не могли бы Вы дать ссылку на теоретическое обоснование этого ограничения? Спасибо.





© PSYCHOL-OK: Психологическая помощь, 2006 - 2024 г. | Политика конфиденциальности | Условия использования материалов сайта | Сотрудничество | Администрация