Сущность теории непараметрической статистики. Ранговая статистика

Достаточно хорошо аппроксимирует Р. с. Т, и разность пренебрежимо мала, когда . При справедливости гипотезы H 0 , согласно к-рой компоненты Х 1 , ... , Х n случайного вектора Xсуть независимые случайные величины, проекция Р. с. Топределяется по формуле

где (см. ).

Существует внутренняя связь между Р. с. и . Как показано в , при справедливости гипотезы H 0 проекция коэффициента корреляции Кендалла в семейство линейных Р. с. с точностью до постоянного множителя совпадает с коэффициентом ранговой корреляции Спирмена , а именно:


Из этого равенства следует, что коэффициент корреляции соrr между и равен


т. е. при больших пР. с. и асимптотически эквивалентны (см. ).

Лит. : Г а е к Я., Ш и д а к З., Теория ранговых критериев, пер. с англ., М., 1971; К е n d a l l M. G., Rank correlation methods, 4ed., L., 1970. М. С. Никулин.


Математическая энциклопедия. - М.: Советская энциклопедия . И. М. Виноградов . 1977-1985 .

Смотреть что такое "РАНГОВАЯ СТАТИСТИКА" в других словарях:

    ранговая статистика - — [А.С.Гольдберг. Англо русский энергетический словарь. 2006 г.] Тематики энергетика в целом EN rank statistics … Справочник технического переводчика

    У этого термина существуют и другие значения, см. Статистика (значения). Статистика (в узком смысле) это измеримая числовая функция от выборки, не зависящая от неизвестных параметров распределения. В широком смысле термин (математическая)… … Википедия

    - (statistics) 1. Совокупность данных и математических методов, используемых для изучения связей между различными переменными. Она включает такие методы, как линейная регрессия (linear regression) и ранговая корреляция. 2. Значения, использующиеся… … Экономический словарь

    СТАТИСТИКА - 1. Вид деятельности, направленной на получение, обработку и анализ информации, характеризующей количественные закономерности жизни об ва во всем ее многообразии, в неразрывной связи с ее качественным содержанием. В более узком смысле слова… … Российская социологическая энциклопедия

    - (non parametric statistics) Статистические технические приемы, которые не допускают особенных функциональных форм для отношений между переменными. Ранговая корреляция двух переменных является тому примером. Использование подобных технических… … Экономический словарь - К. м., получившие свое назв. благодаря тому, что основываются на «со отношении» («co relation») переменных, представляют собой статистические методы, начало к рым было положено в работах Карла Пирсона примерно в конце XIX в. Они тесно связаны с… … Психологическая энциклопедия

    Разработчик Digital Illusions CE Издатель … Википедия

    Карл Пирсон Karl (Carl) Pearson Дата рождения … Википедия

При выставлении экспертных оценок или в других случаях ранжирования возникают ситуации, когда двум или большему числу качеств приписываются одинаковые ранги. В этом случае правила ранжирования таковы:

1. Наименьшему числовому значению приписывается ранг 1.

2. Наибольшему числовому значению приписывается ранг, равный количеству ранжируемых величин.

3. В случае если несколько исходных числовых значений оказались равными, то им приписывается ранг, равный средней величине тех рангов, которые эти величины получили бы, если бы они стояли по порядку друг за другом и не были бы равны.

Отметим, что под этот случай могут попасть как первые, так и последние величины исходного ряда для ранжирования.

4. Общая сумма реальных рангов должна совпадать с расчетной, определяемой по формуле (1).

Например, психолог получил у 11 испытуемых следующие значения показателя невербального интеллекта: 113, 107, 123, 122, 117, 117, 105, 108, 114, 102, 104. Необходимо проранжировать эти показатели.

№ испытуемых п/п Показатели интеллекта Условные ранги Ранги
(8) 8,5
(9) 8,5

Т.к. у 5 и 6 испытуемых показатели интеллекта равные, то им необходимо поставить условные ранги, обязательно идущие по порядку друг за другом – и отметить эти ранги круглыми скобками – (). Но так как они должны иметь одинаковые ранги. То в столбец ранги мы должны поместить среднее арифметическое рангов, проставленных в скобках, т.е. . Часто условные и реальные ранги записывают в одном столбце

Проверим правильность ранжирования по формуле (1):

Просуммируем реальные ранги: 6+4+11+10+8,5+8,5+3+5+7+1+2=66.

Т.к. суммы совпали, то ранжирование выполнено верно.

В ранговой шкале применяется множество статистических методов. Наиболее часто к измерениям, полученным в этой шкале применяются коэффициенты корреляции Спирмена и Кэндалла, кроме того, применительно к данным, полученным в этой шкале, используют разнообразные критерии различий.


Шкала интервалов

В шкале интервалов каждое из воз­можных значений измеренных величин отстоит от ближайшего на равном расстоянии. Главное понятие этой шкалы - интервал , который можно определить как долю или часть измеряемого свойства между двумя соседними позициями на шкале.

Размер интервала - величина фиксированная и постоянная на всех уча­стках шкалы. Для измерения посредством шкалы интервалов ус­танавливаются специальные единицы измерения, в психологии это стены . При работе с этой шкалой измеряемому свойству или предмету присваивается число, равное количеству единиц измерения, эквивалентное количеству имеющегося свойства. Важной особенностью шкалы интервалов является то, что у нее нет естественной точки отсчета (нуль условен и не ука­зывает на отсутствие измеряемого свойства).

Так, в психологии часто используется семантический диффе­ренциал Ч.Осгуда, который является примером измерения по интервальной шкале различных психологических особенностей личности, социальных установок, ценностных ориентации, субъективно-личностного смысла, различных аспектов само­оценки.

3 - 2 - 1 0 +1 +2 +3

Абсолютно Не знаю Совершенно

не согласен (не уверен) согласен

Однако, как подчеркивают С. Стивенс и ряд других исследо­вателей, психологические измерения в шкале интервалов по сущности нередко оказываются измерениями, выполненными в шкале порядков. Основанием для этого утверждения служит тот факт, что функциональные возможности человека меняются в зависимости от разных условий. При измерении, например, силы с помощью динамометра или устойчивости внимания с помощью секундомера, результаты измерения в начале и в кон­це опыта по причине усталости испытуемого не будут квантифицироваться равными интервалами.

Только измерение по строго стандартизированной тестовой методике, при условии того, что распределение значений в реп­резентативной (см. ниже) выборке достаточно близко к нормаль­ному (см. ниже), может считаться измерением в интервальной шкале. Примером последнего могут служить стандартизованные тесты интеллекта, где условная единица измерения IQ эквивален­тна как при низких, так и при высоких значениях интеллекта

Принципиально важным является и то, что к эксперимен­тальным данным, полученным в этой шкале, применимо доста­точно большое число статистических методов.

Шкала отношений

Шкалу отношений называют также шкалой равных отноше­ний. Особенностью этой шкалы является наличие твердо фикси­рованного нуля, который означает полное отсутствие какого-либо свойства или признака. Шакала отношений является наибо­лее информативной шкалой, допускающей любые математичес­кие операции и использование разнообразных статистических методов.

Шкала отношений по сути очень близка интервальной, по­скольку если строго фиксировать начало отсчета, то любая ин­тервальная шкала превращается в шкалу отношений.

Именно в шкале отношений производятся точные и сверх­точные измерения в таких науках, как физика, химия, микро­биология. Измерение по шкале отношений производятся и в близких к психологии науках, таких, как психофизика, психо­физиология, психогенетика.

Использование порядковой шкалы позволяет присваивать ранги объектам по какому-либо признаку. Таким образом, метрические значения переводятся в ранговые. При этом фиксируются различия в степени выраженности свойств. В процессе ранжирования следует придерживаться 2 правил.

Правило порядка ранжирования. Надо решить, кто получает первый ранг: объект с самой большей степенью выраженности какого-либо качества или наоборот. Чаще всего это абсолютно безразлично и не отражается на конечном результате. Традиционно принято первый ранг приписывать объектам с большей степенью выраженности качества (большему значению – меньший ранг). Например, чемпиону присуждают первое место, а не наоборот. Хотя, и здесь если бы был принят обратный порядок, то результаты от этого не изменились бы. Так что порядок ранжирования каждый исследователь вправе определять сам. Например, Е. В. Сидоренко рекомендует меньшему значению приписывать меньший ранг. В некоторых случаях это удобнее, но непривычнее.

Например: имеется неупорядоченная выборка, данные которой необходимо проранжировать. {2, 7, 6, 8, 11, 15, 9}. После упорядочивания выборки ранжируем ее.

Метрические данные

Альтернативный вариант:

Метрические данные

Отдельно следует сказать следующее. Существует группа редко используемых непараметрических критериев (Т-критерий Вилкоксона, U-критерий Манна-Уитни,Q-критерий Розенбаума и др.), при работе с которыми всегда надо меньшему значению приписывать меньший ранг.

Правило связанных рангов. Объектам с одинаковой выраженностью свойств приписывается один и тот же ранг. Этот ранг представляет собой среднее значение тех рангов, которые они получили бы, если бы не были равны. Например, надо проранжировать выборку, содержащую ряд одинаковых метрических данных: {4, 5, 9, 2, 6, 5, 9, 7, 5, 12}. После упорядочивания выборки следует вычислить среднее арифметическое значение связанных рангов.

Метрические данные

Предварительное ранжирование

Окончательное ранжирование

Задания для самостоятельной работы.

    Проранжировать выборку по правилу «большему значению – меньший ранг»: {111, 104, 115, 107, 95, 104, 104}.

    Проранжировать выборку по правилу «меньшему значению – меньший ранг» {20, 25, 8, 7, 20, 14, 27}.

    Объединить две предыдущие выборки и провести ранжирование по правилу «большему значению – меньший ранг»

    Показатели каких признаков из Таблицы Iявляются номинативными, каких – метрическими?

    Перевести показатели осведомленности из Таблицы IПриложения в ранговую шкалу. Выделить уровни выраженности показателей посредством их перевода в номинативную шкалу.

      Таблица I Данные для обработки

учащиеся

профиль ВУЗа

осведомленность

скрытые фигуры

пропущенные

арифметика

понятливость

исключение

изображений

аналогии

числовые ряды

умозаключения

геометрическое сложение

заучивание слов

средний IQ

экстраверсия-

интроверсия

нейротизм

средняя отметка

Профиль ВУЗа: 0 - выбор учеником гуманитарного профиля;

1 - выбор учеником математического или естественно-научного профиля

Коэффициенты корреляции рангов – это менее точные, но более простые по расчету непараметрические показатели для измерения тесноты связи между двумя коррелируемыми признаками. К ним относятся коэффициенты Спирмэна (ρ) и Кендэла (τ), основанные на корреляции не самих значений коррелируемых признаков, а их рангов – порядковых номеров, присваиваемых каждому индивидуальному значению х и у (отдельно) в ранжированном ряду. Оба признака необходимо ранжировать (нумеровать) в одном и том же порядке: от меньших значений к большим и наоборот. Если встречается несколько значений х (или у ), то каждому из них присваивается ранг, равный частному от деления суммы рангов (мест в ряду), приходящихся на эти значения, на число равных значений. Ранги признаков х и у обозначают символами Rx и Ry (иногда Nx и Ny ). Суждение о связи между изменениями значений х и у основано на сравнении поведения рангов по двум признакам параллельно. Если у каждой пары х и у ранги совпадают, это характеризует максимально тесную связь. Если же наблюдается полная противоположность рангов, т.е. в одном ряду ранги возрастают от 1 до n , а в другом – убывают от n до 1, это максимально возможная обратная связь. Подходы для оценки тесноты связи у Спирмэна и Кендэла несколько различаются. Для расчета коэффициента Спирмэна значения признаков х и у нумеруют (отдельно) в порядке возрастания от 1 до n , т.е. им присваивают определенный ранг (Rx и Ry ) – порядковый номер в ранжированном ряду. Затем для каждой пары рангов находят их разность (обозначается как d = Rx Ry ), и квадраты этой разности суммируют.

где d – разность рангов х и у ;

n – число наблюдаемых пар значений х и у .

Коэффициент ρ может принимать значения от 0 до ±1. Следует иметь в виду, что, поскольку коэффициент Спирмэна учитывает разность только рангов, а не самих значений х и у, он менее точен по сравнению с линейным коэффициентом. Поэто-му его крайние значения (1 или 0) нельзя безоговорочно расцени-вать как свидетельство функциональной связи или полного от-сутствия зависимости между х и у. Во всех других случаях, т.е. когда ρ не принимает крайних зна-чений, он довольно близок к r.

Формула (147) применима строго теоретически только тогда, когда отдельные значения х у), а следовательно, и их ранги не повторяются. Для случая повторяющихся (связанных) рангов есть другая, более сложная формула, скорректированная на число по-вторяющихся рангов. Однако опыт показывает, что результаты расчетов по скорректированной формуле для связанных рангов мало отличаются от результатов, полученных по формуле для не-повторяющихся рангов. Поэтому на практике формула (147) ус-пешно применяется как для неповторяющихся, так и для повто-ряющихся рангов.

Коэффициент корреляции рангов Кендэла τ строится несколь-ко по-другому, хотя его расчет также начинается с ранжирования значений признаков х и у. Ранги х (Rx ) располагают строго в порядке возрастания и па-раллельно записывают соответствующее каждому Rx значение Ry . Поскольку Rx записаны строго по возрастанию, то ставится задача определить меру соответствия последовательности Ry «пра-вильному» следованию Rx. При этом для каждого Ry последо-вательно определяют число следующих за ним рангов, превыша-ющих его значение, и число рангов, меньших по значению. Первые («правильное» следование) учитываются как баллы со знаком «+», и их сумма обозначается буквой Р. Вторые («непра-вильное» следование) учитываются как баллы со знаком «–», и их сумма обозначается буквой Q. Очевидно, что максимальное значение Р достигается в том слу-чае, если ранги y (Ry) совпадают с рангами х (Rx) и в каждом ряду представляют ряд натуральных чисел от 1 до п. Тогда после первой пары значений Rx = 1 и Ry = 1 число превышения данных значений рангов составит (n – 1), после второй пары, где Rx = 2 и Ry = 2, соответственно (п – 2) и т.д. Таким образом, если ранги х и у совпадают и число пар рангов равно n , то

Если же последовательность рангов х и у имеет обратную тенденцию по отношению к последовательности рангов х , то Q будет такое же максимальное значение по модулю:

.

Если же ранги у не совпадают с рангами х , то суммируются все положительные и отрицательные баллы (S=P+Q ); отношение этой суммы S к максимальному значению одного из слагаемых и представляет собой коэффициент корреляции рангов Кендэла τ, т.е.:

. (148)

Формула коэффициента корреляции рангов Кендэла (148) применяется для случаев, когда отдельные значения признака (как х, так и у) не повторяются и, следовательно, их ранги не объе-динены. Если же встречается несколько одинаковых значений х (или у), т.е. ранги повторяются, становятся связанными , коэффици-ент корреляции рангов Кендэла определяется по формуле:

, (149)

где S – фактическая общая сумма баллов при оценке +1 каж-дой пары рангов с одинаковым порядком изменения и –1 каждой пары рангов с обратным порядком изме-нения;

– число баллов, корректирующих (уменьшающих) максимальную сумму баллов за счет повторений (объединений) t рангов в каждом ряду.

Отметим, что случаи следования одинаковых повторяющихся рангов (в любом ряду) оцениваются баллом 0, т.е. они не учиты-ваются при расчете ни со знаком «+», ни со знаком «–».

Преимущества ранговых коэффициентов корреля-ции Спирмэна и Кендэла: они легко вычисляются, с их помощью можно изучать и измерять связь не только между количественны-ми, но и между качественными (описательными) признаками, ранжированными определенным образом. Кроме того, при ис-пользовании ранговых коэффициентов корреляции не требуется знать форму связи изучаемых явлений.

Если число ранжируемых признаков (факторов) больше двух, то для измерения тесноты связи между ними можно использовать предложенный М. Кендэлом и Б. Смитом коэффициент конкордации (множественный коэффициент ранговой корреляции):

, (150)

где S - сумма квадратов отклонений суммы т рангов от их средней величины;

т - число ранжируемых признаков;

п - число ранжируемых единиц (число наблюдений).

Формула (150) применяется для случая, кода ранги по каж-дому признаку не повторяются. Если же есть связанные ран-ги, то коэффициент конкордации рассчитывается с учетом числа таких повторяющихся (связанных) рангов по каждому фактору:

, (151)

где t – число одинаковых рангов по каждому признаку.

Коэффициент конкордации W может принимать значения от 0 до 1. Однако, необходимо проверить его на существенность (значимость) с помощью критерия χ2 при отсутствии связанных рангов по формуле (152), а при их наличии – по формуле (153):

, (152) . (153)

Фактическое значение χ2 сравнивается с табличным, соответ-ствующим принятому уровню значимости α (0,05 или 0,01) и числу степеней свободы v = п – 1. Если χ2факт > χ2табл, то W – существенен (значим).

Коэффициент конкордации особенно часто используется в экспертных оценках, например, для того, чтобы определить сте-пень согласованности мнений экспертов о важности того или иного оцениваемого показателя или составить рейтинг отдельных единиц по какому-либо признаку. В формуле (150) в этих случаях т означает число экспертов, а n - число ранжируемых единиц (или признаков).

События С

эксперт j = 1

экспертов a ij

эксперт j = 2

эксперт j = 1

важности а ij

эксперт j = 2

Суммарный ранг важности а i

Среднее значение для суммарных рангов рассматриваемого ряда

Суммарное квадратическое отклонение Sсуммарных событий от среднего значения а есть

называемое коэффициентом конкордации. Величина Wизменяется в пределах от 0 до 1. При W = 0 согласованности совершенно нет, т.е. связь между оценками различных экспертов отсутствует. Наоборот, при W = 1 согласованность мнений экспертов полная.

В том случае, если последовательность (5.2) кроме строгих нера­венств имеет равенства, т.е. существует совпадение рангов, то формула для вычисления коэффициента конкордации имеет вид

Когда ранги повторяются, то для получения нормальной ранжи­ровки, имеющей среднее значение ранга, равное

необходимо приписать событиям, имеющим одинаковые ранги, ранг, равный среднему значению мест, которые эти события поделили между собой.

Например, получена следующая ранжировка событий:

Ранги а i

События 2 и 5 поделили между собой второе и третье места. Зна­чит, им приписывается ранг

события 3, 4 и 6 поделили между собой четвертое, пятое, шестое места, и им приписывается ранг

Таким образом, получаем нормальную ранжировку:

Ранги а" i

Пример. Рассмотрим ранжированиеm= 10 событий р = 3 экспер­тами;N,Q,R. Результаты расчетов представлены в табл. 5.3.

Для крайних значений коэффициента конкордации могут быть вы­сказаны следующие предположения. Если W= 0, то согласованности в оценках нет, поэтому для получения достоверных оценок следует уточ­нить исходные данные о событиях и (либо) изменить состав группы экс­пертов. При W = 1 далеко не всегда можно считать полученные оценки объективными, поскольку иногда оказывается, что все члены экспертной группы заранее сговорились, защищая свои общие интересы.

Необходимо, чтобы найденное значение W было больше заданного значения W 3 (W >W 3). Можно принятьW 3 = 0,5, т.е. при W > 0.5 дейст­вия экспертов в большей степени согласованы, чем не согласованы. При W < 0,5 полученные оценки нельзя считать достоверными, и поэтому следует повторить опрос заново. Жесткость данного утверждения опреде­ляется важностью проводимого исследования и возможностью повторной экспертизы. Практика показывает, что очень часто этим требованием пренебрегают.

Расчет коэффициента W при учете компетентности экспертов при­водится в работе .



Просмотров