Все существующие методы кластерного анализа разделяют на две группы: объединяющие (агломеративные) и разделяющие (дивизимные). Первые последовательно объединяют исследуемые объекты в кластеры, а вторые разбивают группы на отдельные объекты. Техника различных методов кластерного анализа подробно описана в соответствующей учебной литературе[38]. Здесь мы рассмотрим решение соответствующих задач кластерного анализа с помощью подходящего программного обеспечения (задача №2).
3. Изучение степени неравенства распределения преступности по населенным пунктам (в пространстве).
На практике часто возникает вопрос, а значимо ли различаются между собой конкретные населенные пункты и другие объекты по уровню преступности? Отвечая на данный вопрос уместно использовать различные статистические методы и показатели. Самым простым будет измерение размаха преступности, когда из максимального по изучаемой совокупности значения вычитается минимальное, но размах плохо отражает состояние дел по всей изучаемой совокупности, поскольку в расчет принимаются лишь два крайних значения. Можно рассчитать так называемый коэффициент фондовой дифференциации, когда во внимание принимается по несколько крайних сверху и снизу значений вариационного признака, что также непоказательно для всей вариации. Существуют и другие меры вариации, концентрации и дифференциации о которых повествует учебная литература по статистике: стандартное отклонение, дисперсия, коэффициент вариации, квартили, квинтили, децили, коэффициент концентрации Джини, коэффициенты Герфиндаля, Лоренца и другие[39]. Мы же сделаем акцент на коэффициент Джини или коэффициент локализации, который удачно характеризует неравенство распределения изучаемого признака, например, коэффициента преступности на 100 тысяч населения, по всей исследуемой совокупности (по всем изучаемым объектам). Этот коэффициент одной цифрой характеризует всю исследуемую совокупность, и к тому же позволяет построить наглядную геометрическую конструкцию. То есть мы отвечаем на вопрос - значимо ли различаются между собой по уровню преступности те или территориальные объекты (районы, города, области, страны). Для этого показатели преступности в объектах исследования должны приводиться к сопоставимому виду:
1). Нельзя ни при каких условиях сравнивать между собой показатели по различным объектам (пространственным, временным), выраженные в абсолютных величинах, поскольку это приведет к ошибочным выводам. Так, если мы сравним между собой число зарегистрированных преступлений в городе Москве и городе Казани за один и тот же временной период, то число преступлений в Москве будет намного больше, однако это вовсе не означает, что уровень зарегистрированных преступлений в Москве действительно выше, чем в Казани, поскольку население Москвы многократно превышает население Казани. Следовательно, между собой должны сравниваться только относительные величины – коэффициенты преступности, приведенные на определенное количество народонаселения (обычно на 100 тысяч).
2). Нельзя непосредственно сравнивать между собой показатели преступности за разные временные периоды по разным территориям, например, коэффициенты преступности в Казани за период с 1985 по 1995 годы и в Москве за период с 1995 по 2005 годы. В таком случае данные несопоставимы не по численности населения, а по временному периоду, поскольку имело место разное уголовное и уголовно-процессуальное законодательство, практика деятельности правоохранительных органов, разные политические, экономические и другие эффекты и т.п. Для сравнения нужно делать соответствующие поправки.
3) Нельзя непосредственно сравнивать между собой показатели преступности за разные временные периоды по одной и той же территории, например, коэффициенты преступности в Казани за период с 1985 по 1995 годы и в Казани за период с 1995 по 2005 годы. Нужно проводить корректировку.
4). Нельзя непосредственно сравнивать между собой показатели (коэффициенты) преступности по разным странам мира даже за один и тот же период времени. Чтобы проводить сравнение нужно сделать соответствующую корректировку данных – соответствующие поправки.
В статистической литературе приводится такая техника, как «смыкание рядов динамики» и «приведение рядов к одному основанию» [40]. Под смыканием рядов динамики понимают объединение в один ряд (более длинный) двух или нескольких рядов, уровни которых исчислены по разным методологиям или в разных границах. При этом для осуществления такого смыкания необходимо, чтобы данные для одного из периодов (переходного) были исчислены по двум методологиям[41]. Переход к относительным величинам целесообразно осуществлять и при параллельном анализе динамики нескольких показателей (или одного и того же показателя по разным объектам), если по абсолютным данным трудно выявить особенности развития. В таких случаях уровни всех рассматриваемых рядов приводятся в процентах (или коэффициентах) к уровню одного и того же периода или момента времени (либо иной базе сравнения). Этот прием перехода от абсолютных показателей к относительным именуют в статистике приведением рядов к одному основанию[42].
В то же время ничто не мешает нам сравнивать качественные характеристики, в частности уголовное и иное законодательство за любой период времени и по любым территориям. Если же мы сравниваем количественные показатели за разные временные периоды, в разных странах, то должны делать соответствующие оговорки и поправки. Например, сравнивая уровень умышленных убийств в США и Российской Федерации даже за один и тот же временной период, нужно знать, какой смысл вкладывается в понятие умышленного убийства в США и России в этот временной период, а также, каковы особенности регистрации данного вида преступлений. Может случиться так, что в одной стране регистрируют сам факт умышленного убийства без учета числа трупов, а в другой считают число убитых. Следовательно, в одной стране убийство 10-ти человек будет спрятано за фактом одного умышленного убийства, а в другой вместо одного умышленного убийства будет зарегистрировано 10. Без соответствующих поправок простое сравнение коэффициентов в таком случае будет иметь значительные погрешности. В Российской Федерации реальные убийства издавна прячут за «ширму» умышленного причинения тяжкого вреда здоровью, повлекшего смерть потерпевшего, и используют много других способов укрытия убийств от учета, что отрицательно сказывается на изучении и преодолении данного социально-патологического явления.
РЕЗЮМЕ (основные определения)
закон распределения представляет собой функцию в полной мере, описывающую случайную величину с вероятностной точки зрения;
F(y) – интегральная функция распределения преступности или интегральный закон распределения преступности, обладает рядом общих свойств: 1) F(y) – неубывающая функция своего аргумента (аргумент – преступления), то есть при y1>y0 F(y1)≥F(y0); 2) на минус бесконечности F(-¥)=0; 3) на плюс бесконечности F(¥)=1;
производная функции распределения - характеризует плотность, с которой распределяются значения случайной величины (преступности) в данной точке, поэтому её называют дифференциальной функцией или дифференциальным законом распределения;
кластер происходит от английского: cluster - сгусток, пучок, группа;
кластерный анализ – группа статистических методов объединяющего (агломеративные методы) или разделяющего (дивизимные методы) типов, позволяющих проводить классификацию исследуемых объектов с учетом всех закладываемых группировочных признаков одновременно, строить наглядные карты и дендрограммы, анализировать полученные кластеры;
размах вариации – показатель разницы между максимальным и минимальным значением исследуемого вариационного ряда;
дисперсия (от лат. dispersio - рассеяние) – характеристика рассеяния значений вариационного ряда (дисперсия преступности (Y), как случайной величины определяется, как математическое ожидание квадрата отклонения Y от её математического ожидания);
коэффициент концентрации Джини (коэффициент локализации) – показатель степени неравномерности распределения какого-либо признака, например, уровня преступности, в исследуемой совокупности, например, по территории страны, вычисляемый по специальной формуле;
кривая Лоренца – графическое представление коэффициента Джини.
ОСНОВНЫЕ ТЕРМИНЫ
интегральная функция распределения преступности или интегральный закон распределения преступности; дифференциальной функцией или дифференциальным законом распределения; стандартное отклонение, дисперсия, коэффициент вариации, квартили, квинтили, децили, коэффициент концентрации Джини, коэффициент Герфиндаля, коэффициент Лоренца; относительные показатели вариации: относительный размах вариации (коэффициент осцилляции); относительное отклонение по модулю; коэффициент вариации, относительное квартильное расстояние.
♫ Практическое применение (показательные примеры):
Задача №1.
1. Найти закон распределения преступности в Российской Федерации в 2005 году.
Дано: первичные данные статистического учета о числе зарегистрированных преступлений по всем субъектам Российской Федерации за 2005 год.
Таблица к задаче.
Субъект РФ |
Преступления, шт. |
Население |
КП |
Белгородская область |
25243 |
1511620 |
1669,93 |
Брянская область |
31004 |
1378941 |
2248,392 |
Владимирская область |
36862 |
1523990 |
2418,782 |
Воронежская область |
43818 |
2378803 |
1842,019 |
Ивановская область |
26370 |
1148329 |
2296,38 |
Калужская область |
26057 |
1041641 |
2501,534 |
Костромская область |
17404 |
736641 |
2362,616 |
Курская область |
26198 |
1235091 |
2121,139 |
Липецкая область |
18592 |
1213499 |
1532,099 |
Московская область |
116428 |
6618538 |
1759,12 |
Орловская область |
18906 |
860262 |
2197,703 |
Рязанская область |
17313 |
1227910 |
1409,957 |
Смоленская область |
28596 |
1049574 |
2724,534 |
Тамбовская область |
22913 |
1178443 |
1944,345 |
Тверская область |
40586 |
1471459 |
2758,215 |
Тульская область |
20477 |
1675758 |
1221,954 |
Ярославская область |
45190 |
1367398 |
3304,817 |
г. Москва |
218011 |
10382754 |
2099,742 |
Республика Карелия |
15409 |
716281 |
2151,251 |
Республика Коми |
31043 |
1018674 |
3047,393 |
Архангельская область |
31301 |
1336539 |
2341,944 |
Вологодская область |
37176 |
1269568 |
2928,24 |
Калининградская область |
22612 |
955281 |
2367,052 |
Ленинградская область |
36097 |
1669205 |
2162,526 |
Мурманская область |
18257 |
892534 |
2045,524 |
Новгородская область |
15399 |
694355 |
2217,742 |
Псковская область |
18524 |
760810 |
2434,773 |
г. Санкт-Петербург |
100355 |
4661219 |
2152,978 |
Республика Адыгея |
6026 |
447109 |
1347,77 |
Республика Дагестан |
13658 |
2576531 |
530,0926 |
Кабардино-Балкарская Республика |
9283 |
901494 |
1029,735 |
Республика Калмыкия |
5458 |
292410 |
1866,557 |
Карачаево-Черкесская Республика |
6305 |
439470 |
1434,683 |
Республика Северная Осетия - Алания |
6841 |
710275 |
963,1481 |
Краснодарский край |
63494 |
5125221 |
1238,854 |
Ставропольский край |
48088 |
2735139 |
1758,156 |
Астраханская область |
28410 |
1005276 |
2826,09 |
Волгоградская область |
54178 |
2699223 |
2007,17 |
Ростовская область |
80056 |
4404013 |
1817,797 |
Республика Башкортостан |
88877 |
4104336 |
2165,442 |
Республика Марий Эл |
22029 |
727979 |
3026,049 |
Республика Мордовия |
17063 |
888766 |
1919,853 |
Республика Татарстан |
92232 |
3779265 |
2440,475 |
Удмуртская Республика |
54155 |
1570316 |
3448,669 |
Чувашская Республика |
33958 |
1313754 |
2584,807 |
Кировская область |
39249 |
1503529 |
2610,458 |
Нижегородская область |
97379 |
3524028 |
2763,287 |
Оренбургская область |
51122 |
2179551 |
2345,529 |
Пензенская область |
26898 |
1452941 |
1851,28 |
Пермская область |
123923 |
2955497 |
4192,967 |
Самарская область |
82206 |
3239737 |
2537,428 |
Саратовская область |
53939 |
2668310 |
2021,467 |
Ульяновская область |
28280 |
1382811 |
2045,11 |
Курганская область |
38232 |
1019532 |
3749,956 |
Свердловская область |
154723 |
4486214 |
3448,855 |
Тюменская область |
122608 |
3264841 |
3755,405 |
Челябинская область |
98710 |
3603339 |
2739,404 |
Республика Алтай |
5433 |
202947 |
2677,054 |
Республика Бурятия |
30341 |
981238 |
3092,114 |
Республика Тыва |
10301 |
305510 |
3371,739 |
Республика Хакасия |
19273 |
546072 |
3529,388 |
Алтайский край |
75508 |
2607426 |
2895,883 |
Красноярский край |
82540 |
3023525 |
2729,926 |
Иркутская область |
85614 |
2717032 |
3151,012 |
Кемеровская область |
52235 |
2899142 |
1801,74 |
Новосибирская область |
89103 |
2692251 |
3309,61 |
Омская область |
55084 |
2079220 |
2649,263 |
Томская область |
32175 |
1046039 |
3075,889 |
Читинская область |
33080 |
1155346 |
2863,212 |
Республика Саха (Якутия) |
18993 |
949280 |
2000,78 |
Приморский край |
61848 |
2071210 |
2986,081 |
Хабаровский край |
52182 |
1436570 |
3632,402 |
Амурская область |
22898 |
902844 |
2536,208 |
Камчатская область |
9907 |
358801 |
2761,141 |
Магаданская область |
4659 |
182726 |
2549,719 |
Сахалинская область |
14592 |
546695 |
2669,13 |
Еврейская автономная область |
5578 |
190915 |
2921,719 |
Чукотский автономный округ |
851 |
53824 |
1581,079 |
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54