1). По формуле Стерджесса рассчитаем оптимальное число групп: k=1+3,322logN=1+3,322×log94=7,55»8.
2). Найдем длину интервала по формуле:
h===107.
Для удобства вычислений округлим до 100.
3). Рассчитаем переменные рi и qi.
Таблица№2. Таблица для расчета кумулятивных итогов по субъектам РФ (рi).
Субъекты РФ с КП на 100 тыс. населения |
Число субъектов РФ ni |
Число субъектов к итогу, % |
Кумулятивные итоги, % по субъектам РФ рi |
до 100 |
4 |
4,3 |
4,3 |
101-200 |
4 |
4,3 |
8,6 |
201-300 |
8 |
8,5 |
17 |
301-400 |
24 |
25,5 |
42,55 |
401-500 |
19 |
20,2 |
62,77 |
501-600 |
18 |
19,1 |
81,91 |
601-700 |
13 |
13,8 |
95,74 |
700-881 |
4 |
4,3 |
100 |
ИТОГО |
94 |
|
|
Таблица№2. Таблица для расчета кумулятивных итогов по КП (qi).
Субъекты РФ с КП на 100 тыс. населения |
Середина интервала[43], xi |
xini |
|
Кумулятивные итоги по КП, % qi |
До 100 |
50 |
200 |
0,5 |
0,5 |
101-200 |
150 |
600 |
1,5 |
1,9 |
201-300 |
250 |
2000 |
4,8 |
6,8 |
301-400 |
350 |
8400 |
20,4 |
27,1 |
401-500 |
450 |
8550 |
20,7 |
47,9 |
501-600 |
550 |
9900 |
24 |
71,9 |
601-700 |
650 |
8450 |
20,5 |
92,3 |
700-881 |
790 |
3162 |
7,7 |
100 |
ИТОГО |
|
41262 |
|
|
4). Составим итоговую таблицу для расчета коэффициента локализации (коэффициента Джини) и построения кривой Лоренца.
Накопленная частость |
|
|
|
pi субъекты РФ |
qi КП |
pi qi+1
|
pi+1 qi |
4,3 |
0,5 |
8,17 |
|
8,6 |
1,9 |
58,48 |
4,3 |
17 |
6,8 |
460,7 |
32,3 |
42,55 |
27,1 |
2038,145 |
289,34 |
62,77 |
47,9 |
4513,163 |
1701,067 |
81,91 |
71,9 |
7560,293 |
3923,489 |
95,74 |
92,3 |
9574 |
6883,706 |
100 |
100 |
|
9230 |
ИТОГО |
|
24212,95 |
22064,2 |
5). Строим кривую Лоренца
6). Рассчитаем коэффициент Джини. Для этого можно использовать несколько способов. Первый – самый простой и в то же время самый точный, связан с разницей функций (в данном случае можно сразу избавиться от процентов, перейдя к простым частостям). Дело в том, что коэффициент Джини показывает размер площади между функциями q и q1 в нашем примере, а, следовательно, G=( 4.1).
Для нашего примера имеем:
G==0,222.
Коэффициент локализации показывает, что неравенство в распределении преступлений совершенных лицами, ранее совершавшими преступления (на 100 тысяч населения в возрасте 14 лет и старше) по всем субъектам Российской Федерации за 2005 год не велико.
В учебниках по теории статистики обычно приводятся эмпирические формулы для расчета коэффициента Джини по дискретным значениям[44], дающие результаты близкие к тому, который получили мы:
G= =0,215. Если бы исходные данные были не в процентах, а частостях, то операция деления исключалась бы:
G=.
Для исследования вариации изучаемого признака весьма полезны относительные показатели вариации: 1) относительный размах вариации (коэффициент осцилляции): r=, где R – размах вариации; 2) относительное отклонение по модулю: m=; 3) коэффициент вариации: n=; 4) относительное квартильное расстояние: d=, где q= - среднее квартильное расстояние. Все они рассчитываются, как частное от деления соответствующих абсолютных показателей на среднее арифметическое данного ряда.
В нашем примере: =442; s=181, R=854. Тогда получаем: r=854/442=1,93; n=181/442=0,4095=40,95%.
♪☻
ЗАДАЧИ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ
Задача №1.
Дано: коэффициенты преступности в сфере экономики по регионам Республики Казахстан за 2004 год.
Таблица к задаче №1. Коэффициенты преступности в сфере экономики по всем регионам Республики Казахстан за 2004 год.
РЕГИОНЫ |
2004г. |
г. Астана |
76,78 |
Акмолинская |
51,67 |
Актюбинская |
71,75 |
г.Алматы |
110,45 |
Алматинская |
43,02 |
Атырауская |
67,80 |
Восточно-Казахстанская |
55,24 |
Жамбылская |
58,44 |
Западно-Казахстанская |
42,56 |
Карагандинская |
78,22 |
Кзылординская |
89,55 |
Костанайская |
54,96 |
Мангыстауская |
90,37 |
Павлодарская |
83,46 |
Северо-Казахстанская |
62,71 |
Южно-Казахстанская |
41,25 |
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54