Случайная величина (как ее генеральная совокупность, так и выборка) описывается различными способами. Первый да них это построение функции распределения, например, в виде гистограммы. Гистограмма - это представление СВ в виде столбчатого графика, отражающего долю (количество) попаданий СВ в различные диапазоны ее значений.
Другой способ описания СВ - это определение ее параметров, характеризующих среднее значение и разброс СВ вокруг среднего.
Значения средних и рассеяния, определенные для выборки и для генеральной совокупности, могут отличаться. Это отличие трактуется как ошибка в определении параметров генеральной совокупности по параметрам выборки.
Ошибка складывается из двух частей.
Первая — это систематическая ошибка, зависящая от степени репрезентативности выборки.
Вторая - это случайная ошибка, зависящая от объема выборки, Для различения параметров генеральной совокупности и выборки им иногда присваивают различные имена.
В качестве среднего значения СВ могут использоваться различные величины, например, медиана, мода, среднее арифметическое выборки (математическое ожидание генеральной совокупности).
Медианное значение СВ - это одно из ее значений в выборке, относительно которого половина значений превышает медианное, а другая половина не превышает. Разброс (рассеяние) СВ может оцениваться различными величинами, например, размахом (диапазоном разброса), дисперсией или среднеквадратическим отклонением, доверительным интервалом. Размах СВ - это разность между максимальным и минимальным ее значением.
Дисперсия (среднеквадратическое отклонение - СКО) СВ - это расчетная величина, определяемая по специальной формуле и характеризующая степень отклонения каждого из значений СВ от среднего. Среднеквадратическое отклонение генеральной совокупности обозначается греческой буквой «сигма», выборки — латинской «s».
Доверительный интервал — это размах СВ, определенный не по всем ее значениям, а по заданной доле значений, примыкающих к среднему. Доля значений, по которой определяется доверительный интервал, называется доверительной вероятностью. Выбор того или иного показателя определяется решаемой задачей. На практике может потребоваться любая из них.
Простейшей задачей, которую можно решать с использованием данных о ценах на единичные квартиры Ц1, Ц2 и т.д., накопленных за определенный промежуток времени, является определение средней цены Цср. по формуле среднего арифметического:
Цср.=(Ц1+Ц2+...+Цn)/n (1)
где n - число накопленных значений цен (объем выборки).
Для перехода к расчету средней цены 1 кв. м необходимо учесть, что применяемый на практике способ расчета через деление средней цены квартиры Цср. на среднюю площадь квартиры Пер. может дать существенную ошибку (до 5-7%). Поэтому следующее правило обязывает вычислять эту величину по формуле
Сср.=(Ц1+Ц2+...+Цn)/(П+П2+...+Пn) (2)
Иногда удобнее применять равноценную формулу
Сср.=(С1+С2+...+Сn) (3)
где С1, С2 и т.д. — цена 1 кв. м общей площади квартиры;
С1=Ц1/П1ит. д.;
П1 и т.д. - общая площадь квартиры.
Пользуясь данными таблиц по ценам на квартиры за февраль, март и апрель 2006 года рассчитаем по формуле 2 среднюю стоимость одного квадратного метра для однокомнатных двухкомнатных и трехкомнатных квартир в рассматриваемых районах города.
Таблица — «Определение средней стоимости одного кв.м. квартир»
Период времени
Район
Кол-во комнат
∑Цi
∑Пi
Февраль
«Сода»
1
9715
961,7
2
9620
986,6
3
8670
886,2
пр. Октября
1
10540
1086,2
2
14250
1429
3
13730
1365,3
Март
«Сода»
1
15840
1544,5
2
10960
1084,3
3
12040
1277,8
17,76
19,48
15,29
15,49
18,58
15,46
17,07
18,36
16,19
16,92
пр. Октября
1
15640
1586,8
2
15240
1577,3
3
14250
1474,3
Апрель
«Сода»
1
14150
1431
2
13550
1376,2
3
13500
1390,8
пр. Октября
1
17860
1744,2
2
18000
1893,9
3
17140
1781
Аналогично рассчитываются среднемесячные значения времени экспозиции и другие средние величины.
Выделение подвыборок цен для отдельных категорий квартир и зон города позволяет сузить разброс цен в выборке и создает предпосылки для изучения влияния параметров квартир одной категории на их цену.
Наличие нескольких выборок объемом пj, выделенных по признаку типа жилья (хрущевки, стандартные квартиры, улучшенной планировки и т.д.), либо размера (однокомнатные, двухкомнатные и т.д.), либо района расположения (центр, вблизи центра, окраины), либо по сочетанию признаков позволяет получить среднее значение цены 1 кв. м для каждой категории квартир, а затем осреднить его по совокупности квартир города по формуле средневзвешенного арифметического:
Сср.=(Сср.1×n1+Сср.2×n2+...+Сср.j×nj+...+Сср.m×nm)/n, (4)
где m - число выборок (выделенных категорий жилья).
Применение формулы не только облегчает расчеты при определении средней цены продажи или покупки квартир в городе, но и позволяет расширить круг решаемых задач.
Набор значений объемов выборок (n1, ..., nj, ..., nm) характеризует структуру оцениваемой генеральной совокупности. Если известна структура таких совокупностей, как жилищный фонд города; или приватизированный жилой фонд, или вновь строящийся жилой фонд, то при наличии данных по средней цене сделок в каждой категории квартир можно рассчитать среднюю цену 1 кв. м в соответствующем фонде, а также общую стоимость жилого фонда, потенциальный объем рынка (стоимость приватизированного и нового фонда) и др.
Другой пример проанализирован экспертами Агентства ТИТАН (Тверь) в отчете за 1995 год. Обнаружив парадоксальный факт превышения средней цены сделок над средней ценой предложения (при равенстве либо обратном соотношении индивидуальных цен); они правильно его объяснили различием в структуре совокупностей предлагаемых к продаже и проданных квартир.
Оценка дисперсии и среднеквадратического отклонения выборки производится по формулам (исключение выскакивающих значений)
s2 =(Сi-Сср) /(n-1), s=√ s2 (5)
После определения дисперсии необходимо исключить из выборки крайние (справа и слева) «выскакивающие» значения, и заново рассчитать параметры выборки. При этом используется«правило трех сигм»: исключаются значения, лежащие за пределами доверительного интервала в плюс/минус три среднеквадратических отклонения. Это соответствует доверительной вероятности 0,98 (т.е. исключаются из рассмотрения примерно 2% крайних значений). Применяются и более жесткие критерии, например, две сигмы (доверительная вероятность 0,95).
При отсутствии на фирме специалистов, владеющих методами математической статистики или соответствующими компьютерными программами, руководитель фирмы может грубо оценить величину разброса по формуле:
s=(Сmax-Сmin)/6, (6)
где Сmax, Сmin - максимальное и минимальное значения цен в выборке (за исключением "выскакивающих" значений).
Среднее значение случайной величины по данным репрезентативной выборки значений всегда рассчитывается с погрешностью, величина которой зависит от двух. факторов собственного разброса значений в выборке и ее объема. Если разброс измерен величиной среднеквадратического отклонения s, то приближенная оценка погрешности в определении средневыборочного при доверительной вероятности 0,95 равна:
(7)
Из формулы следует, что погрешность в определении среднего обратно пропорциональна корню квадратному из объема выборки и пропорциональна ее собственному разбросу. Наличие данных о погрешности в определении средних цен позволяет при сравнении двух выборок (например, по двум различным районам, или категориям квартир, или за два различных месяца) использовать следующее правило: выборки считаются различающимися незначимо, если разность их средних меньше суммы половины погрешностей. Например, при разнице средних в феврале и марте на 3,5% и погрешности в их определении +\-4% нельзя говорить о росте цен в феврале.
На практике используются два способа привязки данных к моменту времени: «на заданный момент времени» и «за определенный период времени» Общее правило состоит в том, что применение того или иного способа должно строго увязываться с характером данных. Так, данные о структуре жилфонда требуют первого способа, а данные о средней цене сделки - второго. Существуют и данные, которые могут описываться обоими способами, но при этом меняется их трактовка. Так, выражение «средняя цена предложения на 1.01.06» означает, что при расчете этой величины использовались все предложения, содержащиеся в листинге фирмы на эту дату, а выражение «средняя цена предложения за декабрь 05» - только предложения, поступившие за декабрь.
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16