Статистико-маркетинговое исследование

признака, т.е. те границы, в пределах которых с заданной доверительной вероятностью будет находиться теоретическое значение у. Поскольку параметры уравнения регрессии определяются по выборочным данным, являясь функцией наблюденных значений, оценки параметров a и b содержат некоторую погрешность. Дисперсия значения зависимой переменной, определяемой по уравнению линейной зависимости, будет складываться из дисперсии параметра а и дисперсии параметра b. Зная дисперсию показателя y~ и задаваясь уравнением доверительной вероятности, можно определить доверительные границы результативного признака при значении факторного признака x0 следующим образом:

где t определяется в соответствии с уровнем значимости по t-распределению Стьюдента. Величина множителя будет вычисляться для каждого значения x0. С удалением значения факторного признака от своего среднего арифметического значения величина CX0 будет возрастать. Поскольку параметры уравнения регрессии определяются по выборочным данным, являясь функцией наблюденных значений, оценки параметров а и b содержат некоторую погрешность. Поэтому, как и во всех случаях оценки параметров генеральной совокупности по выборочным данным, возникает задача проверки гипотезы о величине коэффициента регрессии.

4.3 Перенесение среднего потребления на район № 35 Построим сложную группировку по признакам, у которых связь с потреблением существенна (род занятий и образование) (табл. 4.12). Найдем среднее потребление в каждой группе и перенесем его в соответствующую группу во второй район. Коэффициент доверия в группе надо находить по таблице Стьюдента, так как каждая группа представляет собой малую выборку. После этого необходимо найти предельную ошибку в каждой группе потребителей xj= tjSx, где Sx средняя ошибка средней из первого района, t=1,96 и рассчитать предельную ошибку средней для всего района в целом (как взвешенную среднюю, у которой вес количество человек в группе): . Тогда среднее потребление во втором районе находится в интервале:

0,3927-0,0698 0,3927+0,0698; 0,3229 0,4625. Если каждый из каждую границу доверительного интервала среднего потребления умножить на количество человек в районе (100000 чел.), то получим границы доверительного интервала емкости рынка по данной продукции (в кг): 32290 Е 46250 5 Расчет доли потребителей с доходом до 1000 руб./мес.В районе № 40 Доля потребителей с доходом до 1000 руб./мес в районе №40: Доверительные пределы генеральной доли выглядят так: . Величина доверительного интервала для генеральной доли зависит от величины предельной ошибки выборки p. Чем больше величина предельной ошибки выборки, тем больше величина доверительного интервала и тем, следовательно, ниже точность оценки. Поскольку величина предельной ошибки выборки равна t, точность оценки параметров генеральной совокупности будет зависеть от принятого уровня доверительной вероятности и от величины стандартной ошибки выборки. Средняя ошибка доли для бесповторной выборки: (или 4,2 %) С вероятностью F =0,95 можем утверждать, что предельная ошибка доли потребителей с доходом до 1000 руб./мес. в первом районе не превысит 0,0823 (р = 1,96Sp) и доля этих потребителей в генеральной совокупности будет находиться в интервале: 0,1817 0,3463. 6 ПРОВЕРКА ГИПОТЕЗЫ О НОРМАЛЬНОМ ЗАКОНЕ РАСПРЕДЕЛЕНИЯ ПОКАЗАТЕЛЯ «СРЕДНЕМЕСЯЧНЫЙ ДОХОД» В РАЙОНЕ № 40 Степень расхождения теоретических и эмпирических частот оценивается с помощью особых показателей критериев согласия, с помощью которых проверяется гипотеза о законе распределения. Критерии согласия основаны на использовании различных мер расстояний между анализируемым эмпирическим распределением и функцией распределения признака в генеральной совокупности. Одним из наиболее часто употребляемых критериев согласия является критерий «хи-квадрат» (2), предложенный К. Пирсоном,

где fj и f`j соответственно частоты эмпирического и теоретического распределений в j-том интервале. Чем больше разность между наблюдаемыми и теоретическими частотами, тем больше величина критерия Пирсона. Чтобы отличить существенные значения 2 от значений, которые могут возникнуть в результате случайностей выборки, рассчитанное значение критерия сравнивается с табличным значением 2табл при соответствующем числе степеней свободы и заданном уровне значимости. Уровень значимости выбираем таким образом, что Р (2расч.> 2табл.) = (величина принимается равный 0,05 или 0,01). Определив значение критерия Пирсона по данным конкретной выборки, можно встретиться с такими вариантами: 1) 2расч.> 2табл. , т.е. 2 попадает в критическую область. Это означает, что расхождение между эмпирическими и теоретическими частотами существенно и его нельзя объяснить случайными колебаниями выборочных данных. В таком случае гипотеза о близости эмпирического распределения к нормальному отвергается. 2) 2расч. 2табл. , т.е. рассчитанный критерий не превышает максимально возможную величину расхождений эмпирических и теоретических частот, которая может возникнуть в силу случайных колебаний выборочных данных. В этом случае гипотеза о близости эмпирического распределения к нормальному не отвергается. Табличное значение критерия Пирсона определяется при фиксированном уровне значимости и соответствующем числе степеней свободы. Число степеней свободы равно k-l-1, где l число условий, которые предполагаются выполненными при вычислении теоретических частот, k число групп. Так как при вычислении теоретических частот нормального распределения в качестве оценок генеральной средней и дисперсии используются соответствующие выборочные характеристики, то для проверки гипотезы о нормальности распределения число степеней свободы равно (k-3). При расчете критерия Пирсона нужно соблюдать следующие условия: 1) число наблюдений должно быть достаточно велико, во всяком случае n50; 2) 2) если теоретические частоты в некоторых интервалах меньше 5, то такие интервалы объединяют так, чтобы частоты были более 5. Расчеты по вычислению 2 приведены в таблицах 6.1 и 6.2. Таблица 6.1 ДоходfjМенее 960605261573044639038,34-1,008470,239914960-16701315344471012252243,06-0,462020,3586221670-238020252346575276784,070,084430,3975242380-309027359246156047172,810,630870,3270203090-3800344562067014039892,541,177320,1995123800-4510415541662020065024,361,723770,090364510-5220486541946034802920,362,270220,03032Более 5220557542230053573616,362,816670,00760Итого110210680185696691,90где xj середина интервала; fj количество человек в группе; t нормативное отклонение; f(t) нормированная функция, f теоретическая чистота. Средний доход: ; СКО:;

Объединив интервалы 6-8, получаем следующие данные: Таблица 6.2 Номер интервалаЭмпирическиечастотыТеоретическиечастоты126149,300235227,189323240,03449205,77456122,99361282,000Итого27,284 Критерий Пирсона (фактический): Критерий Пирсона (табличный): (d.f.= 6-3 =3). Так как , то не подтверждается гипотеза о нормальном распределении показателя «среднемесячный доход потребителя» в районе № 40. ЗАКЛЮЧЕНИЕ При определении

скачать реферат
1 2 3 4 5 6 7 ...    последняя
Рефераты / Статистика /