Главная » Статьи » Решение задач » Задачи по статистике

Задача №23. Регрессионный анализ

Задача

Провести регрессионный анализ зависимости выручки от числа торговых точек.

Таблица 1

Исходные данные

Выручка, тыс. руб. Число торговых точек Выручка, тыс. руб. Число торговых точек
1 1598 2 16 4076 4
2 2644 5 17 1869 6
3 2197 4 18 3524 3
4 1959 5 19 3925 6
5 1052 3 20 1998 4
6 1922 3 21 2606 3
7 2385 5 22 2353 5
8 2581 5 23 2981 3
9 3105 5 24 4471 7
10 3896 4 25 2308 6
11 1510 4 26 4563 5
12 1880 2 27 4306 7
13 3620 5 28 2541 5
14 5002 6 29 6184 8
15 2819 5 30 7481 9

 

Решение

Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения.

Парная регрессия характеризует связь между двумя признаками: факторным и результативным. Уравнение регрессии имеет вид:

Y = ax + b,

где: Y — результативный показатель;
         a,b — параметры регрессии;
         x — факторный показатель.

Оценка параметров уравнений регрессии (а0, а1, …аn) производится на основе метода наименьших квадратов.

Для парной линейной регрессии система нормальных уравнений, полученная на основе метода наименьших квадратов имеет вид:

где    n – количество наблюдений;
a, b – параметры регрессии.

В таблице приведены исходные данные для расчета параметров регрессии.

Таблица 2

X

Y

X2

XY

1

2

1598

4

3196

1352,1

0,154

60455,24

7,84

2

2

1880

4

3760

1352,1

0,281

278653,6

7,84

3

3

1052

9

3156

1980,6

0,883

862303,9

3,24

4

3

1922

9

5766

1980,6

0,030

3434,337

3,24

5

3

3524

9

10572

1980,6

0,438

2382074

3,24

6

3

2606

9

7818

1980,6

0,240

391121,1

3,24

7

3

2981

9

8943

1980,6

0,336

1000794

3,24

8

4

2197

16

8788

2609,1

0,188

169812,3

0,64

9

4

3896

16

15584

2609,1

0,330

1656156

0,64

10

4

1510

16

6040

2609,1

0,728

1207983

0,64

11

4

4076

16

16304

2609,1

0,360

2151846

0,64

12

4

1998

16

7992

2609,1

0,306

373422,3

0,64

13

5

2644

25

13220

3237,6

0,224

352316,6

0,04

14

5

1959

25

9795

3237,6

0,653

1634722

0,04

15

5

2385

25

11925

3237,6

0,357

726863

0,04

16

5

2581

25

12905

3237,6

0,254

431074,5

0,04

17

5

3105

25

15525

3237,6

0,043

17572,84

0,04

18

5

3620

25

18100

3237,6

0,106

146258,4

0,04

19

5

2819

25

14095

3237,6

0,148

175194,7

0,04

20

5

2353

25

11765

3237,6

0,376

782451

0,04

21

5

4563

25

22815

3237,6

0,290

1756784

0,04

22

5

2541

25

12705

3237,6

0,274

485199,5

0,04

23

6

5002

36

30012

3866,0

0,227

1290400

1,44

24

6

1869

36

11214

3866,0

1,069

3988178

1,44

25

6

3925

36

23550

3866,0

0,015

3476,01

1,44

26

6

2308

36

13848

3866,0

0,675

2427496

1,44

27

7

4471

49

31297

4494,5

0,005

553,2843

4,84

28

7

4306

49

30142

4494,5

0,044

35540,54

4,84

29

8

6184

64

49472

5123,0

0,172

1125717

10,24

30

9

7481

81

67329

5751,5

0,231

2991235

17,64

Итого:

144

93356

770

497633

93356

9,437

28909087

78,8

 

Система уравнений для расчета параметров регрессии имеет вид:

Для решения системы уравнений удобно преобразовать их. После преобразования получим следующие формулы для расчета параметров регрессии:

 и 

Средние величины рассчитаем по таблице:

Дисперсия факторного признака равна:

Отсюда найдем параметры регрессии:

 и  

Уравнение регрессии имеет вид:

Подставив в полученное уравнение значения факторного признака из табл. 1, определим расчетное значение результативного показателя (табл.2).

Для проверки значимости полученного уравнения рассчитаем среднюю ошибку для коэффициента парной регрессии b:

Расчет средней ошибки для коэффициента b осуществляется по данным табл. 2:

Критерий Стьюдента рассчитывается по формуле:

Критическое значение критерия при уровне значимости 0,01 и числе степеней свободы 30-2=28 составляет 2,763. Полученное значение критерия намного больше табличного, следовательно, гипотезу о незначительности регрессионной связи между показателями можно отклонить. Это означает, что между количеством торговых точек и выручкой существует регрессионная связь.

Для надежности полученного уравнения регрессии используют показатель средней ошибки аппроксимации:

По данным таблицы 2 определим среднюю ошибку аппроксимации:

Из расчета видно, что средняя ошибка аппроксимации слишком велика, следовательно полученное уравнение регрессии имеет слишком большую погрешность и не может быть использовано для прогнозирования.

Таким образом, из расчетов очевидно, что между количеством торговых точек и выручкой существует зависимость. Однако модель, построенная в результате регрессионного анализа имеет слишком высокую погрешность и для прогнозирования выручки использована быть не может.

 

Категория: Задачи по статистике | Добавил: Mirka (03.09.2014)
Просмотров: 9692 | Теги: регрессионный анализ, задачи по статистике | Рейтинг: 0.0/0
Всего комментариев: 0
avatar