Задачи статистики в пакете SPSS




Диалоговое окно Discriminant Analysis: Save (Дискриминантный анализ: Сохранить)



Диалоговое окно Discriminant Analysis: Save (Дискриминантный анализ: Сохранить)



 Диалоговое окно Discriminant Analysis: Save (Дискриминантный анализ: Сохранить)

Видно, что в 10 версии появилась возможность сохранения информации о модели в так называемом, XML-файле (см. примечания к рис. 16.3).

  • Активируйте вывод Predicted group membership (Прогнозируемой принадлежности к группе), Discriminant scores (Значений дисриминантной функции) и Probabilities of group membership (Вероятностей принадлежности к группе).

  • Подтвердите нажатием Continue (Далее) и затем ОК.

В окне просмотра появится сначала обзор действительных и пропущенных значений:

Analysis Case Processing Summary (Анализ обработанных наблюдений)

Unweighted Cases (He взвешенные случаи)

N

Percent (Процент)

Valid (Действительные)

2200

71,9

Excluded (Исключенные)

Missing or out-of-range group codes (Отсутствующие или находящиеся за пределами допустимой области кодировки принадлежности к группе)

19

,6

At least one missing discriminating variable (По меньшей мере одна отсутствующая дискриминационная переменная)

816

26,7

Both missing or out-of-range group codes and at least one missing discriminating variable (Обе кодировки принадлежности к группе отсутствуют или находятся за пределами допустимой области, или по меньшей мере одна отсутствующая дискриминационная переменная)

23

,8

Total (Общее количество исключённых)

858

28,1

Total (Общее количество случаев)

3058

100,0

В общей сложности 858 наблюдений из 3058, находящихся в файле postmat.sav, были исключены из анализа из-за отсутствия значения переменной ingl_dic или отсутствия значений одной из дискриминационных переменных. Таким образом анализ проводился для 2200 наблюдений. Далее приводятся средние значения, стандартные отклонения и количество наблюдений для всех переменных из обеих групп и для каждой группы в отдельности.

По средним значениям уже заметно, что для постматериалистических типов характерны: более высокий социально-экономический статус отца (2,8148 по сравнению с 2,3904), более высокое образование (2,9853 по сравнению с 2,5248) и принадлежность к младшей возрастной группе (2,1842 по сравнению с 2,8151).

Group Statistics

(Статистики для групп)

INGL_DIC (Индекс Ингпехарта, дихото-мический)

Mean (сред-нее значе-ние)

Std. Deviation (Станда-ртное отклоне-ние)

Valid N (listwise) (Действительные значения (по списку))

Unwei-ghted (Не взвеше-нные)

Weigh-ted (Взвеше-нные)

1,00 (Пост-материа-листический тип)

SES-lndex des Vaters (социально-экономи-ческий статус отца)

2,8148

1,1718

1091

1091,000

Schulabschluss (Образование)

2,9853

,8194

1091

1091,000

ALTER, BEFRAGTE<R>, KATEGORISIERT (Возраст, опрошен-ного(ой), разбит на категории)

2,1842

1,0887

1091

1091,000

Berufsaus-bildung (Профес-сиональное образо-вание)

2,1888

1,1562

1091

1091,000

2,00 (Материа-листический тип)

SES-lndex des Vaters (социально-экономи-ческий статус отца)

2,3904

1,0407

1109

1109,000

Scnulabschluss (Образование)

2,5248

,7627

1109

1109,000

ALTER, BEFRAGTE<R>, KATEGORISIERT (Возраст ,опрошен-ного(ой), разбит на категории)

2,8151

1,2111

1109

1109,000

Berufsa-usbildung (Профес-сиональное образование)

1,8792

1,0249

1109

1109,000

Total (Сумма)

SES-lndex des Vaters (социально-экономи-ческий статус отца)

2,6009

1,1275

2200

2200,000

Schulabschluss (Образование)

2,7532

,8240

2200

2200,000

ALTER, BEFRAGTE<R>, KATEGORI-SIERT (Возраст, опрошен-ного(ой), разбит на категории)

2,5023

1,1942

2200

2200,000

Berufsa-usbildung (Профес-сиональное образование)

2,0327

1,1027

2200

2200,000

Затем проводится тест на значимость различия между переменными, относящимися к обеим группам, то есть выясняется присутствуют ли в них разделяющие (дискриминирующие) особенности, позволяющие судить об отношении к одной из двух групп (постматериалисты — материалисты).

Tests of Equality of Group Means (Тест равенства групповых средних значений)

Wilks1 Lambda (Лямбда Уилкса)

F

df1

df2

Sig. (Значимость)

SES-lndex des Vaters (социально-экономический статус отца)

,965

80,746

1

2198

,000

Schulabschluss (Образование)

,922

186,281

1

2198

,000

ALTER, BEFRAGTE<R>, KATEGORISIERT (Возраст, опрошенного(ых), разбит на категории)

,930

164,951

1

2198

,000

Berufsausbildung (Профессиональное образование)

,980

44,222

1

2198

,000

Как следует из колонки значимости, по всем переменным наблюдается значительное различие между группами (р < 0,001).

Далее приводится корреляционная матрица между всеми переменными, причём коэффициенты были рассчитаны для обеих групп:

Pooled Within-Groups Matrices (Объединённые матрицы внутри групп)

SES-lndex des Vaters (социально- экономи-ческий статус отца)

Schulab-schluss (Образо-вание)

ALTER, BEFRAG -TE<R>, KATEGO-RISIERT (Возраст, опрошен-ного(ой), разбит на категории)

Berufsau-sbildung (Профес- сиона-льное образо-вание)

Corre-lation (Корре-ляция)

SES-lndex des Vaters (социально-экономи-ческий статус отца)

1,000

,327

-,033

,137

Schula-bschluss (Образо-вание)

,327

1,000

-,275

,377

ALTER, BEFRA-GTE<R>, KATEGO-RISIERT (Возраст, опрошен-ного(ых), разбит на категории)

-,033

-,275

1,000

,018

Berufsa-usbildung (Профес-сиональное образо-вание)

,137

,377

,018

1,000

Прежде всего, здесь очень заметна корреляция между переменными schule и statpas и между переменными ausbild и schule. Чем выше социально-экономический статус отца, тем выше школьное образование опрашиваемого; чем выше его школьное образование, тем выше и профессиональное образование.

Далее следует анализ коэффициентов дискриминантной функции. Корреляционный коэффициент между рассчитанными значениями дискриминантной функции и реальной принадлежностью к группе, равный 0,353, является неудовлетворительным:

Eigenvalues (Собственные значения)

Function (Функция)

Eigenvalue (Собствен-ное значение)

% of Variance (% диспе-рсии)

Cumulative % (Сово-купный %)

Canonical Correlation (Канони-ческая корре-ляция)

1

,142а

100,0

100,0

,353

a. First 1 canonical discriminant functions were used in the analysis (Первые 1 канонические дискриминантные функции будут применяться в анализе).

Wilks' Lambda (Лямбда Уилкса)

Test of Function(s) Wilks' Lambda (Тест функции (и)) (Лямбда Уилкса)

Chi-square (Хи-квадрат)

df

Sig. (Значимость)

1 ,875

292,431

4

,000

Тест, проведенный с помощью критерия "Лямбда Уилкса" (k), на предмет, значимо ли различаются между собой средние значения дискриминантной функции в обеих группах, показал очень значимый результат (значение р < 0,001).

Затем приводятся стандартизированные коэффициенты дискриминантной функции и их корреляция с используемыми переменными:

Standardized Canonical Discriminant Function Coefficients

(Стандартизиро-ванные канонические коэффициенты дискриминантной функции)

Function (Функция)

1

SES-lndex des Vaters (социально-экономический статус отца)

,321

Schulabschluss (Образование)

,434

ALTER, BEFRAGTE<R>, KATEGORISIERT (Возраст, опрошенного(ой), разбит на категории)

-,599

Berufsausbildung (Профессиональное образование)

,179

Structure Matrix

(Структурная матрица)

Function (Функция)

1

Schulabschluss (Образование)

,771

ALTER, BEFRAGTE<R>, KATEGORISIERT (Возраст, опрошенного(ой), разбит на категории)

-,726

SES-lndex des Vaters (социально-экономический статус отца)

,508

Berufsausbildung (Профессиональное образование)

,376

Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions (Объединённые корреляции внутри групп между дискриминантными переменными и стандартизированными каноническими дискриминант-ными функциями)

Variables ordered by absolute size of correlation within function (Переменные расположены соответственно величине их абсолютных корреляционных показателей).

После этого приводятся нестандартизированные коэффициенты дискриминантной функции и средние значения дискриминантной функции в обеих группах:

Canonical Discriminant Function Coefficients

(Канонические коэффициенты дискриминантной функции)

Function (Функция)

1

SES-lndex des Vaters (социально-экономический статус отца)

,290

Schulabschluss (Образование)

,549

ALTER, BEFRAGTE<R>, KATEGORISIERT (Возраст, опрошенного(ой), разбит на категории)

-,520

Berufsausbildung (Профессиональное образование)

,164

(Constant) (Постоянно)

-1,297

Unstandardized coefficients (нестандартизированные коеффициенты)

Functions at Group Centroids (Функции для групповых центроидов)

INGL DIC

Function (Функция)

1

1 ,00 (Постматериалистический тип)

,380

2,00 (Материалистический тип)

-.374

Unstandardized canonical discriminant functions evaluated at group means (Нестандартизированные канонические дискриминантные функции, оценка которых происходит относительно средних значений групп).

В данном случае мы отказались от вывода очень длинной таблицы, в которой для каждого наблюдения построчно, приводится информация о значении дискриминантной функции и принадлежности к одной из двух групп.

В заключении приводится классификационная таблица с указанием точности попадания прогнозов:

Classification Resultsа

(Классификационные результаты)

INGL_DIC (Индекс Инглехарта, дихото-мический)

Predicted Group Membership (Прогнозируемая принадлежность к группе)

Total (Сум-ма)

1,00 (Постматери-алисти-ческий тип)

2,00 (Материа-листи-ческий тип)

Original (Перво-начально)

Count (Коли-чество)

1 ,00 (Пост-материа-листи-ческий тип)

710

381

1091

2,00 (Материа-листический тип)

410

699

1109

Ungrouped cases (He сгруп-пирован-ные наблю-дения)

7

12

19

%

1 ,00 (Постматериа-листический тип)

65,1

34,9

100,0

2,00 (Материа-листи-ческий тип)

37,0

63,0

100,0

Ungrouped cases (He сгруп-пирован-ные наблю-дения)

36,8

63,2

100,0

а. 64,0% of original grouped cases correctly classified (64 % наблюдений, первоначально разнесённых по группам, были классифицированы корректно).

Правая колонка таблицы ("Total" (Сумма)) указывает на общее количество наблюдений, которые фактически относятся к соответствующим группам. К группе постматериалистических типов относится 1091 наблюдение, а к группе материалистических типов 1109. Обе колонки, объединенные общим наименованием ("Predicted Group Membership" (Прогнозируемая принадлежность к группе)), указывают на фактическое количество наблюдений, относящихся к каждой из групп. Первая колонка указывает на количество наблюдений, которые были отнесены к первой группе. Из 1091 постматериалистическйх наблюдений корректно определены были 710, это соответствует 65,1 % всех наблюдений. 381 наблюдение было по ошибке отнесено ко 2 группе, что соответствует 34,9 % всех наблюдений. Из 1109 материалистических наблюдений по ошибке к группе 1 были отнесены 410, что соответствует 37,0 %. 699 наблюдений были корректно отнесены к группе 2, что составило 63 %. Строка "Ungrouped cases" (Несгруппированные наблюдения) содержит наблюдения, которые не соответствуют ни одной из групп. Хотя эти наблюдения и не учитываются при расчёте дискриминантной функции, значение функции для них всё равно вычисляется. Из 19 наблюдений, для которых отсутствуют данные о принадлежности к какой-либо группе, 7 были отнесены к постматериалистическим типам, а 12 к материалистическим. В строке под таблицей приводится итоговый результат. 64 % наблюдений были классифицированы корректно. Так как даже при чисто случайном отнесении некоторого наблюдения к одной из двух имеющихся групп, корректность классификации данного наблюдения составила бы 50 %, то 64 %-ную точность прогноза следует рассматривать как довольно умеренный результат. Такой неудовлетворительный результат можно попытаться объяснить тем, что в обе группы входили смешанные типы, которые тяжелее классифицировать, нежели чистые типы. Проверим это предположение путём повторного проведения расчёта, но уже с учётом только чистых типов.

  • Выберите в меню Data (Данные) Select Cases... (Выбрать наблюдения)

  • Щёлкните на опции If condition is satisfied (Если выполняется условие) и затем на выключателе If... (Если).

  • В редакторе условий введите следующее условие:

ing1_ind = 1 OR ing1_ind = 4

  • Подтвердите нажатием Continue (Далее) и затем ОК.

  • В диалоговом окне Discriminant Analysis (Дискриминантный анализ) переменную ingl_ind (не ingl_dic!) поместите в поле для групповых переменных. В качестве границ области изменения задать значения 1 и 4.

  • В список независимых переменных поместите переменные statpaps, schule, alter и ausbild.

  • Дополнительные установки под выключателями Statistics... (Статистики), Classify... (Классифицировать) и Save... (Сохранить) произведите так, как было описано ранее.

Вы получите следующую классификационную таблицу:

Classification Results

(Результаты классификации)

INGLEHART-INDEX (Индекс Инглехарта, дихото-мический)

Predicted Group Membership (Прогнозируемая принадлежность к группе

Total (Сумма)

POSTMATE-RIALISTEN (Постмате-риалисты)

MATERI-ALISTEN (Матери-алисты)

Original (Перво-начально)

Count (Коли-чество)

POSTMATE-RIALISTEN (Постмате-риалисты)

409

109

518

MATERI-ALISTEN (Матери-алисты)

133

297

430

%

POSTMATE-RIALISTEN (Постмате-риалисты)

79,0

21,0

100,0

MATERI-ALISTEN (Матери-алисты)

30,9

69,1

100,0

а. 74,5% of original grouped cases correctly classified (74,5 % наблюдений, первоначально разнесённых по группам, были классифицированы корректно).

К группе постматериалистов относится 518 наблюдений. 409 наблюдений (79 %) были спрогнозированы корректно, а 109 (21,0 %) по ошибке отнесены к группе 4 ("чистые материалисты"). В группе чистых материалистов насчитывается 403 наблюдения. 297 наблюдений (69,1 %) были определены корректно, а 133 (30,9 %) по ошибке были отнесены к группе 1 ("чистые постматериалисты"). Конечным результатом является корректная идентификация наблюдений, равная 74,5 %. Этот показатель значительно выше предыдущего и может быть расценен как приемлемый.





Начало  Назад  Вперед