Множественная нелинейная регрессия в STATISTICA

 

Предсказание выздоровления. Этот пример основан на наборе данных, взятом из книги Neter, Wasserman, and Kutner (1985, стр. 649). Предположим, администратору больницы нужно выявить зависимость между шансами на длительное выздоровление тяжело больных пациентов и числом дней, проведенных в больнице. Файл Patients.sta содержит данные по 15 пациентам; в частности, в этом файле есть информация о числе дней, проведенных пациентом в больнице (переменная Дни) и коэффициент прогноза длительного выздоровления для каждого пациента (переменная Прогноз; большие значения означают лучший прогноз). Откройте этот файл данных с помощью меню Файл - Открыть; он находится в директории /Examples/Datasets.

Множественная нелинейная регрессия в STATISTICA

 

Задание анализа. Выберите опцию Множественная нелинейная регрессия из меню Анализ - Углубленные методы анализа для вывода на экран стартовой панели модуля Множественная нелинейная регрессия. Нажмите кнопку Переменные для вывода на экран стандартного диалогового окна выбора переменных. Здесь выберите переменные DAYS и PROGNOSIS и нажмите OK. Заметим, что впоследствии необходимо будет задать, какая переменная будет зависимой, а какая - независимой. Прежде, чем закрыть Стартовую панель, выберите опцию Показывать описательные статистики, корреляционные матрицы. Это позволит вам просмотреть статистики и корреляции в дальнейшем.

Множественная нелинейная регрессия в STATISTICA

Теперь нажмите OK для вывода на экран диалогового окна Регрессия с нелинейными компонентами (см. ниже). В этом окне можно задать до 10 преобразований, которые будут применены к каждой выбранной переменной. Заметим, что для успешного проведения выбранного преобразования, данные должны попадать в допустимый диапазон значений, заданный для данного преобразования; недопустимые наблюдения будут исключены из анализа. После нажатия кнопки OK в этом диалоговом окне в оперативной памяти будут созданы дополнительные переменные для каждой переменной и преобразования. В данном примере, выберите опции X**2, X**3 и LN(X).

Множественная нелинейная регрессия в STATISTICA

Теперь нажмите OK, чтобы открыть диалоговое окно Просмотр описательных статистик (см. ниже). В информационном поле в верхней части окна показано, что выбранные преобразования были успешно применены ко всем наблюдениям из набора данных.

Множественная нелинейная регрессия в STATISTICA

Просмотр преобразованных переменных. На вкладке Быстрый выберите опцию Корреляции для создания таблицы корреляций между всеми комбинациями исходных переменных и соответствующими преобразованиями. Обратите внимание, что в этой таблице (см. ниже) корреляции между DAYS (V1) и PROGNOSIS (V2) наибольшие (r = -0.977) при логарифмическом преобразовании переменной PROGNOSIS (LN-V2).

Множественная нелинейная регрессия в STATISTICA

Проведение анализа. Нажмите OK в диалоговом окне Просмотр описательных статистик для продолжения анализа. В окне Определение модели - вкладка Быстрый нажмите кнопку Переменные для вывода на экран стандартного диалогового окна выбора переменных. Здесь выберите LN-V2 в качестве зависимой переменной и DAYS в качестве независимой переменной и затем нажмите OK. Теперь нажмите OK в диалоговом окне Задание модели, для расчета модели и вывода на экран диалогового окна Результаты множественной регрессии. Модель подходит к данным очень хорошо, с примерно 95% изменчивостью предсказания LN(PROGNOSIS), объясненной в модели (см. значение скорректированного R2 в информационном поле).

Множественная нелинейная регрессия в STATISTICA

Теперь нажмите ОК для вывода на экран таблицы параметров модели (см. ниже) и соответствующих статистик.

Множественная нелинейная регрессия в STATISTICA

Используя значения B для свободного члена и переменной DAYS из таблицы, модель можно выразить следующим образом:

PROGNOSIS =exp(4.037159 - 0.037974*DAYS)

Просмотр статистик остатков. На вкладке Остатки/Предсказанные/Наблюдаемые значения нажмите кнопку Анализ остатков для вывода на экран диалогового окна Анализ остатков. Затем, на вкладке Остатки выберите опцию Исходные в группе Тип остатков и нажмите кнопку Гистограмма остатков. Результирующий график (см. ниже) показывает, что остатки данных, хотя и в маленьком количестве, стремятся примерно к нормальному распределению.

Множественная нелинейная регрессия в STATISTICA

В заключение, на вкладке Диаграммы рассеяния нажмите кнопку Предсказанные и наблюдаемые для построения диаграммы рассеяния предсказанных и наблюдаемых значений зависимой переменной.

Множественная нелинейная регрессия в STATISTICA

Результирующий график показывает, что результаты прогноза, в общем, хорошие, особенно для больших значений LN(PROGNOSIS). Значения прогноза для пациентов, остававшихся в больнице короткое время, являются менее точными.

Attachments:
FileОписание
Access this URL (http://www.statosphere.ru/downloads/examples/Patients.sta)Множественная нелинейная регрессия в STATISTICAДанные по пациентам - Patients.sta

Добавить комментарий


Защитный код
Обновить

Краткое содержание

Вход для слушателей