Временные ряды в STATISTICA. Анализ распределенных лагов

Данный пример основан на отчетах Министерства образования США. Файл Teachers.sta содержит следующие данные:

(1) число учащихся (переменная Children),

(2) число учителей (Teachers),

(3) среднюю зарплату учителей (Salary).

Данные собирались через каждые 10 лет за период с 1900 по 1980 год.

Временные ряды в STATISTICA. Анализ распределенных лагов

 

Анализ временных рядов в STATISTICA. Преобразования переменных

В этом разделе дается обзор общих соглашений, используемых в модуле Временные ряды для сохранения преобразованных временных рядов в активной рабочей области системы (см. также Основные соглашения).

Преобразования и активная рабочая область. Файл Stocks.sta содержит цены закрытия двух акций за период в 200 дней. Каждая торговая неделя содержит точно пять рабочих дней. Цена закрытия для выходных (когда торгов нет) оценивается. В этом примере, имеем два временных ряда, к которым будем применять несколько операторов сглаживания. Кроме того, будет построено несколько полезных графиков и проведен автокорреляционный анализ биржевых цен. Фрагменты рядов показаны ниже.

Анализ временных рядов в STATISTICA

   

Кластеризация методом K средних в STATISTICA

Этот пример будет иллюстрировать один из других методов кластеризации: метод k средних. Как описано в разделе Вводный обзор, целью алгоритма является оптимальное "разбиение" всего набора объектов на k кластеров. Эта процедура будет перемещать объекты из одного кластера в другой, чтобы минимизировать внутрикластерную дисперсию и максимизировать межкластерную. В Примере 1, вы нашли три кластера во множестве данных об автомобилях (Cars.sta). Теперь посмотрим, какого сорта решение получим с помощью метода k средних в предположении, что в данных имеется всего три кластера.

Спецификация анализа. Выберите Кластерный анализ в меню Анализ - Многомерный разведочный анализ для отображения стартовой панели модуля Кластерный анализ. В появившемся диалоге выберите Кластеризация методом К средних и нажмите кнопку OK для отображения диалогового окна Кластерный анализ: кластеризация методом К средних. В этом диалоге выберите вкладу Дополнительно.

Кластеризация методом K средних в STATISTICA

   

Иерархическая классификация в STATISTICA

Следующий пример основан на выборке автомобилей различных марок. Более точно, было случайно выбрано по одной модели среди тех, которые предлагает соответствующий производитель. Для каждого автомобиля были записаны следующие данные:

1. Приблизительная стоимость автомобиля (переменная Цена - Price),

2. Время разгона автомобиля (от 0 до 60 секунд; переменная Время разгона - Acceler),

3. Величина тормозного пути (Тормозной путь - Braking при скорости 80 миль/час до полной остановки; переменная Тормоз - Braking),

4. Индекс управляемости - способности "держать" дорогу (переменная Управляемость - Handling), и

5. Расход топлива автомобилем (миль на галлон; переменная Расход топлива - Mileage).

Масштаб измерений. Все кластерные алгоритмы нуждаются в оценках расстояний между кластерами или объектами, и ясно, что, когда вы вычисляете расстояние, необходимо задать масштаб. Поскольку различные измерения используют абсолютно различные типы шкал (т.е. чисел секунд, тысяч долларов и т.д.), данные были стандартизованы (командой Стандартизовать в меню Данные), так что каждая переменная имеет среднее 0 и стандартное отклонение 1. Очень важно, что размерности (переменные в этом примере), которые используются для вычисления расстояний между объектами (автомобилями в данном примере), имеют сравнимые величины, иначе анализ был бы смещённым и связан в большей степени с теми измерениями, которые имеют больший размах значений.

Иерархическая классификация в STATISTICA

   

Факторный анализ в STATISTICA

Следующий пример основан на вымышленных данных, относящихся к изучению удовлетворенности жизнью. Предположим, что вопросник был направлен 100 случайно выбранным взрослым. Вопросник содержал 10 пунктов, предназначенных для определения удовлетворенности на работе, удовлетворенности своим хобби, удовлетворенностью домашней жизнью и общей удовлетворенностью в других областях жизни. Ответы на вопросы были введены в компьютер и промасштабированы таким образом, чтобы среднее для всех пунктов стало равным приблизительно 100.

Результаты были помещены в файл данных Factor.sta. Открыть этот файл можно с помощью опции Файл - Открыть; наиболее вероятно, что этот файл данных находится в директории /Examples/Datasets. Ниже приводится распечатка переменных этого файла (для получения списка выберите Все спецификации переменных в меню Данные).

Факторный анализ в STATISTICA

Цель анализа. Целью анализа является изучение соотношений между удовлетворенностью в различных сферах деятельности. В частности, желательно изучить вопрос о числе факторов, "скрывающихся" за различными областями деятельности и их значимость.

   

Страница 4 из 5

Краткое содержание

Вход для слушателей