Session 4 - Data Mining, Data Import and Query

(12 Голосов)

Мы снова рады приветствовать вас в серии Data Mining Statistica! Это четвертый блок, посвященный импорту данных и запросам. Ранее мы говорили об анализе данных и делали обзор процесса. Мы определили набор данных, которые будем использовать в дальнейших блоках. Сегодня мы рассмотрим, как в Statistica можно импортировать файлы с данными из внешних источников. Это может быть файл Excel, текстовый файл и данные из другого статистического программного обеспечения, например SAS, SPSS. Statistica может также запрашивать данные из баз данных OLE DB или ODBC, например SQL, Access или Oracle.

 

 

 

 

 

0:44 Здесь мы видим данные в Excel, которые нам нужно перенести в Statistica. В первом ряду – название переменных, все остальное – другие данные. Давайте посмотрим, как мы можем перенести эти данные в Statistica. Я нажимаю кнопку «открыть» (open) и выбираю Excel файл. Теперь мы можем импортировать выбранную таблицу. Мы помним, что в первом ряду были названия переменных, диапазон стоит по умолчанию, он подойдет для нашей работы. Нажимаю "ок" и Statistica импортирует эти данные в таблицу Statistica. Здесь мы видим наши данные в Statistica.

1:28 Еще один вариант переноса данных – рабочая книга Excel. Теперь эти данные не импортируются в таблицу с данными Statistica, а мы открываем эти данные в рабочей книге Excel. И вот сейчас мы видим наши данные в Statistica. Меню «Данные» представляет собой меню Excel, но статистические графики – это меню Statistica.

2:01 Теперь давайте посмотрим, как можно импортировать файл с расширением jmp. Снова принимаем все настройки по умолчанию. Переносить данные с внешних ресурсов действительно очень легко. И еще давайте посмотрим как получать данные из баз данных SQL. В меню я нахожу «получить внешние данные» и «создать запрос». Я уже установила соединение базы данных с моим SQL сервером. Теперь мы видим, что таблицы уже в нашей базе данных. Я открыла окно с рейтингом кредитоспособности просто перетащив его. Выделяем все поля. Мы можем предварительно просмотреть данные в Statistica, SQL-выражение, мы также может присоединиться к другим таблицам из нашей базы данных или добавить критерий, если, например, хотим добавить данные только определенных дат. Я нажимаю «запустить», даю запросу название и запускаю его. Итак, таблица объединилась с созданными нами данными.

3:18 Итак, мы посмотрели, как можно вводить данные. Теперь мы готовы изучать данные в графическом виде. В следующий раз, мы рассмотрим различные типы графических вариантов и кастомизацию. Затем, мы обратим внимание на способы очистки данных.

Добавить комментарий


Защитный код
Обновить

Краткое содержание

Вход для слушателей