Предоставляем вашему вниманию перевод официальных видеокурсов от компании Statsoft по программе STATISTICA. С помощью данных материалов вы сможете ознакомиться с основными возможностями данной программы и научиться рационально ее использовать. В лекциях рассмотрены основные способы анализа, в том числе кластерный, регрессионный и т.д. Также приводятся методы и приемы решения различных статистических задач, с пояснением на практических примерах.

Называется видеокурс «Data Mining with STATISTICA», что в переводе на русский означает «Интеллектуальный анализ данных в программе STATISTICA». Как видно из названия, этот сборник лекций будет полезен всем, кто по каким-то причинам хочет заняться статистическим анализом с помощью самой подходящей для этого программы - STATISTICA (курс рассчитан на версию 8.0 ENG).

Основным преимуществом этих лекций является то, что материалы выпущены самим производителем, ведь никто не сможет описать способности программы лучше, чем тот, кто создал ее.

Автором является Дженнифер Томпсон, специалист, работающая в компании Statsoft и имеющая степень магистра по статистике. Ее творение хоть и созданное профессионалом, будет интересно очень широкому кругу людей, в том числе и новичкам в мире статистического анализа и обработки данных. Теоретическая часть, объясненная доступным и понятным языком, сочетается тут с практическими примерами, зачастую рассматривающими то ли иное интересное явление.

Для удобства освоения материала, перевод каждой из лекций разделен на части, каждая из которых вынесена в отдельный абзац (цифры перед абзацем означают время его появления в видеоуроке).

Все вопросы про практическому использованию STATISTICA Вы можете задать на наш форум по STATISTICA

Session 17 - Data Mining, C&RT

(8 Голосов)

Деревья регрессии и классификации (C&RT) – тема сегодняшней серии Data Mining STATISTICA. До этого мы рассматривали данные кредитного риска, которые были очищены, были сделаны выборки и отобраны подходящие для анализа переменные. В этом блоке мы будем использовать приложение STATISTICA добытчик данных, чтобы построить дерево классификации для категориальной переменной Кредитный риск. В этом блоке мы будем принимать во внимание основы методов рекурсивного разделения и дерева решений. Эти темы были рассмотрены в предыдущем блоке.

 

Session 18 - CHAID for Classification

(9 Голосов)

В этом блоке серии Data Mining STATISTICA мы обсудим построение деревьев классификации с помощью алгоритма CHAID. Мы будем продолжать использовать данные кредитного риска, которые были очищены и подготовлены для анализа. В предыдущем блоке мы использовали Р&КД для построения дерева классификации. Сегодня мы обсудим, что такое CHAID, рассмотрим опции для анализа, метод поиска наилучшего решения (exhaustive CHAID) и приведем пример в STATISTICA.    

 

Session 19 - Data Mining, Boosted Trees

(8 Голосов)

В этой серии Data Mining STATISTICA мы будем обсуждать построение модели растущих деревьев для процесса классификации. Мы продолжаем работать с данными оценки кредитного рынка, которые мы подготовили для анализа в предыдущих блоках. Мы также исследовали два других алгоритма: C&RT и CHAID. Обсуждая модель растущих деревьев мы рассмотрим, что это такое, выберем варианты анализа, параметры остановки и поработаем с примером при помощи добытчика данных STATISTICA.

 

Session 20 - Data Mining, Random Forest Tools

(8 Голосов)

Метод классификации Случайный лес – тема сегодняшнего блока серии Data Mining Statistica. В нашей серии мы уже подготовили данные для анализа и поработали с другими алгоритмами, как Р&КД, CHAID и метод растущих деревьев. В этом блоке мы обсудим, что такое метод Случайный лес, посмотрим варианты анализа и поработаем с примером в Statistica.

   

Session 21 - Data Mining, Comparing Model

 

(12 Голосов)

Тема данного блока серии Data Mining Statistica – сравнение параллельных моделей. Этот блок продолжает работать с данными кредитного риска и мы уже очистили данные, исследовали их и построили модели, используя методы Р&КД, CHAID, метод растущих деревьев и случайный лес. Мы сравним работу этих моделей. Мы обсудим, как сгенерировать код разработчика в Statistica, используя этот код для определения ошибочных наблюдений, мы также обсудим показатели работы моделей, как, например, диаграмма роста и диаграмма усиления.

   

Страница 3 из 3

Краткое содержание

Вход для слушателей