Session 21 - Data Mining, Comparing Model

 

(12 Голосов)

Тема данного блока серии Data Mining Statistica – сравнение параллельных моделей. Этот блок продолжает работать с данными кредитного риска и мы уже очистили данные, исследовали их и построили модели, используя методы Р&КД, CHAID, метод растущих деревьев и случайный лес. Мы сравним работу этих моделей. Мы обсудим, как сгенерировать код разработчика в Statistica, используя этот код для определения ошибочных наблюдений, мы также обсудим показатели работы моделей, как, например, диаграмма роста и диаграмма усиления.

 

Session 20 - Data Mining, Random Forest Tools

(8 Голосов)

Метод классификации Случайный лес – тема сегодняшнего блока серии Data Mining Statistica. В нашей серии мы уже подготовили данные для анализа и поработали с другими алгоритмами, как Р&КД, CHAID и метод растущих деревьев. В этом блоке мы обсудим, что такое метод Случайный лес, посмотрим варианты анализа и поработаем с примером в Statistica.

 

Session 19 - Data Mining, Boosted Trees

(8 Голосов)

В этой серии Data Mining Statistica мы будем обсуждать построение модели растущих деревьев для процесса классификации. Мы продолжаем работать с данными оценки кредитного рынка, которые мы подготовили для анализа в предыдущих блоках. Мы также исследовали два других алгоритма: C&RT и CHAID. Обсуждая модель растущих деревьев мы рассмотрим, что это такое, выберем варианты анализа, параметры остановки и поработаем с примером при помощи добытчика данных Statistica.

   

Session 18 - CHAID for Classification

(9 Голосов)

В этом блоке серии Data Mining Statistica мы обсудим построение деревьев классификации с помощью алгоритма CHAID. Мы будем продолжать использовать данные кредитного риска, которые были очищены и подготовлены для анализа. В предыдущем блоке мы использовали Р&КД для построения дерева классификации. Сегодня мы обсудим, что такое CHAID, рассмотрим опции для анализа, метод поиска наилучшего решения (exhaustive CHAID) и приведем пример в Statistica.    

 

Session 17 - Data Mining, C&RT

(8 Голосов)

Деревья регрессии и классификации (C&RT) – тема сегодняшней серии Data Mining Statistica. До этого мы рассматривали данные кредитного риска, которые были очищены, были сделаны выборки и отобраны подходящие для анализа переменные. В этом блоке мы будем использовать приложение Statistica добытчик данных, чтобы построить дерево классификации для категориальной переменной Кредитный риск. В этом блоке мы будем принимать во внимание основы методов рекурсивного разделения и дерева решений. Эти темы были рассмотрены в предыдущем блоке.

   

Страница 1 из 3

Краткое содержание

Вход для слушателей