Построение систем машинного обучения на языке Python - Л. П. Коэльо, В. Ричард

Цель  машинного  обучения  –  научить  машину  (точнее,  программу) решать задачу, предъявив ей несколько примеров (с правильными и неправильными решениями). Предположим, что каждое утро, включив  компьютер,  вы  делаете  одно  и  то  же:  сортируете  пришедшую почту, раскладывая письма в папки по темам. Через какое-то время эта работа вам надоест, и вы захотите ее автоматизировать. Один из возможных подходов – проанализировать собственное поведение и выписать  правила,  которыми  вы  руководствуетесь  при  сортировке писем.  Однако  это  громоздкое  и  отнюдь  не  совершенное  решение.

Некоторые правила вы упустите из виду, другие сформулируете излишне детально. Гораздо лучше выбрать какой-то набор метаданных о письмах, задать пары (тело письма, имя папки) и поручить алгоритму  вывести  наилучший  набор  правил.  Такие  пары  называются обучающими данными, а получившийся набор правил можно будет применить к будущим письмам, которых алгоритм еще не видел. Это и есть машинное обучение в простейшем виде.

Разумеется,  машинное  обучение  (его  еще  часто  называют  добычей данных или прогностическим анализом) – не новая дисциплина. Наоборот, своими успехами в последние годы она обязана практическому применению проверенных временем методов и идей из других областей знания, в частности математической статистики. Цель человека – извлечь полезную информацию из данных, например, выявить скрытые закономерности и взаимосвязи. Читая об успешных применениях машинного обучения, вы убедитесь, что прикладная статистика вовсю используется специалистами.

Ниже вы увидите, что процесс поиска подходящего подхода к машинному обучению вовсе не линеен. Напротив, приходится многократно возвращаться назад, пробуя другие сочетания исходных данных и алгоритмов. Именно изыскательская природа этого процесса делает  применение  Python  чрезвычайно  уместным.  Ведь  Python, будучи интерпретируемым высокоуровневым языком программирования, как будто специально придуман для опробования разных вариантов. К тому же, он работает быстро. Конечно, он медленнее C и подобных ему статически типизированных языков. Но при наличии огромного числа простых в использовании библиотек, зачастую написанных на C, вам не придется жертвовать скоростью ради гибкости.

Attachments:
FileОписание
Access this URL (http://www.statosphere.ru/downloads/books/python/02kohelho.rar)Построение систем машинного обучения на языке PythonПостроение систем машинного обучения на языке Python - Л. П. Коэльо, В. Ричард

Добавить комментарий


Защитный код
Обновить

 

Яндекс.Метрика

 

 

Краткое содержание

Вход для слушателей