Математические методы в экологических и географических исследованиях - Пузаченко

Много лет назад, будучи студентом-зоологом, я обратил внимание на то, что в результате полевых исследований собирается огромный объем данных, но в конце концов изучаемое нами явление описывается лишь таблицами средних значений. Такая ситуация показалась мне крайне несправедливой как по отношению к моему труду, так и по отношению к диким животным, которых зоолог вынужден уничтожать для своих исследований.  

 

С другой стороны, мой учитель, упорядочивая множество данных учета численности мышевидных грызунов или птиц, применял четкую логическую процедуру. На библиотечных карточках он в одной и той же последовательности записывал виды и их численность. Виды он раскрашивал в зависимости от численности в три цвета. Каждая карточка содержала информацию об одном учете или местообитании. Затем на большом столе раскладывал, как он говорил, «пасьянс», в котором упорядочивал карточки по сходству цветовой разметки. Проведя такую классификацию, он сравнивал полученные классы с аналогичным образом упорядоченными характеристиками среды и в наглядной форме устанавливал связи между численностью отдельных видов и средой.

Сама процедура пасьянса была очень увлекательна. Она требовала нескольких последовательных перекладываний (итераций). Конечный результат не всегда был строго однозначным. В нем часто сохранялась некоторая неопределенность: какую-то карточку в равной степени можно было отнести к двум разным хорошо отличимым подмножествам. Однако обычно «природа» демонстрировала стремление к некоторому порядку. При всем этом процедура, подчиняясь с полной очевидностью определенному правилу, занимала много времени. Вместе с тем было очевидно, что чисто логически задача взаимоупорядочивания данных разрешима только при относительно небольшом объеме наблюдений.

В то время «узкой специализации», будучи убежденным биологом, я считал себя полностью независимым от математики и не очень утруждался ее изучением. Однако поиск путей устранения очевидных для меня противоречий между «объемом данных и содержанием результатов», практически полной алгоритмизацией процедуры упорядочивания данных и необходимостью ручного перебора, сложность которого экспоненциально увеличивалась с увеличением объема выборки, заставили меня искать их разрешения в области математических методов.

Обратившись к учебнику «Биометрия» Н.А. Плохинского, я с первой страницы столкнулся с проблемами. Попытка понять смысл дисперсии и среднеквадратического отклонения вызвала большие проблемы, а распределение и действующие в нем законы полностью убедили в том, что либо я что-то не понимаю, либо в учебнике упущены какие-то содержательные вещи, без которых невозможно уяснить смысл всех последующих действий. Как показала практика, скорее всего, справедливым оказалось последнее. В то время учебники прикладной статистики в основном сводились к описанию правил действий, и места для рассмотрения их смысла не оставалось. Учебники были написаны по принципу «делай как я, и будет хорошо».

Все-таки после месяца усилий, приложенных к первым десяти страницам, я понял, о чем идет речь, и стал довольно бойко разбирать более сложные операции. Однако результаты классической статистики меня не удовлетворили. Почти вся статистика того времени сводилась к проверке альтернативных гипотез, сравнению средних и расчету коэффициента корреляции как меры отношений между двумя переменными. При этом детали этих отношений в расчет не принимались.

Исследование отношений между свойствами среды и свойствами какого-либо вида животных или растений — важнейшая цель полевого эколога. Классические методы статистики в большинстве своем не очень пригодны для решения такого рода задач. В то время они в большей степени были ориентированы на проверку отклика на воздействие в строго организованном сельскохозяйственном эксперименте, чем на полевые исследования в реальной природе.

Данный факт подвиг меня на расширенный поиск методов исследования отношений. Шестидесятые годы XX века открывали для этого широкие возможности. Это был период бурного развития кибернетики и внедрения строгих математических методов во все сферы человеческой деятельности. Математическая логика и статистическая теория информации дали неплохие основания для полуколичественного исследования отношений и позволили существенно усилить содержательные результаты полевых исследований.

В принципе в то время были разработаны и важнейшие нетрадиционные методы статистического анализа, однако их использование ограничивалось возможностями вычислительной техники. Только с появлением персональных компьютеров весь интеллектуальный потенциал этих методов стал полностью доступен для любого исследователя.

Однако на практике анализ данных в мировой экологической науке, оперирующей с полевыми данными, обычно ограничивается стандартными дисперсионным и факторным анализами. При этом последний обычно используется там, где он теоретически неприменим. По моему мнению, причина — в сохранившейся слабой адаптации существующих учебных пособий к мышлению натуралиста. Как и прежде, в докомпьютерную эпоху, в руководствах по статистическим методам анализа больше внимания уделяется не смыслу действий, а процедуре, написанию формул как алгоритмов некоторых действий без должного объяснения их содержания.

Опыт убедил меня в том, что натуралист обладает специфическим предметным мышлением, при котором смысл имеет только то, действие чего абсолютно понятно. Для натуралиста ответ на вопрос «как предметы и явления соотносятся друг с другом» является полезным, но промежуточным. Его в первую очередь интересует ответ на вопрос «почему они находятся в таких отношениях и к чему это приводит». Вероятность и случайность, несмотря на то, что с ними необходимо считаться, являются его врагами, и все его действия направлены на выявление детерминированных отношений. Именно поиск смысла в наблюдаемом заставляет его углубляться в предмет, хотя часто приводит к недоказуемым результатам. Вообще талант исследователя-натуралиста определяется способностью его мышления распутывать клубок отношений и взаимодействий, выбирать из множества возможностей наиболее достоверные. Он от рождения, не подозревая об этом, владеет законами различных логик и применяет их, соизмеряясь с реальным объектом, ощущает случайность и риск ошибочного вывода, ищет максимально простое объяснение отношений, обладающее при этом наибольшей общностью, и «эстетическая сторона» объяснения является для исследователя существенным критерием истинности.

Вместе с тем, интуитивный натурализм сплошь и рядом граничит с волюнтаризмом и часто опирается на аргументы типа «нам кажется, мы считаем, мы думаем». При этом, как «считают» и каков ход мысли, обычно не разъясняется. Тем не менее, практика любого добросовестного натуралиста показывает, что ему действительно часто «кажется», и желаемое часто искажает действительное. Таким образом, чем сложнее объект, чем больше рассматриваемых взаимосвязанных переменных, тем труднее распутать клубок множества отношений.

В этом случае на помощь приходят количественные методы анализа данных, владение которыми необходимо для современного исследователя, решающего существенно более сложные задачи, чем его учителя. Однако использование этих методов без понимания их смысла и возможностей не исключает ошибочности выводов. Дело в том, что каждый метод опирается на некоторую модель отношений, и на его основе можно «раскрыть реальность» в том и только в том случае, если его логические основания адекватны ее свойствам. Иначе, каждый метод анализа можно рассматривать как отмычку, пригодную для определенного типа замков. Сконструировать универсальную отмычку теоретически невозможно.

В предлагаемом пособии сделана попытка обобщить накопленный опыт изучения и применения количественных методов анализа данных.

При таком подходе необходимо начинать изучение предмета с изложения методологических основ организации самих исследований и важнейших элементов системологии, определяющих всю последовательность дальнейших действий.

Следует обратить особое внимание на возможность использования современным исследователем пакетов статистических программ, освобождающих его от непосредственных трудоемких вычислений. Наиболее распространенными и универсальными являются следующие программные продукты: Statistica, Systat, NCSS, SPSS. В основном все пакеты совпадают, но существенно различаются в деталях. В разных пакетах одни и те же методы могут быть представлены в несколько отличных версиях и с разной полнотой. Пакеты могут отличаться по максимальному объему данных, которые можно включить в анализ, по способу построения изображений и т. п. Опыт показывает, что примерно 90 % типичных задач можно успешно решить, используя пакет статистических программ Statistica. Однако в некоторых случаях приходится обращаться и к другим программным продуктам. Кроме того, в Интернете можно найти множество частных статистических программ, адаптированных для решения относительно узких экологических задач. Обычно эти задачи можно решить, используя пакет общего назначения. Однако такое решение более трудоемко.

Практика показывает, что если исследователь хорошо разобрался со способами управления расчетами в одном пакете программ, то он легко справится и с другими. Кроме того, во всех пакетах существует файл «Помощь» (Help), что позволяет пользователю разобраться в содержании проблемы и путях ее решения. Содержание «Помощи» столь полно, что ее можно рассматривать как оперативный учебник по статистике, адаптированный к конкретному программному продукту.

Это позволяет при изучении конкретных методов анализа и правил действий опираться на один пакет программ, например на Statistica. Можно не сомневаться, что по мере усложнения задач исследования читатель самостоятельно разберется и в других пакетах.

Наконец, необходимо обратить внимание на тот факт, что в современном информационном мире передать через курс лекций или через учебник все знания о предмете невозможно. Важно, чтобы был освоен некоторый базис знаний и умение самообучаться, постоянно перерабатывая новую информацию по соответствующей предметной области. При этом не следует рассчитывать на то, что сразу же при первом прочтении все становится понятным. В некоторых случаях требуется многократный разбор содержания какого-либо текста или метода, иногда он становится понятным при обращении к другим источникам. Процесс расширения знаний непрерывен, и прекращение самообучения с полным основанием можно определить как моральную гибель любого исследователя. Каждый год вы должны узнавать и реализовывать что-то такое, чего не знали и не делали в прошлом. Постоянный поиск нового есть гарант вашего исследовательского здоровья.

Скачать книгу

Комментарии  

 
0 #2 Nadegda 31.01.2012 04:47
Мне кажется, эта "реликтовая" книга прикладной статистики.
И, вместе с тем, очень современная.
Спасибо!
Цитировать
 
 
0 #1 илья-л 03.07.2011 14:31
Отличная книга по статистике для естественников. Спасибо
Цитировать
 

Добавить комментарий


Защитный код
Обновить

Краткое содержание

Вход для слушателей