Применение мат.методов при анализе геологической информации (с использованием STATISTICA) - Михалевич


Применение мат.методов при анализе геологической информации

В первом выпуске учебного пособия по применению математических методов при анализе геоинформации были рассмотрены статистические приемы для работы с количественными данными и, прежде чем мы перейдем к рассмотрению других, более сложных статистических процедур, мы считаем необходимым показать приемы анализа качественных признаков, "сплошь и рядом" используемых в геологии.

 

 

 

Здесь, вместо введения, нам хотелось бы показать природу различных типов данных (в том числе и количественных), природу шкал, в которых они могут измеряться.

Факторы и признаки

Значение фактора (переменной) описывает определенную характеристику в виде некоторого численного значения, причем это значение может меняться от объекта к объекту или для одного и того же объекта во времени.

Примеры пористость в процентах, проницаемость в миллидарси.

Описательный признак это некоторая категория (значение) характеристики, к которой объект принадлежит или не принадлежит, либо свойство или качество, которым объект обладает или не обладает.

Примеры обеспеченность компьютерной техникой, категория запасов полезных ископаемых, высшее образование.

Некоторые характеристики можно выразить только одним способом, тогда как другие допускают представление обоими способами. Например, массу объекта можно рассматривать и как фактор (в килограммах), и как признак (есть "маленькая масса" объекта / нет "маленькой массы" объекта). При выборе формы представления важно учитывать причины проведения измерения, требования объективности, надежности и состоятельности, а также свойства различных измерительных шкал. Эти соображения представлены ниже.

Статистический анализ данных

Подчеркнем сразу, что результат анализа данных зависит, в первую очередь, не от правильности статистических вычислений, а от того, насколько высоко методологическое качество исследования (т. е. насколько правильно оно организовано). Статистический анализ, каким бы он ни был сложным, не способен компенсировать дефекты организации эксперимента или наблюдения. Однако некорректное использование самых простых статистических методов для анализа доброкачественных данных часто приводит к ложным заключениям и выводам.

Для этого ниже будут кратко представлены общие описания некоторых статистических методов и принципы их применения. Настоящий «краткий обзор» касается только наиболее распространенных статистических процедур.

Правильное описание методов статистического анализа должно содержать указание на применяемые статистические критерии и их конкретные варианты; если применялся не общепринятый критерий или метод расчета, должно быть объяснение, почему использован именно он. Поскольку результат применения многих критериев может зависеть от используемого алгоритма вычислений, в отчетах по конкретным исследованиям должны быть указаны программа или пакет статистических программ, с помощью которых проводились вычисления. Большинство коммерческих пакетов статистических программ имеют отличные характеристики, и нет заметной разницы в том, какой из mix применяется для большинства задач.

Статистические выводы

Наиболее распространенный тип статистического вывода доказательство того, что найденные различия между выборками неслучайны и, следовательно, отражают действительные различия между генеральными совокупностями.

Различие групп означает их неравенство по некоторому показателю. Чтобы доказать этот вывод, применяют формальный логический прием. Сначала предполагают, что группы неразличимы (нулевая гипотеза), затем доказывают, что эта гипотеза может быть отвергнута без совершения большой ошибки. Отрицание нулевой гипотезы и означает неравенство групп, т. е. принятие альтернативной гипотезы, которая состоит в том, что различия между группами не случайны, а отражают истинные различия между совокупностями.

Для проверки нулевой гипотезы используют разнообразные статистические критерии. Никакой статистический критерий не дает абсолютной уверенности в различии или в идентичности групп. Напротив, все статистические критерии позволяют утверждать что-либо лишь с некоторой вероятностью ошибки.

Чаще всего исследователя интересует различие, и соответственно речь идет об отклонении нулевой гипотезы. Поэтому обычно оценивают именно риск принятия ошибочного решения о том, что различие существует (ошибка первого рода, или а ошибка).

Для риска и устанавливается пороговая величина вероятности ошибки р на уровне, традиционно равном 0,05 или 0,01.

Многомерные методы (наиболее часто используемые)

Остановимся на методах анализа многомерных данных, в которых каждый наблюдаемый объект характеризуется множеством переменных. Многомерные методы позволяют одновременно изучать изменение набора характеристик (множественный регрессионный анализ также относится к этим методам).

Многомерные методы являются необычайно мощными, так как они позволяют исследователю работать с большим числом переменных, чем он может осознать сам. Однако они сложны как с теоретической, так и с методологической точек зрения. Статистические критерии и процедуры большей части этих методов разработаны лишь при очень сильных ограничениях. Вид этих критериев и их поведение при более слабых допущениях (которые обычно используются при решении большинства реальных задач) плохо изучены. В самом деле, некоторые из рассмотренных ниже процедур совсем не имеют теоретического обоснования, а критерии проверки соответствующих гипотез для них еще не созданы. Тем не менее, эти методы кажутся наиболее перспективными и многообещающими в исследованиях. В большинстве задач приходится иметь дело со сложными комбинациями действующих факторов, которые не удается выделить в чистом виде и изучить изолированно. Зачастую бывает трудно принять обоснованное правильное решение относительно какой-либо из переменных. В этом случае лучший способ решения задачи состоит в ее многомерной реализации.

Наиболее часто из многомерных методов используют кластерный анализ, метод главных компонент, дискриминантный анализ и т. д. Эти методы и принцип факторного анализа описаны в данном пособии.

Скачать книгу

Комментарии  

 
+1 #12 Админ 08.11.2012 14:31
Цитирую спасибо большое!!!:
халафян.а.а 2008 Современные статистические методы медицинских исследований - вот эту книу ищу - нет случайно


такой нет.... есть:
Статистический анализ медицинских данных (с применением STATISTICA) – Реброва
Медико-биологическая статистика - Гланц
Применение непараметрическ их критериев статистики в медико-биологических исследованиях – Гублер
Цитировать
 
 
+1 #11 спасибо большое!!! 08.11.2012 13:50
халафян.а.а 2008 Современные статистические методы медицинских исследований - вот эту книу ищу - нет случайно
Цитировать
 
 
+3 #10 Nadegda 31.01.2012 04:34
Спасибо за книги!
Цитировать
 
 
+3 #9 Romul 26.10.2011 17:40
Наконец то нашел
Спасибо
Цитировать
 
 
+4 #8 Paavaa 27.09.2011 10:31
спасибо большое! особенно понравилось объяснение решения задач и доступность изложения материала)
Цитировать
 
 
+4 #7 Андро 06.09.2011 10:34
очень полезно и не только геологам)
Цитировать
 
 
+5 #6 Ruslan 09.08.2011 12:55
Spasibo za knigi
Цитировать
 
 
+8 #5 Artem 25.07.2011 09:39
спасибо! Удачи вашему сайту :-)
Цитировать
 
 
+5 #4 аня 20.07.2011 09:43
Благодарю!!! :-) :-) :-)
Цитировать
 
 
+6 #3 Сергей_С 15.07.2011 15:06
+1 присоединяюсь
спасибо!
Цитировать
 

Добавить комментарий


Защитный код
Обновить

Краткое содержание

Вход для слушателей