Математическая обработка данных в социальных науках - Крамер

Издание книги на русском языке, в которой описывается применение современных статистических методов анализа социальных и гуманитарных данных во всем их разнообразии, было и ожидаемо, и необходимо. Ни для кого не секрет, что Россия значительно отстает от стран Западной Европы и США в области приложения количественных методов. В этих странах подобных учебников, адресованных читателям самого различного уровня подготовки (от студентов колледжей, еще не имеющих даже степени бакалавра, до докторантов, избравших прикладную статистику и измерения в гуманитарных науках своей основной специализацией), издается великое множество. Однако соответствующих переводов на русский язык не было с тех пор, как прекратилось издание серии «Библиотечка иностранных книг для экономистов и статистиков».   За последнюю четверть XX в. за рубежом достигнуты большие успехи в области статистики с точки зрения как развития науки (появились новые методы статистического анализа), так и программного обеспечения (все больше методов реализуется в широко используемых статистических пакетах), а также в области методологии (понимания того, какие методы и в каких случаях использовать). Западные исследователи активно применяют статистические методы разной степени сложности, о которых российские ученые узнают либо из публикуемых статей, либо из выступлений на конференциях.

 

 

За последние годы было издано достаточно много монографий и учебных пособий, написанных отечественными авторами. Но они охватывают в основном простейшие и самые распространенные способы статистического анализа: описательную статистику, сопоставление двух выборок, а все выходящее за рамки этого обязательного минимума рассматривается только в ознакомительном формате (А.Д.Наследов, 2004; А.П.Кулаичев, 2006) либо посвящено отдельным методам (А.Н.Гусев, 2000; О.В.Митина, И. Б. Михайловская, 2001). В результате большое количество методов, уже широко известных и активно используемых коллегами за рубежом, позволяющих проверять более интересные и дифференцированные гипотезы, до настоящего времени известны узкому кругу исследователей, применяются крайне редко (например, дискриминантный анализ, анализ ковариаций) или не используются вообще (логлинейный анализ).

Структурное моделирование, оформившееся как методология работы с данными в США и странах Западной Европы в конце 70-х—начале 80-х годов XX в. и по сути органично включающее практически все линейные статистические методы — от определения простейших показателей до многомерного регрессионного и факторного анализа, получившего здесь естественное развитие и объединение (О.В.Митина, 2005), является, по нашему мнению, абсолютно необходимым в психологии и других гуманитарных дисциплинах, но только начинает применяться в России, поэтому учебно-методическое обеспечение особенно актуально.

Хотя статистический анализ имеет многовековую историю, по-настоящему оформление прикладной статистики как методологии работы с числовыми данными можно связывать с именем Ф. Гальтона, который в конце XIX в. впервые применил статистический анализ в биологии и психологии, ввел в психологию тесты и опросники (включая и сам термин «тест»), разработал близнецовый анализ. В 1888 г. ученый выступил с докладом на заседании Королевского общества «Корреляции и их измерение, преимущественно по антропометрическим данным».

Применение статистических методов во многом шло параллельно и взаимосвязано с развитием метрических дисциплин как в естественных и инженерных (био-, хемометрика, метрология), так и в гуманитарных, социальных (измерения в психологии, социологии, экономике, истории) областях и способствовало их оформлению в науки с точки зрения требований строгости, доказательности, объективности, верифицируемости и пр. Статистика помогает доказывать различные гипотезы о проявлениях психологических свойств личности, целесообразности использования новых средств и методов лечения, причин и следствий тех или иных заболеваний и отклонений, предсказывать результаты политических выборов, проводить разработку месторождений полезных ископаемых, контролировать работу атомных станций и т.д. Как правило, проверяются гипотезы о количественных характеристиках различных параметров (переменных) и связи этих параметров друг с другом попарно или в более сложных конфигурациях. Затем возникает вопрос точности и обоснованности результатов. Насколько надежны результаты исследования? Достаточно ли большая выборка? Существуют ли подвыборки, в которых взаимосвязь между установленными переменными значимо различается? Насколько можно доверять полученным измерениям? На все эти вопросы можно ответить с помощью статистических методов. Широкое распространение компьютеров привело к тому, что возможность провести статистический анализ имеет практически каждый, однако, для того чтобы не сделать ошибочных выводов, необходимы соответствующие знания.

В последние годы российские психологи все интенсивнее сотрудничают с американскими и западноевропейскими коллегами, получают приглашения опубликовать результаты своих работ в иностранных журналах, но часто сталкиваются с проблемами, связанными с качеством выполнения и описания результатов количественного анализа данных. Для решения этих проблем, на наш взгляд, необходимо обеспечить доступ к определенной информации — удачно составленным лекционным курсам, качественным учебникам и монографиям; возможность присутствовать на докладах и мастер-классах, проводимых ведущими специалистами в этой области. Современная мобильность — возможность участия в зарубежных мероприятиях и Интернет-коммуникации — позволяет решить эти проблемы.

Наиболее образованными в области использования статистических методов оказались ученые-экономисты. И это неудивительно. Исторически сложилось так, что благодаря экономике у многих математиков появилась возможность стать лауреатами Нобелевской премии. Интегрирование математики в эту область науки способствовало интенсивному развитию эконометрики непосредственно (за счет собственных достижений) и косвенным образом (через повышение общего уровня математической грамотности ученых-экономистов). По мнению Нобелевского комитета, в настоящее время эконометрика применяется в качестве стандартного метода микроэкономики, изучающей все, начиная от расходов на ведение домашнего хозяйства и предпринимательских инвестиций и заканчивая организацией производств, рынков труда и эффектами государственной политики.

Россия в данном случае не является исключением. Статистическая и математическая грамотность эконометриков — достойный пример для подражания. Госстандарт, утвержденный Министерством образования РФ для соответствующих специальностей, свидетельствует о возможности хорошей подготовки прикладных статистиков среди гуманитариев и социальных исследователей в нашей стране.

Отметим также, что, несмотря на лидерство статистики в области работы с количественными данными, это не единственный способ анализировать и репрезентировать результаты. Неправомерно сводить эконометрию, биометрию, клиометрию, психометрию и т.д. исключительно к статистике. В настоящее время методология гораздо шире и включает методы нелинейных динамических систем, нейронные сети, симуляционное моделирование и др. Однако, даже в этом случае при построении моделей на основе функционального подхода исследователи используют данные предварительного статистического анализа, например аппроксимации или регрессии, прежде чем строить дифференциальную или разностную модель (О. В. Митина, В. Ф. Петренко, 2002). Более того, уместно напомнить, что даже математические физики, традиционно отдающие предпочтение аналитическим методам дифференциальных и интегральных уравнений, функционального анализа и т.п., в настоящее время предлагают учитывать флуктуационные эффекты, полноценно проанализированные с помощью статистических методов (В. И. Кляцкин, 2002). С учетом таких тенденций правомерно прогнозировать развитие количественных методов анализа и математического моделирования в противоположную сторону: от использования статистических методов к построению функциональных моделей. И в этом случае статистика будет играть роль не только иллюстратора результатов, но и своеобразного фундамента для построения дальнейших операциональных моделей, а значит, требования к уровню ее использования существенно возрастают.

Теория и практика анализа данных в той или иной науке, являясь одной из ее отраслей, занимают не какое-то обособленное место, а выполняют важную интегрирующую функцию. Использование сходного математического аппарата при решении исследовательских задач из разных сфер науки позволяет фиксировать их однотипность и тем самым помогает классифицировать исследовательские научные проблемы как интегральные, объединяющие в единый класс частные задачи, возникшие в различных отраслях, но по сути своей являющиеся проявлениями обобщенной латентной проблемы.

Итак, перейдем к анализу предлагаемой читателю книги. Собственный научный интерес автора связан с анализом психологических и педагогических данных. Преподавательскую деятельность он также ведет для студентов этих специальностей, чем и объясняется психологическое содержание рассматриваемых в книге примеров. Поэтому, безусловно, книга в первую очередь привлечет внимание ученых и аспирантов психолого-педагогического профиля; несмотря на то что требования к выполнению статистических процедур достаточно универсальны, тем не менее для каждой дисциплины существует своя специфика: степень строгости, допустимая погрешность, правила интерпретации и т.д. Однако и все остальные исследователи, чьи интересы связаны с анализом данных, найдут в ней много полезного для себя. Точно так же целесообразным является изучение психологами соответствующих книг для экономистов, медиков или биологов.

В каждой главе разбирается хотя и искусственный (сокращенный), но все же достаточно содержательный пример, что делает процедуру интерпретации достаточно осмысленной и стимулирует читателя не только проделать вслед за автором все вычисления, но, быть может, повторить их и на других переменных из этого примера, представляющих содержательный интерес. Все расчеты автор эксплицирует, и это методически очень полезно. Конечно, в настоящее время никто не выполняет вычисления ни на бумаге, ни даже с помощью калькулятора, однако при изучении того или иного метода целесообразно хоть раз проделать все выкладки «вручную», чтобы не относиться к компьютерной программе как к черному ящику (со страхом и недоверием или, наоборот, возлагая слишком большие надежды).

Необходимо заметить, что применение количественных методов сродни искусству и наивно было бы ожидать, что прочтя одну или даже несколько книг, вы обретете желаемую степень уверенности при работе. Главное — это большая практика. Именно тогда вы обнаруживаете «подводные камни», которые не указаны ни в одной книге — авторы даже порой не рефлексируют их. Поэтому не огорчайтесь, если, просчитав за автором весь пример, а потом выполнив все процедуры на компьютере, вы все еще не обрели желаемой уверенности. Главное — сохранить мотивацию продолжать освоение этой области.

Второй очень правильный методический прием (помимо включения в объяснения всех численных расчетов) — последовательное и подробное описание диалога работы с компьютером. Приведение в книге пошагово всех интерфейсных окон позволяет читателю без особых проблем воспроизвести все шаги самостоятельно и делает этот процесс воспроизводимым даже для читателей самого начального уровня компьютерной грамотности (не секрет, что среди психологов и педагогов таких немало).

Базовой программой, с помощью которой проанализировано большинство примеров, является SPSS. Это действительно наиболее популярная среди западных психологов и педагогов программа, и ее полезно освоить. При этом работать лучше с русифицированной версией. Недостатки русификации англоязычных статистических программ связаны с отсутствием устоявшейся статистической терминологии (в силу недостаточной развитости статистики в нашей стране). Поэтому переводчики порой проявляют фантастическую изобретательность, переводя то или иное слово, но при этом увеличивают хаос в сознании пользователя, не имеющего профессиональной математической и статистической подготовки. Отсюда возникает путаница при переводе, например, таких терминов: «part correlation» и «partial correlation». Или человек с удивлением осознает, что «ящик с усами» и «boxplot» — это одно и то же, или обнаруживает, что «индекс пригодности» обозначает надежность альфа-Кронбаха.

Одну «нишу» с SPSS (для исследователей и аспирантов, специализирующихся в гуманитарных и социальных науках) занимает программа STATISTICA. Это более молодая, но быстро развиваемая программа, имеющая множество дополнительных программных блоков, существенно расширяющих ее возможности. Большей частью они не востребованы отечественными учеными (например, алгоритмы нейронных сетей), но в перспективе владение программой STATISTICA может оказаться очень полезным.

Для читателей, имеющих начальный уровень компьютерного и статистического образования, полезно будет в качестве дополнительной точки опоры использование программы STADIA, созданной в России (автор А. П. Кулаичев), а потому во многом учитывающей специфику отечественной аудитории (хорошо продуманный с методической точки зрения, дружественный интерфейс легко осваивается студентам и первокурсникам и, встроенный Help достаточно информативен и понятен и содержит статистические рекомендации). Кроме того, автором STADIA недавно выпушен учебник (А. П. Кулаичев, 2006).

Для реализации конфирматорного факторного анализа и путевого анализа, являющихся частными случаями структурного моделирования, в книге используется еще одна программа — LISREL, узконаправленная для анализа структурных моделей. Эта программа не является распространенной в России, однако для примера, рассматриваемого в гл. 2, достаточно возможностей демонстрационной версии, бесплатно загружаемой прямо с сайта. На наш взгляд, кроме LISREL существуют более дружественные программы, с помощью которых выполнять структурное моделирование, в частности конфирматорный факторный анализ, оказывается намного легче. Примером такой программы является EQS (P. М. Bentier, 1996; О.В.Митина, 2005). Также у SPSS есть дополнительная надстройка AMOS, но она не входит в стандартный пакет и ее нужно приобретать дополнительно, в то время как в программе STATISTICA этот блок устанавливается по умолчанию (Л.Я.Дорфман, А. В. Огородников, 2005).

После каждой главы приведен список литературы, рекомендуемый автором, а также редактором перевода. Предлагаемые списки не претендуют на полноту, главное, что указанные в них книги еще не стали библиографической редкостью и их можно найти в книжных магазинах (год издания — не ранее 2000 г.). Правила применения той или иной процедуры можно найти и в справочной информации (Help) используемых программ SPSS, STATISTICA, STADIA, а также на их веб-сайтах.

Скачать книгу

Добавить комментарий


Защитный код
Обновить

Краткое содержание

Вход для слушателей