Другое

Взаимосвязь экономических явлений. Представление о факторном анализе

Методика факторного анализа

Тема 5.

1. Понятие, типы и этапы проведения факторного анализа.

2. Систематизация и классификация факторов в АХД.

3. Детерминированное моделирование.

4. Типы факторных моделей и способы их преобразования.

Все явления и процессы хозяйственной деятельности предприятий взаимосвязаны, взаимозависимы и взаимообусловлены. Одни из них связаны между собой непосредственно, другие – косвенно.

Каждое явление можно рассматривать и как причину, и как результат. Если тот или иной показатель рассматривается как следствие, как результат действия одной или нескольких причин и выступает в качестве объекта исследования, то при изучении взаимосвязей его называют результативным показателем.

Факторы – показатели, которые определяют поведение результативного показателя и выступают в качестве причин изменения его величины.

Каждый результативный показатель зависит от многочисленных факторов. Чем детальнее исследуется влияние факторов на величину результативного показателя, тем точнее результаты анализа и оценки деятельности предприятия. Поэтому важным методологическим вопросом в АХД является изучение и измерение влияние факторов на величину исследуемых экономических показателей, с этой целью и проводится факторный анализ.

Факторный анализ – методика комплексного и системного изучения и измерения воздействия факторов на величину результативного показателя.

Выделяют следующие типы факторного анализа :

I По характеру исследуемых взаимосвязей:

Детерминированный факторный анализ (применяется когда связь результативного показателя с факторами определена и носит функциональный характер, т.е. ее можно выразить как у = f(х));

Стохастический факторный анализ (применяется когда связь факторов с результативным показателем сложно четко обозначить целевой функцией, то есть она является неполной, вероятностной (корреляционный) характер, т.е. нет функциональной зависимости). При корреляционной связи изменение аргумента (x) может дать несколько значений прироста функции (f) в зависимости от сочетания других факторов.

II По методике исследования:

Прямой факторный анализ (осуществляется дедуктивным способом - от общего к частному);

Обратный факторный анализ (причинно-следственные связи исследуются с помощью способа индукции - от частного к общему);

III По степени детализации:

Одноуровневый (для исследования первой ступени подчиненных показателей без их дальнейшей детализации);

Прибыль = Выручка – с/с

Многоуровневый (детализация входящих в факторную модель показателей на составные элементы с целью изучения их сущности).


Прибыль = Выручка – с/с;

Прибыль = объем*(цена 1) – объем*(Затраты переменные 1) – затраты постоянные

IV По состоянию изучаемых явлений:

Статический (изучение влияние факторов на определенную дату)

Динамический (исследование причинно-следственных связей в динамике).

V По времени (по периоду исследования):

Ретроспективный (изучение причин изменения результатов хозяйственной деятельности за прошлые годы);

Перспективный или прогнозный (исследование влияния факторов на результативный показатель в перспективе).

Основные этапы проведения факторного анализа :

1. Отбор факторов для анализа исследуемых результативных показателей.

2. Классификация и систематизация факторов с целью обеспечения системного подхода к их изучению.

3. Моделирование взаимосвязи между факторами и результативными показателями.

4. Расчет влияния факторов и оценка роли каждого из них в изменении величины результативного показателя.

5. Практическое использование факторной модели для управления экономическими процессами.

Систематизация и классификация факторов в АХД.

Системный подход в анализе хозяйственной деятельности требует взаимосвязанного изучения факторов с учетом их внутренних и внешних связей, взаимодействия и соподчиненности (иерархии), что достигается с помощью их систематизации (структурирования).

Структурирование (систематизация) – разделение исследуемого показателя на множество составляющих элементов (факторов) и выявление между ними взаимосвязей и соподчиненности.

Структурирование (систематизация) – размещение изучаемых явлений или объектов в определенном порядке с выявлением между ними взаимосвязей и соподчиненности.

Систематизация факторов в АХД осуществляется с помощью построения структурно-логической модели, которая дает возможность установить наличие и направление связи не только между изучаемыми факторами и результативным показателем, но и между самими факторами. Различают детерминированные и стохастические структурно-логические факторные модели.

Создать детерминированную факторную систему – значит представить изучаемое явление в виде алгебраической суммы, частного или произведения нескольких факторов, определяющих его величину и находящихся с ним в функциональной зависимости.

Развитие детерминированной факторной системы (модели) достигается за счет детализации комплексных факторов до элементных, которые уже не возможно разложить на сомножители (или слагаемые).

Основная трудность при развитии факторной системы – это сложность нахождения факторов общего характера, которые можно было бы представить в виде алгебраической суммы, частного или произведения нескольких факторов. Однако исследование более конкретных факторов в АХД имеет большую ценность, чем исследование общих факторов.

Следовательно, совершенствование методики факторного анализа должно быть направленно на взаимосвязанное изучение конкретных факторов, которые находятся, как правило, в стохастической связи с результативным показателем.

Таким образом с целью повышения эффективности АХД предприятия в какой-то момент времени при проведении факторного анализа мы вынуждены будем перейти от детерминированного факторного анализа к стохастическому.

В стохастическом факторном анализе систематизация факторов так же играет большую роль, т.к. при систематизации возможно установление наличия или отсутствие причинно-следственных связей между исследуемыми показателями, изучение направления связей, формы зависимости, что очень важно при определении степени влияния каждого фактора и обобщения результатов анализа.

Для осуществления более четкой систематизации факторов, оценки места, роли и степени их влияния на результативный показатель все факторы в АХД классифицируются по каким-либо признакам.

Признаки классификации факторов:

1. По своей природе:

- природно-климатические (оказывают большое влияние в с/х, в лесном хозяйстве) – учет их влияния позволяет более точно оценить результаты работы предприятия;

- социально-экономические (жилищные условия работников, культурно-массовая работа, оздоровление трудящихся, образование кадров) – эти факторы способствуют более полному использованию производственных ресурсов и повышению эффективности работы предприятия.;

- производственно-экономические – определяют полноту и эффективность использования ресурсов, а так же конечные результаты деятельности предприятия.

2. По степени воздействия:

Основные (значимые) – оказывают наибольшее влияние на результативный показатель;

Второстепенные – оказывают не существенное влияние на результативный показатель.

Экономическая наука кроме своих специфических методов использует также и некоторые общенаучные методы - синтез, анализ, сравнения, абстракции и много другое. Одним из видов экономического анализа является факторный анализ, который представляет собой мощный инструмент, позволяющий не только разложить то или иное на составляющие, но и определить, какая составляющая оказывает то или иное влияние на процесс в целом. Более детально данный вид анализа рассмотрим в данной статье.

По определению, факторный анализ - это вид математического нескольких переменных, который позволяет определить, какое влияние на функцию оказывает та или иная переменная. Почему так важен именно в экономике? Все потому, что ни один не является зависимым лишь от одного фактора. Так, цена зависит от спроса и предложения, заработная плата - от трудоспособности сотрудника и отработанного времени, прибыль предприятия - от совокупности всех показателей деятельности фирмы вместе взятых. Но как определить, какой из факторов оказывает ключевое влияние на тот или иной показатель? Именно здесь нам пригодится факторный анализ.

Начнем с простого примера. Попробуем произвести факторный анализ себестоимости. На себестоимость продукции оказывают влияние такие факторы, как стоимость сырья, заработная плата рабочих, амортизация оборудования в расчете на единицу продукции.Выходит, что себестоимость является функцией от всех этих факторов, и, по сути, является суммой стоимостей всех затрат. Таким образом, возрастание каждого из этих видов затрат приведет к росту себестоимости единицы продукции. Логично предположить, что стоимость сырья в большинстве случаев занимает наибольшую долю в себестоимости продукции. Можем сделать вывод, что именно она оказывает наибольшее влияние на себестоимость, и значит, именно на поиске более дешевого сырья необходимо сконцентрироваться поиске резервов снижения себестоимости.

Попробуем произвести факторный Тут все несколько сложнее, ведь есть факторы, способствующие как росту, так и снижению производительности. Среди факторов, способствующих росту - качество и надежность оборудования, квалификация персонала, удобство работы персонала, соотношение рабочего времени и перерывов в работе. Среди факторов, снижающих производительность - количество случаев выхода оборудования из строя, наличие «узких мест» - участков производства с недостаточной производственной мощностью, отвлекающие факторы - шумы, вибрации и прочие внешние раздражители. Конечно же, все вышеуказанные факторы будут иметь в функции различные коэффициенты, и именно с их помощью будет выражаться степень влияния того или иного фактора на производительность труда, однако общий принцип понятен: действие факторов, повышающих производительность, необходимо усиливать, а факторов, понижающих эффективность труда - минимизировать.

Проведя факторный анализ того или иного явления в экономике, можно составить некий план действий, согласно которому можно будет с минимальными затратами времени и ресурсов максимизировать или минимизировать некоторые показатели деятельности фирмы. Это поможет в кратчайшие сроки сделать так, чтобы фирма работала максимально эффективно и прибыльно. Широко применяется факторный анализ и в макроэкономике - анализируется объем ВВП, соотношение экспорта и импорта, вычисляется необходимое количество в обращении и многие другие показатели эффективности функционирования экономики страны.

Федеральное агентство по образованию

Государственное образовательное учреждение

высшего профессионального образования

Тамбовский государственный университет им. Г.Р.Державина

Академия экономики и управления

Реферат

по статистике на тему: «Факторный метод анализа»

Выполнила: студентка 201 группы

Букатина Анастасия

Проверила: Золотухина В.Н.

Тамбов 2010

    Краткая история

    Задачи и условия факторного анализа

    Процедура вращения. Выделение и интерпретация факторов

    Список литературы

Факторный анализ - многомерный статистический метод, применяемый для изучения взаимосвязей между значениями переменных.

    Краткая история

Факторный анализ впервые возник в психометрике и в настоящее время широко используется не только в психологии, но и в нейрофизиологии, социологии, политологии, в экономике, статистике и других науках. Основные идеи Факторного анализа были заложены английским психологом и антропологом, основателем евгеники Гальтоном Ф. (1822-1911), внесшим также большой вклад в исследование индивидуальных различий. Но в разработку Факторного анализа внесли вклад многие ученые. Разработкой и внедрением Факторного анализа в психологию занимались такие ученые как: Спирмен Ч. (1904, 1927, 1946), Терстоун Л. (1935, 1947, 1951) и Кеттел Р. (1946, 1947, 1951) Также нельзя не упомянуть английского математика и философа Пирсона К., в значительной степени развившего идеи Ф. Гальтона, американского математика Хотеллинга Г., разработавшего современный вариант метода главных компонент. Внимания заслуживает и английский психолог Айзенк Г., широко использовавший Факторный анализ для разработки психологической теории личности. Математически факторный анализ разрабатывался Хотеллингом, Харманом, Кайзером, Терстоуном, Такером и др. Сегодня факторный анализ включён во все пакеты статистической обработки данных - R, SPSS, SAS, Statistica и т. д.

    Задачи и условия факторного анализа

Факторный анализ позволяет решить две важные проблемы исследователя: описать объект измерения всесторонне и в то же время компактно . С помощью факторного анализа возможно выявление скрытых переменных факторов, отвечающих за наличие линейных статистических связей корреляций между наблюдаемыми переменными.

Например, анализируя оценки полученные по нескольким шкалам, исследователь замечает, что они сходны между собой и имеют высокий коэффициент корреляции, он может предположить, что существует некоторая латентная переменная, с помощью которой можно объяснить наблюдаемое сходство полученных оценок. Такую латентную переменную называют фактором . Данный фактор влияет на многочисленные показатели других переменных, что приводит нас к возможности и необходимости выделить его как наиболее общий, более высокого порядка.

Таким образом можно выделить 2 цели Факторного анализа:

    определение взаимосвязей между переменными, их классификация, т. н. «объективная R-классификация»;

    сокращение числа переменных.

Для выявления наиболее значимых факторов и, как следствие, факторной структуры, наиболее оправданно применять метод главных компонент (МГК). Суть данного метода состоит в замене коррелированных компонент некоррелированными факторами. Другой важной характеристикой метода является возможность ограничиться наиболее информативными главными компонентами и исключить остальные из анализа, что упрощает интерпретацию результатов. Достоинство МГК также в том, что он - единственный математически обоснованный метод факторного анализа .

Факторный анализ может быть 1) разведочным - он осуществляется при исследовании скрытой факторной структуры без предположения о числе факторов и их нагрузках; и 2) конфирматорным , предназначенным для проверки гипотез о числе факторов и их нагрузках (примечание 2). Практическое выполнение факторного анализа начинается с проверки его условий. В обязательные условия факторного анализа входят:

    Все признаки должны быть количественными.

    Число признаков должно быть в два раза больше числа переменных.

    Выборка должна быть однородна.

    Исходные переменные должны быть распределены симметрично.

    Факторный анализ осуществляется по коррелирующим переменным .

При анализе в один фактор объединяются сильно коррелирующие между собой переменные, как следствие происходит перераспределение дисперсии между компонентами и получается максимально простая и наглядная структура факторов. После объединения коррелированность компонент внутри каждого фактора между собой будет выше, чем их коррелированность с компонентами из других факторов. Эта процедура также позволяет выделить латентные переменные, что бывает особенно важно при анализе социальных представлений и ценностей.

    Процедура вращения. Выделение и интерпретация факторов

Сущностью факторного анализа является процедура вращения факторов, то есть перераспределения дисперсии по определённому методу. Вращение бывает ортогональным и косоугольным . При первом виде вращения каждый последующий фактор определяется так, чтобы максимизировать изменчивость, оставшуюся от предыдущих, поэтому факторы оказываются независимыми, некоррелированными друг от друга (к этому типу относится МГК). Второй вид - это преобразование, при котором факторы коррелируют друг с другом. Преимущество косоугольного вращения состоит в следующем: когда в результате его выполнения получаются ортогональные факторы, можно быть уверенным, что эта ортогональность действительно им свойственна, а не привнесена искусственно. Однако если цель ортогональных вращений - определение простой структуры факторных нагрузок, то целью большинства косоугольных вращений является определение простой структуры вторичных факторов, то есть косоугольное вращение следует использовать в частных случаях. Поэтому ортогональное вращение предпочтительнее. Существует около 13 методов вращения в обоих видах, в статистической программе SPSS 10 доступны пять: три ортогональных, один косоугольный и один комбинированный, однако из всех наиболее употребителен ортогональный метод «варимакс ». Метод «варимакс» максимизирует разброс квадратов нагрузок для каждого фактора, что приводит к увеличению больших и уменьшению малых значений факторных нагрузок. В результате простая структура получается для каждого фактора в отдельности.

Главной проблемой факторного анализа является выделение и интерпретация главных факторов. При отборе компонент исследователь обычно сталкивается с существенными трудностями, так как не существует однозначного критерия выделения факторов, и потому здесь неизбежен субъективизм интерпретаций результатов. Существует несколько часто употребляемых критериев определения числа факторов. Некоторые из них являются альтернативными по отношению к другим, а часть этих критериев можно использовать вместе, чтобы один дополнял другой:

    Критерий Кайзера или критерий собственных чисел . Этот критерий предложен Кайзером, и является, вероятно, наиболее широко используемым. Отбираются только факторы с собственными значениями равными или большими 1. Это означает, что если фактор не выделяет дисперсию, эквивалентную, по крайней мере, дисперсии одной переменной, то он опускается.

    Критерий каменистой осыпи или критерий отсеивания . Он является графическим методом, впервые предложенным психологом Кэттелом. Собственные значения возможно изобразить в виде простого графика. Кэттел предложил найти такое место на графике, где убывание собственных значений слева направо максимально замедляется. Предполагается, что справа от этой точки находится только «факториальная осыпь» - «осыпь» является геологическим термином, обозначающим обломки горных пород, скапливающиеся в нижней части скалистого склона. Однако этот критерий отличается высокой субъективностью и, в отличие от предыдущего критерия, статистически необоснован. Недостатки обоих критериев заключаются в том, что первый иногда сохраняет слишком много факторов, в то время как второй, напротив, может сохранить слишком мало факторов; однако оба критерия вполне хороши при нормальных условиях, когда имеется относительно небольшое число факторов и много переменных.

На практике возникает важный вопрос: когда полученное решение может быть содержательно интерпретировано. В этой связи предлагается использовать ещё несколько критериев.

    Критерий значимости . Он особенно эффективен, когда модель генеральной совокупности известна и отсутствуют второстепенные факторы. Но критерий непригоден для поиска изменений в модели и реализуем только в факторном анализе по методу наименьших квадратов или максимального правдоподобия.

    Критерий доли воспроизводимой дисперсии . Факторы ранжируются по доле детерминируемой дисперсии, когда процент дисперсии оказывается несущественным, выделение следует остановить. Желательно, чтобы выделенные факторы объясняли более 80 % разброса. Недостатки критерия: во-первых, субъективность выделения, во-вторых, специфика данных может быть такова, что все главные факторы не смогут совокупно объяснить желательного процента разброса. Поэтому главные факторы должны вместе объяснять не меньше 50,1 % дисперсии.

    Критерий интерпретируемости и инвариантности . Данный критерий сочетает статистическую точность с субъективными интересами. Согласно ему, главные факторы можно выделять до тех пор, пока будет возможна их ясная интерпретация. Она, в свою очередь, зависит от величины факторных нагрузок, то есть если в факторе есть хотя бы одна сильная нагрузка, он может быть интерпретирован. Возможен и обратный вариант - если сильные нагрузки имеются, однако интерпретация затруднительна, от этой компоненты предпочтительно отказаться.

Практика показывает, что если вращение не произвело существенных изменений в структуре факторного пространства, это свидетельствует о его устойчивости и стабильности данных. Возможны ещё два варианта: 1). сильное перераспределение дисперсии - результат выявления латентного фактора; 2). очень незначительное изменение (десятые, сотые или тысячные доли нагрузки) или его отсутствие вообще, при этом сильные корреляции может иметь только один фактор, - однофакторное распределение. Последнее возможно, например, когда на предмет наличия определённого свойства проверяются несколько социальных групп, однако искомое свойство есть только у одной из них.

Факторы имеют две характеристики: объём объясняемой дисперсии и нагрузки. Если рассматривать их с точки зрения геометрической аналогии, то касательно первой отметим, что фактор, лежащий вдоль оси ОХ, может максимально объяснять 70 % дисперсии (первый главный фактор), фактор, лежащий вдоль оси ОУ, способен детерминировать не более 30 % (второй главный фактор). То есть в идеальной ситуации вся дисперсия может быть объяснена двумя главными факторами с указанными долями . В обычной ситуации может наблюдаться два или более главных факторов, а также остаётся часть неинтерпретируемой дисперсии (геометрические искажения), исключаемая из анализа по причине незначимости. Нагрузки, опять же с точки зрения геометрии, есть проекции от точек на оси ОХ и ОУ (при трёх- и более факторной структуре также на ось ОZ). Проекции - это коэффициенты корреляции, точки - наблюдения, таким образом, факторные нагрузки являются мерами связи. Так как сильной считается корреляция с коэффициентом Пирсона R ≥ 0,7, то в нагрузках нужно уделять внимание только сильным связям. Факторные нагрузки могут обладать свойством биполярности - наличием положительных и отрицательных показателей в одном факторе. Если биполярность присутствует, то показатели, входящие в состав фактора, дихотомичны и находятся в противоположных координатах.

Методы факторного анализа:

    метод главных компонент

    корреляционный анализ

    метод максимального правдоподобия

Список литературы:

    Индивидуальные различия. Колин Купер. Москва, Аспект Пресс, 2000 г., 527 стр.

    Измерение в психологии. А. Н. Гусев, Ч. А. Измайлов, М. Б. Михалевская. Москва, Смысл, 1997 г., 287 стр.

    Факторный анализ для психологов. О. В. Митина, И. Б. Михайловская. Москва, Учебно-методический коллектор Психология, 2001 г, 169 стр.

    Статистический анализ: подход с применением ЭВМ. А. Афифи, С. Эйзен. Москва, Мир, 1982 г., 488 стр.

    Факторный, дискриминантный и кластерный анализ, сборник работ под ред. Енюкова И. С. Москва, Финансы и статистика, 1989, 215 стр.

    SPSS для социологов. Пациорковский В. В., Пациорковская В. В. Учебное пособие ИСЭПН РАН, Москва, 2005, 433 стр.

    SPSS: Искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. Бююль А., Цёфель П. СПб., ООО «ДиаСофтЮП», 2002, 603 стр.

    Электронный учебник по статистике. Москва, StatSoft. WEB: www.statsoft.ru/home/textbook/default.htm.

Одним из основных инструментов экономических исследований является факторный анализ, представляющий собой раздел многомерного статистического анализа, объединяющего методы оценки размерности множества наблюдаемых переменных посредством исследования структуры ковариационных или корреляционных матриц. В отличие от других методов анализа, он позволяет аналитикам решить две основные задачи: компактно и всесторонне описать предмет измерения и выявить отвечающие за наличие линейных статистических корреляционных связей между наблюдаемыми переменными факторы.

Оправданно применяя метод главных компонентов, предназначенных для замены коррелированных факторов некоррелированными, а также ограничиваясь исследованием наиболее существенных информативных факторов и исключая остальные из анализа, упростив тем самым интерпретацию результатов, факторный анализ предстает как методика комплексного и системного исследования зависимости остальных факторов от величины критериального результативного показателя.

Основными типами факторного анализа являются: детерминированный, функциональный (результативный критериальный показатель, представляющий собой произведение частных или алгебраическую сумму факторов); стохастический, корреляционный (при наличии между результативным и факторными показателями неполной или вероятностной связи); прямой, дедуктивный (от общего к частному); обратный, индуктивный (от частного к общему); статический и динамический; ретроспективный и перспективный; одноступенчатый и многоступенчатый.

Факторный анализ начинают с проверки его обязательных условий, согласно которым: все признаки являются количественными; число признаков в два раза превышает число переменных; выборка однородна; распределение исходных переменных носит симметричный характер; изучение факторов осуществляется по коррелирующим переменным. Факторный анализ проводится в несколько этапов: отбор факторов; классификация и систематизация факторов; моделирование взаимосвязей между результативными и факторными показателями; расчет влияния факторов и оценка роли каждого из них в изменении величины результативного показателя; практическое использование факторной модели (подсчет резервов прироста результативного показателя). По характеру взаимосвязи между показателями различают методы детерминированного и стохастического факторного анализа (табл. 1.5).

Методы факторного анализа

Таблица 1.5

Методы

Краткая характеристика

Детерминированный факторный анализ

Детерминированный факторный анализ - это методика влияния факторов, функционально связанных с критериальным результативным показателем, позволяющим представить критериальный показатель факторной модели как частное, произведение или алгебраическую сумму переменных. Детерминированному факторному анализу свойственны следующие методы: цепных подстановок; абсолютных разниц; относительных разниц; интегральный; логарифмирования

Стохастический

Стохастический анализ - методика исследования факторов, связь с критериальным результативным показателем которых носит, в отличие от функциональной связи, неполный, вероятностный (корреляционный) характер. При корреляционной связи путем изменения аргумента в зависимости от сочетания других переменных, влияющих на величину показателя результативного показателя, можно получить ряд значений прироста функции, в то время как при функциональной (полной) зависимости изменение аргумента всегда приводит к соответствующим изменениям функции. Стохастический анализ проводится с помощью применения следующих методов факторного анализа: парной корреляции; множественного корреляционного анализа; матричной модели; математического программирования; теории игр

Статический и динамический

Статический факторный анализ практикуется в целях оценки влияния факторов на критериальные результативные показатели на конкретную дату, а динамический - для выявления динамики причинно-следственных связей

Ретроспективный и перспективный

Факторный анализ может носить как ретроспективный характер (выявлять причины изменения величины результативного показателя за прошедший период), так и перспективный (исследовать влияние факторов на значение критериального показателя в перспективе)

Для проведения экономического анализа важное значение имеет применение детерминированного моделирования и разных типов факторных детерминированных моделей, предназначенных для моделирования корреляций между критериальным результативным фактором и остальными переменными факторными показателями. Суть данного моделирования заключается в представлении взаимосвязи исследуемого показателя с факторами как конкретное математическое уравнение, выражающее функциональную или корреляционную связь.

Детерминированные факторные модели позволяют исследовать функциональную зависимость между исследуемыми показателями в случае соблюдения при построении факторной модели следующих требований: факторы, включенные в модель, должны быть реальными, а не абстрактными; факторы должны быть в причинно-следственной взаимосвязи с исследуемым результативным показателем; показатели факторной модели должны быть количественно измеримы; должна быть возможность измерения влияния отдельных факторов; вначале в факторную модель записываются количественные факторы, затем качественные; если в факторной модели присутствует несколько количественных или качественных факторов, то вначале записываются факторы более высокого порядка, а затем - более низкого.

Наибольшее распространение в факторном анализе получили следующие типы детерминированных факторных моделей (табл. 1.6).

Типы детерминированных факторных моделей

Таблица 1.6

Факторные

модели

Краткая характеристика

Аддитивные

Используются, если критериальный результативный показатель представлен в виде алгебраической суммы ряда факторных параметров показателей:

Разработанная факторная модель может быть подвергнута дополнительным преобразованиям при возникновении углубления проводимого исследования, с использованием в этих целях ряда способов и приемов. Оттого, насколько реально и точно разработанные модели отражают взаимосвязь между исследуемыми показателями, зависят конечные результаты экономического анализа бизнеса организации. Моделирование аддитивных факторных систем предполагает осуществление последовательного разложения факторов исходной факторной системы на составные переменные:

у = a + b.

Так, факторы первого уровня а и b зависят, в свою очередь, от ряда других факторов:

a = с + d, b = е + m,

y = c + d + e + m.

Факторные

модели

Краткая характеристика

Мультипликативные модели

Применяются в тех случаях, когда критериальный результативный показатель выражается в виде произведения ряда факторных показателей:

Суть моделирования мультипликативных факторных систем кроется в детальном последовательном разложении комплексных факторов исходной факторной системы на факторы-сомножители:

у = Я X Ь.

Величина факторов первого уровня а и Ь, в свою очередь, зависят от ряда других факторов:

a = с х, b = е х т,

y=cxd*exm

Кратные модели

Если критериальный результативный показатель можно определить как отношение одного факторного показателя к другому, то

Различают следующие способы преобразования факторных кратных моделей:

1) удлинение (преобразовывает числитель, заменяя один фактор или ряд факторов на сумму однородных показателей):

2) формальное разложение (удлиняет знаменатель, заменяя один или ряд факторов на сумму или произведение однородных показателей):

3) расширение (преобразовывает исходную факторную модель, умножая числитель и знаменатель соотношения на один показатель или несколько новых показателей):

Критериальные результативные показатели можно разложить на факторы различными способами и представить как различные типы детерминированных моделей факторов. Способ моделирования выбирают в зависимости от объекта исследования и поставленных целей, а также от профессиональных знаний и навыков аналитика.

Большинство способов оценки факторов в моделях детерминации основаны на элиминировании, наиболее универсальным методом в котором являются цепные подстановки, используемые для того, чтобы измерить влияние факторов во всех типах моделей факторной детерминации: мультипликативных, аддитивных, кратных и смешанных (комбинированных). Благодаря данному способу можно оценить как отдельные факторы оказывают влияние на величину критериального результативного показателя, постепенно заменяя базисную величину каждого фактора показателя в составе критериального показателя на фактическую величину в отчетном периоде. Для этого исчисляют ряд условных значений критериального результативного показателя, учитывающих последовательное изменение одного, двух и более факторов, при неизменном значении остальных. Сравнительная оценка изменения величины критериального параметра до и после изменения уровня того или иного фактора позволяет исключать (элиминировать) влияние всех факторов, за исключением того, воздействие которого на прирост результативного показателя определяется.

Влияние того или иного показателя оценивается благодаря последовательному вычитанию: из второго расчета первого, из третьего - второго и т.д. В первом расчете все величины являются плановыми, в последнем - фактическими. Например, алгоритм расчета при трехфакторной мультипликативной модели выглядит следующим образом:

В алгебраическом виде сумма влияния факторов равноценна общему приросту критериального результативного показателя:

При несоблюдении указанного равенства аналитику следует искать ошибки в произведенных им расчетах. Исходя из этого, разработано правило, согласно которому следует, что число расчетов на единицу больше числа показателей приведенного уравнения.

При использовании метода цепных подстановок предполагается обеспечение соблюдения строгой последовательности подстановки, ибо ее произвольное изменение чревато искажением результатов анализа. В процессе аналитических процедур целесообразно выявить влияние в первую очередь количественных показателей, затем - качественных. Например, требуется оценить влияние численности работников и производительности труда на объем производства промышленной продукции. Для этого сначала оценивается влияние количественного показателя (численности работников), а затем - качественного показателя (производительности труда).

Метод цепной подстановки обладает существенным недостатком, так как при его использовании следует считать, что величины факторов меняются независимо друг от друга. Хотя в действительности они изменяются одновременно и во взаимосвязи, что влечет за собой дополнительный прирост результативного показателя, как правило, присоединяемый к последнему из исследуемых факторов. Таким образом, величина влияния факторов на изменение результативного показателя зависит от месторасположения того или иного фактора в схеме аналитической модели. Этим объясняется разница в расчетах при изменении последовательности подстановки. Таким образом, степень влияния факторов на изменение критериального показателя колеблется в зависимости от места фактора в модели детерминации. Этот недостаток детерминированного факторного анализа устраняется благодаря использованию более сложного интегрального метода, позволяющего оценить влияние факторов в мультипликативных, кратных и смешанных моделях кратно-аддитивного вида.

Способ абсолютных разниц - это модификация способа цепной подстановки, в котором изменение критериального показателя за счет каждого фактора способом абсолютных разниц определяется как произведение отклонения изучаемого фактора на базисное или отчетное значение другого фактора в зависимости от выбранной последовательности подстановки:

Способ относительных разниц предназначен для оценки влияния факторов на прирост критериального показателя в мультипликативных и смешанных моделях вида:

Он предполагает нахождение относительного отклонения каждого факторного показателя и определение направления и размера влияния факторов в процентах путем последовательного вычитания (из первого - всегда 100%).

При применении способа сокращенных подстановок показатели для расчета представляют собой промежуточные произведения с последовательным накоплением влияющих факторов. Производятся подстановки, а затем путем последовательного вычитания находятся размеры влияния факторов.

Интегральный метод позволяет достигнуть полного разложения результативного показателя по факторам и носит универсальный характер, т.е. применим к мультипликативным, кратным и смешанным моделям. Изменение критериального показателя измеряется на бесконечно малых отрезках времени, путем суммирования приращения результата, определяемого как частные произведения, умноженные на приращения факторов на бесконечно малых промежутках.

Применение интегрального метода обеспечивает более высокую точность расчетов влияния факторов по сравнению со способами цепной подстановки, абсолютных и относительных разниц, позволяя устранить неоднозначную оценку влияния, ибо в данном случае результаты не зависят от местоположения факторов в модели, а дополнительный прирост результативного показателя, возникающий из-за взаимодействия факторов, распределяется между ними равномерно.

Для распределения дополнительного прироста недостаточно взять его часть, соответствующую количеству факторов, так как факторы могут действовать в разных направлениях. Поэтому изменение результативного показателя измеряется на бесконечно малых отрезках времени путем суммирования приращения результата, определяемого как частные произведения, умноженные на приращения факторов на бесконечно малых промежутках. Операция вычисления определенного интеграла сводится к построению подынтегральных выражений, зависящих от вида функции или модели факторной системы.

В связи со сложностью вычисления некоторых определенных интегралов и дополнительных трудностей, связанных с возможным действием факторов в противоположных направлениях, на практике используются специально сформированные рабочие формулы:

1. Модель вида

2. Модель вида

3. Модель вида

4. Модель вида

К основным приемам элиминирования, которые опираются на относительные показатели динамики, пространственных сравнений, выполнения плана (оцениваемых отношением фактического уровня исследуемого показателя со сравниваемым), относится индексный метод.

Индексные модели позволяют построить количественную оценку роли отдельных факторов в тенденциях динамики изменений обобщающих показателей в статистике, планировании и экономическом анализе. Расчет любого индекса предполагает сопоставление соизмеряемой величины с базисной. Если индекс отражается в виде соотношения непосредственно соизмеряемых величин, то его называют индивидуальным, а если индекс представляет соотношения сложных явлений, то групповым, или тотальным. Различают несколько форм индексов (агрегатные, арифметические, гармонические).

Основу любой формы общего индекса составляет агрегатный индекс, позволяющий оценить степень влияния различных факторов на изменение уровня критериальных показателей в мультипликативных и кратных моделях. На корректность определения размера каждого фактора влияют: количество знаков после запятой (не менее четырех); количество самих факторов (связь обратно пропорциональна).

Принципами построения агрегатных индексов являются: изменение одного фактора при неизменном значении всех остальных. При этом если обобщающий экономический показатель представляет собой произведение количественного (объемного) и качественного показателей факторов, то при определении влияния количественного фактора качественный показатель фиксируется на базисном уровне, а при определении влияния качественного фактора количественный показатель фиксируется на уровне отчетного периода.

Допустим, что Y - а * b * с х d,

а;

Факторный индекс, показывающий, как изменяется показатель b и т.д.;

Так называемый «общий индекс изменений в результирующем показателе» в зависимости от всех факторов.

При этом

С помощью индексного метода можно разложить по факторам не только относительные, но и абсолютные отклонения обобщающего показателя, определяя при этом влияние отдельных факторов с помощью разности между числителем и знаменателем соответствующих индексов, т.е. при расчете влияния одного фактора элиминируя влияние другого:

С помощью индексного метода факторного анализа можно разложить по факторам не только относительные, но и абсолютные отклонения в обобщающем показателе. Другими словами, влияние отдельного фактора можно определить при помощи разности между числителем и знаменателем соответствующих индексов, т.е. при расчете влияния одного фактора элиминируя влияние другого.

Допустим:

где а - количественный фактор, а b - качественный,

показателя за счет фактора а ;

Абсолютный прирост результирующего

показателя за счет фактора Ь

- абсолютный прирост результирующего

показателя за счет влияния всех факторов.

Рассмотренный принцип разложения абсолютного прироста обобщающего показателя по факторам целесообразно применять, если число факторов равно двум (один из них количественный, другой - качественный), а анализируемый показатель представлен как их произведение, так как теория индексов не дает общего метода разложения абсолютных отклонений обобщающего показателя по факторам при числе факторов более двух. Для решения этой задачи используется метод цепных подстановок.

Методы факторного анализа успешно применяются в целях объективной оценки влияния факторов на критериальный показатель деятельности организации. В качестве одного из примеров такого подхода рассмотрим, каким образом изменения в объеме реализации продукции оказывают влияние на финансовые результаты деятельности организации. Как правило, изменение выручки от реализации происходит вследствие: 1) изменения объема реализации (в натуральном выражении); 2) изменения отпускных цен. Общее изменение выручки от реализации может быть представлено в виде суммы факторных отклонений:

где N x - выручка отчетного года;

N 0 - выручка базисного года;

А N - изменение выручки в результате изменения объема реализации;

AN p - изменение выручки в результате изменения отпускных цен на продукцию;

AN c - изменение выручки в результате изменения структуры реализации продукции.

Представим выручку (N) как произведение цены реализации (Р) на объем реализации (Q ):

N 0 = Р 0 х Q 0 - выручка базисного года;

jV, = Р, х (2, - выручка отчетного года.

Оценка влияния изменения объема реализации продукции (при неизменных ценах) на изменение выручки производится следующим образом:

Оценка влияния изменения цены реализации (при неизменном объеме) на изменение выручки осуществляется следующим образом:

В процессе анализа определяется влияние такого фактора, как изменение структуры реализации, а также удельный вес отдельных ассортиментных позиций в общем объеме реализации в базисном и анализируемом периодах, а затем рассчитывается влияние структурных сдвигов на общий объем реализации. Недополученная выручка в результате изменения ассортимента реализованной продукции оценивается отрицательно, а сверхплановая выручка - положительно.

Введение в факторный анализ

В течение последних лет факторный анализ нашел свое применение среди широкого круга исследователей в основном благодаря развитию высокоскоростных компьютеров и пакетов статистических программ (например, DATATEXT, BMD, OSIRIS, SAS и SPSS). Это также коснулось большой группы пользователей, не имеющих соответствующей математической подготовки, но, тем не менее, заинтересованных в использовании потенциальных возможностей факторного анализа в своих исследованиях (Harman, 1976; Horst, 1965; Lawley и Maxswel, 1971; Mulaik, 1972).

Факторный анализ предполагает, что изучаемые переменные представляют собой линейную комбинацию некоторых скрытых (латентных) ненаблюдаемых факторов. Иными словами, существует система факторов и система изучаемых переменных. Определенная зависимость между этими двумя системами позволяет посредством факторного анализа с учетом имеющейся зависимости получать выводы по изучаемым переменным (факторам). Логическая сущность этой зависимости состоит в том, что каузальная система факторов (система независимых и зависимых переменных) всегда имеет уникальную корреляционную систему изучаемых переменных, а не наоборот. Только при жестко ограниченных условиях, налагаемых на факторный анализ, возможна недвусмысленная интерпретация каузальных структур по факторам на наличие корреляции между изучаемыми переменными. Кроме этого, существуют проблемы и другой природы. Например, при сборе эмпирических данных возможно допущение разного рода ошибок и неточностей, что в свою очередь затрудняет работу по выделению скрытых ненаблюдаемых параметров и их дальнейшего исследования.

Что же такое факторный анализ? Факторный анализ относится к множеству статистических техник, основная задача которых состоит в представлении множества изучаемых признаков в виде сокращенной системы гипотетических переменных. Факторный анализ - исследовательский эмпирический метод, который преимущественно находит свое применение в социальных и психологических дисциплинах.

В качестве примера использования факторного анализа можно рассмотреть изучение свойств личности с помощью психологических тестов. Свойства личности не поддаются прямому измерению, о них можно судить только на основании поведения человека, ответов на те или иные вопросы и т.д. Для объяснения собранных эмпирических данных их результаты подвергаются факторному анализу, который и позволяет выявить те личностные свойства, которые оказывали влияние на поведение испытуемых в проведенных опытах.

Первым этапом факторного анализа, как правило, является выбор новых признаков, которые являются линейными комбинациями прежних и «вбирают» в себя большую часть общей изменчивости наблюдаемых данных, а поэтому передают большую часть информации, заключенной в первоначальных наблюдениях. Обычно это осуществляют с помощью метода главных компонент, хотя иногда используют и другие приемы (например, метод главных факторов, метод максимального правдоподобия).

    Метод главных компонент– статистический прием, позволяющий преобразовывать исходные переменные в их линейную комбинацию (GeorgH.Dunteman). Цель метода – получить сокращенную систему исходных данных, которая намного проще для понимания и дальнейшей статистической обработки. Этот подход был предложен Пирсоном (1901) и независимо от него получил свое дальнейшее развитие у Хотеллинга (1933). Автор пытался минимизировать использование матричной алгебры при работе с данным методом.

Основная цель метода главных компонент – выделение первичных факторов и определение минимального числа общих факторов, которые удовлетворительно воспроизводят корреляции между изучаемыми переменными. Результат данного шага – матрица коэффициентов факторных нагрузок, представляющих собой в ортогональном случае коэффициенты корреляции между переменными и факторами. При определении числа выделяемых факторов используется следующий критерий: выделяются только факторы с собственными значениями больше указанной константы (как правило, единицы).

Однако обычно факторы, полученные методом главных компонент, не поддаются достаточно наглядной интерпретации. Поэтому следующим шагом факторного анализа является преобразование (вращение) факторов таким образом, чтобы облегчить их интерпретацию. Вращение факторов состоит в нахождении наиболее простой факторной структуры, то есть такого варианта оценки факторных нагрузок и остаточных дисперсий, который и дает возможность содержательно интерпретировать общие факторы и нагрузки.

    Наиболее часто исследователями в качестве метода вращения используется метод варимакс. Это метод, позволяющий, с одной стороны, за счет минимизации разброса квадратов нагрузок для каждого фактора, получить упрощенную факторную структуру за счет увеличения больших и уменьшения малых факторных нагрузок, с другой стороны.

Итак, основные цели факторного анализа:

    сокращение числа переменных (редукция данных);

    определение структуры взаимосвязей между переменными, т.е. классификация переменных .

Поэтому факторный анализ используется или как метод сокращения данных или как метод классификации.

Практические примеры и советы по применению факторного анализа можно, найти в книге Стивенса (Stevens, 1986); более подробное описание приводят Кули и Лонес (Cooley, Lohnes, 1971); Харман (Harman, 1976); Ким и Мюллер (Kim, Mueller, 1978a, 1978b); Лоули и Максвелл (Lawley, Maxwell, 1971); Линдеман, Меренда и Голд (Lindeman, Merenda, Gold, 1980); Моррисон (Morrison, 1967) и Мулэйк (Mulaik, 1972). Интерпретация вторичных факторов в иерархическом факторном анализе, как альтернатива традиционному вращению факторов, дана Верри (Wherry, 1984).

Вопросы подготовки данных для применения

факторного анализа

Рассмотрим ряд вопросов и кратких ответов в рамках использования факторного анализа.

    Какой уровень измерений требует факторный анализ или, иными словами, в каких шкалах измерений должны представляться данные для факторного анализа?

Факторный анализ требует, чтобы переменные были представлены в интервальной шкале (Stevens, 1946) и отвечали нормальному распределению. Это требование предполагает также, что в качестве входных данных используются ковариационные или корреляционные матрицы.

    Должен ли исследователь избегать использования факторного анализа, когда метрическая основа переменных определена неточно, т.е. данные представлены в порядковой шкале?

Нет необходимости. Многие переменные, представляющие, например, измерения мнений испытуемых по большому количеству тестов, не имеют точно установленной метрической базы. Однако, в общем, предполагается, что многие «порядковые переменные» могут содержать числовые значения, не искажающие и даже сохраняющие основные свойства изучаемого признака. Задачи исследователя: а) правильно определить число рефлексивно выделяемых порядков (уровней); б) учесть, что сумма допущенных искажений будет включена в корреляционную матрицу, являющуюся основой входных данных факторного анализа; в) коэффициенты корреляции закрепляются в качестве «порядковых» искажений в измерениях (Labovitz, 1967, 1970;Kim, 1975).

Долгое время считалось, что искажения назначаются числовым значениям именно порядковых категорий. Однако это необоснованно, поскольку и для метрических величин возможны искажения, пусть даже минимальные, в процессе проведения эксперимента. В факторном анализе результаты зависят от возможного допущения ошибок, получаемых в процессе измерения, а не их происхождения и соотнесения к данным определенного типа шкал.

    Можно ли использовать факторный анализ для номинальных (дихотомических) переменных?

Многие исследователи утверждают, что использовать факторный анализ для номинальных переменных очень удобно. Во-первых, дихотомические значения (значения, равные «0» и «1») исключают выбор каких-либо иных, отличных от них. Во-вторых, как результат, коэффициент связи является эквивалентом коэффициента корреляции Пирсона, который и выступает в качестве числового значения переменной для факторного анализа.

Однако однозначно положительного ответа на данный вопрос нет. Дихотомические переменные сложно выразить в рамках аналитической факторной модели: каждая переменная имеет значение весовой нагрузки, по крайней мере, двух основных факторов - общего и частного (Kim,Muller). Даже если эти факторы имеют два значения (что довольно редко встречается в реальных факторных моделях), то итоговые результаты в наблюдаемых переменных должны содержать, как минимум, четыре различных значения, которые, в свою очередь, и оправдывают противоречивость использования номинальных переменных. Поэтому факторный анализ для таких переменных используется с целью получения ряда эвристических критериев.

    Сколько должно быть переменных для каждого гипотетически построенного фактора?

Предполагается, что для каждого фактора должно быть, по крайней мере, три переменные. Но это требование опускается, если факторный анализ используется для подтверждения какой-либо гипотезы. В общем, исследователи едины в том, что необходимо иметь, по крайней мере, вдвое больше переменных, чем факторов.

Еще один момент касательно данного вопроса. Чем больше размер выборки, тем достовернее значение критерия ХИ -квадрат. Результаты считаются статистически значимыми, если выборка включает как минимум 51 наблюдение. Таким образом:

N-n-150,(3.33)

где N – размер выборки (число измерений),

n – количество переменных (Lawley, Maxwell, 1971).

Это, конечно, только общее правило.

    Какой смысл имеет знак факторной нагрузки?

Сам знак не имеет существенного значения и не существует пути для оценки значимости связи между переменной и фактором. Однако знаки переменных, входящих в фактор, имеют специфическое значение относительно знаков других переменных. Различные знаки просто означают, что переменные связаны с фактором в противоположных направлениях.

Например, по результатам факторного анализа было получено, что для пары качеств открытый-замкнутый (многофакторный опросник Кетелла) имеют место соответственно положительная и отрицательная весовые нагрузки. Тогда говорят, что доля качестваоткрытый, в выделенном факторе больше, чем доля качествазамкнутый.

Главные компоненты и факторный анализ

    Факторный анализ как метод редукции данных

Предположим, что проводится (до некоторой степени "глупое") исследование, в котором измеряется рост ста людей в метрах и сантиметрах. Таким образом, имеются две переменные. Если далее исследовать, например, влияние разных пищевых добавок на рост, будет ли целесообразным использовать обе переменные? Вероятно, нет, т.к. рост является одной характеристикой человека, независимо от того, в каких единицах он измеряется.

Предположим, что измеряется удовлетворенность людей жизнью с помощью опросника, содержащего различные пункты. Задаются, например, вопросы: удовлетворены ли люди своим хобби (пункт 1) и как интенсивно они им занимаются (пункт 2). Результаты преобразуются так, что средние по уровню ответы (например, для удовлетворенности) соответствуют значению 100, в то время как ниже и выше средних ответов расположены меньшие и большие значения, соответственно. Две переменные (ответы на два разных пункта) коррелированы между собой. Из высокой коррелированности двух этих переменных можно сделать вывод об избыточности двух пунктов опросника. Это, в свою очередь, позволяет осуществить объединение двух переменных в один фактор.

Новая переменная (фактор) будет включать в себя наиболее существенные черты обеих переменных. Итак, фактически, выполнено сокращение исходного числа переменных и осуществлена замена двух переменных одной. Отметим, что новый фактор (переменная) в действительности является линейной комбинацией двух исходных переменных.

Пример, в котором две коррелированные переменные объединены в один фактор, показывает главную идею факторного анализа или, более точно, анализа главных компонент. Если же пример с двумя переменными распространить на большее число переменных, то вычисления становятся сложнее, однако основной принцип представления двух или более зависимых переменных одним фактором остается в силе.

    Метод главных компонент

Анализ главных компонент является методом сокращения или редукции данных, т.е. методом сокращения числа переменных. Возникает естественный вопрос: сколько факторов следует выделять? Отметим, что в процессе последовательного выделения факторов они включают в себя все меньше и меньше изменчивости. Решение о том, когда следует остановить процедуру выделения факторов, главным образом зависит от точки зрения на то, что считать малой "случайной" изменчивостью. Это решение достаточно произвольно, однако имеются некоторые рекомендации, позволяющие рационально выбрать число факторов (см. раздел Собственные значения и число выделяемых факторов ).

В случае, когда имеются более двух переменных, можно считать, что они определяют трехмерное "пространство" точно так же, как две переменные определяют плоскость. Если имеется три переменные, то можно построить трехмерную диаграмму рассеяния (см. рис. 3.10).

Рис. 3.10. Трехмерная диаграмма рассеяния признака

Для случая более трех переменных, становится невозможным представить точки на диаграмме рассеяния, однако логика вращения осей с целью максимизации дисперсии нового фактора остается прежней.

После того, как найдена линия, для которой дисперсия максимальна, вокруг нее остается некоторый разброс данных и процедуру естественно повторить. В анализе главных компонент именно так и делается: после того, как первый фактор выделен , то есть, после того, как первая линия проведена, определяется следующая линия, максимизирующая остаточную вариацию (разброс данных вокруг первой прямой), и т.д. Таким образом, факторы последовательно выделяются один за другим. Так как каждый последующий фактор определяется так, чтобы максимизировать изменчивость, оставшуюся от предыдущих, то факторы оказываются независимыми друг от друга (некоррелированными или ортогональными ).

    Собственные значения и число выделяемых факторов

Рассмотрим некоторые стандартные результаты анализа главных компонент. При повторных вычислениях выделяются факторы с все меньшей и меньшей дисперсией. Для простоты изложения считают, что обычно работа начинается с матрицы, в которой дисперсии всех переменных равны 1,0. Поэтому общая дисперсия равна числу переменных. Например, если имеется 10 переменных и дисперсия каждой из них равна 1, то наибольшая изменчивость, которая потенциально может быть выделена, равна 10 раз по 1.

Предположим, что при изучении степени удовлетворенности жизнью включено 10 пунктов для измерения различных аспектов удовлетворенности домашней жизнью и работой. Дисперсия, объясненная последовательными факторами, представлена в таблице 3.14:

Таблица 3. 14

Таблица собственных значений

STATISTICA ФАКТОРНЫЙ АНАЛИЗ

Собственные значения (factor.sta) Выделение: Главные компоненты

Значение

Собственные значения

% общей дисперсии

Кумулят. собств. знач.

Кумулят. %

Во втором столбце таблицы 3. 14. (Собственные значения) представлена дисперсия нового, только что выделенного фактора. В третьем столбце для каждого фактора приводится процент от общей дисперсии (в данном примере она равна 10) для каждого фактора. Как видно, первый фактор (значение 1) объясняет 61 процент общей дисперсии, фактор 2 (значение 2) – 18 процентов, и т.д. Четвертый столбец содержит накопленную (кумулятивную) дисперсию.

Итак, дисперсии, выделяемые факторами, названы собственными значениями . Это название происходит из использованного способа вычисления.

Как только получена информация о том, сколько дисперсии выделил каждый фактор, можно возвратиться к вопросу о том, сколько факторов следует оставить. Как говорилось выше, по своей природе это решение произвольно. Однако имеются некоторые общеупотребительные рекомендации, и на практике следование им дает наилучшие результаты.

Критерии выделения факторов

    Критерий Кайзера. Сначала отбираются только те факторы, собственные значения которых больше 1. По существу, это означает, что если фактор не выделяет дисперсию, эквивалентную, по крайней мере, дисперсии одной переменной, то он опускается. Этот критерий предложен Кайзером (Kaiser, 1960), и является наиболее широко используемым. В приведенном выше примере (см. табл. 3.14) на основе этого критерия следует сохранить только 2 фактора (две главные компоненты).

    Критерий каменистой осыпи является графическим методом, впервые предложенным Кэттелем (Cattell, 1966). Он позволяет изобразить собственные значения в виде простого графика:

Рис. 3. 11. Критерий каменистой осыпи

Оба критерия были изучены подробно Брауном (Browne, 1968), Кэттелем и Джасперсом (Cattell, Jaspers, 1967), Хакстианом, Рожерсом и Кэттелем (Hakstian, Rogers, Cattell, 1982), Линном (Linn, 1968), Тюкером, Купманом и Линном (Tucker, Koopman, Linn, 1969). Кэттель предложил найти такое место на графике, где убывание собственных значений слева направо максимально замедляется. Предполагается, что справа от этой точки находится только «факториальная осыпь» («осыпь» – геологический термин, обозначающий обломки горных пород, скапливающиеся в нижней части скалистого склона). В соответствии с этим критерием можно оставить в рассмотренном примере 2 или 3 фактора.

Какому критерию все-таки следует отдавать предпочтение на практике?Теоретически, можно вычислить характеристики путем генерации случайных данных для конкретного числа факторов. Тогда можно увидеть, обнаружено с помощью используемого критерия достаточно точное число существенных факторов или нет. С использованием этого общего метода первый критерий (критерий Кайзера ) иногда сохраняет слишком много факторов, в то время как второй критерий (критерий каменистой осыпи ) иногда сохраняет слишком мало факторов; однако оба критерия вполне хороши при нормальных условиях, когда имеется относительно небольшое число факторов и много переменных.

На практике возникает важный дополнительный вопрос, а именно: когда полученное решение может быть содержательно интерпретировано. Поэтому обычно исследуется несколько решений с большим или меньшим числом факторов, и затем выбирается одно наиболее "осмысленное". Этот вопрос далее будет рассматриваться в рамках вращений факторов.

    Общности

На языке факторного анализа доля дисперсии отдельной переменной, принадлежащая общим факторам (и разделяемая с другими переменными) называется общностью . Поэтому дополнительной работой, стоящей перед исследователем при применении этой модели, является оценка общностей для каждой переменной, т.е. доли дисперсии, которая является общей для всех пунктов. Тогда доля дисперсии , за которую отвечает каждый пункт, равна суммарной дисперсии, соответствующей всем переменным, минус общность (Harman, Jones, 1966).

    Главные факторы и главные компоненты

Термин факторный анализ включает как анализ главных компонент, так и анализ главных факторов. Предполагается, что, в целом, известно сколько факторов следует выделить. Можно узнать (1) значимость факторов, (2) можно ли интерпретировать их разумным образом и (3) как это сделать. Чтобы проиллюстрировать, каким образом это может быть сделано, производятся действия "в обратном порядке", то есть, начинают с некоторой осмысленной структуры, а затем смотрят, как она отражается на результатах.

Основное различие двух моделей факторного анализа состоит в том, что в анализе главных компонент предполагается, что должна быть использована вся изменчивость переменных, тогда как в анализе главных факторов используется только изменчивость переменной, общая и для других переменных.

В большинстве случаев эти два метода приводят к весьма близким результатам. Однако анализ главных компонент часто более предпочтителен как метод сокращения данных, в то время как анализ главных факторов лучше применять с целью определения структуры данных.

Факторный анализ как метод классификации данных

    Корреляционная матрица

Первый этап факторного анализа предусматривает вычисление корреляционной матрицы (в случае нормального выборочного распределения). Вернемся к примеру об удовлетворенности и рассмотрим корреляционную матрицу для переменных, относящихся к удовлетворенности на работе и дома.