Меню Рубрики

Анализ как метод многомерных группировок

Многомерные группировки и их виды: на основе многомерной средней, кластерного анализа, методов дендритов и шаров. Важнейшие группировки и классификации, применяемые в практике статистики.

Сущность способа многомерной группировки заключается в том, что объекты классифицируют одновременно по всему набору признаков. Этот фиксированный набор признаков образует так называемое признаковое пространство, в котором каждому из них придается смысл координаты. Если в набор входит р признаков, то любой объект рассматривается как точка в р-мерном признаковом пространстве и задача рационального группирования сводится к выделению сгущений точек в этом пространстве. В этом случае группы формируются на основании близости объектов по большому числу признаков. При этом ни один из признаков, входящих в набор, не является необходимым или достаточным условием принаделжности конкретного объекта к группе.

Достоинство способа многомерной группировки заключается в том, что он позволяет с той или иной степенью точности формализовать задачу классификации, используя при этом различные алгоритмы таксономии, и выделить реально существующие в признаковом пространстве скопления точек — объектов с одновременной их группировкой по большому числу признаков.

Недостатком способа многомерной группировки является то, что он может быть применен только для классификации объектов, характеризуемых большим набором количественных признаков.

Избежать этого недостатка позволяют методы многомерных группировок.

Для ее решения целесообразно использовать методы многомерной группировки в однородности.

Кластерный анализ (англ. cluster analysis) — многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя.

Большинство исследователей склоняются к тому, что впервые термин «кластерный анализ» (англ. cluster — гроздь, сгусток, пучок) был предложен математиком Р. Трионом. Впоследствии возник ряд терминов, которые в настоящее время принято считать синонимами термина «кластерный анализ»: автоматическая классификация, ботриология.

Спектр применений кластерного анализа очень широк: его используют в археологии, медицине, психологии, химии, биологии,государственном управлении, филологии, антропологии, маркетинге, социологии и других дисциплинах. Однако универсальность применения привела к появлению большого количества несовместимых терминов, методов и подходов, затрудняющих однозначное использование и непротиворечивую интерпретацию кластерного анализа.

Кластерный анализ выполняет следующие основные задачи:

Разработка типологии или классификации.

Исследование полезных концептуальных схем группирования объектов.

Порождение гипотез на основе исследования данных.

Проверка гипотез или исследования для определения, действительно ли типы (группы), выделенные тем или иным способом, присутствуют в имеющихся данных.

Независимо от предмета изучения применение кластерного анализа предполагает следующие этапы:

Отбор выборки для кластеризации. Подразумевается, что имеет смысл кластеризовать только количественные данные.

Определение множества переменных, по которым будут оцениваться объекты в выборке, то есть признакового пространства.

Вычисление значений той или иной меры сходства (или различия) между объектами.

Применение метода кластерного анализа для создания групп сходных объектов.

Проверка достоверности результатов кластерного решения.

Можно встретить описание двух фундаментальных требований предъявляемых к данным — однородность и полнота. Однородность требует, чтобы все кластеризуемые сущности были одной природы, описываться сходным набором характеристик. Если кластерному анализу предшествует факторный анализ, товыборка не нуждается в «ремонте» — изложенные требования выполняются автоматически самой процедурой факторного моделирования (есть ещё одно достоинство — z-стандартизация без негативных последствий для выборки; если её проводить непосредственно для кластерного анализа, она может повлечь за собой уменьшение чёткости разделения групп). В противном случае выборку нужно корректировать.

Формальная постановка задачи кластеризации

Пусть — множество объектов, — множество номеров (имён, меток) кластеров. Задана функция расстояния между объектами . Имеется конечная обучающая выборка объектов . Требуется разбить выборку на непересекающиеся подмножества, называемые кластерами, так, чтобы каждый кластер состоял из объектов, близких по метрике , а объекты разных кластеров существенно отличались. При этом каждому объекту приписывается номер кластера .

Алгоритм кластеризации — это функция , которая любому объекту ставит в соответствие номер кластера . Множество в некоторых случаях известно заранее, однако чаще ставится задача определить оптимальное число кластеров, с точки зрения того или иного критерия качества кластеризации.

Кластеризация (обучение без учителя) отличается от классификации (обучения с учителем) тем, что метки исходных объектов изначально не заданы, и даже может быть неизвестно само множество .

Решение задачи кластеризации принципиально неоднозначно, и тому есть несколько причин (как считает ряд авторов):

не существует однозначно наилучшего критерия качества кластеризации. Известен целый ряд эвристических критериев, а также ряд алгоритмов, не имеющих чётко выраженного критерия, но осуществляющих достаточно разумную кластеризацию «по построению». Все они могут давать разные результаты. Следовательно, для определения качества кластеризации требуется эксперт предметной области, который бы мог оценить осмысленность выделения кластеров.

число кластеров, как правило, неизвестно заранее и устанавливается в соответствии с некоторым субъективным критерием. Это справедливо только для методов дискриминации, так как в методах кластеризации выделение кластеров идёт за счёт формализованного подхода на основе мер близости.

результат кластеризации существенно зависит от метрики, выбор которой, как правило, также субъективен и определяется экспертом. Но стоит отметить, что есть ряд рекомендаций к выбору мер близости для различных задач.

Не нашли то, что искали? Воспользуйтесь поиском:

источник

И числу детей в 1989 г.

Группировка семей России по месту проживания

(по материалам переписи населения)

Группа семей по месту проживания В том числе подгруппа семей по числу детей Число семей, тыс.
Городское население 1 ребенок
2 детей
3 детей
4 детей
5 и более детей
Итого по группе
Сельское население 1 ребенок
2 детей
3 детей
4 детей
5 и более детей
Итого по группе
Итого по подгруппам 1 ребенок
2 детей
3 детей
4 детей
5 и более детей
Всего

По первому признаку образованы две группы, а по второму — пять. Группировка показывает, что большинство семей и в городе, и в деревне имеет только одного ребенка, а в общей численности семей они составляют 51% (11933:23486)

Число городских семей, в которых два ребенка, меньше почти в 1,4 раза, чем семей с одним ребенком. В сельской местности численность таких семей различается незначительно — всего на 1%.

При построении сложной группировки всегда возникает вопрос о последовательности разбиения единиц исследуемого объекта по признакам. Рекомендуется сначала производить группировку по признакам, значения которых имеют ярко выраженные качественные различия. С увеличением числа группировочных признаков быстро растет количество групп. Группировка с большим числом групп становится ненаглядной. Поэтому, на практике строят сложные группировки не более, чем по трем признакам.

Группировка, осуществляемая одновременно по комплексу признаков называется многомерной. Характеристика одной и той же стороны изучаемого явления может быть дана с помощью набора признаков. Например, для характеристики технического уровня развития предприятий может быть использованы следующие показатели: удельный вес активной части промышленно-производственных основных фондов, удельный вес автоматических машин и оборудования в составе рабочих машин и оборудования, электровооруженность труда, машиновооруженность рабочих, коэффициент обновления машин и оборудования.

Характеризуя таким образом каждую единицу совокупности набором признаков, можно рассматривать эту единицу как точку в m-мерном пространстве, а задача многомерной группировки будет состоять в выделении точек, составляющих однородные группы единиц. Исходные данные для задачи многомерной группировки представляют в виде матрицы «объект-признак». Строками ее являются значения признаков, характеризующих соответствующий объект, а столбцами – значения каждого признака для рассматриваемой совокупности объектов.

Мерой «сходства» между единицами может служить различные критерии. В зависимости от выбранного критерия и существуют различные виды многомерной группировки.

Выделяют 3 типа мер сходства:

Меры первого и второго типов называют мерами близости: чем больше их величины, тем ближе объекты к друг другу.

Обратное положение с показателями расстояния: чем больше их величины, тем больше различия между объектами.

Меры сходства могут определяться как между объектами, так и между признаками.

Для измерения степени близости между парами объектов (i и j) используют коэффициенты подобия S. Один из наиболее простых способов рассчитать этот коэффициент по формуле:

, где Рij – число совпадающих признаков у объектов i и j, а m – общее число признаков, по которым осуществляется сравнение. Очевидно, что 01.

Часто в качестве мер сходства используют коэффициент корреляции – либо как измеритель силы связи между объектами (строками матрицы), либо как измерители связи признаков (столбцами матрицами).

Если признаки не поддаются точной количественной оценке, то мерами их связи служат коэффициенты ранговой корреляции.

Во многих случаях роль меры сходства играет функция расстояния. Для сопоставимости статистических показателей расстояния определяют по статистическим стандартизированным данным, т.е. заменяют первичные данные данными, вычисляемыми по формуле:

Чаще всего принимаются следующие меры расстояния между объектами:

где xil – значение l-го признака у объекта i

xjl – значение l-го признака у объекта j

Евклидово расстояние не учитывает неравнозначность осей пространства. При ненормированных осях возможен случай, когда 2 объекта, сильно различающихся только по одному признаку, окажутся далекими в евклидовом пространстве. Поэтому часто вводят взвешенное евклидово расстояние, где подбором весов wl пытаются нормировать оси пространства:

, где

Обычно величину wl — обратно пропорциональна среднему квадратическому отклонению σ значений признака хl.

3. расстояние Махаланобиса:

где Xi=( Xi1, … , Xim) – строки значений признаков для объекта i

Xj=( Xj1, … , Xjm) – строки значений признаков для объекта j

R -1 – матрица, обратная матрице парных линейных коэффициентов корреляции признаков.

Применение методов многомерной группировки связано с большой вычислительной работой и осуществляется с помощью специальных алгоритмов, реализованных в различных статистических пакетах прикладных программ.

С помощью различных методов (дендроидов, метода шаров, корреляционных плеяд, многомерной средней, кластерного анализа) осуществляется формирование групп, в которых единицы совокупности объединяются на основании близости по всему комплексу признаков.

Дата добавления: 2014-01-06 ; Просмотров: 547 ; Нарушение авторских прав? ;

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

источник

Многомерные группировки формируются на основе одного из методов статистической теории распознавания образов — кластерного анализа (от англ. cluster — скопление, группа элементов, характеризуемые каким-то общим свойством). Кластерный анализ включает в себя большое количество вычислений и обязательно связан с использованием быстродействующих ЭВМ, что в настоящее время не является препятствием. Эти вычисления производятся не последовательно по отдельным признакам (как при комбинированной группировке), а одновременно по большому набору признаков. Этот набор образует так называемое признаковое пространство.

Каждому признаку придается смысл координаты. Если в наборе Г большое число (обозначим его символом п) признаков, то каждый объект рассматривается как точка в n-мерном пространстве. Задача многомерной группировки сводится к выделению сгущений точек (группы объектов) в этом пространстве. Геометрическая близость двух или нескольких точек (объектов) в этом пространстве означает как бы их количественную однородность по описываемым признакам. Мерой близости (сходства) между объектами могут служить различные критерии: коэффициент корреляции, евклидово расстояние между объектами и др. Чем меньше это расстояние, тем больше сходства.

Кластерный анализ выполняет следующие основные задачи:

· разработка типологии или классификации;

· исследование полезных концептуальных схем группирования объектов;

· порождение гипотез на основе исследования данных;

· проверка гипотез или исследования для определения, действительно ли типы (группы), выделенные тем или иным способом, присутствуют в имеющихся данных.

Задача многомерной группировки сводится к выделению сгущений точек объектов в образуемом пространстве. Группы объектов (кластеры), сформированные на основе «близости», описывают объект одновременно по всему комплексу признаков. На основании многомерных группировок совокупность статистических признаков расчленяют на однородные группы таким образом, что различия между признаками, попавшими в одну группу, оказываются менее значительными, чем между признаками, попавшими в разные группы. Освоение многомерных группировок юридическими статистиками на основе современных компьютерных программ поможет решить многие сложные проблемы в криминологии, деликтологии и социологии права в тех случаях, когда число различных факторов (объектов) исчисляется сотнями и даже тысячами, а их взаимосвязи при обычных статистических методах выявляются с трудом.

1) Понимание данных путём выявления кластерной структуры. Разбиение выборки на группы схожих объектов позволяет упростить дальнейшую обработку данных и принятия решений, применяя к каждому кластеру свой метод анализа (стратегия «разделяй и властвуй»).

2) Сжатие данных. Если исходная выборка избыточно большая, то можно сократить её, оставив по одному наиболее типичному представителю от каждого кластера.

3) Обнаружение новизны (англ. novelty detection). Выделяются нетипичные объекты, которые не удаётся присоединить ни к одному из кластеров.

Читайте также:  Какие анализы нужно принести гастроэнтерологу

В первом случае число кластеров стараются сделать поменьше. Во втором случае важнее обеспечить высокую степень сходства объектов внутри каждого кластера, а кластеров может быть сколько угодно. В третьем случае наибольший интерес представляют отдельные объекты, не вписывающиеся ни в один из кластеров.

Во всех этих случаях может применяться иерархическая кластеризация, когда крупные кластеры дробятся на более мелкие, те в свою очередь дробятся ещё мельче, и т. д. Такие задачи называются задачами таксономии. Результатом таксономии является древообразная иерархическая структура. При этом каждый объект характеризуется перечислением всех кластеров, которым он принадлежит, обычно от крупного к мелкому.

В основу построения многомерной группировки положен принцип перехода от величин, имеющих определённую размерность (рубли, тонны, гектары и т.д.), к безразмерным относительным величинам. На основе многомерной группировки можно построить уравнение регрессии, количественно отражающее степень связи между признаками. [13, с. 94]

Эти методы получили распространение благодаря использованию ЭВМ и пакетов прикладных программ. Цель этих методов — классификация данных, иначе говоря, группировка на основе множества признаков. Задачи этого класса широко распространены в науках о природе и обществе, в практической деятельности по управлению массовыми процессами. Например, выделение типов предприятий по финансовому положению, по экономической эффективности деятельности производится на основе множества признаков: выделение и изучение типов людей по степени их пригодности к определенной профессии; диагностика болезней на основании множества объективных признаков и т. д. [3, c. 133]

Простейшим вариантом многомерной классификации является группировка на основе многомерных средних, алгоритм которых заключается в следующем:

1. Составляется матрица абсолютных значений признаков по всем статистическим единицам.

2. Абсолютные значения признаков заменяются их нормированными по среднему значению уровнями:

где Pij — нормированное значение j-ого признака у i-ой статистической единицы; x — среднее значение j-того признака,

3. Для каждой статистической единицы рассчитывается многомерная средняя:

k — число оснований группировки;

4. В соответствии со значениями многомерной средней совокупность разделяется на однородные группы, то есть выполняется простая группировка по многомерной средней.

Многомерной средней называется средняя величина нескольких признаков для одной единицы совокупности. Поскольку нельзя рассчитать среднюю величину абсолютных значений разных признаков выраженных в разных единицах измерения, то многомерная средняя вычисляется из относительных величин, как правило, — из отношений значений признаков для единицы совокупности к средним значениям этих признаков:

где — многомерная средняя для i-единицы;

— значения признака для i-единицы;

— среднее значение признака ;

i — номер единицы совокупности.

Многомерные средние дают обобщённую характеристику уровня интенсивности производства или другого показателя по группе факторов. При этом значимость признака для многомерной оценки институциональной единицы считается одинаковой, что экономически, конечно, неточно.

Обобщающей характеристикой в цехе или по организации в целом может выступать сводный показатель в виде условной нормированной многомерной средней, учитывающей различные аспекты экономической деятельности:

— оснащенность основными средствами;

Расчет подобного показателя уровня производства в виде многомерной средней проиллюстрирован на примере предприятия ОАО «Белшина» (Таблица 6). По каждому году рассчитаны 4 значения признака:

1. Среднемесячная оплата труда работников, руб., х1.

2. Валовый доход отчётного периода, руб., х2.

3. Среднегодовая стоимость основных средств на конец отчётного периода, руб., х3.

4. Отношение дебиторской задолженности к кредиторской задолженности, %, х4.

Таблица 6 — Расчет многомерных средних, характеризующих уровень производства подготовительного цеха №1 ОАО «Белшина» 2007-2009гг.

источник

Выбрать один признак в качестве группировочного зачастую бывает достаточно трудно. Анализ по нескольким признакам довольно трудоемок и обладает принципиальным недостатком — размыванием совокупности, поскольку даже комбинация двух признаков при попытке разбить совокупность на три или четыре категории дает шесть или восемь подгрупп. В некоторых из них оказывается одно-два наблюдения, что недостаточно для подготовки обоснованных выводов об этих подгруппах. Избежать этого недостатка позволяют методы многомерных группировок. Широкое распространение они получили благодаря использованию вычислительной техники при расчетах. При анализе деятельности отдельных предприятий методы многомерной группировки используют нечасто из-за их сложности, более распространены они при социологических и экономических исследованиях отраслей и регионов. Наиболее разработанным методом многомерной классификации является кластерный анализ (см. раздел 2.8.3). [c.85]

В зависимости от числа положенных в их основание признаков различают простые и многомерные группировки. [c.31]

Многомерная группировка производится по двум и более признакам. Частным случаем многомерной группировки является комбинационная группировка, базирующаяся на двух и более признаках, взятых во взаимосвязи, в комбинации. [c.31]

Подходы к формированию групп, применяемые в многомерной группировке, лучше, чем комбинационные, согласуются со сложившимся представлением о существовании естественных типов объектов, близких по совокупности признаков. В самом деле, при комбинационной группировке объект, отклоняющийся по одному-единственному признаку от нормы, характерной для группы, будет автоматически из нее исключен. Более того, если этот признак используется на первом шаге группировки, то объект может легко попасть в группу, очень далекую от той, с которой он в действительности имеет наибольшее сходство. Если вспомнить понятие пространства признаков, то группы, получаемые при комбинационной группировке, представляют собой секторы такого пространства. При этом границы между ними обычно параллельны осям данного пространства и жестко заданные интервалы признаков часто разрушают реально существующие классы. Этот основной недостаток делает комбинационные группировки не всегда эффективными для выделения типов объектов по комплексу признаков, так как с добавлением каждого нового признака опасность разрушения объективно существующих однородных групп возрастает. [c.36]

Следовательно, главное преимущество методов многомерной группировки заключается в том, что они позволяют с той или иной степенью приближения выделить реально существующие [c.36]

Реализация методов последовательного разбиения возможна и без применения вычислительной техники, в то время как методы многомерной группировки в связи с трудоемкостью расчетов требуют использования ЭВМ, почему их часто называют методами автоматической классификации. Цели этих двух способов совпадают, основное же различие состоит в том, что при автоматической классификации исследователь лишь указывает направление поиска (заданием набора признаков, имеющих отношение к цели классификации), но отказывается на данном этапе от самостоятельного формирования классов. [c.37]

Многомерные группировки в статистике [c.38]

В экономических исследованиях нашли применение следующие математико-статистические методы стохастического моделирования хозяйственных явлений и процессов оценка связи и корреляции между показателями оценка статистической значимости связей регрессионный анализ выявление параметров периодических колебаний экономических показателей группировка многомерных наблюдений, дисперсионный анализ современный факторный (компонентный) анализ трансформационный анализ. [c.110]

Классификация и ранжировка хозяйственных объектов являются одной из важнейших задач экономического анализа. Выявление классов однотипных предприятий для разработки общих нормативов планирования, оценки, стимулирования и ранжировка хозяйственных объектов по результатам хозяйственной деятельности давно внедрились в экономический анализ. Новые возможности повышения качества решения этих задач появляются в результате применения таких методов, как группировка многомерных наблюдений, дисперсионный анализ, в частности современный факторный и компонентный анализ, кластерный анализ. Предпочтительным для аналитических целей наряду со специальными приемами классификации является исследование структуры совокупности хозяйственных объектов методами современного факторного (компонентного) анализа. Синтетические факторы или компоненты, выявленные на основе внутренних связей системы экономических показателей, характеризуют отдельные самостоятельные стороны экономических явлений (технический уровень производства, уровень управленческой работы, уровень организации производства и труда и т.п.) и имеют вполне определенную содержательную экономическую интерпретацию. Поэтому классификация и ранжировка хозяйственных объектов по значениям этих факторов или компонент носят более значительную аналитическую нагрузку, чем группировка на основе гетерогенного набора признаков. [c.115]

Для исследования стохастических соотношений используются следующие способы экономического анализа, с которыми мы уже знакомились в предыдущих главах сравнение параллельных и динамических рядов, аналитические группировки, графики. Однако они позволяют выявить только общий характер и направление связи. Основная же задача факторного анализа -определить степень влияния каждого фактора на уровень результативного показателя. Для этой цели применяются способы корреляционного, дисперсионного, компонентного, современного многомерного факторного анализа и т.д. [c.128]

Многомерные методы предоставляют объективные количественные средства для исследования сходства, близости, группировки или классификации данных. Данные могут быть представлены в виде множества показателей, переменных, которые характеризуют объекты, например предприятия, или один объект в разные моменты времени, например хозяйственную деятельность предприятия в различные годы. Большинство методов позволяет решать задачу с наименьшим числом переменных и выделением наиболее важных характеристик и скрытых факторов. [c.95]

Излагаются статистические методы группировки, выборочный, индексный, корреляционный, анализ динамики. Показаны их взаимосвязи и возможности применения с использованием ПЭВМ в рыночной экономике в сборе информации в связи с увеличением числа хозяйственных единиц и их типов, аудите, финансовом менеджменте, прогнозировании. Четвертое издание (3-е изд. — 1997 г.) полностью переработано, расширено изложение методов многомерной классификации данных, подробнее рассмотрены применение выборочного метода, методы совмещения индексов и регрессий введен анализ соотношения индексов экономических показателей. Включена глава, посвященная статистическому изучению структуры данных и ее изменений. [c.2]

Простейшим вариантом многомерной классификации является группировка на основе многомерных средних. [c.134]

Кластерный анализ — один из методов многомерного анализа, предназначенный для группировки (кластеризации) совокупности, элементы которой характеризуются многими признаками. Значения каждого из признаков служат координатами каждой единицы изучаемой совокупности в многомерном пространстве признаков. Каждое наблюдение, характеризующееся значениями нескольких показателей, можно представить как точку в пространстве этих показателей, значения которых рассматриваются как координаты в многомерном пространстве. Расстояние между точками р и q с k координатами определяется как [c.105]

Приемы и методы экономического анализа также весьма разнообразны. В ходе анализа широко применяется метод сравнений, детализации, элиминирования, факторного разложения, балансовый, группировки, взаимосвязанного изучения. Последние годы в анализе все шире применяются приемы и методы, заимствованные из математики, кибернетики и других наук. Отметим, в частности, корреляционный, регрессионный, вариационный, дисперсионный, многомерный, факторный анализ линейное и динамическое программирование, статистическое моделирование. [c.17]

Если контроллер определяет закономерность, структуру и группировку конкретного явления в работе компании в большом круге объектов, в каждом из которых имеется множество переменных, то применяются многомерные методы. Любой потенциальный партнер в этом случае характеризуется рядом переменных (размер уставного капитала, объем оборотных средств, число наименований выпускаемой продукции, производственная мощность, численность персонала и т.д.). Позиция здесь следующая предоставлять льготы фирмам, наиболее близким по совокупности параметров к уже зарекомендовавшему себя положительно кругу партнеров. Для этого при помощи факторного анализа определяется группировка всех фирм-партнеров в многомерном пространстве описывающих переменных. [c.161]

Если в основе группировки лежит несколько признаков, то ее называют сложной. Сложная группировка может выполняться как комбинационная и как многомерная в комбинационной группы, выделенные по одному признаку, затем подразделяются на подгруппы последующему признаку (рис. 6.2.1), многомерная же осуществляется одновременно по комплексу признаков (рис. 6.2.2). [c.92]

Курс Статистика имеет целью дать студентам представление о содержании статистики как научной дисциплины, познакомить с ее основными понятиями, методологией и методиками расчета важнейших статистических аналитических показателей. В соответствии с этим данное учебное пособие охватывает самые общие начальные элементы статистической науки, и прежде всего важнейшие направления анализа социально-экономических процессов. В дальнейшем на базе курса Статистика изучаются конкретные статистические дисциплины теория статистического наблюдения, анализ и прогнозирование временных рядов, классификации и группировки, многомерные статистические методы, экономическая и отраслевые статистики, анализ хозяйственной и финансовой деятельности. Что касается общеэкономических специальностей, данный курс служит основой для разработки и совершенствования методов экономического анализа. [c.3]

Первый способ является исторически более ранним. Он включает в себя два метода. Во-первых, это типичный для него метод комбинационной группировки, при которой формирование групп производится путем последовательного разбиения сначала всей совокупности по одному признаку, затем полученных частей — по другому и т. д., причем строго соблюдается принцип иерархии групп. Во-вторых, это многошаговый метод последовательных разбиений совокупности. Способ многомерной классификации, когда группы формируются на основе близости объектов одновременно по большому числу признаков, получил широкое применение с разработкой методов распознавания образов и появлением ЭВМ. [c.33]

Группировка объектов по величине многомерной средней Кол-во объектов Номера объектов Средние значения по признакам [c.48]

Наличие широкой базы для сравнения как в рамках отдельного предприятия, так и в масштабах района, области позволяет чаще использовать в анализе следующие приемы сопоставление параллельных и динамических рядов, аналитические группировки, корреляционный анализ, многомерный сравнительный анализ и др. [c.7]

Для решения перечисленных задач применяются такие математи-ко-статистические методы стохастического моделирования, как группировка многомерных наблюдений, корреляционный и регрессионный анализ, таксономический метод, дисперсионный анализ, методы причинного анализа, компонентный анализ. [c.278]

Читайте также:  Какие анализы сдавать для уролога

Мы убедились, как трудно выбрать какой-то один признак в качестве основания группировки. Еще труднее проводить группировку по нескольким признакам. Комбинация двух признаков позволяет сохранить обозримость таблицы, но комбинация трех или четырех признаков дает совершенно неудовлетворительный результат ведь даже при выделении трех категорий по каждому из груп-пировочных признаков мы получим 9 или 12 подгрупп. Равномерность распределения единиц по группам в принципе невозможна. Вот и получаются группы, в которые входят 1 — 2 наблюдения. Сохранить сложность описания групп и вместе с тем преодолеть недостатки комбинационной группировки позволяют методы многомерных группировок. Часто их называют методами многомерной классификации. [c.133]

Кластерный анализ — один из методов многомерного анализа, предназначенный для группировки (кластеризации) совокупности, элементы которой характеризуются многими признаками. Значения каждого из признаков служат координатами каждой единицы изучаемой совокупности в многомерном пространстве признаков. Каждое наблюдение, характеризу- [c.130]

Модель фасетной организации аналитического учета реализует многомерный учет, позволяющий получать итоги счета в любой необходимой для анализа группировке. [c.111]

Наиболее широко в перечне методов маркетингового анализа представлена статистика. Методология маркетингового анализа использует следующие статистические методы абсолютные, средние, относительные величины, динамические ряды и ряды распределения, группировки, индексы, вариационный и дисперсионный анализ, корреляционно-регрессионный и многомерный анализ, графический метод, трендовые модели, методы экспертных оценок. Эконометрика в маркетинге представлена методами линейного и нелинейного моделирования, а также динамического программирования, моделями, базирующимися на теории массового обслуживания (теория очередей) и теории принятия решений (теория риска), имитационными моделями. Самостоятельное значение придается логистическим моделям управления г отоками товаров и денег и оптимизации товарных запасов. В маркетинговом анализе широко используются квалиметрические методы, а также методы социометрии. Стратегические матрицы (решетки), используемые в маркетинговом планировании для целей разработки оптимальной стратегии, могут найти применение и в маркетинговом анализе — для определения рейтинга фирмы и ее позиции на рынке, для прогноза риска и т.п. Немаловажное значение придается также неформальному описательному и качественному анализу, сценариям развития и т.п. [c.100]

М.с. охватывает широкий круг одно-и многомерных методов и правил обработки статистических данных от простых приемов статистического описания (выведение средней, а также степени и характера разброса исследуемых признаков вокруг нее, группировка данных по классам и сопоставление их характерис- [c.184]

ФАКТОРНЫЙ АНАЛИЗ [fa torial analysis] — область математической статистики (один из разделов многомерного статистического анализа), объединяющая вычислительные методы, которые в ряде случаев позволяют получить компактное описание исследуемых явлений на основе обработки больших массивов информации. От других средств подобного «сжатия информации» (напр., распространенных методов статистической группировки объектов) Ф.а. отличается тем, что не опирается на заранее заданный, априорный перечень факторов, влияющих на изучаемые переменные, а наоборот, при соблюдении определенных правил и предосторожностей помогает обнаружить наиболее важные из этих факторов, причем скрытые (латентные). Скажем, экономист непосредственно наблюдает множество различных показателей статистического учета деятельности предприятий, чтобы выявить закономерности, влияющие на рост производительности труда (об- [c.374]

Метод многомерной классификации (AID — automati intera tion dete tion) достаточно отличается от других методик этой группы. AID начинает с поиска зависимой переменной, например уровень возврата анкет при почтовых рассылках, и независимых переменных, чтобы найти те, которые наиболее четко проводят группировку по заданным критериям. Если интересующий предмет — ответ на [c.107]

В данной главе мы продемонстрировали, как самоорганизующиеся карты Ко-хонена могут быть использованы для сведения многомерных данных по развивающимся рынкам к одно- или двумерным картам. Эти карты отражают черты сходства и различия между различными рынками и, как результат, позволяют выявлять группы стран, обладающих общими характеристиками. Группировка развивающихся рынков представляет важность для распределения активов между различными рынками равно как и для более совершенного ранжирования в целях снижения затрат на управление инвестиционным портфелем, состоящим из акций компаний развивающихся рынков. [c.157]

источник

Статистика не ограничивается простым описанием явлений, даже если они сгруппированы и переведены в средние величины. У нее есть куда более важная задача — выявить статистические закономерности, т.е. устойчивые связи между явлениями. Многомерный анализ — это форма статистики, имеющая дело более чем с одной переменной. При этом методы двумерной статистики (bivariate statistics), например простой линейной регрессии и корреляции, не считаются частным случаем многомерного статистического анализа, поскольку речь идет об одной переменной.

Методы многомерного анализа позволяют анализировать количественные зависимости отдельных сторон исследуемого объекта от множества его признаков. К ним, в частности, относят:

  • • кластерный (таксономический) анализ — классификация признаков и объектов при отсутствии предварительных или экспертных данных о группировке информации;
  • • логлинейный анализ — поиск и оценка взаимосвязей в таблице, сжатое описание табличных данных;
  • • корреляционный анализ — метод обработки статистических данных, с помощью которого измеряется теснота связи между двумя или более переменными;
  • • факторный анализ — многомерный статистический анализ признаков, установление внутренних взаимосвязей признаков;
  • • регрессионный анализ — изучение изменений значений результирующего признака в зависимости от изменений признаков-факторов;
  • • дискриминантный анализ — изучение различия между двумя и более объектами по нескольким признакам одновременно.

Задачи регрессионного анализа — выбор формы связи и определение расчетных значений зависимой переменной (функции регрессии). Цель корреляционного анализа — измерение тесноты связи между признаками и явлениями. Наличие связи между явлениями совсем не означает, что одно явление является причиной другого.

Коэффициент корреляции — числовая характеристика совместного распределения двух случайных величин, выражающая их взаимосвязь.

Коэффициент корреляции позволяет выявить и количественно оценить взаимосвязь между двумя переменными. Он может показывать степень идентичности характеристик сравниваемых групп (например, ценностей или доходов), а также степень связи между двумя признаками (например, зависимость политических ориентаций от материального дохода). При одновременном возрастании переменных корреляция является положительной. Тогда же, когда возрастание одной переменной связано с уменьшением другой, корреляция считается отрицательной.

Отрицательная корреляция означает наличие обратной зависимости (с увеличением значений одного показателя значение другого уменьшается). Положительная корреляция свидетельствует о прямой зависимости (при увеличении значений одного показателя увеличивается значение другого).

Крайние значения коэффициента корреляции обозначаются «+» и «-». В том случае, если величина коэффициента корреляции составляет «+», можно говорить о тождестве, если «-», то о полной обратной зависимости (когда величина одного признака максимальна, то другого — минимальна). Если коэффициент равен нулю, то связь между переменными отсутствует. Иногда с помощью коэффициента корреляции можно установить причинно-следственные связи 1 .

Коэффициенты корреляции удовлетворенности жизнью специалистов высшей квалификации с отдельными показателями в 2002 и 2008 гг. (Пирсон R)

Специалисты высшей квалификации

Специалисты средней квалификации

Удовлетворенность работой в целом

Удовлетворенность условиями труда

Удовлетворенность оплатой труда

Удовлетворенность возможностями профессионального роста

Удовлетвореность своим материальным положением

Расположение на лестнице «нищие — богатые»

Расположение на лестнице «бесправные большая власть»

Беспокойство, что не найдет работу, если будет уволен

Беспокойство, что не сможет обеспечить себя самым необходимым через 12 месяцев

Мнение об изменении материального положения за последние 12 месяцев

Мнение о том, как будут жить через 12 месяцев

Среднемесячная зарплата за последние 12 месяцев

Совокупный денежный доход респондента за последние 30 дней

1 См.: Казаринова II. В., Филатова О. Г., Хренов А. Е. Социология : учебник для вузов / под ред. Г. С. Батыгина. М.: NOTA BENE, 1999. С. 49.

Данные таблицы показывают, в частности, что наиболее тесной является связь удовлетворенности жизнью с фактором удовлетворенности респондентов материальным положением, что объясняется глубокой дифференциацией семей по уровню материального благосостояния и высоким уровнем обеспокоенности основной массы населения трудностями решения материальных проблем. Коэффициент детерминации (Пирсон R2), характеризующий тесноту этой связи, снизился в группе средней квалификации и практически не изменился в группе с высшей, объясняя около 25% дисперсии независимой переменной. В то же время самыми слабыми являются связи с расположением респондентов на лестницах «нищие — богатые», «бесправные — большая власть» и фактором обеспокоенности респондентов невозможностью обеспечить себя самым необходимым в течение ближайших 12 месяцев, которые за последние годы немного усилились [1] .

Среди наиболее известных и часто применяемых коэффициентов корреляции можно назвать:

  • 1) коэффициент корреляции Пирсона;
  • 2) коэффициент корреляции Спирмена;
  • 3) коэффициент корреляции Крамера;
  • 4) коэффициент корреляции фи.

Одним из индексов такого рода при использовании порядковой шкалы измерения выступает коэффициент ранговой корреляции Спирмена (rs)> названный так по имени американского психолога Чарльза Спирмена, который использовал его в своих исследованиях вместо обычных коэффициентов корреляции. Формула расчета его имеет следующий вид:

где ф — разность рангов; / — общее число сопоставляемых пар.

Понятно, что коэффициент ранговой корреляции Спирмена будет равен + 1 (абсолютная положительная связь), если ответы всех респондентов обеих анализируемых групп будут в точности совпадать; он будет равен -1 (абсолютная отрицательная связь), если ответы всех респондентов обеих анализируемых групп будут прямо противоположны; если rs = 0, то это означает полное отсутствие всякой связи.

Строго говоря, коэффициент ранговой корреляции показывает, насколько одинаковыми или различными оказываются ответы па один и тот же вопрос со стороны двух сравниваемых между собою групп респондентов.

Корреляционная матрица строится на основе расчета коэффициента парной корреляции Пирсона. На основании матрицы корреляций происходит формирование факторов.

Факторный анализ — многомерный метод, применяемый для изучения взаимосвязей между значениями переменных. Его основателями являются Ф. Гальдон и Ч. Спирмен. Базовое предположение факторного анализа заключается в том, что корреляционные связи между большим числом наблюдаемых переменных определяются существованием меньшего числа гипотетических наблюдаемых переменных или факторов. На сегодняшний день существует ряд методов факторного анализа, основное различие между которыми заключается в способах оценки факторной структуры и факторной нагрузки.

Это один из способов снижения размерности, т.е. выделения во всей совокупности признаков тех, которые действительно влияют на изменение зависимой переменной. Применение процедуры факторного анализа позволяет нам:

  • 1) понизить число переменных для унификации их описания, через введение более общих вторичных переменных;
  • 2) производить косвенное оценивание переменных, не поддающихся непосредственному измерению;
  • 3) подтвердить наличие структурной теории исследуемой области (или создать ее), т.е. провести эксплораторный (поисковый) или конфир- маторный (подтверждающий) структурный анализ.

Проведение факторного анализа требует умения вычислять среднее значение и стандартное отклонение, использовать статистические критерии, а также знакомство с корреляционным и регрессионным анализом.

Процесс факторного анализа состоит из трех этапов:

  • • подготовки ковариационной матрицы (либо корреляционной матрицы);
  • • выделения первоначальных ортогональных векторов;
  • • вращение с целью получения окончательного решения.

Сущностью факторного анализа является процедура вращения факторов, т.е. перераспределения дисперсии. Практически на всех этапах применяется метод главных компонент (факторов). Факторный анализ позволяет решить две важные проблемы исследователя — описать объект измерения всесторонне и в то же время компактно. С помощью факторного анализа возможно выявление скрытых переменных факторов, отвечающих за наличие линейных статистических связей корреляций между наблюдаемыми переменными.

Факторный анализ способствует определению степени взаимосвязи между непосредственно ненаблюдаемыми переменными (факторами) и эмпирически наблюдаемыми признаками. Факторный анализ активно применяется в социологии, психологии, экономике и других науках. Это один из сложных математических приемов [2] .

Логлинейный анализ (логарифмически линейный анализ) — совокупность алгоритмов, направленных на изучение связей в многомерных таблицах сопряженности и объединенных единым подходом к моделированию этих таблиц. Логлинейный анализ применяется, главным образом, при построении таблиц сопряженности, охватывающих многие переменные, частично или полностью являющиеся поминальными или порядковыми мерами, а также при причинном моделировании данных. Он позволяет проверить статистическую значимость различных факторов и взаимодействий, присутствующих в таблице сопряженности (например, пол, возраст, семейное положение и т.п.). Он больше применяется в зарубежной, нежели в отечественной социологии.

В статье И. Л. Бутенко «Какого обращения заслуживают социологические данные?» [3] говорится о том, что понятие «некорректное обращение с данными» включает: 1) фальсификацию; 2) спекуляцию; 3) манипуляцию.

Вам необходимо конкретизировать их на практических примерах и дать свои разъяснения.

источник

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp» , которое позволит вам всего за несколько минут, выполнить повышение оригинальности любого файла в формате MS Word. После такого повышения оригинальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, РУКОНТЕКСТ, etxt.ru. Программа «StudentHelp» работает по уникальной технологии так, что на внешний вид, файл с повышенной оригинальностью не отличается от исходного.

Читайте также:  Географический язык какие анализы сдать

Тип работы: Курсовая. Предмет: Статистика. Добавлен: 15.06.2012. Год: 2004. Страниц: 29. Уникальность по antiplagiat.ru:

Курсовая работа
по статистике:
«Методы построения многомерных группировок»

Введение. 3
1. Задачи и виды группировок. 5
2. Техника выполнения группировок. 10
3. Статистические таблицы как результат группировок. 16
4. Кластерный анализ как метод многомерных группировок. 21
Заключение. 28
Список использованных источников. 29

Основой методологии статистической науки служит всеобщий метод познания — диалектический и исторический материализм. Это означает, что метод статистики базируется на законах и категориях материалистической диалектики, согласно которым общественные явления и процессы рассматриваются в развитии, взаимной связи и причинной обусловленности.
Знание законов и категорий материалистической диалектики, законов общественного развития — это и есть тот фундамент, с помощью которого можно понять и правильно истолковать явления, подлежащие статистическому исследованию, выбрать надлежащий инструмент, методологически правильный подход к их изучению.
Специфика и достоинство статистических методов заключаются в их комплексности, соответствии принципу системного научного исследования. Это обусловлено наряду с многообразием форм статистической закономерности еще и сложностью самого процесса статистического исследования, состоящего по меньшей мере из трех стадий:
1) статистическое наблюдение, включающее сбор и оценку качества первичных статистических данных;
2) сводку первичного статистического материала;
3) обобщение и анализ сведенного материала.
Прохождение каждой стадии исследования связано с использованием специфических методов, объясняемых содержанием выполняемой работы. На первой стадии в связи с необходимостью учета всего многообразия фактов и форм осуществления социально-экономических процессов, в соответствии с их массовым характером применяется метод массового статистического наблюдения, обеспечивающий всеобщность, полноту и представительность (репрезентативность) полученной первичной инфор-мации.
Сводка заключается в систематизации, обработке первичных данных, приведении их в определенный порядок, подсчете численности единиц совокупности и объема характеризующих их признаков и, что более характерно, — в разделении информации по признакам различия, т. е. группировке статистических данных, переходе от характеристики единичных фактов к характеристике данных, объединенных в группы. Методы группировки различаются в зависимости от задач исследования и качественного состояния первичного материала.
Задачи третьего этапа статистического исследования — обобщение и анализ данных, т. е. выявление характерных свойств и закономерностей социально-экономических явлений, — решаются посредством применения весьма широкого и разнообразного круга статистических методов.
Ведущую роль в процессе обобщения и разработки статистических данных занимает расчет обобщающих показателей уровня социально-экономических явлений: абсолютных, относительных и средних, отличающихся еще большим многообразием форм в сравнении с теми статистическими методами, которые применяются на предшествующих этапах исследования.
Многомерные группировки являются востребованными в экономике и математической науке. С их помощью проводятся экономические исследования в России. Компьютеризация вычислений позволяет проводить исследования и анализ наиболее эффективно. В связи с этим, выбранная тема курсовой работы является весьма актуальной.

1. Задачи и виды группировок.

Огромное значение и роль группировок в статистическом ис-следовании вытекает из характера объекта статистики, его специфики. Явления общественной жизни, изучаемые статистикой, отличаются многообразием форм и стадий развития, они состоят из существенно различающихся частей, обладающих многими специфическими свойствами.
Изучая количественную сторону массовых общественных явлений в неразрывной связи с их качественными особенностями, статистика стремится показать совокупность явлений в дифференциации, в многообразии их типов, рассмотреть взаимосвязи и отношения между последними. С помощью метода группировок решаются сложные задачи статистического анализа. Учитывая, что необходимость группировки обусловливается прежде всего наличием качественных различий между изучаемыми явлениями, первую задачу группировок можно сформулировать как задачу выделения в составе массового явления тех его частей, которые однородны по качеству и условиям развития и в которых действуют одни и те же закономерности влияния факторов. В результате такой группировки выделяются социально-экономические типы, а отсюда и название группировки — типологическая. В ленинских работах типы социально-экономических явлений рассматриваются исторически, как выражение конкретного общественного процесса, его форм и разветвлений, как выражение существенных черт, общих для множества единичных явлений.
С задачами типологической группировки тесно связаны и две другие задачи группировок: характеристика структуры и структурных сдвигов в исследуемой совокупности и выявление взаимосвязи между отдельными признаками изучаемого явления.
Примерами типологических группировок могут служить груп-пировки хозяйств по формам собственности; населения — по классовой принадлежности или общественным группам; работников—на занятых преимущественно физическим и преимущественно умственным трудом и т. д.

Первой ступенью систематизации и обобщения данных стати-стического наблюдения является статистическая сводка. Понятие статистической сводки в широком смысле слова охватывает целый комплекс статистических операций, направленных на объе- | динение зарегистрированных при наблюдении единичных слу. чаев в группы, сходные в том или ином отношении; подсчет итогов по выделенным группам и по всей совокупности в целом и оформление результатов группировки и сводки в виде статистических таблиц. В план статистической сводки включаются вопросы, связанные с последовательным осуществлением отдельных этапов сводки, с очередностью обработки материалов наблюде-ния. При составлении плана сводки разрабатываются макеты сводных таблиц, на основе которых дается характеристика размеров, структуры и взаимосвязей изучаемых явлений. В плане сводки указывается также, кто и в какие сроки осуществляет сводку, каким способом, куда поступают сводные данные и кто проводит их дальнейшую обработку.
Одним из основных и наиболее распространенных методов об-работки и анализа первичной статистической информации является группировка. Целостную характеристику совокупности необходимо сочетать с характеристикой составных ее частей, классов и т. п. Под группировкой в статистике понимают расчленение статистической совокупности на группы, однородные в каком-либо существенном отношении, и характеристику выделенных групп системой показателей в целях выделения типов явлений, изучения их структуры и взаимосвязей.
Метод группировки является основой для применения других методов статистического анализа основных сторон и характерных особенностей изучаемых общественных явлений. По своей роли в процессе исследования метод группировок выполняет некоторые функции, аналогичные функциям эксперимента в естественных науках: посредством группировки по отдельным признакам и комбинации самих признаков статистика имеет возможность выявить закономерности и взаимосвязи явлений в условиях, в известной мере определяемых ею. При использовании метода группировок появляется возможность проследить взаимоотношение различных факторов.
В развитие метода группировок огромный вклад внесли оте-чественные статистики. Им принадлежит первенство в применении комбинационных таблиц, в разработке классификации таблиц и в проведении многочисленных группировок материалов аграрных переписей и обследований, которые оказали благотворное влияние на другие отраслевые статистики и общую методологию.

Список использованных источников.
1. Бендина Н.В. Общая теория статистики (конспект лекций). — М.: ПРИОР, 1999.
2. Гусаров В.М. Теория статистики. — М.: Аудит,1998.
3. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики. — М.: Инфра-М, 1998.
4. Толстик Н.В., Матегорина Н.М. Статистика. — Ростов-на-Дону, Феникс, 2000.
5. Ефимова М.Р., Рябцев В.М. Общая теория статистики: Учебник. – М.: Финансы и статистика, 1991. – 304 с.
6. Статистика: Курс лекций / Харченко Л.П., Долженкова В.Г., Ионин В.Г. и др.; Под ред. к.э.н. В.Г. Ионина. – Новосибирск: Изд-во НГАЭиУ, М.: ИНФРА-М, 1999. – 310 с.
7. Калинина В.Н., Панкин В.Ф. Математическая статистика: Учебник, Высшая школа, 2001г. — 336 стр.
8. Айвазян С.А., Мхитарян В.С. Прикладная статистика в задачах и упражнениях, ЮНИТИ — 2001, 270 стр.
9. Адамов В.Е. и др. «Экономика и статистика фирм» Учебник. 3-е изд., перераб. и доп. – 2002, 288 с.
10. Кожухарь Л.И.Основы общей теории статистики, Финансы и статистика — 1999, 144 стр.
11. Башина О.Э. «Общая теория статистики» Учебник. — 5-е издание. – 2001. – 440 с.
12. Гришин А.Ф. «Статистика» Учеб. пособие 2003. — 240 с.
13. Практикум по теории статистики. Учебное пособие
14. Шмойлова Р.А., Финансы и статистика — 2001, 416 стр.
15. Под ред. И.И. Елисеевой «Социальная статистика» Учебник. — 3-е изд., перераб. и доп. 480 стр.

* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.

источник

Главная Математика, химия, физика Применение статистических группировок в обработке результатов деятельности торговых организаций

Этап II. Использование полученных относительных величин для определения многомерной средней по формуле:

k — число факторных признаков.

Этап III. Определение общих факторов: А, В, С, D …, включающих идентичные по экономическому содержанию факторные признаки (х1, х2, х3, х4 …), и расчет их многомерных средних:.

Этап IV. Построение аналитической многомерной группировки, в основание которой положена многомерная средняя.

Этап V. Определение числа групп исходя из объема совокупности, определение ширины равного интервала для большого объема наблюдений:

Этап VI. Определение числа единиц изучаемой совокупности по и т.д. в каждой группе.

Рассмотрим использование многомерных средних на примере классификации филиальной сети Сбербанка России по основным финансовым показателям по состоянию на 1 января 2012 г. с целью выделения однородных групп территориальных банков. В таблице 9представлены основные показатели, характеризующие финансовое состояние коммерческих банков.

Получили матрицу многомерных средних общих факторов таблица 10. Рассчитаем ширину интервала группировки по многомерной средней, одинаковое для каждой группы:

Число групп = (1,171 0,835): 3= 0,112.

На основании произведенных расчетов была выполнена группировка территориальных банков Сбербанка России по многомерной средней. Ее цель заключалась в выявлении влияния отдельных факторных показателей (…) на платежеспособность (Y — результативный показатель) коммерческого банка.

Таблица 9 — Классификации филиальной сети Сбербанка России по основным финансовым показателям по состоянию на 1 января 2012 г.

Финансовая устойчивость, рентабельность (А):

Качество кредитного портфеля

Эффективность использования привлеченных средств

Риски (процентный и кредитный) (D):

Платежеспособность — результативный показатель

Группировка банков показала, что из трех выделенных групп по многомерной средней больше половины банков (59%) имеют самую высокую платежеспособность. Их средний коэффициент платежеспособности равен 1,203, т.е. суммарные обязательства территориальных банков превышают на 20,3% вложенные активы. Обобщенные факторы оказали различное влияние на платежеспособность банков, так в I группе (до 0,947) многомерной классификации больше влияния на этот показатель оказала ликвидность и меньше влияния оказали риски.

Для большинства банков, вошедших во II группу (от 0,947 до 1,059) классификации (10 банков) и имеющих лучшую платежеспособность из всех выделенных групп, такое финансовое состояние обосновывается влиянием финансовой устойчивости и рентабельности.

Таблица 10 — Матрица отношений и многомерная средняя основных финансовых показателей филиальной сети Сбербанка России на 1 января 2012 г.

Таблица 11 — Классификации филиальной сети Сбербанка России по основным финансовым показателям по состоянию на 1 января 2012 г.

В III группу (от 1,059 и выше) вошли всего три банка, имеющие самую большую многомерную среднюю, которая объясняется влиянием на платежеспособность рисков (кредитного и процентного).

Более обоснованным методом многомерной классификации является кластерный анализ (агломеративно-иерархический метод), преимущество которого заключается в более точной оценке однородности групп, обеспеченной использованием различных алгоритмов иерархической классификации: метод «ближайшего соседа», метод «дальнего соседа», метод k-средних.

Реализация этого метода происходит с использованием прикладных компьютерных программ, что значительно расширяет возможности статистического анализа и делает его перспективным.

Слово «кластер» (cluster) обозначает скопление, группу элементов, характеризуемых каким-либо общим свойством, наиболее важными из которых являются:

плотность, позволяющая определить кластер как скопление точек в пространстве данных;

дисперсия, характеризующая степень рассеяния точек в пространстве относительно центра кластера.

форма — это расположение точек в пространстве;

отделимость, характеризующая степень перекрытия кластеров и расстояние между ними в пространстве.

Не все из этих свойств достаточно четко формализуемы, поэтому существуют специальные коэффициенты сходства: коэффициент корреляции, меры расстояния, коэффициент ассоциативности, вероятностные коэффициенты сходства. Из всех этих инструментов был выбран наиболее приемлемый в силу наглядности и относительной простоты расчета — меры расстояния.

Выбор расстояния является ключевым моментом исследования, от которого зависит окончательный вариант разделения объектов на кластеры. Одним из используемых при многомерной классификации меры расстояния является Евклидово, или Хемингово, расстояние.

Евклидово расстояние имеет определенные преимущества (например, расстояние между двумя объектами не изменяется при введении в анализ нового объекта, которое может показаться выбросом) и вычисляется по исходным данным, тем не менее на расстояние могут сильно влиять различия между осями, по координатам которых вычисляются эти расстояния.

Оно является геометрическим расстоянием в многомерном пространстве и вычисляется следующим образом:

источник