Меню Рубрики

Какая информация нужна для анализа

Несмотря на то, что «процесс анализа информации» — это скорее технический термин, но его наполнение на 90 % связано с деятельностью человека.

Понимание потребностей в основе любой задачи по анализу информации тесно связано с пониманием бизнеса компании. Сбор данных из подходящих источников требует опыта в их подборе, независимо от того, насколько окончательный процесс сбора данных может быть автоматизирован. Для превращения собранных данных в аналитические выводы и эффективного применения их на практике необходимы глубокие знания бизнес-процессов и наличие навыков консультирования.

Процесс анализа информации представляет собой цикличный поток событий, который начинается с анализа потребностей в рассматриваемой области. Затем следует сбор информации из вторичных и (или) первичных источников, ее анализ и подготовка отчета для лиц, ответственных за принятие решений, которые будут его использовать, а также давать свои отзывы и готовить предложения.

На международном уровне процесс анализа информации характеризуется следующим образом:

  • Сначала в ключевых бизнес-процессах определяются этапы принятия решений, которые сопоставляются со стандартными конечными результатами анализа информации.
  • Процесс анализа информации начинается с оценки потребностей на международном уровне, т. е. с определения будущих потребностей, связанных с принятием решений, и их проверкой.
  • Этап сбора информации автоматизирован, что позволяет выделить время и ресурсы на первичный анализ информации и, соответственно, повысить ценность уже имеющейся вторичной информации.
  • Значительная часть времени и ресурсов тратится на анализ информации, выводы и интерпретацию.
  • Полученная в результате аналитическая информация доводится до сведения каждого лица, ответственного за принятие решений, в индивидуальном порядке с отслеживанием процесса ее дальнейшего использования.
  • У членов группы, которая занимается анализом информации, сформирована установка на непрерывное совершенствование.

Термин «процесс анализа информации» означает непрерывный, цикличный процесс, который начинается с определения информационных потребностей людей, ответственных за принятие решений, и заканчивается предоставлением того объема информации, который соответствует этим потребностям. В этом отношении необходимо сразу же провести различие между объемом информации и процессом анализа информации. Определение объема информации направлено на выявление целей и потребностей в информационных ресурсах для всей программы анализа информации, тогда как процесс анализа информации начинается с определения потребностей по одному, пусть даже и незначительному, конечному результату такого анализа.

Процесс анализа информации всегда должен быть привязан к существующим в компании процессам, то есть стратегическому планированию, продажам, маркетингу или управлению производством товара, в рамках которых и будет использоваться данная информация. На практике же использование полученной на выходе информации должно быть либо напрямую связано с ситуациями принятия решений, либо такая информация должна способствовать повышению уровня информированности организации по тем направлениям операционной деятельности, которые имеют отношение к различным бизнес-процессам.

На рис. 1 показаны этапы цикличного процесса анализа информации (подробнее об этом см. ниже). В свою очередь, в правой части диаграммы показаны конкретные итоги процесса анализа информации, когда решения принимаются на основе общих исследований рынка, и итоги процесса анализа информации, прямо связанного с различными бизнес-процессами и проектами.


Кликните мышкой по изображению, чтобы увеличить его

Цикл анализа информации состоит из шести этапов. Их подробное описание приведено ниже.

Тщательная оценка потребностей позволяет определить цели и объем задачи по анализу информации. Даже если те, кто решает такую задачу, будут вести сбор информации для собственного использования, имеет смысл четко обозначить ключевые направления в решении этой задачи для концентрации ресурсов в наиболее подходящих областях. Однако в подавляющем большинстве случаев те, кто проводит исследования, не являются конечными пользователями его результатов. Поэтому они должны иметь полное представление о том, для чего будут использоваться конечные результаты, чтобы исключить сбор и анализ данных, которые в конечном итоге могут оказаться неактуальными для пользователей. Для этапа анализа потребностей разработаны различные шаблоны и анкеты, задающие высокую планку качества на начальной стадии решения задачи.

Однако самое важное заключается в том, что потребности организации в анализе информации должны быть до конца изучены и трансформированы из внешних во внутренние для того, чтобы программа анализа информации представляла собой определенную ценность. Сами по себе шаблоны и анкеты не могут обеспечить достижение этой цели. Они, естественно, могут оказаться полезными, но бывали случаи, когда отличный анализ потребностей проводился просто на основе неофициальной беседы с руководителями компании. Это, в свою очередь, требует от группы по анализу информации подхода с позиций консультирования или, по крайней мере, умения продуктивно вести деловые переговоры с теми, кто отвечает за принятие решений.

В рамках цикла анализа информации мы отдельно выделяем сбор информации из вторичных и первичных источников. Для этого есть ряд причин. Во-первых, сбор информации из общедоступных источников обходится дешевле, чем обращение напрямую к первичным источникам. Во-вторых, это проще, при том, разумеется, условии, что люди, перед которыми поставлена такая задача, имеют достаточный опыт изучения имеющихся вторичных источников. На самом деле, управление источниками информации и связанная с этим оптимизация затрат сами по себе являются отдельной областью знаний. В-третьих, охват вторичных источников информации перед проведением исследований в форме интервью даст тем, кто проводит такие исследования, ценную базовую информацию общего характера, которую можно проверить и использовать, выдавая ее в ответ на информацию от интервьюируемых. Кроме того, если в ходе изучения вторичных источников удастся получить ответы на некоторые вопросы, это снизит стоимость этапа исследований первичных источников, а иногда и вовсе исключит необходимость их проведения.

Каким бы огромным ни был объем имеющейся на сегодняшний день общедоступной информации, не ко всем сведениям можно получить доступ через изучение вторичных источников. После изучения вторичных источников пробелы в исследовании можно заполнить, интервьюируя экспертов, хорошо знакомых с темой исследования. Этот этап может оказаться относительно дорогим по сравнению с изучением вторичных источников, что, естественно, зависит от масштаба поставленной задачи, а также от того, какие ресурсы задействованы: нередко компании привлекают к участию в исследованиях первичных источников сторонних исполнителей.

После сбора информации из различных источников необходимо разобраться, что именно из этого нужно для первоначального анализа потребностей в соответствии с поставленной задачей. Опять-таки, в зависимости от объема поставленной задачи этот этап исследований может оказаться довольно затратным, так как включает в себя, по меньшей мере, временные затраты внутренних, а иногда и внешних, ресурсов и, возможно, некую дополнительную проверку правильности результатов анализов посредством дальнейших интервью.

Формат предоставления результатов после выполнения задачи по анализу информации имеет для конечных пользователей немаловажное значение. Как правило, у людей, ответственных за принятие решений, нет времени на поиск ключевых результатов анализа в большом объеме полученных ими данных. Основное содержание необходимо перевести в легкий для восприятия формат с учетом их требований. В то же время следует обеспечить удобный доступ к дополнительным фоновым данным для тех, кто заинтересуется и захочет «копнуть глубже». Эти основные правила применяются независимо от формата предоставления информации, будь то программное обеспечение с базой данных, информационный бюллетень, презентация PowerPoint, личная встреча или семинар. Кроме того, существует еще одна причина, по которой мы отделили этап предоставления информации от конечного использования, а также получения отзывов и предложений по предоставленной аналитической информации. Иногда решения будут приниматься в той же последовательности, в которой будет предоставляться аналитическая информация. Однако гораздо чаще базовые, справочные материалы будут предоставлены до того, как возникнет фактическая ситуация принятия решения, поэтому формат, канал и способ предоставления информации влияют на то, как она будет восприниматься.

Этап использования служит своего рода лакмусовой бумажкой для оценки успешности выполнения задачи по анализу информации. Он позволяет понять, отвечают ли полученные результаты потребностям, определенным в самом начале процесса анализа информации. Независимо от того, были ли получены ответы на все первоначально заданные вопросы, на этапе использования, как правило, возникают новые вопросы и необходимость в новом анализе потребностей, особенно если потребность в анализе информации носит постоянный характер. Кроме того, в результате совместных усилий по созданию информационных материалов конечными пользователями и специалистами в области анализа информации к моменту перехода на этап ее использования может оказаться, что конечные пользователи такой информации уже внесли свой вклад в ожидаемый конечный результат. С другой стороны, те, кто в основном занимался анализом, могут быть активно задействованы в процессе формирования выводов и интерпретации результатов, на основании которых будут приниматься окончательные решения. В идеале продуманные замечания и комментарии на этапе использования уже можно использовать в качестве основы для оценки потребностей в рамках следующей задачи анализа информации. Таким образом, цикл процесса анализа информации завершается.

Определение этапов принятия решений в бизнес-процессах, которые требуют проведения аналитических исследований рынка

Термин «анализ информации для этапа принятия решения» приобретает все большую популярность, поскольку компании, в которых уже действует программа анализа информации, начали рассматривать различные варианты более эффективной интеграции этих программ в процессы принятия решений. Насколько абстрактными, или наоборот конкретными, будут меры по «улучшению связи между конечными результатами анализа информации и бизнес-процессами», в значительной степени будет зависеть от того, были ли данные бизнес-процессы определены формально, а также от того, есть ли у группы по анализу информации понимание конкретных информационных потребностей, связанных с этапами принятия решений в рамках этих процессов.

Как мы упоминали в главе 1, методы и способы, которые обсуждаются в этой книге, оптимально подходят для компаний, у которых уже имеются структурированные бизнес-процессы, например процесс выработки стратегии. Компаниям, управление которыми не так четко структурировано, возможно, придется проявить некоторую креативность при использовании подходов методики проведения анализа рынка международного уровня с учетом действующих у них схем управления. Тем не менее, основные принципы, которые мы здесь рассматриваем, подойдут для любой компании.

Оценка потребностей в анализе информации: почему это так важно?

С учетом того, что понимание ключевых требований к анализу информации в самом начале этого процесса оказывает более сильное влияние на качество конечных результатов, чем какой бы то ни было этап данного процесса, поразительно, что этапу оценки потребностей нередко уделяется слишком мало внимания. Несмотря на потенциальную ограниченность ресурсов на других этапах процесса анализа информации, одно лишь пристальное внимание к оценке потребностей во многих случаях позволило бы существенно повысить ценность и применимость конечных результатов данного процесса, оправдывая таким образом затраты времени и ресурсов на выполнение задачи по анализу информации. Ниже мы рассмотрим конкретные способы улучшения качества оценки потребностей.

Нередко автоматически считается, что руководство знает, какая информация нужна компании. Однако на самом деле высшее руководство, как правило, имеет представление лишь о части информационных потребностей своей организации и даже в этом случае, возможно, находится не в самом лучшем положении, чтобы точно определить, какая информация нужна, не говоря уже о том, где ее можно найти.

В результате постоянно повторяется ситуация, когда для выполнения задач по анализу информации нет ни четко сформулированного представления о проблеме, ни ее бизнес-контекста. Те, кто лучше всего знаком с источниками информации и методами анализа, тратят время на беспорядочную, по всей видимости, обработку данных и не видят картины в целом, а также тех подходов, которые имеют наиболее существенное значение для компании. Неудивительно, что в результате люди, ответственные за принятие решений, получают гораздо больше информации, чем им нужно, что в принципе контрпродуктивно, поскольку вскоре они начинают игнорировать не только бесполезную, но и важную информацию. Им нужен не больший объем информации, а более качественная и точная информация.

В то же время у людей, ответственных за принятие решений, могут быть нереалистичные ожидания по поводу доступности и точности информации, так как перед постановкой задачи они не проконсультировались со специалистами в области анализа информации. Следовательно, в идеале специалисты в области анализа информации и люди, ответственные за принятие решений, должны находиться в постоянном контакте друг с другом и вместе работать над тем, чтобы обе стороны имели одинаковое представление о первоочередных информационных потребностях. Умение управлять этим процессом потребует от аналитиков, работающих в этом направлении, целого ряда навыков:

  • Аналитик должен понимать, как выявлять и определять информационные потребности людей, ответственных за принятие решений.
  • Аналитик должен развивать навыки эффективного общения, проведения интервью и презентаций.
  • В идеале аналитик должен разбираться в психологических типах личности, чтобы учитывать различную направленность людей, ответственных за принятие решений.
  • Аналитик должен знать организационную структуру, культуру и среду, а также ключевых опрашиваемых лиц.
  • Аналитик должен сохранять объективность.

На начальных этапах внедрения программы анализа информации целевая группа для проведения мероприятий, как правило, ограничена, равно как и конечные результаты, которые дает программа. Аналогичным образом при обработке конечных результатов часто возникают различные затруднения (так называемые «узкие места»): даже простой сбор разрозненных данных из вторичных и первичных источников может потребовать знаний и опыта, которых у компании нет, а после завершения сбора информации может оказаться, что времени и ресурсов для проведения детального анализа собранных данных недостаточно, не говоря уже о подготовке информативных и тщательно проработанных презентаций, которыми могли бы воспользоваться люди, ответственные за принятие решений. Более того, на начальных этапах разработки программы анализа информации практически ни у одной компании нет специальных инструментов хранения и распространения результатов такого анализа. Как правило, в конечном итоге результаты предоставляются целевым группам в виде обычных вложений, пересылаемых по электронной почте.

Сложности выполнения аналитической задачи в рамках цикла анализа информации можно описать, пользуясь стандартным треугольником управления проектом, т. е. необходимо выполнить задачу и выдать результат при трех основных ограничениях: бюджете, сроках и объеме работ. Во многих случаях эти три ограничения конкурируют между собой: в стандартной задаче по анализу информации увеличение объема работ потребует увеличения сроков и бюджета; жесткое ограничение по срокам, вероятно, будет означать увеличение бюджета и одновременное сокращение объема работ, а ограниченный бюджет, скорее всего, означает как ограничение объема работ, так и сокращение сроков на реализацию проекта.

Возникновение в процессе анализа информации «узких мест» обычно приводит к существенным трениям при выполнении исследовательской задачи в рамках цикла анализа информации на начальных этапах разработки программы для такого анализа. Поскольку ресурсы ограничены, в первую очередь следует устранить наиболее критичные «узкие места». Достаточно ли у группы по анализу информации возможностей для его проведения? Необходимо ли дополнительное обучение? Или проблема скорее заключается в том, что аналитикам не хватает ценной информации, с которой можно работать — другими словами, наиболее критичным «узким местом» является сбор информации? А может быть, группе по анализу информации просто не хватает времени, то есть группа не в состоянии своевременно реагировать на срочные запросы?

Повысить эффективность выполнения аналитической задачи в рамках цикла анализа информации можно в двух направлениях. «Производительность» цикла, т. е. тщательность, с которой группа по анализу информации может обрабатывать аналитические задачи на каждом этапе, и скорость ответа на вопрос. На рис. 2 показана разница между этими подходами и в целом различие между задачами по стратегическому анализу и запросами на проведение исследований, требующими оперативного реагирования.

Хотя и тот, и другой подход предполагают прохождение аналитической задачи через все этапы цикла анализа информации, группа по анализу информации, перед которой поставлена задача оперативно провести исследования, будет работать над изучением вторичных и первичных источников параллельно (иногда один телефонный звонок специалисту может дать необходимые ответы на вопросы, поставленные в запросе на проведение исследований). Кроме того, во многих случаях анализ и предоставление информации объединены, например, в кратком обзоре, который аналитик передает руководителю, запросившему данную информацию.

Производительность цикла анализа информации можно повысить, добавив либо внутренние (нанятые), либо внешние (приобретенные) ресурсы там, где они необходимы, что позволит добиться более качественных результатов и расширить возможности по обслуживанию все большего количества групп пользователей в пределах организации.

Тот же принцип применим и к обеспечению быстродействия при реализации последовательности операций, т. е. важно то, насколько быстро срочная задача по проведению исследований проходит через различные этапы цикла. По сложившейся традиции компании преимущественно концентрируются на обеспечении стабильной пропускной способности посредством долгосрочных схем планирования ресурсов и обучения персонала. Однако по мере развития такого специализированного направления, как анализ информации, и повышения доступности глобальных профессиональных ресурсов, привлекаемых со стороны, все большее распространение получают и временные схемы, реализуемые в каждом конкретном случае и обеспечивающие необходимую гибкость.

На рис. 3 показаны два типа итоговых результатов цикла анализа информации, то есть стратегический анализ и исследования, требующие оперативного реагирования (см. график конечных результатов анализа информации). Несмотря на то, что задачи по проведению исследований, требующих оперативного реагирования, обычно связаны с бизнес-процессами, уровень их анализа не очень высок из-за банальной нехватки времени для проведения такого анализа. С другой стороны, задачи по стратегическому анализу, как правило, связаны с высоким уровнем совместного творчества на этапе анализа и предоставления информации, что ставит их практически на вершину треугольника, где осуществляется интерпретация и применение полученной информации.

Отлаженность процесса анализа информации можно наглядно представить в виде графика цикла равномерной толщины (рис. 2), в том смысле, что зрелый процесс анализа информации не имеет «слабых звеньев» или существенных «узких мест» в организации последовательности операций. Такая равномерность требует соответствующего планирования ресурсов на каждом этапе, что, в свою очередь, достигается благодаря многократному прохождению цикла с учетом всех деталей. Например, первоначальную оценку потребностей можно постепенно улучшить благодаря тому, что люди, ответственные за принятие решений и пользующиеся результатами работы, будут замечать недостатки и типичные расхождения на начальном этапе выполнения задач по аналитическим исследованиям рынка. С тем же успехом можно со временем развить сотрудничество между специалистами по поиску информации и аналитиками (если эти две функции разделены) благодаря тому, что вопросы, которые ранее остались незамеченными и были подняты в ходе анализа, передаются специалистам по поиску информации с целью сбора дополнительных данных. Со временем опыт покажет, какие ресурсы нужны для каждого из этих этапов, чтобы добиться оптимальных результатов.

Какие результаты в конечном итоге являются «оптимальными», определяется тем, насколько точно полученная на выходе информация соответствует потребностям людей, ответственных за принятие решений, в рамках бизнес-процессов. И это снова возвращает нас к равномерной толщине цикла анализа информации: процесс анализа информации международного уровня начинается не с оценки потребностей как таковых, а с четкого определения, где и как будет применяться полученная на выходе информация. На самом деле, общение между людьми, ответственными за принятие решений, и специалистами в области анализа информации в рамках всего аналитического процесса международного уровня должно быть постоянным, информативным и направленным в обе стороны.

Читайте также:  Как построить гистограмму через анализ данных

Один из способов укрепления связей между принятием решений и исследованиями рынка — заключить соглашения об уровне услуг с ключевыми заинтересованными сторонами, которые обслуживает программа аналитических исследований рынка. Согласование необходимого уровня услуг по исследованиям рынка с руководителями высшего звена по стратегическому планированию, продажам, маркетингу и НИОКР позволит четко определить конечные результаты проведения таких аналитических исследований и мероприятия по каждой группе заинтересованных лиц на ближайшие 6–12 месяцев, в том числе бюджет на исследования рынка, задействованных лиц, основные этапы и взаимодействие на протяжении всего процесса.

Заключение соглашений об уровне услуг имеет ряд преимуществ:

  • Необходимо время, чтобы сесть и обсудить основные цели и этапы принятия решений по ответственным за ключевые бизнес-процессы = группа по исследованиям рынка получает более полное представление о том, что важно для руководства, и вместе с тем улучшает личные отношения.
  • Уменьшается риск непредвиденной избыточной нагрузки по специальным проектам, благодаря выявлению направлений для регулярного пересмотра, стратегического анализа информации и т. д.
  • Появляется время для совместного творчества в процессе анализа информации: нередко совещания и семинары по аналитическим исследованиям рынка с участием постоянно занятых руководителей нужно планировать за несколько месяцев.
  • Благодаря четкой постановке целей и оценке результатов упорядочиваются мероприятия по исследованиям рынка, повышается уровень аналитики.
  • В целом уменьшается замкнутость организации и так называемое «варение в собственном соку», сотрудничество между руководителями и специалистами по аналитическим исследованиям рынка становится более плодотворным.

Приведенные в конце два примера наглядно показывают, как благодаря налаженному процессу анализа информации аналитическая группа может реагировать на различные требования, содержащиеся в задаче по анализу информации, в зависимости от географического региона, который анализируется в рамках этой задачи. В «западном мире» из вторичных источников можно получить большое количество достоверной информации практически по любой теме. Благодаря этому задача специалистов в области анализа информации сводится к поискам наилучших источников для эффективного с точки зрения затрат сбора информации с целью ее последующего анализа и предоставления отчетов.

С другой стороны, на развивающихся рынках часто наблюдается нехватка надежных вторичных источников или же отсутствие необходимых данных на английском языке. Следовательно, специалистам в области анализа информации нужно быстро обратиться к первичным источникам и провести интервью, как правило, на языке данной страны. В этой ситуации важно полагаться на достаточно большое количество источников, чтобы оценить правильность результатов исследований, прежде чем перейти к их анализу.

Компании, работающей в химической отрасли, потребовался большой объем информации о существовавших ранее, современных и будущих бизнес-циклах по нескольким направлениям производства товаров химической промышленности на рынке Северной Америки. Данную информацию предполагалось использовать для оценки будущего роста по определенным направлениям производства химической продукции, а также для планирования развития бизнеса на основе понимания бизнес-циклов в отрасли.

Анализ проводился с использованием статистических методов, в том числе регрессионного и визуального анализа. Анализ бизнес-циклов проходил как в количественном, так и в качественном отношении, с учетом мнений отраслевых экспертов о долгосрочном росте. При выполнении задачи использовались исключительно вторичные источники информации, а для проведения анализа — статистические методы, в том числе регрессионный и визуальный анализ. В результате был представлен подробный аналитический отчет с описанием длительности и характера бизнес-циклов, а также оценкой перспектив на будущее для ключевых направлений производства продукции компании (этилен, полиэтилен, стирол, аммиак и бутилкаучук).

Пример. Оценка рынка гидродифторида аммония и фтористоводородной кислоты в России и СНГ

Перед одним из крупнейших в мире ядерных центров стояла задача по изучению рынка для этих двух побочных продуктов его производства, а именно гидродифторида аммония и фтористоводородной кислоты, в России и СНГ. При недостаточной емкости этого рынка им пришлось бы инвестировать в строительство объектов по утилизации указанных продуктов.

Были проведены исследования вторичных источников как на уровне России и СНГ, так и на глобальном уровне. В связи с узкоспециализированным характером рынка и высоким внутренним потреблением побочных продуктов основной упор делался на исследования первичных источников. При подготовке к последующему анализу были проведены 50 подробных интервью с потенциальными клиентами, конкурентами и специалистами отрасли.

В окончательном отчете была представлена оценка объема рынка без учета внутреннего потребления, анализ сегментов, анализ импорта, анализ цепочки создания стоимости, анализ замещающих технологий и продуктов по каждому промышленному сегменту, прогноз развития рынка, анализ ценообразования и, наконец, оценка потенциальных возможностей рынка в России и СНГ.

Пример. Эффективный процесс анализа информации на основе оценки преобладающих тенденций для представления руководителям в виде отчетов

Ведущая энергетическая и нефтехимическая компания успешно усовершенствовала процесс анализа информации, приняв за основу анализ стратегических сценариев для сбора, анализа и предоставления информации.

Благодаря интеграции мероприятий по анализу информации в ключевые бизнес-процессы на этапе планирования, удалось четко определить истинные стратегические потребности организации и довести их до аналитической группы, которая, соответственно, сумела организовать процесс анализа таким образом, чтобы основное внимание уделялось стратегии и действиям. Процесс анализа информации в компании начинается с изучения преобладающих тенденций и заканчивается наглядными примерами реагирования на риски с рекомендациями для руководства.

Ключом к повышению эффективности программы анализа информации стала успешная оценка потребностей с точки зрения стратегических целей компании. При этом ответственные за принятие решений люди участвовали в процессе анализа информации уже на начальном этапе (обсуждения, совещания, семинары). Это способствовало налаживанию двустороннего диалога и более полной интеграции программы анализа информации в другие направления деятельности компании.

Пример. Глобальная биотехнологическая компания разработала цикл анализа информации для своевременного предоставления аналитических данных и упреждающего принятия решений.

Цель программы анализа информации заключалась в предоставлении информации с целью заблаговременного оповещения и предупреждения, что позволило бы ввести в действие реализуемые и выполнимые стратегии на всех рынках, где работает компания. Был введен в действие цикл анализа информации, в котором на нескольких этапах были задействованы лица, заинтересованные в анализе информации (как для ввода, так и для вывода информации), а также многочисленные источники информации.

Лица, заинтересованные в анализе информации, представляли четыре ключевые функции в компании (группа по стратегии, маркетинг и продажи, финансы, связи с инвесторами и директора). Наиболее активная деятельность велась на этапах планирования и реализации. Успешное внедрение цикла анализа информации, объединившего внутренние заинтересованные стороны (для оценки потребностей) и многочисленные источники информации в рамках четко определенного процесса предоставления результатов анализа, означало, что реализованная аналитическая программа оказала определенное влияние на разработку стратегии и упреждающее принятие решений.

источник

В задачах машинного обучения качество моделей очень сильно зависит от данных.
Но сами данные в реальных задачах редко бывают идеальными. Как правило, самих данных не много, количество доступных для анализа параметров ограничено, в данных шумы и пропуски. Но решать задачу как-то нужно.

Я хочу поделиться практическим опытом успешного решения задач машинного обучения. И дать простой набор шагов, позволяющих выжать из данных максимум.

Решение задач анализа данных состоит из двух больших этапов:

  1. Подготовка данных.
  2. Построение на подготовленных данных моделей.

На практике, качество итоговых моделей намного сильнее зависит от качества подготовленных данных, чем от выбора самой модели и её оптимизации.

Например, XGBoost может дать улучшение качества модели порядка 5% по сравнению со случайным лесом, нейронная сеть до 3% по сравнению с XGBoost. Оптимизации, регуляризация и подбор гиперпараметров может ещё добавить 1-5%.

Но просто добавив информационные признаки, извлечённые из тех же данных, которые уже есть, можно сразу получить до 15% прироста качества модели.

Извлечение фич – это расширение пространства информационных признаков новыми данными, которые могут быть полезны для повышения качества модели, но которые модель не может извлечь сама.

Современные алгоритмы машинного обучения, такие как нейронные сети, умеют самостоятельно находить нелинейные закономерности в данных. Но для того чтобы это произошло, данных должно быть много. Иногда очень много. Так бывает не всегда. И тогда мы можем помочь нашей модели.

В своей работе я придерживаюсь следующих основных принципов:

1. найти все возможные характеристики описываемых моделью объектов;
2. не делать предположения о важности извлекаемых из данных параметров;
3. извлекаемые параметры должны быть осмыслены.

Расскажу о каждом пункте подробнее

Данные, на которых мы обучаем модель – это объекты реального мира. Изначально мы не располагаем векторами и тензорами. Всё что у нас есть – это какое-то сложное описание каждого объекта в выборке. Это могут быть, например, номер телефона, цвет упаковки, рост и даже запах.

Для нас важно всё. И из каждого из этих сложных признаков можно извлечь цифровую информацию.

Мы извлекаем всю цифровую информацию, которая может как-то охарактеризовать каждый аспект нашего объекта.

Когда-то такой подход считался плохой практикой. Линейные модели не могли работать с коррелирующими параметрами, так как это приводило к плохой обусловленности матриц, неограниченному росту весов. Сегодня проблема мультиколлинеарности практически исчерпана за счёт использования продвинутых алгоритмов и методов регуляризации. Если у вас есть рост и вес человека – берите оба эти параметра. Да, они коррелируют, но мультиколлинеарность – в прошлом. Просто используйте современные алгоритмы и регуляризацию.

Итак, рассмотрите каждый аспект вашего объекта и найдите все числовые характеристики. В конце ещё раз посмотрите и подумайте. Не упустили ли вы чего-то.

Предположим, вы располагаете номерами телефонов. Казалось бы, бесполезная информация. Но по номеру телефона можно много чего сказать. Можно узнать регион владельца номера, к какому оператору номер относится, частота оператора в регионе, относительный объём оператора и много чего ещё. Зная регион, можно добавить много параметров, характеризующих его в зависимости от решаемой вами задачи.

Если у вас есть информация об упаковке, то вы знаете её геометрические размеры. К геометрическим характеристикам относятся не только высота, ширина и глубина, но и их отношения – они тоже описывают габариты. Материал упаковки, разнообразие цветов, их яркость и много-много чего ещё.

Исследуйте диапазоны изменяемых значений каждого извлечённого признака. В некоторых случаях, например, логарифм параметра будет работать гараздо лучше самого параметра. Поскольку логарифм – характеристика порядка. Если у вас большие разбросы в диапазоне значений, обязательно логарифмируйте параметры.

Если у вас есть периодичность в параметрах, используйте тригонометрические функции. Они могут дать очень богатый набор дополнительных признаков. Например, когда одной из характеристик вашего объекта являются замкнутые кривые, использование тригонометрических функций обязательно.

Используйте внешние источники. Единственным ограничением в использовании внешних источников должна быть стоимость их извлечения относительно бюджета решаемой задачи.

Не делайте предположения о важности извлекаемых из данных параметров.
Какой бы экспертизой в предметной области мы не обладали, мы не знаем всех статистических закономерностей. Я не перестаю удивляться как иногда, казалось бы, не важные на первый взгляд вещи улучшают качество модели и выходят в топ features importance. В конечном итоге у вас будет много признаков, которые вообще не работают. Но вы не знаете заранее, какие хитрые сочетания не важных, на первый взгляд, параметров сработают хорошо.

Признаки, которые вы извлечёте, как правило, не будут работать по одиночке. И вы не найдёте корреляции с целевой переменной каждого параметра по отдельности. Но вместе они работать будут.

Ну и наконец, не засоряйте пространство информационных признаков бессмысленными фичами. Это кажется противоречащим написанному выше, но есть нюанс – здравый смысл.
Если информация хоть как-то описывает объект – она полезна. Если вы просто взяли и попарно перемножили все фичи, то, скорее всего, никакого смысла вы не добавили, но возвели в квадрат размерность признакового пространства.

Иногда можно встретить совет попарно перемножать фичи. И это действительно может сработать, если у вас линейная модель. Таким образом вы добавите нелинейность и улучшите разделимость признакового пространства. Но современные алгоритмы, в особенности нейронные сети не нуждаются в таком искусственном и неосмысленном добавлении нелинейности.
Впрочем, если вы обладаете достаточным запасом вычислительной мощности, можете так сделать и проверить сами.

Если у вас есть большой набор не размеченных данных и небольшой размеченных, можно добавить фич используя обучение без учителя. Автокодировщики работают хорошо.

Когда данные собраны, нужно навести в них порядок.

Может так получиться, что некоторые компон��нты вашего признакового пространства будут постоянны или обладать очень малой вариативностью, не имеющей статистической значимости. Выкидывайте их без сожаления.

Проверьте взаимные корреляции. Мы ставим порог по абсолютному значению взаимных корреляций 0.999. В ваших задачах он может быть другой. Но некоторые признаки могут просто линейно выражаться друг через друга. В этом случае нужно оставить только один. В случае прямой линейной зависимости смысла оставлять оба параметра из коррелирующей пары нет. Отмечу, что просто к функциональной зависимости это не относится.

И наконец, посчитайте features importance. Делать это нужно по двум причинам.

Во-первых, откровенно слабые информационные признаки могут непродуктивно нагружать ваши вычислительные ресурсы, не привнося полезной информации.

Во-вторых, вам нужно найти самые важные признаки и проанализировать их.

Удалять информационные признаки не обязательно. Сейчас есть достаточно хорошие методы обучения высокомерных моделей. Ценой будет время вычисления.
А вот самые важные признаки нужно пристально рассмотреть. На самом деле, протащить целевую переменную в пространство признаков намного проще, чем кажется на первый взгляд. Особенно, если происхождение данных не контролируется вами полностью.
Если вы видите такую картинку на вашей диаграмме важности признаков,

то это может быть не поводом для радости, а поводом для полного исключения фичи из пространства признаков.

Извлекайте все данные которые можно извлечь, но руководствуйтесь здравым смыслом.
Не пытайтесь включать эксперта, преждевременно удаляя признаки.

Используйте функциональные выражения от ваших информационных признаков, если они оправданы.

Удаляйте статистически не значимые переменные и переменные сильно коррелирующие с другими.

Сделайте диаграмму важности признаков. Возможно удалите самые не важные.
Изучите самые важные.

Если самые важные сильно выделяются на фоне остальных, изучите их особо пристально. Постройте графики распределений. Попытайтесь понять, почему они влияют так сильно. Подумайте над их удалением.

Если у вас есть возможность проверить вашу модель не только на тестовых, но и на реальных данных. Проверьте её сначала исключив подозрительно важные параметры, а затем включив их. И сравните результаты.

Приведённые здесь рекомендации зависят от того, какой алгоритм используется для построения модели. Я обычно использую нейронные сети. Эти рекомендации точно не подойдут вам, если вы используете логистические и линейные регрессии.

В статье не затронута обширная тема сбора данных. Старайтесь понять, как собирались данные для анализа. В особенности, уделите внимание формированию целевой переменной.

Объём статьи не позволяет затронуть все аспекты, но я постарался изложить основные моменты.
Большинство публикаций по машинному обучению ориентированы на описание алгоритмов. Но сбор и подготовка данных – это 95% работы по построению модели. Надеюсь, моя заметка поможет вам пореже наступать на грабли.

А какие методы улучшения качества моделей используете вы?
Автор — Валерий Дмитриев rotor
Спасибо MikeKosulin за правки 🙂

источник

Сегодня владение нужной информацией приравнивается к успеху. Тем более, дорого стоит обладание правильной и нужной информацией. Каждый из руководителей или менеджеров хоть раз думал: «Какая информация мне нужна, чтобы… (подставить нужную цель)». Интересно то, что у вас уже есть нужная, полезная, уникальная информация – это данные предприятия о его деятельности!

Анализ данных предприятия – это метод изучения и оценка результатов деятельности предприятия. А значит, в процессе такого анализа нужно изучить какой-нибудь процесс (например, продажи упали). И второе – необходимо оценить результат этого изучения (насколько упали, по сравнению с какими периодами упали).

Подобный бизнес-анализ данных предприятия важен, в первую очередь, для контроля всей деятельности предприятия. Поэтому нужен регулярный контроль (то есть анализ). Без регулярности такой контроль будет бесполезным. А кроме того, информация, полученная на основе такого анализа, играет ключевую роль в прогнозировании и планировании деятельности компании.

  1. Собираем информацию для анализа (обычно это внутренние источники компании – базы данных, CRM-системы, учетные системы).
  2. Затем всю информацию консолидируют, приводят к единому виду: извлекают данные, преобразуют и загружают в хранилище данных.
  3. Теперь эти данные нужно представить в удобном, «читаемом» виде – обычно используются таблицы и графике.
  4. И вот только сейчас начинается собственно анализ данных предприятия.
  5. В итоге – получаем некий набор данных, но их еще нужно интерпретировать: на этом этапе делаются выводы, высказываются гипотезы и делаются прогнозы.

Таким образом можно анализировать любые данные компании:

  • складскую деятельность,
  • хозяйственную деятельность,
  • финансовую отчетность.

Анализ финансовой отчетности – это применение методов и инструментов анализа к документам финансовой отчетности отделов. Но, конечно, с целью – для получения информации и результатов, на основе которых можно принимать стратегически верное решение. Главное преимущество такого анализа – после его проведения вы в меньшей степени полагаетесь на догадки и предположения, а в большей – на свои же собственные данные и опыт.

У анализа финансовой отчетности могут быть разные цели:

  • для кредиторов важна ликвидность компании,
  • для инвесторов – показатели рентабельности,
  • а для налоговых органов – корректность выплаты налогов.
  • Для начала выберите подходящие (целевые) коэффициенты: будут ли это плановые показатели самой компании, или те же показатели, но с учетом экономической ситуации, или вообще – такие же коэффициенты, но у компании-лидера рынка? Решать вам. Важно, с чем будем сравнивать при анализе.
  • Потом готовим исходные данные. И в первую очередь – это бухгалтерская отчетность. Она содержит реальные данные на текущий момент и данные за отчетные периоды. А значит, на основе этих данных можно смело строить прогнозы.
  • Затем рассчитываем показатели. Это собственные коэффициенты компании, которые необходимы бизнес-аналитику, чтобы получить более полное и верное представление о состоянии дел. Сравнение финансовых коэффициентов делается за несколько прошлых периодов. Обычно в анализе финансовой отчетности используют следующие показатели:
    — расчет показателей ликвидности
    — показатели платежеспособности
    — показатели рентабельности
    — оборачиваемость
  • Наконец, проводится собственно анализ.
  • И делается аналитическое заключение – с выводами, предположениями и прогнозами.
Читайте также:  Папилломы на шее какие анализы сдавать

Конечно, это огромный труд – как временной, так и ресурсный. Что может помочь упростить и автоматизировать работу?

Сейчас в основном подобный анализ финансовых данных делается в таблицах, на основе которых могут быть построены данные. Функциональность таблиц позволяет ускорить процесс. Но есть минусы такого подхода – много источников информации на начальном этапе, данные в которых представлены в разном виде, ручное внесение этих данных, сложная для восприятия информация на выходе – много таблиц, цифр и непоказательные графики.

Сегодня уже появились интересные аналитические решения и инструменты, которые в разы сокращают время на внесение данных и их обработку и анализ. Крупные компании, конечно, уже столкнулись с проблемой быстрого анализа большого объема информации и многие уже внедрили решения на основе Tableau.

Представители компаний говорят о том, что отчеты и данные, которые делались раньше табличными методами по 6-8 часов, с помощью Tableau собираются за 10 минут!

Узнать больше о Tableau можно в разделе Обучение — прочитайте нашу Базу знаний.

Или просто напишите нам — и мы проведем вам презентацию и расскажем о продукте подробнее.

Хотите узнать, как провести анализ и сделать отчеты быстро?

источник

Заключительная часть серии статей от AIC о том, как анализировать ю-тесты

В прошлой статье мы писали, что на юзабилити-тестировании приоритетнее записывать действия респондента, а мнение и комментарии — по возможности. Вы можете вести записи во время тестирования и/или после по видеозаписи.

Выбирайте наиболее удобный и эффективный для вас формат сбора данных. Собирать их вы можете на стикерах, бумаге, в протокол или электронный документ.

Для записи на чистую бумагу запаситесь достаточным количеством листков и ручек, чтобы не пришлось сбегать с интервью. Помечайте вопрос, который вы задаете респонденту, затем записывайте его действия, ошибки и особо эмоциональные комментарии.

Другой вариант записи данных от руки: распечатайте сценарий вашего интервью на половину страницы, а данные записывайте на вторую половину. Старайтесь записывать данные в едином формате для всех респондентов, чтобы потом было просто соотнести их между собой и сделать выводы.

К примеру, вы можете разделить листок или документ на несколько частей в соответствии с шагами, который выполняет пользователь на сайте или в приложении. Напротив каждой такой части фиксируйте наблюдения за всеми респондентами. В итоге получите табличку, в которой будут уже рассортированные наблюдения, по которым легко будет делать выводы о каждом задании и шаге.

Первые два варианта подойдут тем, кто уверен в своем почерке и скорости письма. Альтернативой является запись в документ на компьютере. Для протокола лучше всего использовать табличку, в первом столбце которой будет сценарий интервью, а в других столбцах записи за респондентами.

Во время интервью записывайте пошагово действия и слова респондента. Не пытайтесь интерпретировать, давать оценку его действиям и словам. К примеру, если пользователь несколько раз пытался ввести свой пароль, есть соблазн написать: «Не понимает подсказку как создать пароль». Записывайте только факты: «Три раза пытался создать пароль, не получилось». Со словами так же — записывайте прямую речь, не делая выводов.

После тестов собирается достаточно много записей, особенно если у вас было больше 10 респондентов. Поэтому постарайтесь сначала выделить основные сложности, с которыми столкнулись участники исследования на каждом шагу. Следом найдите комментарии (пользовательскую оценку) респондентов по каждому этапу и в целом по отношению к продукту. Для каждого пункта таблицы анализируйте собранные данные и составляйте выводы.

К примеру, если несколько человек не смогли или не сразу придумали правильный пароль, то можно это выделить в проблему: «Пользователи не понимают, как составить пароль».

Если у заказчика были конкретные вопросы до исследования, найдите в данных ответы на них и отметьте, чтобы потом внести в отчет или презентацию. Данные нужно тщательно отобрать и интерпретировать их, исходя из контекста — ответ пользователя всегда зависит от его персональной ситуации, и при выводах нужно учитывать все детали.

К примеру, человек говорит, что не будет пользоваться авторизацией через соцсети. Причинами могут быть:

  • боязнь утечки персональных данных;
  • респондент не пользуется социальными сетями;
  • привык использовать и получать сообщения только на почту.

При любом из этих ответов мы не можем однозначно ответить: убирать такую авторизацию, оставить или изменить ее. Нужно разбирать ситуацию каждого респондента, чтобы не сделать неверных выводов на основании его ответов. И затем, при необходимости — проверять это на большой аудитории продукта.

Итак, вы провели интервью и собрали все данные. Проведите их анализ и сделайте выводы. При анализе записанных интервью смотрите каждый шаг заданий по каждому респонденту и группируйте наблюдения по общим темам. Прочитав все наблюдения по одной теме, постарайтесь сделать общие выводы для всех респондентов.

Проставьте в таблице оценку успешности прохождения сценариев каждому респонденту в зависимости от его ошибок: от «не выполнено» до “выполнено успешно”. После этого оцените, какие из заданий или шагов тестирования оказались наиболее проблемными и сложными для прохождения — о них стоит сообщить команде и заказчику в первую очередь.

Также в процессе тестирования отмечайте: какими путями при прохождении сценариев респонденты пользуются чаще, какие элементы вызывают положительную оценку или упрощают прохождение заданий. Это пригодится при редизайне, для планирования элементов и принятия решений о выборе ключевых их них.

После того, как вы выделили темы и собрали проблемы, не забудьте оценить их по критичности прохождения сценария исходя из того, как они влияли на респондентов:

  • Критические проблемы — из-за которых пользователь не может пройти сценарий,
  • Серьезные проблемы — увеличивают время прохождения сценария,
  • Минорные проблемы — вызывают вопросы у пользователей, но не влияют на прохождение сценариев.

Если в ходе тестирования респондент столкнулся с неинтерфейсными проблемами, их стоит вынести в раздел инсайтов. Инсайты — это знания, которые вы получили во время интервью или тестирования, но которые не относятся напрямую к интерфейсу. Здесь содержатся знания, которые могут быть полезны представителям бизнеса в целом и сделают отчет интересным не только команде продукта.

К примеру, респонденты отказываются оформлять заказ, потому что нет возможности оплатить заказ при получении. Стоит сообщить об этом команде и проверить с аналитиками, сколько пользователей уходит на этапе оплаты.

Выпишите полученные проблемы и инсайты исследования в отдельную табличку по каждому заданию и шагу — это содержание основной части вашего отчета. Такой список можно дополнить пояснениями, которые помогут другим членам команды понять, в чем конкретно состоит проблема и что происходило с пользователями при прохождении сценария.

Мы всегда делаем комплексные работы — с дизайном и A/B тестами. Поэтому важно понятно донести полученные результаты до команды, чтобы внести правильные изменения в интерфейс и протестировать их на большей выборке.

В создании отчета принимает участие специалист, проводящий исследования, ведущий UX-специалист с экспертными знания в отрасли, менеджер продукта и дизайнер (на случай, если нужна помощь в отрисовке макетов).

Отчет помогает членам команды и заинтересованным лицам узнать о недостатках продукта и точках роста. Также он помогает сравнить результативность продукта по прошествии нескольких итераций и отследить изменения.

В зависимости от целей исследования отчет также может включать в себя план развития продукта:

  • перечень исправлений текущего продукта и введение нового функционала;
  • список гипотез для A/B тестирований;
  • предложение по глобальной перестройке продукта.

Если команда торопится с внедрением изменений в продукт или не нуждается в оформлении результатов — их можно презентовать команде, обсудить и передать в работу.

Для внешних заказчиков или руководства лучше составлять отчет или презентацию, в которых будет рассказано все об исследовании с самого начала. Текст отчета должен быть максимально простым, конкретным и поясняющим. Старайтесь писать его как будто для людей, которые никогда не слышали про юзабилити-тестирования, про детали продукта и его возможности. Для наглядности добавьте скриншоты.

Начните отчет с описания тестируемого продукта, целей тестирования и вопросов, которые были до тестирования. В начале отчета должно быть описание самого исследования: как и где оно проводилось, на каких сегментах ЦА.

Основная часть отчета состоит из описания инсайтов, проблем интерфейса и рекомендаций по их решению. Сделайте выводы:

  • о том, какие задания были наиболее сложными;
  • о тенденциях в интерфейсе, которые были основными причинами ошибок и проблем;
  • о разных сегментах ЦА: были ли такие, которые справились хуже остальных, чем различается опыт групп.

Часть проблем может быть известны из данных аналитики или данных заказчика. В отчете эти проблемы следует раскрыть максимально, чтобы затем минимизировать уход пользователей.

К примеру, из данных аналитики мы знали, что анкета является узким местом на пути оформления покупки билетов. Поэтому в исследовании необходимо узнать, в чем причина проблемы.

Постарайтесь разобраться в каждом случае: почему проблема возникла, как сильно она нарушает сценарий, какие неверные или лишние действия совершают респонденты в процессе. Это поможет вам понять, какое решение позволит ликвидировать или снизить влияние проблемы.

В описании проблемы напишите, как она проявлялась во время тестирования (что делали респонденты), вставьте скриншот экрана, на котором есть эта проблема.

Опирайтесь на действия респондентов, а не на их слова, потому что часто это не совпадает. Например, респонденты не могут выполнить задание или выполняют его неправильно, но при этом говорят, что сайт удобный и понятный.

Старайтесь к каждой проблеме и инсайтам сформулировать рекомендацию. Это может быть текстовая рекомендация. Например, исправить верстку или оптимизировать скорость загрузки страницы. Либо это может быть макет элемента или целой страницы, или страница в дизайне. При этом визуальные рекомендации следует описывать: что сделали, что изменилось.

Если мы проводим юзабилити-тест с последующим A/B тестированием, на финальном этапе мы приоритезируем гипотезы, чтобы определиться с очередностью их запуска. Мы обсуждаем в команде с аналитиками все проблемы и оцениваем каждую гипотезу по нескольким критериям (обычно мы применяем PIE-фреймфорк):

  • Потенциал — то, как много улучшений можно сделать на странице. Как правило, потенциал устанавливается, опираясь на экспертную оценку исследователей, мнение клиентов, данные веб-аналитики по поведению пользователей на странице и трафику.
  • Важность — насколько ценен трафик на странице. Самые важные страницы — это страницы с самым дорогим и большим трафиком. Возможно, в результате тестирования мы найдем страницы со множеством ошибок юзабилити, но если они не имеют большого значения для бизнеса и не играют ключевой роли в достижении пользовательской цели, то приоритет по этой странице можно опустить.
  • Легкость — насколько легко будет выполнить тест на странице (техническая реализация, организационные или политические барьеры).

После этого согласовываем список с заказчиком, поочередно выкатываем гипотезы на A/B тестирование и замеряем их эффективность.

Автор — Александра Вязовик, UX-исследователь в AIC

источник

Время чтения: 26 минут Нет времени читать? Нет времени?

Крутая бизнес-идея — это половина успеха. Вторая половина — кропотливая аналитическая работа и тщательное планирование. Причем потратить время на это лучше до того, как вы вложите в свое детище хотя бы рубль, чтобы потом не было мучительно больно.

На просторах интернета можно найти десятки историй, в которых бизнес разваливался просто потому что предприниматель не уделил достаточно внимания анализу рынка на старте. Да что далеко ходить, у автора этой статьи тоже есть свой печальный опыт. Поэтому с уверенностью могу сказать: исследование рынка — не формальность. Оно позволит принять правильное решение в тех случаях, когда лучше вообще не начинать, или скорректировать планы, если шансы на успех все же есть.

Разберемся, как проанализировать рынок перед запуском бизнеса и не потратить на это много времени и денег.

Кому-то этот этап покажется необязательным и излишним. Однако отнестись к нему стоит серьезно. Именно задачи и цели определяют, какой информации достаточно для анализа. Если вы будете исследовать рынок, не имея перед собой списка вопросов, рискуете потратить кучу времени на сбор и обработку лишней информации.

Перед запуском бизнеса прежде всего нужно понять, насколько перспективно вообще затевать эту историю. Поэтому главная цель исследования будет звучать так:

Определить целесообразность запуска нового бизнеса в выбранной нише.

Я буду рассматривать каждый этап на примере анализа гипотетического бизнеса — парикмахерской, которую планируется открыть в Твери. Моя цель — определить целесообразность открытия новой парикмахерской в городе.

Теперь нужно сформулировать задачи, решение которых поможет нам достичь цели. Чтобы определить целесообразность, нужно:

  1. Узнать емкость и динамику рынка.
  2. Оценить уровень спроса и релевантность вашего предложения потребностям целевой аудитории.
  3. Проанализировать конкурентную ситуацию на рынке, выявить сильных игроков.
  4. Изучить внешние факторы и глобальные тенденции, которые могут повлиять на рынок.

Список задач можно использовать в качестве плана, которым вы будете руководствоваться при исследовании рынка.

Для моей гипотетической парикмахерской задачи будут выглядеть аналогично. В дальнейшем мы развернем каждый пункт в детальный список вопросов.

Анализ рынка начинается со сбора данных, которые впоследствии нужно будет структурировать и обработать.

Понять, что у нового бизнеса нет шансов в выбранной нише, иногда удается уже на этом этапе. Тогда не приходится тратить время на исследование покупателей и конкурентов.

Чтобы иметь общее представление о перспективности рынка, нужно ответить на вопросы:

  1. Какова емкость рынка?
  2. Какова его динамика?
  3. Как менялся рынок в последние несколько лет?

Вычислить точные показатели в некоторых сферах и тем более для конкретных регионов проблематично. Но для нашей цели этого и не нужно. Достаточно найти подтверждения тому, что рынок не падает, и на нем есть место для новых игроков. Если вы открываете не интернет-магазин и не планируете работать на всю страну, важно рассматривать вопросы в контексте конкретного региона.

Поскольку я скорее теоретик, чем практик-бизнесмен, за определением емкости и сопутствующими понятиями обратимся к теории маркетинга.

Емкость рынка — это количество товаров или услуг, которые покупатели готовы купить по сложившимся ценам.

Обычно рассчитывается для конкретной территории и за конкретный период, чаще всего — за год. Так, для моего примера мне нужно вычислить, какой объем парикмахерских услуг готовы купить жители Твери за год. Показатель можно представить в натуральном — например, количество стрижек — и денежном выражении.

  • уровня потребления продукта;
  • наличия аналогичных способов удовлетворить ту же потребность;
  • уровня цен;
  • качества товаров;
  • эффективности маркетинговых и рекламных вложений и т. д.

Показатель рассчитывают несколькими способами: экспертный подход, экономико-математическое моделирование, метод отраслевого роста и другие. Все они довольно трудоемки и затратны по времени. К тому же, чтобы получить более точные результаты, лучше задействовать несколько методов. Однако для определения целесообразности запуска бизнеса достаточно приблизительных цифр.

Стоит учитывать, что есть потенциальная и реальная емкость рынка. Последнюю вычислить сложно: нужно суммировать объемы продаж всех игроков в регионе, а такую информацию обычно не афишируют. Исключение — некоторые крупные компании, которые публикуют в сети финансовые результаты деятельности. Незатратный способ узнать реальную емкость рынка — поискать данные Росстата и открытые маркетинговые исследования. Правда, подробная информация в них представлена в основном по всей стране и крупным городам, региональные отчеты детализированы слабо. Но и такие данные будут полезны.

С потенциальной емкостью все проще. Маркетолог-практик Андрей Минин в книге «Маркетинговое планирование: Российская практика» для ориентировочной оценки рынка предлагает отталкиваться от норм потребления. Нужно умножить численность целевой аудитории в регионе на максимальный уровень потребления и среднюю стоимость одной единицы продукции. Первый показатель можно найти на сайте Росстата, второй — в отраслевых публикациях или соцопросах, третий — вычислить самостоятельно на основе рыночных цен.

Чтобы определить динамику, нужно взять показатели емкости рынка за последние 5 лет. Если она увеличивается, значит динамика положительная, если уменьшается — отрицательная. Такая информация позволит увидеть перспективность рынка. Положительная динамика говорит о том, что рынок растет, а значит у новых игроков есть шанс занять свое место. В случае с отрицательной, нужно выяснить причины, оценить конкурентную ситуацию и предложения других игроков, и только после этого принимать решение — стоит выходить на рынок или нет.

Попробуем узнать емкость и динамику рынка парикмахерских услуг Твери.

В отчете Росстата «Структура бытовых услуг населению» отдельной строкой выделены парикмахерские и косметические услуги, указан их объем за 2017 год и доля в процентах. На скриншоте видно, что доля растет, а объем составляет 97,4 млрд. руб.

Казалось бы, вот она, емкость, что тут еще считать? Однако эта таблица отражает оборот во всей стране, нас же интересует Тверь. Поскольку таких точных данных для своего региона на сайте Росстата я не нашла, попробуем рассчитать емкость на основе норм потребления.

Целевая аудитория парикмахерской широка: стригутся и мужчины, и женщины возрастом от 3 и до 70-80 лет. На сайте Росстата можно создать отчет по поло-возрастному составу населения для любого региона. Я составила такую таблицу для Твери. Исключив население младше 3 и старше 70 лет, получаем 364,4 тыс. человек.

Теперь нужно понять, сколько раз в год они пользуются услугами парикмахерских. Для своего гипотетического примера я нашла опрос в сети и буду считать его результаты репрезентативными. Для реального бизнеса это не совсем верно — мы не знаем, кто и из каких регионов участвовал в нем. Чтобы собрать данные лучше опросить свою целевую группу. Например, вы можете таргетировать пост в соцсетях по полу, возрасту и географии — многие люди листая ленту машинально читают вопрос и отвечают. Другой вариант — платные сервисы опросов.

Больше всего респондентов проголосовали за варианты «раз в месяц» и «несколько раз в год». Поскольку мы рассматриваем широкую целевую аудиторию, нужно помнить — часть из этих людей ходит в парикмахерскую каждый месяц, другие — не чаще раза в год или не ходят вовсе. Предположим, в среднем жители Твери ходят в парикмахерскую раз в 3 месяца, или 4 раза в год. Последний параметр для расчета — средняя стоимость услуги — 450 руб.

Читайте также:  Как можно сдать анализ на хламидии

Теперь умножим количество потенциальных клиентов на уровень потребления и стоимость одной услуги.

364,35 тыс. чел. × 4 услуги × 450 руб. = 655,8 млн. руб.

Учитывая, что реальная емкость, которую мы вычислили пропорционально населению от общероссийской, почти в 2,5 раза больше, рынку есть куда расти.

Осталось разобраться с динамикой. Достоверных статистических данных для своего региона мне найти не удалось. Однако по данным Тверьстата с 2013 года в городе появилось 23 новых парикмахерских, а количество кресел (да, есть в статистических отчетах и такой параметр) увеличилось почти в 1,5 раза.

Ситуацию на российском рынке иллюстрирует график, который на основе данных Росстат построила исследовательская компания NeoAnalytics. При желании можно купить полную версию исследования и сэкономить время. Но такой график, который я нашла в демо-версии, тоже поможет сформировать представление о ситуации на рынке.

Подобную диаграмму можно составить и самостоятельно — данные для нее NeoAnalytics взяла в открытых отчетах Росстата. Однако времени на это может уйти довольно много — найти нужную информацию на сайте государственной статистики не так просто.

Без анализа целевой аудитории в бизнесе не обходится ни одно управленческое решение. Логично, что и на старте ее нужно тщательно изучить. На этом этапе нужно выяснить:

  1. Кто ваша целевая аудитория: их пол, возраст, семейное положение, наличие детей, геолокация, национальность, уровень образования, профессиональная сфера, доход и т. д.
  2. Почему они будут покупать у вас: какую потребность удовлетворяет продукт, как часто и в каких количества он им требуется.
  3. Как выбирают и покупают: на какие характеристики обращают внимание, что может помешать или подтолкнуть к покупке у вас, что ожидают от вашего продукта.
  4. Размер целевой аудитории.

Это далеко не полный список параметров потенциальных клиентов, которые можно исследовать. Однако на этапе принятия решения о запуске бизнеса подробный анализ не нужен: достаточно понять, что в предполагаемом регионе есть целевая аудитория и предложение релевантно ее потребностям. Способов поближе познакомиться с потенциальными клиентами много. Кратко рассмотрим некоторые из них.

Статистика поисковиков — самый простой, но не универсальный источник информации. Если продукт в принципе не ищут в интернете или его можно найти и купить другими способами: в офлайн-магазине, по объявлению в газете или на билборде — он не отразит реальной картины. Однако общее представление о востребованности получить можно. Рассмотрим подробнее несколько инструментов.

«Яндекс.Вордстат». Сервис показывает, сколько раз в месяц пользователи Яндекса искали ваш продукт. Удобно анализировать статистику по отдельным городам и регионам. Инструмент «История запросов» позволяет понять, как изменился интерес к товару или услуге за последние пару лет, а также выявить сезонные тенденции. Например, скриншот ниже показывает, что в Твери спрос на парикмахерские услуги снижается осенью и весной и взлетает под новый год.

Google Trends. Чем-то похож на «Вордстат». Показывает динамику популярности поискового запроса. Можно выбрать регион и настроить период, а также взглянуть на ситуацию в поиске по картинкам, новостям, товарам и в YouTube.

Рекламный кабинет Mail.ru. Интересен тем, что выдает статистику запросов с разделением по полу и возрасту. Правда, детализировать результаты по региону не получится. Зато можно примерно определить половозрастные характеристики целевой аудитории.

Делать выводы, прогнав по нескольким сервисам один запрос, неправильно. Чтобы увидеть более четкую и реальную картину лучше подобрать несколько запросов, по которым потенциальные клиенты могут искать ваш продукт, и собрать общую статистику.

Инструмент Facebook. Показывает, сколько активных пользователей Facebook соответствуют вашей аудитории по региону, полу, возрасту, интересам и т. д. Можно задать более детальные настройки — выбрать тех, кто любит путешествовать или у кого есть дети определенного возраста. Сервис покажет половозрастной состав этой аудитории, семейное положение, образование и при достаточно большой выборке — сферу деятельности. Также можно посмотреть, какие страницы эти люди просматривают и лайкают, с каких устройств сидят и какие действия на Facebook совершают. Эта информация может впоследствии пригодиться для продвижения. Но на данном этапе внимание на нее можно не обращать.

Для своей парикмахерской мне удалось узнать, что на Facebook в месяц бывает 30–35 тыс. активных пользователей из Твери нужных мне пола и возраста, большинство из них имеют высшее образование и состоят в браке.

Поиск по людям. Этот инструмент можно использовать в любой соцсети, где есть наша целевая аудитория. Зная пол, возраст, географию, семейное положение и другие характеристики, вы можете посмотреть приблизительное количество потенциальных покупателей. Но в соцсетях зарегистрированы не все, стоит учитывать погрешность.

В качестве главного сегмента целевой аудитории моей парикмахерской я выделила женщин от 25 до 45 лет. Давайте посмотрим, что мне скажет «ВКонтакте».

Тут нужно учитывать фейковые аккаунты и прочий мусор, так что реальная цифра будет чуть меньше.

К нему относятся сообщения на форумах, отзывы, посты и комментарии в соцсетях и другие публикации, которые создают пользователи. Из предыдущих источников информации мы узнали о размере целевой аудитории, ее поле, возрасте, семейном положении и образовании. В пользовательском контенте нужно искать, почему и как часто люди будут покупать ваш продукт, а также на какие характеристики будут обращать внимание и почему выберут именно вас.

На такой анализ аудитории может уйти очень много времени, поэтому на этапе принятия решения о запуске бизнеса глубоко закапываться в дебри клиентских «хотелок» нет смысла. Можно крупными мазками набросать основные критерии и пункты, чтобы оценить, способно ли ваше предложение удовлетворить запросы покупателей.

О том, какими товарами и услугами пользуется целевая аудитория, можно спросить у нее самой. Главное — правильно составить список вопросов, получить репрезентативные данные и грамотно их обработать. Увлекаться здесь тоже не стоит — детальную информацию будем собирать потом.

  • Очно в местах, где встречается много потенциальных клиентов. Если ЦА — родители детей до 3 лет, можно направить интервьюеров в детский магазин, игровой центр или центр планирования семьи.
  • По телефону. Правда, нелегко найти базу, которая хотя бы процентов на 70 состоит из представителей ЦА.
  • Через сервис платных опросов. Цена вопроса — от 0 до 50 тыс. руб. Зато можно задать параметры, которым должны соответствовать респонденты.

Еще один вариант — создать опрос в Google Forms, а респондентов найти в соцсетях. Однако тут нужно подумать, как мотивировать их принять участие — люди не любят тратить время просто так. Полезно также самим создать темы на форумах, в блогах и соцсетях, где обитает целевая аудитория. Правда, из обсуждения придется вручную добывать нужную информацию, собирать ее в таблицу и переводить в количественные показатели.

Вы запускаете бизнес не в вакууме. Конкуренция есть в любой сфере. Исключение — новые и уникальные продукты и услуги, которые кроме вас никто не производит и не оказывает. Но и тут все не так однозначно — целевая аудитория может удовлетворять ту же потребность другими способами.

Пример из B2B — компания оптимизирует закупки. В регионе больше никто не оказывает таких услуг. Конкуренцию составляют внутренние отделы предприятий и штатные специалисты, ведь потенциальные клиенты могут оптимизировать закупки своими силами. Именно поэтому на предыдущем шаге я добавила пункты о знакомых и частных специалистах в опрос. Они тоже составляют конкуренцию парикмахерским, и мне важно понять, какая часть целевой аудитории стрижется у них.

Анализируя конкурентов перед запуском бизнеса, нужно узнать:

  1. Сколько компаний работает в вашей нише в предполагаемом регионе?
  2. Какой уровень конкуренции: высокий, средний или низкий?
  3. Какой ассортимент товаров или услуг предлагают конкуренты?
  4. Какую ценовую политику они ведут?
  5. Каковы их сильные и слабые стороны? Как они позиционируют себя на рынке?
  6. Через какие каналы продвигают товары и услуги?
  7. Каковы объемы продаж и финансовые показатели?
  8. Какие каналы дистрибуции и продаж используют?

Эта информация покажет, с кем вам придется иметь дело при выходе на рынок. Если вы заранее решили, в каком ценовом сегменте будете работать и на какую часть целевой аудитории ориентироваться, особое внимание уделите тем, кто находится в тех же нишах. Однако остальных игроков тоже стоит изучить, пусть и не так тщательно.

«Получить более полное и объективное мнение о конкурентах в определенной степени помогает метод, предложенный Райсом и Траутом в «Маркетинговых войнах». Попробуйте рассмотреть сильные стороны конкурента с точки зрения слабости. Крупная и мощная компания часто неповоротлива, монополист может иметь проблемы с репутацией, самая сильная компания на рынке, сильная во всех сферах деятельности, может быть не самой сильной на конкретном участке».

Первым делом нужно понять, сколько компаний оказывают те же услуги или продают те же товары. Для этого можно воспользоваться каталогами компаний, данными 2ГИС или «Яндекс.Карт», а также отчетами Росстата. Последние, кстати, не сильно расходятся с 2ГИС. По данным региональной статистики, в 2017 году в Твери работало 380 компаний, оказывающих парикмахерские и косметические услуги, а 2ГИС находит 342 организации на карте города.

Здесь нас интересуют ассортимент товаров и услуг, цены, сильные и слабые стороны, позиционирование. Конечно, когда на рынке работают сотни или даже тысячи компаний, детально проанализировать каждого игрока не удастся. Да это и не нужно — слишком велики временные затраты. Нас интересуют ключевые игроки и прямые конкуренты — выборка из 10–20 организаций. В таком объеме информацию реально собрать за 1-2 дня. Для удобства можно заранее продумать параметры, которые вас интересуют. Для интернет-магазина это могут быть количество товаров, способы доставки и оплаты, регионы и стоимость доставки, условия возврата и т. д.

Список параметров пригодится и при проработке других источников информации, о которых мы поговорим ниже.

Целевая аудитория может рассказать не только о себе, но и о конкурентах. Чтобы не проводить десятки исследований, можно убить одним выстрелом двух зайцев. Просто дополните опрос, например, такими вопросами:

  1. Какие парикмахерские вы знаете в нашем городе?
  2. Услугами какой парикмахерской обычно пользуетесь?
  3. Почему выбрали именно ее?

Вы можете сформулировать аналогичные вопросы для вашей ниши. Эта информация позволит выявить наиболее популярные компании на рынке и понять, почему клиенты выбирают их.

Отраслевые рейтинги, обзоры и аналитические статьи могут содержать массу полезной информации о рынке и отдельных его игроках. Правда, большую часть подробных исследований аналитические компании проводят по заказу или продают готовые. В открытых источниках можно найти названия ключевых игроков рынка, чтобы потом собрать данные о них самостоятельно.

Если компании в вашей сфере представлены в интернете и активно занимаются интернет-маркетингом, стоит воспользоваться сервисами анализа конкурентов. Подобных инструментов много, платных и бесплатных:

  • SEMRush;
  • Advodka;
  • Spywords
  • AdVse;
  • Serpstat;
  • SimilarWeb и другие.

Функционал сервисов немного отличается, но большинство из них позволяют узнать:

  • посещаемость сайта;
  • ссылочный профиль;
  • по каким запросам представлены в поиске и рекламируются в контексте;
  • бюджеты на контекстную рекламу и т. д.

На этапе принятия решения о запуске бизнеса это позволит понять, насколько активно конкуренты продвигаются в интернете, какие методы и каналы используют. Для интернет-магазинов и онлайн-бизнеса лидерство по этим параметрам равносильно ключевому положению на рынке.

Этот источник информации удастся использовать не всем и не в любой нише. Показатели финансовой деятельности публикуют в основном крупные компании. Найти их не так просто. Однако если вам удастся это сделать, по финансовым показателям лидеров рынка можно делать выводы в целом о прибыльности бизнеса в этой сфере.

Этот способ затратен по времени, но эффективен. Если вы планируете работать в офлайне, пройдитесь по конкурентам и посмотрите, как обстоят дела с ассортиментом и ценами, как персонал общается с посетителями, насколько удобно купить товар или воспользоваться услугой.

Прежде чем отправляться в путь, составьте список параметров, которые хотите оценить. Так вы сможете объективно сравнить предложения конкурентов и ничего не упустите.

Вариантов несколько — Priceva, Competera, Price2Spy и другие. Инструменты пригодятся тем, кто планирует открыть интернет-магазин, так как работают в основном с eCommerce. Анализируют сайты розничных и оптовых магазинов, прайсы поставщиков и производителей, данные маркетплейсов. Находят конкурентов по названию товара, бренду, модели и другим параметрам.

Если вы не планируете пользоваться сервисом постоянно, можно выбрать вариант с тестовым периодом или бесплатным тарифом.

На рыночную ситуацию влияют не только его участники, но и события за его пределами. Влияние извне может быть отрицательным: привести к падению цен и спроса на продукт, и положительным: вызвать рост продаж, повышение маржинальности и т. д.

На рынок, а значит и на успех вашего будущего предприятия, могут повлиять:

  1. Изменения в законодательстве. Например, ввод акцизов на электронные сигареты отразился на их маржинальности.
  2. События на импортно-экспортном рынке. Запрет ввоза каких-либо товаров освобождает рынок для отечественных производителей, что и происходит в последнее время с фермерскими сырами.
  3. Появление новых, более современных аналогов. Так, в свое время выпуск MP3-плееров привел к снижению спроса на «сидишники».
  4. Массовое изменение общественного мнения, которое может повлиять на отношение к вашему товару. Повальное увлечение здоровым образом жизни повысило спрос на услуги диетологов, фитнес-клубов и других игроков этой сферы.

Чтобы найти информацию о событиях вне рынка, проанализируйте:

  • новеллы законодательства;
  • отраслевые СМИ;
  • порталы для импортеров и экспортеров;
  • общетематические СМИ в контексте трендов и событий, которые теоретически могут повлиять на рынок.

Увлекаться и притягивать за уши все подряд не стоит. Рискуете сами себя убедить, что перспектив у рынка никаких, и вообще скоро все рухнет. Берем в расчет только уже случившиеся факты, которые прямо влияют на отрасль.

К примеру, в 2014 году на рынок парикмахерских услуг повлияли санкции, кризис и падение рубля. Помните график? После 2013 года темпы роста рынка резко пошли вниз, хотя до этого уверенно летели вверх. Впрочем, такие глобальные события обычно отражаются не на каком-то одном рынке, а на всей экономике в целом. Сферы, для которых они проходят незамеченными, скорее исключение.

Если не представить собранную информацию в наглядной и удобной для анализа форме, сделать правильные выводы будет проблематично. Рассмотрим несколько распространенных форматов.

В таком формате удобно анализировать статистические и другие количественные данные. Помните график динамики рынка парикмахерских услуг в начале статьи? Для своего анализа вы можете построить нечто подобное.

В виде круговых диаграмм наглядно представлять данные опросов и по размеру сегмента оценивать, какой процент респондентов проголосовал за тот или иной ответ. Если будете пользоваться платными сервисами опросов, перевести данные в такой формат сможете прямо в интерфейсе. Другой вариант — ввести количественные показатели в Excel и там же построить диаграмму.

В этом формате можно визуализировать любую информацию — структуру статьи, план подготовки к празднику или отпуску и т. д. Однако в отличие от графиков, количественные показатели так анализировать неудобно, а вот качественные — вполне. При анализе рынка в таком формате, например, можно представить данные о целевой аудитории.

Майнд-карты удобные еще и тем, что между объектами можно проводить взаимосвязи с комментариями, которые затем пригодятся при формулировании выводов.

Пожалуй, самый универсальный формат данных. В таблицы можно сводить и количественные и качественные показатели. При анализе рынка в этом формате собирают информацию о конкурентах. Удобнее всего это делать в Excel или GoogleSheets. Каждый конкурент — отдельной строкой, а в столбцах — интересующие нас параметры. Не забудьте добавить в таблицу свою будущую компанию и прописать по ней все, что сможете, чтобы сравнить.

Когда данные собраны, структурированы и визуализированы, пришло время анализировать и делать выводы. Для этого можно воспользоваться двумя довольно простыми и распространенными методами — SWOT и PEST.

Преимуществ и недостатков у этого метода хватает. Однако на этапе принятия решения о для нас важно, что он прост в применении и не затратен по времени. Чтобы сделать выводы о перспективности рынка, нужно разложить факторы, которые влияют на него, по 4 квадратам, обозначенным буквами аббревиатуры SWOT:

  • Strengths — сильные стороны;
  • Weakness — слабые стороны;
  • Opportunities — возможности;
  • Threats — угрозы.

В первые два квадрата попадут внутренние факторы, касающиеся конкуренции и целевой аудитории, во вторые — внешние. К сильным сторонам в таком контексте можно отнести все, что может помочь вам добиться успеха в выбранной нише.

Этот метод похож на SWOT — факторы, влияющие на рынок, тоже нужно расположить в 4 квадратах. Отличие в том, что здесь мы рассматриваем только влияние внешней среды в разрезе политических, экономических, социальных и технологических факторов.

Когда все факторы, которые могут повлиять на успех, выявлены и разложены по полочкам, можно делать выводы. Их удобно формулировать в виде ответов на вопросы-задачи, которые мы ставили в начале статьи. Чтобы не ошибиться в выводах, стоит придерживаться нескольких правил:

  1. Будьте объективны. Даже если вы соберете большой массив репрезентативных данных, составите таблицы и все визуализируете, риск сделать неверные вывод остается. На этом этапе нужно максимально абстрагироваться от того, что вы оцениваете шансы на успех СВОЕЙ компании. Посмотрите на ситуацию глазами стороннего наблюдателя. Если понимаете, что отдалиться не удается, лучше доверить это дело человеку со стороны.
  2. Используйте только достоверные и достаточные данные. Делать выводы нужно на основе устойчивых тенденций, а не случайных событий. От информации, которую не удалось проверить и подтвердить лучше отказаться.
  3. Учитываете только те факторы, которые прямо влияют на рынок. Не стоит проводить длинные цепочки последствий. Такое трудно спрогнозировать без использования сложных методов экономического моделирования.

Даже грамотный анализ рынка не защитит от провала на 100 %. Прогореть можно по сотне разных причин: неверная стратегия, ненадежные партнеры, хитрые конкуренты. Однако такое исследование позволит отмести заведомо проигрышные бизнес-идеи, а для проектов у которых есть шансы — собрать информацию, которая пригодится для решения других бизнес-задач:

  • разработки стратегии развития;
  • совершенствования продукта и сервиса;
  • создания грамотной маркетинговой политики;
  • запуска эффективной рекламы
  • расширения сферы деятельности;
  • создания новых продуктов;
  • планирования комплексного интернет-продвижения и т. д.

Последнее, кстати, можете доверить специалистам Texterra, чтобы у вас осталось больше времени на развитие бизнеса.

источник