R
можно легко выполнить анализ Парето и визуализировать результат (справедливости ради отмечу, что не менее легко это делается в любом табличном редакторе, поскольку сам по себе анализ прост до неприличия). Анализ Парето заключается в классификации проблем на немногочисленные, но существенно важные, и многочисленные, но несущественные. Он позволяет распределить усилия и установить основные факторы, с которых нужно начинать действовать, чтобы преодолеть возникающие проблемы.
Рассмотрим анализ на примере данных Мониторинга сексуального поведения МСМ и их знаний в отношении ВИЧ за 2009 г. (краткие результаты тут, полный отчёт тут).
В опроснике было два вопроса, касающихся доступности тестирования на ВИЧ: «Является ли тестирование на ВИЧ для Вас доступным?» (да/нет) и «Почему для Вас лично тестирование недоступно?» (вопрос задавался тем, кто на предыдущий ответил «нет», в качестве вариантов респондентам предложено 10 формулировок, в том числе «другое», при этом каждый опрошенный мог выбрать сразу несколько вариантов).
В результате получено такое распределение ответов:
1) «не знаю, к кому обратиться» — 44%
2) «в нашем населённом пункте нет учреждения, где тестируют» — 2%
3) «не знаю, где находится пункт тестирования» — 24%
4) «нет денег на тестирование» — 22%
5) «неудобный график работы учреждения или пункта тестирования» — 3%
6) «неудобное расположение пункта тестирования» — 1%
7) «не устраивает отношение персонала» — 1%
8) «боюсь разглашения своего статуса» — 18%
9) «другое» — 3%
10) «затрудняюсь ответить» — 21%
При анализе доли полученных ответов сортируются по мере убывания, а кумулятивная кривая показывает тот момент, когда сумма самых больших долей достигает 80%.
Проделаем это в
R
.1. Введём наши данные в вектор:
> nedostup = c(44,2,24,22,3,1,1,18,3,21)
2. Для удобства припишем данным названия — номера ответов:
> names(nedostup)=c(1:10)
3. Установим в
R
нужный пакет и подключим его:> install.packages('qcc')
> library(qcc)
4. Нарисуем, собственно, диаграмму и получим табличку:
> pareto.chart(nedostup)
Pareto chart analysis for nedostup
Frequency Cum.Freq. Percentage Cum.Percent.
1 44.0000000 44.0000000 31.6546763 31.6546763
3 24.0000000 68.0000000 17.2661871 48.9208633
4 22.0000000 90.0000000 15.8273381 64.7482014
10 21.0000000 111.0000000 15.1079137 79.8561151
8 18.0000000 129.0000000 12.9496403 92.8057554
5 3.0000000 132.0000000 2.1582734 94.9640288
9 3.0000000 135.0000000 2.1582734 97.1223022
2 2.0000000 137.0000000 1.4388489 98.5611511
6 1.0000000 138.0000000 0.7194245 99.2805755
7 1.0000000 139.0000000 0.7194245 100.0000000
5. Собственно, всё — техническая часть закончена. Теперь смотрим на содержание. Из колонки «Cum.Percent.» в табличке видно, что самыми важными (80% всех случаев недоступности) являются такие причины как «не знаю, к кому обратиться», «не знаю, где находится пункт тестирования», «нет денег на тестирование» и «затрудняюсь ответить».
Поскольку вариант «нет денег на тестирование» означает, по сути, то же незнание (тестирование на ВИЧ в Украине бесплатно), постольку напрашивается вывод, что основным препятствием при тестировании для опрошенных МСМ является недостаток информации о том, где и как пройти тест (отметим также, что вариант «затрудняюсь ответить» в целом согласуется с предыдущими — у таких респондентов нет вообще представления о том, что у них спрашивают, т. е. нет информации о тестировании).
И чтобы её решить, достаточно простого средства — напечатать визитки с описанием, как попасть в пункт тестирования в каждом конкретном городе и раздавать их силами МСМ-сервисных общественных организаций.
Примечание:
В заметке использован материал http://sixsigmaonline.ru/load/22-1-0-255
Немає коментарів:
Дописати коментар