10 груд. 2012 р.

Как показать среднее и погрешности на гистограмме

Представим, что на иллюстрации нужно показать как результаты нескольких экспериментов, так и их среднее с погрешностями. Один из способов в R таков:

data=c(1,2,3,4,3,2,1) # вводим данные
barplot(data) # рисуем нашу иллюстрацию
abline(h=mean(data)) # добавляем линию средней
abline(h=mean(data)+sd(data)) # добавляем линии верхнего и нижнего стандартного отклонений
abline(h=mean(data)-sd(data))

Вуаля:

Вместо функций mean() и sd(), естественно, можно вставить либо конкретные числа, либо другие меры средней тенденции и погрешностей. Например, подключив пакет library(epicalc), можно визуализировать среднее с доверительным интервалом:

barplot(data)
abline(h=mean(data))
abline(h=c(ci(data)$lower95ci,ci(data)$upper95ci))


Читать далее

29 лист. 2012 р.

Кто ходит в гости по утрам...

Есть у нас в институте чёрный жирный тунеядец — Васька. Лет шесть назад его отняла у собак аспирантка, пригрела, кастрировала, и, уехав в Португалию, оставила местным дамам в наследство. Каждое утро этот мерзавец обходит всех своих попечительниц на всех пяти этажах, выпрашивавет жалобно так еду, и получает — то рыбку, то паштет из гуся... А потом развалится посередине центральной лестницы, спит, все тушку обходят. Правда, когда иду я, кот предусмотрительно ретируется (раньше возмущался, но понял, что это неконструктивно). Так и наши мальчики в общаге ходили по девчачьим комнатам — где бутербродик дадут, где борща нальют... можно самому и не готовить. Кто ходит в гости по утрам, тот поступает мудро! То там сто грамм, то сям — глядишь: и снова утро.
Читать далее

18 лист. 2012 р.

Единство мира

Нет, это был не оргазм. Просто приятная (очень приятная!) щекотка. Такое бывает не часто, но это так вдохновляет — когда, читая работу в одной области знания, видишь уравнения, которыми когда-то преподаватели проедали мозг в совершенно другой области.

Вот сегодня: занесла меня нелёгкая в эпидемиологию, читаю обзор по сексуальным сетям и внезапно вижу те дифференциальные уравнения, которые когда-то учил на химической кинетике (теория активных соударений). Самое прелестное этом то, что из таких моделей можно вывести вполне проверяемые цифирками предсказания и, если они оправдаются, то можно вешать себе на шею медальку. Если не оправдаются, взять другую модель, проверить и снова повесить медальку... Наука в чистом виде — выводы проверяемы и предсказуемы! А вот что можно вывести из размышлений качественников, боящихся логарифмов как чёрт ладана, — для меня по-прежнему загадка (читать это занимательно, но чем эта беллетристика от какого-нибудь Толстого с Достоевским отличается?).

В самом деле, чтобы две частицы прореагировали, они должны: а) столкнуться; б) обладать достаточной для преодоления сил отталкивания энергией; в) столкнуться не просто так, а нужной стороной, и г) обладать какими-то особенностями, чтобы прореагировать (напр., нести неспаренный электрон).

Что нужно для того, чтобы какой-нибудь ВИЧ передался? По сути то же самое: а) два чела должны сойтись в одной точке; б) обладать достаточным для преодоления зоны комфорта желанием; в) про нужную сторону столкновения предоставляю фантазировать самостоятельно; г) обладать облегчающими инфицирование особенностями (всякие там повреждения слизистых, нужная концентрация вируса в крови/сперме и т. п.).

Некая проблема только в том, что люди ведут себя не как газ, а как очень вязкая жидкость, поэтому модель должна учитывать и это — не все со всеми, а только некоторые с некоторыми, которые живут рядом. Поэтому от модели кинетической теории газов исследователи переходят к моделям конденсированных сред, в частности поведения полимеров — очень длинных цепочек, сложно переплетённых друг с другом.

Тем не менее, и такие модели давно существуют в естественных науках, они могут быть применены. Единство мира в этом, а не в мистике.

Читать далее

17 лист. 2012 р.

Театр абсурда

Не знаю, как в других академических институтах, но в нашем с давних времён перестройки строго блюдутся традиции делать так, чтобы каждый день был как подвиг. Особенно зимой.

То, что реактивы покупаем за свои, — это мелочи. То, что оборудование украшено милыми сердцу наклейками «Личное имущество» (собственно, оно таковым и является), тоже как-то даже уже не возмущает: в конце-концов, кому степень нужна — мне или институту?!? Но вот работать при +13 С почему-то некомфортно. Даже сидя в пальто и фуфайке (manteau a la Rus, говорят у нас). Поэтому те, у кого среди «личного имущества» числятся обогреватели, ими беззастенчиво пользуются, да и сушильные шкафы не стоят без употребления. Батареи при этом либо вообще выключены (как сейчас), либо весьма условно теплы (как зимой, чтобы не порвались) — экономия!!! Естественно, тратится электричество.

Но вот приходит момент, когда институт исчерпывает свой лимит на электроэнергию и чтобы не впадать в штрафы, розетки и вытяжки выключаются, даже свет по вечерам не приветствуется... Часть сотрудников идёт работать домой, прочие оставшиеся на поле брани закрывают лабораторию изнутри, светят себе фонариками и тихонько так сидят над печкой, подсоединённой к линии освещения (она не выключается, в отличие от силовой), пьют чай, приготовленный снова-таки в «личном имуществе», и что-то делают, делают, делают... вид, что что-то делают.

Я недавно осознал, что всё наше стекло (всякие там колбы, пробирки, бюретки etc) было куплено ещё при дорогом Леониде Ильиче: разбилась колба — почти трагедия. Всё это можно было бы описать одним словом, но его я оставляю на фантазию читателя.

Читать далее

14 лист. 2012 р.

Бездны невежества

Каждый раз, когда я принимаю коллоквиумы у студентов (по заданному в начале лекции списку вопросов надо устно, глядя в глаза, повторить основные тезисы), я поражаюсь тем безднам, которые открываются. И это, повторяю, только у тех, кого регулярно слышу! Какой мох нарос в головах прочих, которые старательно прикидываются ветошью на задних партах, я даже боюсь представить!

Ну вот неужели ЭКОЛОГИ (не юристы, не бухгалтеры, не всякие прочие филолухи) могут не знать состав воздуха (хотя бы приблизительно)? Температуру кипения воды? Что такое навоз? Как выглядит торф? Как посчитать % чего-то? ...

Даже не знаю, на какой мине в следующий раз подорвусь со своей скромной эрудицией! Конечно, эти знания не врождённые, но — ё-моё! — их дают ещё в школе, а не на третьем курсе вуза! В первых классах, на природоведении!

Читать далее

13 лист. 2012 р.

Linguae antiquae

День начался с того, что соавтор первых статей, встретив на пороге института, почему-то решил узнать, как мой греческий поживает? — никак, увы. Латынь ещё держится (вот какие чудеса остаточных знаний энтузиазм молодости демонстрирует!), а от древнегреческого только падежи, презенс, имперфект и аорист сквозь пыль годов просвечивают. А жаль — красивый язык!
Читать далее

5 лист. 2012 р.

Арифметика

Ещё из городских суеверий: Парк кованных фигур, фигура «Ворона», люди кидают по пять копеек и загадывают желание. Пока всё тривиально.

Но вот подходит мамаша со чадами, роется по карманам, а пятачков-то нет! Доця маме: «давай 10 коп бросим». Мама задумывается, потом говорит: «Лучше 25 — пять желаний загадать можно!»
Читать далее

4 лист. 2012 р.

Бизнес-сети на рынке

Эта заметка — о данных, собранных ушедшим другом. В то время, в 2010 г., был сложный для нас период: не выдержав нагрузки у меня в организаци­и, он покинул её (что, в общем-то, поставило под удар два тогдашних проекта... ну да ладно — справились­) и создал свою. Её деятельнос­ть началась с исследован­ия горловских­ предприним­ателей. Часть дизайна этого исследован­ия один в один воспроизво­дила нашу предыдущую­ работу. В целом, это было развитие нашей идеи сравнить структуры двух сообществ:­ стигматизи­рованного и нестигмати­зированног­о.

Гипотеза была такова: первое сообщество, мужчины, имеющие секс с мужчинами (МСМ), загнанное в тень, вынуждено поддержива­ть свою целостност­ь единственн­о доступным способом — коллекцион­ируя контакты друг друга, т. е. быть в известной степени подобным сицилийско­й мафии. Второе, частные предприним­атели, торгующие на рынке, имея только одного естественн­ого врага — фискальные­ органы государств­а — и не испытывая необходимо­сти стыдиться себя («торгаш» — тоже стигма, но сила её воздействи­я значительн­о меньше, чем клеймо гомосексуа­льности), будет более разобщённы­м на бытовом уровне.

Целостност­ь / сплочённос­ть может проявлятьс­я по-разному. С одной стороны, сплочённос­ть выступает как наличие субъективн­о важных контактов с другими членами своего коллектива­ / общины / сообщества­. С другой — это способност­ь выступить единым фронтом против общего врага.

С такой точки зрения МСМ и предприниматели ведут себя по-разному. МСМ разобщены территориально, но их взаимные связи образуют целостную систему. К сожалению, обусловливающая это стигма одновременно разрушает «боевой» потенциал группы — ведь для совместных действий нужно выйти из уютной тени, заявить о себе и подвергнуться, как минимум, осуждению окружающих.

В отличие от МСМ, торгующие на рынке предприниматели близки территориально (они каждый день находятся на чётко выделенной части города), пребывают на виду. У них нет особой нужды знать телефоны всех своих соседей по рынку — в случае совсем уж острой необходимости они могут увидеться лично в соседнем ряду. В то же время, они легко сплачиваются в протестах — напр., из-за ликвидации рынка городскими властями или против нового Налогового кодекса.

Когда мы просим респондентов указать своих партнёров, пользуясь «телефонной книгой» своих мобильных, мы фиксируем только один из двух указанных аспектов — наличие субъективно важных контактов, но совершенно упускаем из виду те повседневные связи, которые проистекают из территориальной общности. Соответственно, полученная сетевая структура ничего не говорит о «боевом» потенциале группы. В этом состоит ограничение методики.

Сопоставление двух сетей — МСМ Донецка и ФЛП на рынках Горловки станет предметом одной из следующих публикаций. Цель нынешней, как указано выше, — проанализировать данные только о социальных связях бизнес-партнёров на рынке.

Очень печально, но в отчёте самого РЦСИ «Праксис» упущено очень много деталей, а та база, которую в своё время мне прислал её автор Евгений ЛЕЩИНСКИЙ, не содержит расшифровки категорий вопросов об организационно-правовом статусе опрошенных (ФЛП на едином налоге, на общей системе налогообложения, с наёмными сотрудниками или без таковых...) и о виде деятельности (продукты питания, одежда, канцелярия и т. п.). Поэтому в нашем распоряжении сейчас только такие данные:

– описание методики рекрутинга;
– список связей 50 ФЛП двух горловских рынков;
– пол и возраст узлов сети.

Попытаемся, всё же, пользуясь этой более чем скупой информацией, разобраться в вопросе о связанных в 2010 г. с структурой социальной сети ФЛП рынков г. Горловки факторах.

Методика рекрутинга (воспроизводится по отчёту) — «снежный ком», что подразумевает опрос одного информанта и просьбу порекомендовать 3–5 своих знакомых для проведения аналогичного опроса. Так процедура повторяется до тех пор пока не будет опрошено заданное количество респондентов.

После того, как интервьюер объяснил суть задачи и получил от респондента информированное согласие, опрашиваемому предлагалось самостоятельно составить список всех друзей и знакомых, с которыми он взаимодействует в рамках своего бизнеса.

Социо-демографические характеристики совокупности (воспроизводятся по отчёту): опрошено 50 человек, преобладают мужчины (64%) и люди в возрасте от 30 до 49 лет. Средний заработок составляет 2100 грн. в месяц (минимум 500 грн., максимум — 6000 грн.). Подавляющее большинство ФЛП заняты в сфере торговли промышленными товарами. Наёмный труд используется каждым восьмым предпринимателем, при этом максимальное количество наёмных работников составляет 3 человека.

Высшее образование имеет лишь каждый восьмой. При этом все торгующие продовольствием имеют высшее образование, а в самой большой группе — торговля промышленными товарами — высшее образование имеют лишь 12%, большинство же является выпускниками техникумов.

В 92% случаев частные предприниматели не имеют отдельного административного помещения и всю финансово-административную деятельность ведут на территории своей торговой точки. Наиболее распространённым видом коммуникации в среде ФЛП остается мобильный телефон.

Согласно полученным результатам, треть респондентов оценила свой уровень владения ПК как «самый низкий». Еще 30% респондентов оценили свой уровень знаний в этом вопросе как средний. Отмечается дисбаланс по полу в самооценках уровня знаний: у мужчин преобладает средний уровень, у женщин — низкий уровень.

Что же касается характеристик всех узлов (50 респондентов указали на 330 своих бизнес-партнёров), то оно в целом не отличается от описанных: 64% мужчин; люди в возрасте от 20 до 29 лет составляют 22%, 30–39 лет — 37%, 40–49 лет — 29%, а 12% относится к группе 50 лет и старше.

Структура сети изображена на рисунке (розовые — респонденты, синие — их коллеги, которые в опросе не участвовали).


Она включает в себя 380 узлов, соединённых 367 связями. Плотность (отношение существующего числа связей к теоретически возможному) составляет 0.005 — сеть весьма разрежена.

Следует отметить, что несмотря на использование «снежного кома» при рекрутинге, сеть оказалась несвязной, разбитой на 23 отдельных компонента, наименьший из которых есть один изолированный узел, а наибольшие объединяют 31, 40 и 145 человек. На наш взгляд, это вполне согласуется со сформулированным выше ограничением — наличие знакомства с другими предпринимателями на рынке вовсе не означает, что контакты этих людей будут записаны в телефон респондента.

Поскольку в массиве преобладают мужчины, постольку бОльшая часть связей (52%) соединяет двух мужчин:

Пол партнёровмужчинаженщина
мужчина192 связи
женщина99 связей76 связей
С т. з. возраста преобладают связи между 30- и 40-летними (18%), на втором месте связи двух тридцатилетних и между 20- и 30-летними (по 15%). Реже всего встречаются партнёры с большой разницей в возрасте или связи между двумя людьми в возрасте 50 лет и старше:

Возраст партнёров, лет20–2930–3940–3450+
20–2921 связь
30–3951 связь51 связь
40–4932 связи64 связи49 связей
50+13 связей27 связей32 связи9 связей
Распределение степеней центральности (т. е. количества связей у каждого узла) весьма далеко от нормального — преобладают узлы с центральностью 1, что обусловлено методикой формирования массива сетевых данных (мы ничего не знаем о связях нереспондентов).

Факторы, ассоциированные со структурой, определялись моделированием. Т. к. предикторов немного, то все они (образование полностью гетерогенной по возрасту и полу связи, центральность узла равная единице, гомофилия по статусу респондент–нереспондент, полу и возрасту) были включены в тестируемую модель. Результаты приведены в таблице.

ФакторlnORSEp-Значение
Образование гетерогенной по всем параметрам связи-3.40.2<0.001
Центральность узла равна 14.30.3<0.001
Гомофилия по статусу респондент–нереспондент-3.30.2<0.001
Гомофилия по возрасту
20–29 лет0.60.20.01
30–39 лет0.20.10.12
40–49 лет0.60.2<0.001
50+ лет0.50.30.18
Гомофилия по полу
мужчина0.80.1<0.001
женщина1.00.2<0.001


Полученная модель, в целом, неплохо воспроизводит наблюдаемую структуру сети, хотя даёт несколько больше связей мужчина–мужчина и больший размер самого крупного компонента, чем нужно.


Из коэффициентов полученной модели можно заключить, что несмотря на количественное преобладание в массиве 30-летних и мужчин, бОльшую склонность к образованию однородных соответственно по возрасту и полу связей демонстрируют 40-летние ФЛП и ФЛП-женщины. Вероятность образования связи между людьми, отличающимися по обоим этим параметрам, невелика — exp(-3.4)/(1+exp(-3.4)) = 0.03. Низкое значение общей гомофилии по статусу респондент–нереспондент согласуется с разбитостью сети на два десятка отдельных компонентов.

Как было указано выше, скупой набор измеренных и доступных сейчас параметров не позволяет найти объяснение полученным закономерностям, исходя из результатов самого исследования. Однако мы можем воспользоваться опытом своей повседневности.

К 40 годам жизнь (и деловые связи, в частности) стабилизируется, для людей становится важной предсказуемость будущего, соответственно 40-летние ФЛП «обрастают» кругом таких же постоянных и проверенных годами бизнес-партнёров.

Что касается несколько бОльшей склонности ФЛП-женщин образовывать связи с другими женщинами, то этот результат, как будто бы, противоречит известной из литературы бОльшей гомосоциальности мужчин. Вместе с тем, поскольку речь идёт о бизнес-контактах в 2010 г., т. е. до реформы Налогового кодекса, то можно предположить, что меньшая гомофильность по полу ФЛП-мужчин связана с существовавшим способом ведения дела: мужчина-хозяин точки ради минимизации налоговых отчислений делал своих реализаторов (преимущественно женщин) тоже частными предпринимателями. Вполне естественно, что у хозяина точки в телефоне есть номера его сотрудников-реализаторов, т. е. ФЛП низшего порядка. У реализаторов (как правило, женщин), соответственно, могут быть телефоны друг друга для того, чтобы в случае нехватки на точке какого-то товара из обычного ассортимента (напр., подходящего размера одежды) быстро уточнить его наличие у коллеги и, т. о., всё-таки не потерять клиента.

В целом, проведённая работа даёт представление о структуре социальной сети территориально-компактного профессионального сообщества. Её результаты, на самом общем уровне будут использованы для сравнения со структурами, которые образуют местные совокупности МСМ.

Читать далее

2 лист. 2012 р.

Шанс есть всегда

Охотница зазевалась, дичь убежала… Приехал домой, у порога, как всегда, встречает кошка, смотрит преданными глазами, ожидая еды. Еда дадена, но тут откуда-то — прямо под нос хищнице — выбежала маленькая серая дурочка.

Началась охота, вредительница была поймана, придушена и положена на ковёр. Подхожу, кошка смотрит на меня обожающими глазами (даже если она сильно голодна, то прежде чем приступить к сервированной трапезе, она обязательно несколько раз потрётся об меня, поблагодарит так сказать)… за эти несколько секунд мышь (или мыш) очухивается и быстро-быстро линяет в норку… наконец до влюблённой доходит, что она проворонила свой трофей — ходит вокруг меня и жалобно так мявкает. Потом, очевидно, решает заесть огорчение и в один присест наминает гору элитного паштета — не мышь, конечно, но тоже есть можно!
Читать далее

Сексуальная сеть МСМ г. Мариуполя

В 2010 г. мы опросили 100 МСМ г. Мариуполя. Среди прочего, в опросе фигурировал сетевой блок (такой же, как описан в http://donbas-socproject.blogspot.com/2012/10/blog-post_30.html), одним из вопросов которого был «У Вас был секс с ... в течение последнего перед опросом года?». На картинке — визуализация ответов: сексуальная сеть МСМ (розовеньким обозначены респонденты, синим — их знакомые, которых мы не опрашивали). Картинка забавная. Есть и большой связный компонент с героем-любовником, и треугольники, и общие партнёры... Пока анализ в деталях не даю. Просто полюбуйтесь.


Читать далее

30 жовт. 2012 р.

Социальная сеть МСМ Донецка и прилегающих городов: попытка анализа

Материал для этого анализа собирался, по большей части, между делом. В 2009 г., когда заканчивалась первая фаза немецко-украинского проекта «Сеть» (Connect+, Центр «Наш мир»), встал вопрос о его оценке. Мы разработали для получателей услуг проекта небольшую анкету, намереваясь узнать их мнение о полученных материалах. Само по себе это было бы скучным опросом очень маленькой выборки, поэтому мы дополнили опросник сетевым блоком, в котором просили каждого респондента указать на отдельном листике всех своих знакомых мужчин, практикующих однополый секс. Это была инновация — до нас никто ни в Украине, ни вообще на постсоветском пространстве не занимался анализом социальных сетей гомосексуальных мужчин.

Естественно, мы понимали, что такая просьба — передать посторонним людям сведения о своих знакомых без их согласия — может быть воспринята в штыки. В то же время нам нужно было как-то однозначно идентифицировать эти контакты, т. к. мы подозревали, что у разных, даже незнакомых друг с другом респондентов, могут быть общие знакомые (забегая вперёд скажу, что наши подозрения подтвердились).

Компромисс выглядел так: в анкете респондент писал последние четыре цифры своего номера и точно так же обозначал своих знакомых, последними четырьмя цифрами их телефона. По этой комбинации нельзя узнать конкретного человека, но она (особенно в сочетании с другими данными) является уникальным кодом человека в собираемом массиве.

Кроме последних четырёх цифр респондент характеризовал себя и своих знакомых именем, возрастной группой (15–19, 20–29, 30–39 лет и т. д.), по официальному (холост, женат, разведён или вдов) и фактическому (живу сам, с родителями, с мужчиной-партнёром, с женщиной-партнёршей) семейному положению, а также указывал город проживания.

В результате мы получили 63 эгоцентрических сетей, каждая связь которой выглядела примерно так:

Максим.30-39.Донецк.холост.сам.0034 -> Александр.20-29.Донецк.холост.с-родителями.9555

(до стрелки — информация о респонденте, после — о знакомом респондента, стрелка условно обозначает наличие связи, т. е. тот факт, что номер телефона знакомого записан в телефонную книгу мобильника респондента).

Как только данные были собраны и проверены, мы обезличили их, т. е. вышеприведённый пример приобрёл такой вид:

X3.30-39.Донецк.холост.сам -> X5.20-29.Донецк.холост.с-родителями

а рабочий массив стал двумя таблицами: а) список связей (X3 -> X5 и т. п.); б) список характеристик каждого узла (напр. X3, 30-39 лет, Донецк, холост, живёт сам и т. п.). Эти два списка мы экспортировали в R, как описано в http://donbas-socproject.blogspot.com/2009/12/r.html.

Вот схема сети согласно результатам опроса (63 розовых кружка — респонденты, 300 синих — их знакомые, которых мы не опрашивали).


Первое, что следует отметить — сеть получилась плотной и связной. Действительно, как мы предполагали, респонденты не только были соединены друг с другом (на схеме — розовый с розовым), но и через общих знакомых (триада розовый–синий–розовый). Долю таких общих знакомых посчитать легко: число синих кружков с центральностью больше 1, делённое на общее число синих кружков, — 14%.

Второе, поскольку 86% нереспондентов были упомянуты лишь единожды (т. е. только одним из опрошенных), то сеть выглядит как ряд кустов на общем корне, которым являются связи респондентов друг с другом.

Третье, в сети нет изолятов, т. е. таких узлов, у которых нет никаких связей.

Если свойства 2 и 3 обусловлены способом сбора информации, то первое явилось непосредственным следствием высокой плотности связей в изучаемом сообществе. В свою очередь, эта плотность очевидно связана с преобладанием среди целевой группы проекта «Сеть» (по крайней мере, в Донецкой области) людей старше 30 лет (60%), наличием значительной доли (31%) тех МСМ, которые ходят на плешку, а также живущих в небольших городах области (14%).

Ядро сети (совокупность 79 узлов с тремя и бОльшим числом связей) значительно более монолитно и спаяно. Так, его централизация (0.28) вдвое выше централизации всей сети (0.14). В отличие от структурных, социодемографические характеристики ядра повторяют в пределах ошибки соответствующие характеристики целой сети.

Вопрос, решаемый в настоящей работе таков: каковы основные факторы, ассоциированные с образованием связей внутри изучаемой сети?

Исследование опиралось на процедуры, разобранные в http://donbas-socproject.blogspot.com/2012/10/grey-anatomy.html, т. е. на многомерное моделирование изоморфных случайных сетей с учётом ключевых структурных показателей сети реальной.

Более формально исследовательский вопрос распадается на ряд гипотез:

1 действуют правила общего подобия двух связанных узлов (общая гомофилия):
  1.1 связи образуются по признаку респондент–не респондент (следствие способа формирования массива);
  1.2 связи образуются внутри города или агломерации;
  1.3 связи образуются между близкими по возрасту узлами;
  1.4 связи учитывают семейное положение (напр., женатый–не женатый, живу сам–живу с родителями и т. п.)

2 склонность к образованию связей отличается у узлов, принадлежащих к разным подгруппам (дифференциальная гомофилия):
  2.1 женатые менее переборчивы (т. е. более склонны образовывать и поддерживать связи с людьми разного возраста, города, семейного положения), чем холостые и разведённые;
  2.2 МСМ старше 30 лет менее переборчивы, чем молодые;
  2.3 живущие с родителями или с женщиной-партнёршей менее переборчивы, чем живущие отдельно.

Базовая модель, в которую вошли только предикторы связей и гомофилия по  признаку респондент–не респондент, оказалась крайне неудовлетворительной — она давала множество изолятов и связей между нереспондентами:


Добавление в модель предиктора, учитывающего преобладание узлов со центральностью 1, улучшило модель (появилась отмеченная выше кустистая структура и центральное ядро):


Однако эта модель не дала ответы на поставленные вопросы, поэтому мы пошли от обратного — включили в модель все возможные предикторы и затем исключали их по одному, добиваясь разумного баланса результатов. Оказалось, что гомофилия по возрасту (как общая, так и дифференциальная) не является сколь-либо значимым фактором в нашей сети, тогда как прочие (место жительства и семейное положение) играют заметную роль:

ФакторlnORSEp-Значение
Образование гетерогенной по всем параметрам связи-3.90.1<0.001
Центральность узла равна 13.10.2<0.001
Гомофилия по статусу респондент–нереспондент
нереспондент-4.00.7<0.001
респондент0.90.1<0.001
Гомофилия по месту жительства
Донецкая агломерация0.50.1<0.001
Горловская агломерация0.90.70.2
Мариуполь2.80.5<0.001
другие области Украины1.60.4<0.001
Гомофилия по официальному семейному положению
разведён или вдов0.31.00.7
женат0.70.70.3
холост0.40.1<0.001
Гомофилия по фактическому семейному положению
живу сам0.80.30.001
живу с партнёром-мужчиной0.60.1<0.001
живу с родителями0.20.10.2
живу с партнёршей-женщиной-0.70.60.3

Из таблицы видно, что нереспонденты намного менее склонны образовывать связи с другими нереспондентами, чем респонденты. Это, как указано выше, является следствием способа формирования выборки — поскольку мы не опрашивали нереспондентов, то у нас нет полной информации об их эгоцентрических сетях, мы не знаем, есть ли у них в знакомых другие нереспонденты из нашего массива.

Относительно места жительства отметим, что «переборчивость» в связях (когда контакты устанавливаются и поддерживаются преимущественно с людьми из того же населённого пункта) явным образом связана с географической удалённостью: так, люди из Мариуполя (южный край области) и те, кто живёт вообще в других областях, демонстрируют значительно большую склонность образовывать связи соответственно с мариупольцами и МСМ не из области, чем те, кто живёт в Донецкой агломерации. Жители Горловской агломерации, расположенной недалеко от Донецкой, вообще не проявили статистически значимой гомофилии (это значит, что среди их контактов случайным образом представлены как жители самой Горловской агломерации, так и других населённых пунктов).

Связь семейного положения и тенденций к образованию связей, в целом, подтверждает высказанные выше гипотезы. Так, контакты женатых и разведённых/вдовых не проявляют сколь-либо заметной тенденции отбора по семейному положению, тогда как среди знакомых у холостых несколько больше таких же холостых. Это можно было бы связать с возрастом, но как указано выше возраст оказался незначимым предиктором, что подтверждается гомофилией по фактическому семейному положению — живущие с  родителями МСМ (преимущественно молодёжь) не демонстрируют особой переборчивости в связях, тогда как живущие отдельно (как молодые, так и зрелые мужчины), а также проживающие с партнёром-мужчиной (также разного возраста) предпочитают общаться соответственно с отдельно живущими и «замужними».

На наш взгляд такие связи с семейным положением предположительно можно пояснить тем, что неженатые и живущие отдельно МСМ выступают обладателями двух важных ресурсов — свободы от контроля партнёрши/родителей и возможности распоряжаться местом для встреч, тогда как женатые, живущие с партнёршей-женщиной или родителями вынуждены подстраивать свои планы под временнЫе и квартирные возможности своих знакомых (особенно если речь идёт о сексе).

Таким образом, проведённый анализ продемонстрировал связь со структурой социальной сети ряда социодемографических характеристик МСМ Донецка и прилегающих городов.

Безусловно, проведённая работа имеет ряд ограничений, которые не позволили добиться идеальной сходимости сети наблюдаемой (см. рис. выше) и сети смоделированной:


• информация об узлах включала всего три параметра, что не позволило уйти в выводах далеко от тривиальности (так, не учтёнными оказались, к примеру, принадлежность к сообществу плешки, идентичностные характеристики, открытость, имущественное положение и др.);

• информация о связях не учитывала ни силу связи (напр., два человека только вчера познакомились или дружат уже давно), ни её качество (напр., связаны ли люди просто знакомством или они являются сексуальными партнёрами).

Однако, в целом, эта работа демонстрирует ряд возможностей сетевого анализа, которые в дальнейшем могут быть применены к анализу структуры скрытого от посторонних глаз сообщества.

Примечание: первая попытка проанализировать данные была сделана в публикации

Касянчук М. Г. и др. «Сеть» и сети: отчёт об исследовании «Структура социальной сети МСМ Донецка и прилегающих городов» / М. Г. Касянчук, Е. Б. Лещинский, Г. А. Журбий, Р. В. Сидорченко, Ю. Н. Миготин («Донбасс-СоцПроект», Центр «Наш мир»). — Донецк: Компьютерная типография, 2009. — 80 c.

При подготовке нынешнего текста все цифры проверены, устранены неточности.


Читать далее

25 жовт. 2012 р.

Упражнения­ по экспоненци­альному моделирова­нию случайных графов на примере флирта в сериале Grey’s Anatomy

Перевод поста http://badhessian.org/lessons-on-exponential-random-graph-modeling-from-greys-anatomy-hook-ups/

Я недавно нашёл прекрасный­ пост Gary Weissman’а Grey’s Anatomy Network of Sexual Relations (перевод на русский тут) и вдохновилс­я им. Для тех, кто ничего не слышал об этом телесериал­е, сообщаю, что он чрезвычайн­о популярен,­ отмечен наградами как лучшая медицинска­я драма, транслируе­мая ABC. Идя навстречу ожиданиям зрителей, шоу регулярно показывает­, как его герои флиртуют друг с другом.

Пытаясь дать студентам-медикам ряд простейших­ концепций анализа социальных­ сетей, Weissman создал набор сетевых данных о сексуальны­х контактах героев этого сериала. Хотя я особо не интересуюс­ь ни этим шоу, а сексуальны­е или воображаем­ые сети лежат вдали от моих исследовательских интересов,­ пост Weissman’а мне кажется отличной демонстрац­ией анализа социальных­ сетей в педагогиче­ских целях.

Я бы хотел, ради развлечения, вернуться к этим данным и рассмотреть их с помощью экспоненциального моделирования случайных графов (ERGM) в аспекте образования связей. Прежде чем я продолжу, я бы хотел сказать, что самые лучшие пособия по ERGM созданы их авторами и доступны на сайте. Моим любимым пособием из-за его прикладной направленности является серия презентаций на февральской конференции Sunbelt Workshop 2011 г. Если вы всерьёз настроены изучить ERGM, то указанные публикации должны стать вашими настольными книгами. Тем не менее, я думаю, что существует та аудитория, которая с бОльшим восторгом наблюдает за приключениями сексуальных врачей на телевидении, чем читает о брачных сетях во Флоренции 16 века.

Экспоненциальные модели случайных графов являются способом понять процесс возникновения сетевой структуры, процесс образования в ней сетей. В нашем примере «образование сетей» и «снять потрахаться» являются синонимами. Эти модели работают, измеряя некий набор известных сетевых характеристик и используя распределение их значений для генерации случайных сетей. Такие случайные сети затем сравниваются с сетью наблюдаемой, чтобы оценить правдоподобие модели. Хорошие ERG-модели продуцируют сети, изоморфно похожие на наблюдаемую сеть, и пользуются небольшим набором характеристик. Плохие ERG-модели продуцируют сети, которые слабо похожи на наблюдаемую сеть, но при этом используется много ненужных характеристик.

Какими характеристикам следует пользоваться? Число рёбер (т. е. «связей», «отношений») является одной из самых важных. Если мы занимаемся образованием связи, то очень важно знать число этих связей. Кроме того, в посте Weissman’а некоторые комментаторы упоминали важность пола персонажей или, к примеру, их должность в больнице. Узлы (т. е., «акторы», «вершины») могут иногда характеризоваться атрибутами, такими как пол, возраст, должность или астрологический знак. При моделировании сети можно использовать атрибуты узлов, чтобы оценить такие ассортативные эффекты как общая гомофилия («Спят ли члены больничных коллективов с сотрудниками, занимающими такие же должности?»), дифференциальная гомофилия («Спят ли штатные врачи с другими такими же? Делают ли они это чаще, чем интерны с другими интернами?») и ассортативное смешивание («Do resident-attending couples occur more frequently than we’d expect vis-à-vis nurse-attending couples?»). Можно анализировать и другие свойства сетей, но это зависит от доступности данных, типа анализируемой сети (направленная, ненаправленная, бимодальная), а также от сходимости модели.

Использованные здесь данные восходят к тем, которые Weissman сделал доступными. Я добавил узлы и рёбра по информации, найденной при просмотре Wikipedia. Я включал лишь те персонажи, которые переспали с одним или несколькими другими персонажами в сериале. Я также добавил такие атрибуты, как пол персонажа, расу, должность в больнице, приблизительный возраст, номер сезона, в котором он появился, и астрологический знак, под которым родился актёр. Я собрал эти атрибуты из Wikipedia и IMDB. Для простоты я кодировал расу каждого персонажа как чёрный (black), белый (white) или другой (other). Хотя я не люблю рассматривать расу именно в этих терминах, однако число персонажей и их разнообразие невелико, чтобы вдаваться в нюансы этого вопроса. Что касается приблизительного возраста персонажей, то я пользовался возрастом актёров, их играющих, а в двух случаях мне пришлось самому сделать предположения. Как у Weissman’а, нынешние данные, вероятно, не содержат какой-то информации об отношениях, узлах, упрощают описание персонажей и их взаимоотношений.

Для начала откройте R-терминал. Установите и загрузите пакеты ergm и RCurl, если вы не сделали этого раньше.

install.packages("RCurl"); install.packages("ergm")

library(RCurl); library(ergm)


Пакет RCurl будет использован для того, чтобы загрузить данные из моего файла на Google Docs. Пакет ergm включает несколько других пакетов, таких как network, поскольку ERGM использует объекты, созданные последним.

Далее, прочтите данные и создайте объект класса network.

#First, read in the sociomatrix

ga.mat<-getURL("https://docs.google.com/spreadsheet/pub?key=0Ai--oOZQWBHSdDE3Ynp2cThMamg1b0VhbEs0al9zV0E&single=true&gid=0&output=txt",ssl.verifypeer = FALSE)


ga.mat<-as.matrix(read.table(textConnection(ga.mat), sep="\t",header=T, row.names=1, quote="\""))

#Second, read in the network attributes

ga.atts<-getURL("https://docs.google.com/spreadsheet/pub?key=0Ai--oOZQWBHSdDE3Ynp2cThMamg1b0VhbEs0al9zV0E&single=true&gid=1&output=txt",ssl.verifypeer=FALSE)


ga.atts<-read.table(textConnection(ga.atts), sep="\t", header=T, quote="\"",stringsAsFactors=F, strip.white=T, as.is=T)

#Third, create a network object using the sociomatrix and its corresponding attributes

ga.net<-network(ga.mat,vertex.attr=ga.atts,vertex.attrnames=colnames(ga.atts),directed=F,hyper=F,loops=F,multiple=F,bipartite=F)


Теперь, когда вы получили данные, мы можем поиграть с ними. Прежде чем перейти к моделированию, давайте посмотрим на схему сети, отметив розовым цветом узлы, означающие женщин, и голубым — мужчин.

plot(ga.net,vertex.col=c("blue","pink")[1+(get.vertex.attribute(ga.net,"sex")=="F")],label=get.vertex.attribute(ga.net,"name"), label.cex=.75)

Расположение узлов на вашем рисунке может несколько отличаться. Здесь то, что получилось у меня:



Следует отметить несколько интересных особенностей этой сети.

Во-1, с точки зрения связности у нас есть большой связный компонент,но в целом граф поделён на четыре отдельных компонента. Если бы шоу продолжалось без появления новых персонажей, я бы думал, что один из самых маленьких компонентов должен бы «соединиться» с самым большим компонентом.

Во-2, большая часть сексуальных отношений в сериале суть гетеросексуальны. Только два ребра (torres-arizona и torres-hahn) были однополыми. По всей видимости, здесь нет нечётно-численных циклов: в сексуальных сетях циклы из трёх, пяти, семи и др. элементов содержат как минимум одну однополую связь внутри цикла.

В-3, в отражение способа построения выборки сеть не содержит сексуально-одиноких изолятов. Минимальная степень (число связей, падающих на узел) равна единице. В-четвёртых, сеть оказывается уязвимой перед табу «бывший бывшей бывшего». В одном из исследований сексуальных сетей учёные обнаружили запрет на создание пары с бывшим партнёром бывшего партнёра бывшего партнёра из-за возможных осложнений. Кажется, что здесь есть как минимум три цикла, отвечающих критериям этого табу. Вместе с тем, также хорошо известно, что нежелательные последствия, возникающие от сексуальных отношений с другими, делают шоу правдоподобным.

Давайте начнём наш формальный анализ с базовой модели, которая включает только число рёбер и, как второй предиктор, nodematch("sex"), который схватывает гетеросексуальную тенденцию сети.

ga.base<-ergm(ga.net~edges+nodematch("sex")) #Estimate the model summary(ga.base) #Summarize the model

Вот выдача команды summary(ga.base):

==========­==========­======
Summary of model fit
==========­==========­======

Formula: ga.net ~ edges + nodematch(“sex”)

Iterations: 20

Monte Carlo MLE Results:

Estimate Std. Error MCMC % p-value

edges -2.3003 0.1581 NA <1e -04="-04" -3.1399="-3.1399" 0.001="0.001" 0.01="0.01" 0.05="0.05" 0.1="0.1" 0.7260="0.7260" 0="0" 1311.43="1311.43" 1="1" 2="2" 320.47="320.47" 324.47="324.47" 334.17="334.17" 944="944" 946="946" 990.97="990.97" aic:="aic:" bic:="bic:" code="code" codes:="codes:" degrees="degrees" deviance:="deviance:" e-04="e-04" freedom="freedom" na="na" nodematch.sex="nodematch.sex" null="null" of="of" on="on" residual="residual" signif.="signif."


В согласии с ожиданиями число рёбер и гетеросексуальность суть значимые предикторы образования связей, поскольку p-значение существенно меньше, чем условный уровень значимости 0.05. Колонка «MCMC%» слева указана как пропущенная (NA), поскольку эта модель не требует оценки марковских цепей по методу Монте-Карло. Коэффициенты, −2.30 и −3.14, показывают условные логарифмы шансов (log-odds), таким образом логарифмы шансов того, что два персонажа вступили в сексуальные отношения, равны (-2.30)*увеличение числа связей на единицу + (-3.14)*увеличение числа однополых отношений. Логарифм шансов того, что одна гетеросексуальная связь образуется внутри сети, равен −2.30, что даёт её вероятность exp(-2.30)/(1+exp(-2.30)) = 0.09. Аналогично, логарифм шанса образования гомосексуальной связиравен −2.30-3.14 = 5.44, что соответствует вероятности 0.004 = exp(-5.44)/(1+exp(-5.44)).

Давайте посмотрим, какую случайную, расчётную сеть эта модель могла бы создать.

plot(simulate(ga.base),vertex.col=c("blue","pink")[1+(get.vertex.attribute(ga.net,"sex")=="F")])

Ваша картинка может несколько отличаться от того, что получилось у меня:


Эта сеть точно отражает как число рёбер, так и склонность к образованию гетеросексуальных связей, однако здесь не всё в порядке: некоторые из наших узлов суть изоляты. Иными словами, расчёт предсказывает существование в сети сексуально-воздерживающихся индивидов. Поскольку никаких таких людей в нашей реальной сети нет из-за особенностей формирования выборки, построенная модель неудовлетворительна.

Хотя у нас есть значения критерия согласия (goodness of fit), данного функцией правдоподобия, один обычный, систематический способ определения критерия согласия — это сравнение параметров немоделированной, наблюдаемой сети с такими же параметрами рассчитанных ERGM сетей.

ga.base.gof<-gof(ga.base)

summary(ga.base.gof) #Summarize the goodness of fit

par(mfrow=c(3,1)); plot(ga.base.gof) #Plot three windows. It's OK to ignore the warning.


Рисунок воспризводит ту же информацию, которую выдаёт команда summary(). p-Значения в правых колонках суть вероятности того, что рассчитанные сети точно совпадают с сетью наблюдаемой в ряду данных параметров. Мы видим, что в терминах of the edgewise shared partner and minimum geodesic distance measurements represent the data quite well. Однако, если мы посмотрим на такой параметр как центральность, то увидим то, что согласуется с нашими выводами из рисунков — число воздерживающихся изолятов (узлов с центральностью 0) больше, чем нужно, число узлов с центральностью 1 (моногамистов) — меньше, и что нет оценок для узлов с центральностью 3 и 9.

Мы сейчас добавим в модель параметр, контролирующий эффект моногамии (центральность 1).

ga.base.d1<-ergm(ga.net~edges+nodematch("sex")+degree(1)) summary(ga.base.d1) plot(simulate(ga.base.d1),vertex.col=c("blue","pink")[1+(get.vertex.attribute(ga.net,"sex")=="F")]) ga.base.d1.gof<-gof(ga.base.d1); summary(ga.base.d1.gof) par(mfrow=c(3,1)); plot(ga.base.d1.gof)

Если принять значение BIC предыдущей модели 334.17 как исходное, то мы увидим, что модель ga.base.d1 лучше — её BIC равен 316.56. Эффект моногамии также является статистически значимым. Рисунок демонстрирует меньше изолятов, что подтверждает команда gof(). Судя по значениям критерия согласия, модель кажется разумным приближением к реальности, если не принимать во внимание персонаж шоу с девятью сексуальными партнёрами.

В отличие от предыдущей модели, эта использует методику оценки марковских цепей (MCMC). Мы можем оценить результаты MCMC.

mcmc.diagnostics(ga.base.d1)

В выводе следует сначала глянуть на второй пункт, в котором сравниваются параметры расчётной и наблюдаемой моделей.

Are sample statistics significantly different from observed?

edges nodematch.sex degree1 Overall (Chi^2)

diff. -0.0968000 0.0232000 0.0534000 NA
test stat. -0.2942081 0.8328180 0.3379779 1.086016
P-val. 0.7685989 0.4049474 0.7353798 0.780451


Вроде бы всё в порядке: рассчитанные при помощи MCMC графы значимо не отличаются от наблюдаемого. Давайте посмотрим по-другому:

Sample statistics auto-correlation:
Chain 1

edges nodematch.sex degree1

Lag 0 1.0000000 1.00000000 1.0000000
Lag 100 0.8476292 0.47956824 0.7334256
Lag 200 0.7332856 0.26641687 0.6116231
Lag 300 0.6371281 0.17109432 0.5198955
Lag 400 0.5587029 0.12489565 0.4480439
Lag 500 0.4883954 0.08496445 0.3860807

Sample statistics burn-in diagnostic (Geweke):
Chain 1

Fraction in 1st window = 0.1
Fraction in 2nd window = 0.5

edges nodematch.sex degree1

-1.590 -1.068 1.372

P-values (lower = worse):

edges nodematch.sex degree1

0.1117691 0.2856841 0.1701817


В целом, нет ничего подозрительного в результатах диагностики MCMC. Параметр автокорелляции между лагами несколько больше, чем предпочитаемый мною (лаги должны быть ближе к нулю и дальше от единицы, за исключением нулевого лага). Кроме того, статистика Geweke, приблизительно соответствующая z-статистике, когда её p-значения незначимы, должна быть значительно ближе к нулю. К счастью, мы можем так изменить некоторые параметры по умолчанию в MCMC для того, чтобы получить более приемлемый результат.

ga.base.d1<-ergm(ga.net~edges+nodematch("sex")+degree(1),control=control.ergm(MCMC.burnin=50000, MCMC.interval=5000))

При увеличении MCMC.burnin с 10,000 (по умолчанию) до 50,000 должен уменьшаться параметр Geweke. При увеличении MCMC.interval со 100 (по умолчанию) до 5000 должна уменьшаться автокорреляция между лагами. Если бы параметры нашего расчётного образца действительно значимо отличались от наблюдаемых, мы бы увеличили размер выборки в MCMC с 10,000 (по умолчанию) до 20,000 или даже 50,000.

ga.base.d1<-ergm(ga.net~edges+nodematch("sex")+degree(1),control=control.ergm(MCMC.burnin=50000,MCMC.interval=5000, MCMC.samplesize=50000))

Нам следовало бы поупражняться в увеличении этих параметров MCMC, но это может резко увеличить время расчётов.

summary(ga.base.d1) #The figures are mostly the same

mcmc.diagnostics(ga.base.d1)

Ура! MCMC диагностика заметно улучшилась, что указывает на большую жёсткость нашей последней модели.

Теперь, когда мы понимаем чуть больше, как оценивать качество модели, мы можем вернуться к интригующему вопросу секса! Только что мы моделировали сеть по числу рёбер, склонности к гетеросексуальности и по моногамии, но могут ли другие аспекты привнести смысл в анализ? Я бы предложил начать с возраста, поскольку большинство любовных связей возникают между сверстниками.

ga.base.d1.age<-ergm(ga.net~edges+nodematch("sex")+degree(1)+absdiff("birthyear"),control=control.ergm(MCMC.burnin=50000, MCMC.interval=5000))

summary(ga.base.d1.age)

mcmc.diagnostics(ga.base.d1.age)

summary(gof(ga.base.d1.age))

Кажется, модель ощутимо улучшилась! Значение BIC снизилось с 316.56 до 297.51, MCMC-диагностика выглядит хорошо, значение критерия согласия выглядит, в целом, разумным, а разница в возрасте значима и отрицательна, что указывает на то, что чем больше разница в возрасе акторов, тем меньше шансы у них флиртовать друг с другом.

Наконец, давайте рассмотрим ассортативность с точки зрения группировки по расам. Предыдущие исследования юношеских сексуальных и любовных сетей открыли такую ассортативность. Создательница сериала, Shonda Rhimes, сознательно построила отбор актёров так, чтобы представить расовое разнообразие. Поскольку шоу включает ряд афроамериканских (наряду с обилием других не-белых) персонажей, можно попытаться установить, привело ли такое разнообразие при отборе персонажей к расовому разнообразию в сексуальных отношениях. Для начала, давайте попробуем построить модель общей гомофилии по расе.

ga.base.d1.age.race<-ergm(ga.net~edges+nodematch("sex")+degree(1)+absdiff("birthyear")+nodematch("race"),control=control.ergm(MCMC.burnin=50000,MCMC.interval=5000))

summary(ga.base.d1.age.race)

mcmc.diagnostics(ga.base.d1.age.race)

summary(gof(ga.base.d1.age.race))

Мы в самом деле нашли эффект расового отбора, предполагающий, что образование связи более вероятно между персонажами одной и той же расы. В этом шоу сексуальные отношения являются скорее внутри-, нежели межрасовыми по сравнению с тем, что было бы, если бы персонажи разных рас комбинировались совершенно случайно. MCMC-диагностика выглядит хорошо, а измерения критерия согласия в пределах разумного. Хотя полученная модель выглядит хорошо по многим индикаторам, но заметно небольшое увеличение BIC (298.21) по сравнению с предыдущей моделью (297.51). Если бы нам были интересны только параметры сети, то предыдущая модель даёт лучшие значения.

Но возможно, что белые персонажи проявляют большую гомофилию, а чёрные — меньшую? Или наоборот? Мы можем посмотреть на это как на дифференциальную гомофилию. В модель добавляем параметр diff=T к слагаемому nodematch("races").

ga.base.d1.age.racediff<-ergm(ga.net ~ edges + nodematch("sex") + degree(1) +absdiff("birthyear") + nodematch("race", diff=T), control=control.ergm(MCMC.burnin=50000,MCMC.interval=5000))

summary(ga.base.d1.age.racediff)

Хотя мы можем моделировать дифференциальную гомофилию, ergm() не смог интерпретировать категорию «other», поскольку в наблюдаемой сети нет сексуальных отношений между латиноамериканцами и азиатоамериканцами. ergm() указывает на эту сложность следующей фразой:

Observed statistic(s) nodematch.race.Other are at their smallest attainable values. Their coefficients will be fixed at -Inf.

Аналогично, the AIC, BIC, отклонение и эффекты nodematch.race.Other помечены как NA в summary. Давайте попробуем создать новую модель, исключив гомофилию между латиноамериканцами и азиатоамериканцами. Чтобы это сделать, мы включаем параметр keep=c(1,3) в слагаемое nodematch("race"), поскольку «Black» и «White» были первой и третьей категориями, перечисленными в summary(ga.base.d1.age.racediff).

ga.base.d1.age.racediff<-ergm(ga.net~edges+nodematch("sex")+degree(1)+absdiff("birthyear")+nodematch("race", diff=T, keep=c(1,3)),control=control.ergm(MCMC.burnin=50000, MCMC.interval=5000))

summary(ga.base.d1.age.racediff)

mcmc.diagnostics(ga.base.d1.age.racediff)

summary(gof(ga.base.d1.age.racediff))

Как и в предыдущей модели, мы видим значимую ассортативность по расовым группам в сериале. Как чёрные, так и белые персонажи проявляют склонность к расовой гомофилии бОльшую, чем можно было бы ждать, если бы выбор партнёра был случайным. Эта модель также указывает, что эффекты гомофилии сильнее среди афроамериканских персонажей (на это указывает более высокий коэффициент и меньшее p-значение при nodematch.race.Black по сравнению с nodematch.race.White term). Проверка MCMC-диагностики и статистик критерия согласия говорит, что полученная модель является хорошим отражением оригинальной сети. Вместе с тем, BIC ещё больше сдвигается к 300.73, указывая что модель менее экономна по сравнению с моделью общей гомофилии и модели с возрастом.

Давайте посмотрим на картинку.

plot(simulate(ga.base.d1.age.racediff),vertex.col=c("blue","pink")[1+(get.vertex.attribute(ga.net,"sex")=="F")])


Ваша может выглядеть несколько иначе, но в целом, кажется, эта модель воспроизводит оригинальные данные достаточно хорошо. Результат расчётов отличается наличием большого компонента, небольшим количеством изолятов (их даже может не быть), несколькими небольшими компонентами и, хотя отношения на ней преимущественно гетеросексуальны, мы видим четыре однополых связи (в оригинальных данных их было две).

Хотя число съёмов в сериале Grey’s Anatomy может казаться удивительным, в аспекте образования диад видно скорее традиционное восприятие сексуальных отношений: доминируют нормы моногамии, а бОльшая часть связей суть гетеросексуальны и соединяют пары близкого возраста и одной расы. Следует, однако отметить, что описанный анализ обошёл ряд альтернативных версий, которые могли бы лучше отразить свойства сети. Я приглашаю читателей самостоятельно поиграть с данными и с другими моделями. Несколько дополнительных примеров:

#Perhaps men and women have different tendencies to form sexual partnerships?

ga.base.d1.age.sex<-ergm(ga.net~edges+nodematch("sex")+degree(1) +absdiff("birthyear")+nodefactor("sex"), control=control.ergm(MCMC.burnin=100000, MCMC.interval=5000)) #Maybe less "traditional" than previously concluded?


#Perhaps you're interested in the assortative mixture among roles in the hospital?
#Resident-resident sexual contacts (28) are the reference group,
#and unobserved pairings between positions (3-5, 9, 12-15, 17-21, 24, 27) are omitted.

ga.base.d1.age.rolemix<-ergm(ga.net~edges+nodematch("sex")+degree(1)+absdiff("birthyear") +nodemix("position", base=c(3:5, 9, 12:15, 17:21, 24, 27, 28)), control=control.ergm(MCMC.burnin=50000, MCMC.interval=5000))


list.vertex.attributes(ga.net) #List the different vertex attributes in the network object

get.vertex.attribute(ga.net, "sign") #Provides each actor's astrological sign.

?ergm.terms #This command will provide a list of other terms that ergm() can model

?control.ergm #This command will present different options on the estimation methods.



Читать далее

Видеоролик к выборам


Читать далее

16 жовт. 2012 р.

Права меншин або танці на кістках замість діалоґу

Весь досвід українських нецивілізованих, диких виборів свідчить про те, що учасники перегонів за хліб з варенням не ґребують нічим. Можна позиціонувати себе своїми досягненнями, але набагато легше помиїти конкурентів. Шкода, але при цьому отой хліб з варенням — майбутні депутатські вигоди — повністю заступають якісь елементарні людські цінності. Про права людини, зокрема право на гідність, годі й згадувати.

Два свіжих приклади з близької області.

Перший: прийняття законопроекту 8711 Радою — жодна партія і жодна політична сила не голосували проти. Але як здійнявся суспільний галас, представниця опозиційної партії УДАР вголос засудила голосування. Але ж де ти, розумнице, була під час самого голосування? Політичний цинізм? — Авжеж, так!

Другий: Донецьк, на Форум розмаїття в Прес-клубі запрошено представників партій і пересічних ЛҐБТ-виборців. Виборці з’явились, журналісти з’явились, партії натомість прийти злякались (бо ж, звісно, треба буде відповідати на вельми незручні питання) і не прийшли. Один-єдиний голова передвиборчого штабу одіозно-фашистської Свободи прийшов, але інкогніто — теж боягуз. А от після заходу на сайті УДАРу з’являється дуже скандальний матеріал і менш ніж за добу щезає, де пишеться якась дурня «голосуйте за нас и мы легализируем гомосексуализм». Може сам УДАР і непричетний до цього, адже цей матеріал швиденько зацитували його конкуренти, але де ж офіційна заява керівництва?

Гра з правами тої ґрупи, яка потребує захисту, гра з людською гідністю в такий спосіб нічого крім огиди до ВСІХ учасників передвиборчого процесу не залишає.

Що більше це спостерігаю, то міцнішим стає моє переконання: навіть факт приходу на виборчу дільницю бруднить нормальну людину. Не ходив і не піду на ваші вибори — плескайтесь в лайні самі.

Читать далее

Форум разнообразия: избиратели особенные — проблемы общие: Пост-релиз, 15 октября 2012 г.

Ни одна партия не прислала, несмотря на неоднократные приглашения, своих представителей на встречу с избирателями.

12 октября 2012 г. в Донецком пресс-клубе состоялся анонсированный заранее Форум разнообразия, на котором ЛГБТ1-сообщество Донецкой области, общественные организации области (в т. ч. право-консервативного толка) и журналисты обсудили актуальные для социальных меньшинств вопросы.

На форуме были представлены результаты первого в Украине исследования электоральных предпочтений ЛГБТ-сообщества, оценена численность ЛГБТ-избирателей в Донецкой области (25000 чел.), состоялась дискуссия о пресловутом законопроекте № 8711 и прошла выставка картин художника СЕВЕРИНА. Но самое главное — обычные, «рядовые» ЛГБТ высказали своё мнение, пожелания к партиям.

«Порядок на улице, проблемы малого бизнеса, образование, здравоохранение, ЖКХ — вот что волнует ЛГБТ-сообщество, впрочем, как и большинство избирателей Украины, — говорит руководитель исследования Надежда ВЕЛИЧКО, — реальная жизнь и реальные заботы. Почему же политики хотят, чтобы геи и лесбиянки стали людьми вне закона? Чем любовь мешает государству? Всех волнует законопроект 8711. Ведь с его принятием и без того непростая жизнь в нашем обществе, где зашкаливает уровень ксенофобии и которое скатывается к фашизму, станет ещё сложнее».

«Мы с возмущением констатируем, — говорит М. КАСЯНЧУК, руководитель ЛГБТ-центра „Донбас-СоцПроект“, — что все политические силы, претендующие на место в парламенте, трусливо игнорируют требования огромного количества своих избирателей, боятся посмотреть в глаза тем людям, которые содержат их своими налогами».

Результатом форума станет обращение к политическим партиям с требованием неотступно следовать букве Конституции Украины, гарантирующей всем гражданам равные права, не допускать сужения предусмотренного ей перечня гражданских свобод в угоду сиюминутным политическим амбициям, принимать во внимание не только «интересы большинства», но и потребности миноритизированных социальных групп, бороться с разжиганием вражды и ненависти.

Напоминаем, что «Особенные избиратели: голоса меньшинств в парламентской избирательной кампании 2012» — проект Молодёжного инновационного центра «Медиа-М» при финансовой поддержке Европейского Союза. Цель проекта — представить общественности голоса уязвимых социальных групп и меньшинств во время предвыборной кампании, привлечь внимание общества и политиков к проблемам и интересам этих групп, сделать их видимыми в местных общинах.

В течение сентября—октября 2012 года в рамках проекта идут Форумы разнообразия и кампании социальной рекламы в шести городах (Черкассы, Белогорск, Ужгород, Донецк, Бердичев и Луганск). Главные участники форумов — люди с инвалидностью, ромы, геи и лесбиянки, социальные сироты, представители исламских и христианских радикальных общин. Весной 2013-го в этих же городах пройдёт второй цикл форумов — будут обсуждаться изменения в положении меньшинств и уязвимых групп, а также то, насколько их пожелания были учтены депутатами новоизбранной Верховной Рады.

Партнёром МИЦ «Медиа-М» в Донецкой области является общественная организация «Межрегиональный центр ЛГБТ-исследований Донбас-СоцПроект».

Пресс-служба ЛГБТ-центра «Донбас-СоцПроект»

Реакция в СМИ:

http://progorod.info/story/70880#.UH6Q-lb1dqw

Читать далее

14 жовт. 2012 р.

Форум в Донецке: то, что осталось за кадром

Утро 12 октября 2012 года началось с тревожного звонка из пресс-клуба: «Начало Форума у Вас в 12.00? Так знайте, что с 10.00 до 12.00 в этом зале будут заседать члены Компартии. Мы видим, как заходят туда молодые крепкие парни». Этот факт, конечно, мог ничего не означать.

Ну, арендовали КПУ свободное время для своего собрания, ну, и что? Но странный факт, еще за 2 дня до нашего форума, я спрашивала, можно ли до форума подготовить зал? Хотя бы за полчаса до 12 часов. Дирекция —"да, без проблем, хоть за час«. Разобраться и расставить акценты решила на месте. Директор, пожилая мадам, встретила меня достаточно враждебно. «Так это вы — геи и лесбиянки? Почему вы об этом не сказали? Я бы отказала вам в аренде сразу». «Позвольте? В счёте четко было написано «...центр ЛГБТ — исследований... ЛГБТ — это лесбиянки, геи, бисексуалы, трансгендеры». Атмосфера накалялась, и я внятно объяснила, что у нас на форуме будут представители СМИ, гости из Киева, Европарламента, иностранцы. Любая провокация со стороны КПУ или других «нетерпимых слоев населения» будет зафиксирована. Поэтому пока не поздно, разрулите ситуацию. Со своей стороны я предупредила милицию. «Зачем милиция? Нам еще милиции не хватало!, — кипишевала директор. «Для охраны правопорядка», — ответила я.

Мы не смогли подготовить помещение так, как хотели, времени не хватило. Открывали зал уже когда в коридоре столпилось большое количество нетерпеливых журналистов.

Ребята (геи) всегда настороженно принимают журналистов. Фотография с определенными комментариями могут не просто «подпортить имидж», но и стоить жизни. В нашем гомофобном обществе, ребята с нетрадиционной ориентацией легко могут стать жертвой агрессивно настроенных особей (по-другому их назвать трудно), которые просто не знают куда деть свою ярость. А тут как раз законом 8711 показали направление. Вот они! Туда! Геи во всех твоих бедах виноваты! Перефразируя известную фразу «Бей жидов — спасай Россию», этим законом говорят: «Бей геев — спасай Украину»! Они виноваты в кризисе власти, экономики, морали, наконец! Бред. Но ... это наша жизнь. Журналисты были недовольны ограничениями в съемках. «Это медийное мероприятие!!» «Но есть еще закон о конфиденциальной информации». Со мной не стали спорить, а я все мероприятие контролировала, куда направлены нескромные объективы.

Не все пришедшие на форум геи зашли в конференц-зал. Человек 10 гуляли по коридору, пили кофе, рассматривали картины, выставленные здесь же. Они очень боялись телевизионщиков. Такой «камин-аут» не входил в их жизненные планы («камин-аут» — означает открыто заявить о своїй ориентации). Некоторые приехали из дальних городов Донецкой области, но так и ушли, не замеченные.

Это очень трудно быть не таким как все. Хотелось бы, чтобы те, кто устраивают травлю, любители «поохотиться за ведьмами», когда-нибудь сами ощутили это состояние. Как это — быть без вины виноватым?

Этого хотелось бы не из мести, а для понимания.

Надежда ВЕЛИЧКО, Центр ЛГБТ-исследований «Донбасс-СоцПроект»

Читать далее

13 жовт. 2012 р.

Форум разнообразия

12 октября 2012 г. в Донецком пресс-клубе состоялся «Форум разнообразия». ЛГБТ-сообщество Донецкой области, общественные организации Украины (в т. ч. право-консервативного толка), глава предвыборного штаба ВО «Свобода» и журналисты обсудили актуальные для социальных меньшинств, в целом, и ЛГБТ, в частности, вопросы.



На форуме были представлены результаты первого в Украине исследования электоральных предпочтений ЛГБТ-сообщества, оценена численность ЛГБТ-избирателей в Донецкой области (а эта цифра, 25000 чел. очень близка к численности населения г. Дебальцево), состоялась дискуссия о пресловутом законопроекте 8711 и, наконец, прошла выставка картин художника СЕВЕРИНА. Но самое главное — обычные, «рядовые» ЛГБТ высказали своё мнение, высказали пожелания к партиям.



К сожалению, кроме Свободы ни одна политсила не откликнулась на неоднократные приглашения...




Отзывы прессы:

http://www.62.ua/article/202659
http://novosti.dn.ua/details/188288/
http://donetsk.comments.ua/news/2012/10/12/171248.html
http://www.svoboda.org.ua/diyalnist/novyny/033524/
http://062.ua/news/v-donecke/16547-gomoseksualisty-kak-osobaya-gruppa-izbirateley-kak-k-etomu-otnosit-sya
http://dennislapin.livejournal.com/162712.html
http://mungaz.net/main/3656-doneckie-gei-i-lesbiyanki-hotyat-zapustit-socialnuyu-reklamu-fotoreportazh.html
http://c-pod.molode.com.ua/2012/10/14/lhbt-spilnota-donechchyny-naperedodni-vyboriv/
http://capricios.livejournal.com/1296138.html
http://www.bbc.co.uk/ukrainian/ukraine_in_russian/2012/10/121017_ru_s_gay_forum_donetsk.shtml
http://panorama.dn.ua/news/politics/9255-2012-10-12-13-41-41
http://panorama.dn.ua/news/politics/9254-2012-10-12-13-27-00
http://telegraf.dn.ua/analytics/raduzhne-skachki-verhovnoj-rad-nakanune-vborov/
http://realityinua.com/category/news/news_4996.html
http://mk-donbass.com.ua/index.php?id=8058&show=news&newsid=50978
http://union.ua/ru/politics/15_10_2012_predstaviteli_netraditsionnykh_seks_menshinstv_obsudili_vybory.html
http://www.lkyiv.com/modules/weblog/details.php?blog_id=4379


Читать далее

ВО «Свобода» вивчає життя ЛГБТ-спільноти


Голова виборчого штабу ВО «Свобода» в Донецьку, номер 34 списку партії, Юрій НОЄВИЙ відвідав «Форум Різноманіття» ЛГБТ-Центра «Донбас-СоцПроект».

Під час дискусій кандидат від Свободи повідомив, що регулярно відвідує геївське кафе «Їжаки» в Симеїзі. «ЛГБТ-Центр „Донбас-СоцПроект“, — каже його голова М. КАСЯНЧУК,  — вітає цікавість ВО „Свобода“ до повсякденного життя ЛГБТ-спільноти. Саме це, як відомо із соціології, сприяє руйнації фальшивих стереотипів і встановленню тісних, глибинних зв’язків між людьми».

Нагадаємо, раніше посаду голови ВО «Свобода» в Донецькій області займав Артур ШЕВЦОВ. Однак він був звільнений з неї через «недалекоглядність політичних прогнозів».
Читать далее

1 жовт. 2012 р.

Быстро построить линейную модель

Быстро построить картинку линейной зависимости двух непрерывных переменных можно так:

plot(Y~X)
abline(lm(Y~X))


Ну а параметры этой модели выводятся на экран как обычно: summary(lm(Y~X))
Читать далее

29 вер. 2012 р.

Корреляция

Наверное, все слышали такую аббревиатуру как ЯМР — образец помещают в сильное (очень сильное!) магнитное поле и облучают радиоволнами... собственно, это не важно. В далёкие времена, когда деревья и приборы были большими, случился, как рассказывают старейшины, некий казус.

Решили старейшины, а тогда просто молоденькие аспиранты и мэнээсы, выпить и закусить. Когда градус креативности сравнялся с энергией активации подвигов, а было это уже ночью, взяли они петуха и поместили меж магнитов то ли ЯМР-а, то ли ЭПР-а. Включают поле — петух кричит. Сильнее его магнитят — сильнее кричит... Одним словом, «відкриття». Неужто несчастная птица чувствует теслы фибрами души? Утром (или днём, но история об этом умалчивает), по трезвом рассуждении оказалось, что таки чувствует, только не теслы, и не фибрами — магниты были закреплены подвижно: выше поле, магниты ближе друг к другу и больше давят птичку, а та, естественно, протестует... Корреляция налицо!
Читать далее

28 вер. 2012 р.

Волны желания

Моя любовь к наливным ручкам накатывалась на меня волнами.

В первом классе я их ненавидел, возмущался, почему нельзя писать шариковыми, ходил по уши в чернилах, которые постоянно вытекали из ручки, засыхали и их нужно было вымывать в школьном буфете под краном...

Потом, лет на девять — до окончания школы — чернила были забыты. А вот в техникуме (я ещё и сталевар-недоучка!) было прикольно снова писать чернилами конспекты по сопромату, физхимии и производству стали. Причём прикол состоял в том, что мои пальцы научились быть чистыми, а вот сосед по парте, Димочка, почему-то был всегда в моих чернилах...

Снова, на несколько лет, наступило забвение, но защита диссертации принесла подарок — недорогой (увы!) Паркер. Прошедшие годы, видимо, сказались: теперь и мои руки были чисты, и лицам коллег посчастливилось избежать чернильных пятен.

И вот сегодня, опять после многолетнего перерыва мне захотелось взять ручку — на этот раз самую-самую — залить в неё чернил и написать: «я тебя люблю»...

Читать далее

17 вер. 2012 р.

Голос лесбиянок и геев на парламентских выборах 2012 г.

Политики и чиновники разного уровня, выступая с публичными заявлениями и работая над реализацией государственных программ, принимают во внимание только своеобразно понимаемые «интересы большинства», не учитывая наличия и потребностей ряда миноритизированных, подчас «невидимых» групп населения, таких как этнические и национальные меньшинства, люди с негетеросексуальной ориентацией, люди с ограниченными физическими возможностями и другие. Соответственно, время от времени в парламенте возникают популистские законодательные инициативы, явным или косвенным образом направленные на ограничение гражданских свобод людей из таких особых групп.

Первая на постсоветском пространстве попытка рассмотреть потребности ЛГБТ-сообщества в контексте выборов в наивысший орган законодательной власти в Украине — Верховную Раду осуществлена общественной организацией «Межрегиональный центр ЛГБТ-исследований Донбас-СоцПроект» в период с 15 по 25 сентября 2012 г.

Опрошено 254 чел. в возрасте от 17 до 70 лет, в среднем — 32 года, преимущественно гомосексуалов (66%), среди них мужчин 81%, никогда не состоявших в браке 76%, в основном — со средним достатком (40%), остальные — бедные (33%) либо обеспеченные (27%).

Электоральная активность. Представители ЛГБТ-сообщества характеризуются достаточно высокой электоральной активностью: 68% из имевших право голоса голосовали на парламентских выборах 2007 г., 73% — на президентских 2010-го.

60% приняли решение, что пойдут голосовать на парламентских выборах 2012 г., 17% голосовать не планируют.

Первостепенная характеристика кандидата с точки зрения ЛГБТ-сообщества — его социально-экономическая программа (этого мнения придерживаются 50%), на втором месте (для 22%) — принадлежность кандидата к той же социальной группе, что и избиратель, на третьем месте (21%) — чисто личностные качества (умение говорить, внешность, харизма, обаяние).

Сексуальная ориентация кандидата в депутаты может быть в позитивном или негативном смысле определяющей при голосовании на выборах, сексуальная ориентация кандидата не имеет значения лишь для четверти (24%) опрошенных, причём последнее мнение характерно для более молодых ЛГБТ.

Половина респондентов (47%) готовы проголосовать за открытого представителя ЛГБТ-сообщества при условии, что их устроит его / её политическая программа; пятая часть (21%) готова голосовать за кандидата из ЛГБТ невзирая на политическую программу.

Специфическими проблемами ЛГБТ являются отсутствие понимания или осуждение со стороны родственников (64%), разглашение конфиденциальной информации о респондентах или угроза её разглашения (30 и 18% соответственно), проблемы с правоохранительными органами из-за сексуальной ориентации (20%).

В целом для опрошенных, те вопросы, которые касаются специфических проблем ЛГБТ, являются менее значимыми, чем вопросы общего характера (свобода слова, экономическое и социальное благополучие).

Свобода слова. Три четверти (76%) знают о рассмотрении парламентом законопроектов по запрету «пропаганды гомосексуализма», в частности 8711.

Две трети (64%) считают, что эти законопроекты могут быть обращены лично против них. Среди ЛГБТ ценность свободы слова осознаётся как высокая.

Приоритетные проблемы, беспокоящие ЛГБТ как избирателей:

* проблемы жилищно-коммунальной сферы (в частности, требующие ремонта дороги, нерегулярность транспорта, плохая работа канализации и т. д.);

* социальные проблемы (в частности, высокое количество бездомных, избыток пьяной молодёжи на улицах, агрессивные бездомные псы, плохая экология и т. п.);

* политические проблемы (в частности, коррупция, недостаточный уровень либеральности, непрозрачность власти и т. п.).

Качество работы местных властей респондентами оценено как невысокое, что совпадает с оценками со стороны населения в целом.

Нынешний курс развития страны считают неправильным большинство (56%) опрошенных, ещё 30% затрудняются в его оценке и лишь менее шестой части опрошенных (14%) полагают его правильным.

Мнение о наличии конструктивной политсилы. Большинство (52%) не видят политической силы, способной решить проблемы страны; видят таковую силу лишь 13% опрошенных, а свыше трети (34%) затруднились что-либо ответить.

Полный отчёт об исследовании: http://lgbtqstudies.wordpress.com/2012/10/24/elections-ukr-2012/

Библиографическая ссылка для цитирования:

Шеремет С. П. Мнения ЛГБТ в контексте парламентских выборов 2012 г. : краткий обзор результатов социологического исследования / Киевское городское отделение Общественной организации «Межрегиональный центр ЛГБТ-исследований Донбас-СоцПроект». — Под ред. М. Г. Касянчука. — К., 09.10.2012. — 2 с.




Читать далее