30 окт. 2012 г.

Социальная сеть МСМ Донецка и прилегающих городов: попытка анализа

Материал для этого анализа собирался, по большей части, между делом. В 2009 г., когда заканчивалась первая фаза немецко-украинского проекта «Сеть» (Connect+, Центр «Наш мир»), встал вопрос о его оценке. Мы разработали для получателей услуг проекта небольшую анкету, намереваясь узнать их мнение о полученных материалах. Само по себе это было бы скучным опросом очень маленькой выборки, поэтому мы дополнили опросник сетевым блоком, в котором просили каждого респондента указать на отдельном листике всех своих знакомых мужчин, практикующих однополый секс. Это была инновация — до нас никто ни в Украине, ни вообще на постсоветском пространстве не занимался анализом социальных сетей гомосексуальных мужчин.

Естественно, мы понимали, что такая просьба — передать посторонним людям сведения о своих знакомых без их согласия — может быть воспринята в штыки. В то же время нам нужно было как-то однозначно идентифицировать эти контакты, т. к. мы подозревали, что у разных, даже незнакомых друг с другом респондентов, могут быть общие знакомые (забегая вперёд скажу, что наши подозрения подтвердились).

Компромисс выглядел так: в анкете респондент писал последние четыре цифры своего номера и точно так же обозначал своих знакомых, последними четырьмя цифрами их телефона. По этой комбинации нельзя узнать конкретного человека, но она (особенно в сочетании с другими данными) является уникальным кодом человека в собираемом массиве.

Кроме последних четырёх цифр респондент характеризовал себя и своих знакомых именем, возрастной группой (15–19, 20–29, 30–39 лет и т. д.), по официальному (холост, женат, разведён или вдов) и фактическому (живу сам, с родителями, с мужчиной-партнёром, с женщиной-партнёршей) семейному положению, а также указывал город проживания.

В результате мы получили 63 эгоцентрических сетей, каждая связь которой выглядела примерно так:

Максим.30-39.Донецк.холост.сам.0034 -> Александр.20-29.Донецк.холост.с-родителями.9555

(до стрелки — информация о респонденте, после — о знакомом респондента, стрелка условно обозначает наличие связи, т. е. тот факт, что номер телефона знакомого записан в телефонную книгу мобильника респондента).

Как только данные были собраны и проверены, мы обезличили их, т. е. вышеприведённый пример приобрёл такой вид:

X3.30-39.Донецк.холост.сам -> X5.20-29.Донецк.холост.с-родителями

а рабочий массив стал двумя таблицами: а) список связей (X3 -> X5 и т. п.); б) список характеристик каждого узла (напр. X3, 30-39 лет, Донецк, холост, живёт сам и т. п.). Эти два списка мы экспортировали в R, как описано в http://donbas-socproject.blogspot.com/2009/12/r.html.

Вот схема сети согласно результатам опроса (63 розовых кружка — респонденты, 300 синих — их знакомые, которых мы не опрашивали).


Первое, что следует отметить — сеть получилась плотной и связной. Действительно, как мы предполагали, респонденты не только были соединены друг с другом (на схеме — розовый с розовым), но и через общих знакомых (триада розовый–синий–розовый). Долю таких общих знакомых посчитать легко: число синих кружков с центральностью больше 1, делённое на общее число синих кружков, — 14%.

Второе, поскольку 86% нереспондентов были упомянуты лишь единожды (т. е. только одним из опрошенных), то сеть выглядит как ряд кустов на общем корне, которым являются связи респондентов друг с другом.

Третье, в сети нет изолятов, т. е. таких узлов, у которых нет никаких связей.

Если свойства 2 и 3 обусловлены способом сбора информации, то первое явилось непосредственным следствием высокой плотности связей в изучаемом сообществе. В свою очередь, эта плотность очевидно связана с преобладанием среди целевой группы проекта «Сеть» (по крайней мере, в Донецкой области) людей старше 30 лет (60%), наличием значительной доли (31%) тех МСМ, которые ходят на плешку, а также живущих в небольших городах области (14%).

Ядро сети (совокупность 79 узлов с тремя и бОльшим числом связей) значительно более монолитно и спаяно. Так, его централизация (0.28) вдвое выше централизации всей сети (0.14). В отличие от структурных, социодемографические характеристики ядра повторяют в пределах ошибки соответствующие характеристики целой сети.

Вопрос, решаемый в настоящей работе таков: каковы основные факторы, ассоциированные с образованием связей внутри изучаемой сети?

Исследование опиралось на процедуры, разобранные в http://donbas-socproject.blogspot.com/2012/10/grey-anatomy.html, т. е. на многомерное моделирование изоморфных случайных сетей с учётом ключевых структурных показателей сети реальной.

Более формально исследовательский вопрос распадается на ряд гипотез:

1 действуют правила общего подобия двух связанных узлов (общая гомофилия):
  1.1 связи образуются по признаку респондент–не респондент (следствие способа формирования массива);
  1.2 связи образуются внутри города или агломерации;
  1.3 связи образуются между близкими по возрасту узлами;
  1.4 связи учитывают семейное положение (напр., женатый–не женатый, живу сам–живу с родителями и т. п.)

2 склонность к образованию связей отличается у узлов, принадлежащих к разным подгруппам (дифференциальная гомофилия):
  2.1 женатые менее переборчивы (т. е. более склонны образовывать и поддерживать связи с людьми разного возраста, города, семейного положения), чем холостые и разведённые;
  2.2 МСМ старше 30 лет менее переборчивы, чем молодые;
  2.3 живущие с родителями или с женщиной-партнёршей менее переборчивы, чем живущие отдельно.

Базовая модель, в которую вошли только предикторы связей и гомофилия по  признаку респондент–не респондент, оказалась крайне неудовлетворительной — она давала множество изолятов и связей между нереспондентами:


Добавление в модель предиктора, учитывающего преобладание узлов со центральностью 1, улучшило модель (появилась отмеченная выше кустистая структура и центральное ядро):


Однако эта модель не дала ответы на поставленные вопросы, поэтому мы пошли от обратного — включили в модель все возможные предикторы и затем исключали их по одному, добиваясь разумного баланса результатов. Оказалось, что гомофилия по возрасту (как общая, так и дифференциальная) не является сколь-либо значимым фактором в нашей сети, тогда как прочие (место жительства и семейное положение) играют заметную роль:

ФакторlnORSEp-Значение
Образование гетерогенной по всем параметрам связи-3.90.1<0.001
Центральность узла равна 13.10.2<0.001
Гомофилия по статусу респондент–нереспондент
нереспондент-4.00.7<0.001
респондент0.90.1<0.001
Гомофилия по месту жительства
Донецкая агломерация0.50.1<0.001
Горловская агломерация0.90.70.2
Мариуполь2.80.5<0.001
другие области Украины1.60.4<0.001
Гомофилия по официальному семейному положению
разведён или вдов0.31.00.7
женат0.70.70.3
холост0.40.1<0.001
Гомофилия по фактическому семейному положению
живу сам0.80.30.001
живу с партнёром-мужчиной0.60.1<0.001
живу с родителями0.20.10.2
живу с партнёршей-женщиной-0.70.60.3

Из таблицы видно, что нереспонденты намного менее склонны образовывать связи с другими нереспондентами, чем респонденты. Это, как указано выше, является следствием способа формирования выборки — поскольку мы не опрашивали нереспондентов, то у нас нет полной информации об их эгоцентрических сетях, мы не знаем, есть ли у них в знакомых другие нереспонденты из нашего массива.

Относительно места жительства отметим, что «переборчивость» в связях (когда контакты устанавливаются и поддерживаются преимущественно с людьми из того же населённого пункта) явным образом связана с географической удалённостью: так, люди из Мариуполя (южный край области) и те, кто живёт вообще в других областях, демонстрируют значительно большую склонность образовывать связи соответственно с мариупольцами и МСМ не из области, чем те, кто живёт в Донецкой агломерации. Жители Горловской агломерации, расположенной недалеко от Донецкой, вообще не проявили статистически значимой гомофилии (это значит, что среди их контактов случайным образом представлены как жители самой Горловской агломерации, так и других населённых пунктов).

Связь семейного положения и тенденций к образованию связей, в целом, подтверждает высказанные выше гипотезы. Так, контакты женатых и разведённых/вдовых не проявляют сколь-либо заметной тенденции отбора по семейному положению, тогда как среди знакомых у холостых несколько больше таких же холостых. Это можно было бы связать с возрастом, но как указано выше возраст оказался незначимым предиктором, что подтверждается гомофилией по фактическому семейному положению — живущие с  родителями МСМ (преимущественно молодёжь) не демонстрируют особой переборчивости в связях, тогда как живущие отдельно (как молодые, так и зрелые мужчины), а также проживающие с партнёром-мужчиной (также разного возраста) предпочитают общаться соответственно с отдельно живущими и «замужними».

На наш взгляд такие связи с семейным положением предположительно можно пояснить тем, что неженатые и живущие отдельно МСМ выступают обладателями двух важных ресурсов — свободы от контроля партнёрши/родителей и возможности распоряжаться местом для встреч, тогда как женатые, живущие с партнёршей-женщиной или родителями вынуждены подстраивать свои планы под временнЫе и квартирные возможности своих знакомых (особенно если речь идёт о сексе).

Таким образом, проведённый анализ продемонстрировал связь со структурой социальной сети ряда социодемографических характеристик МСМ Донецка и прилегающих городов.

Безусловно, проведённая работа имеет ряд ограничений, которые не позволили добиться идеальной сходимости сети наблюдаемой (см. рис. выше) и сети смоделированной:


• информация об узлах включала всего три параметра, что не позволило уйти в выводах далеко от тривиальности (так, не учтёнными оказались, к примеру, принадлежность к сообществу плешки, идентичностные характеристики, открытость, имущественное положение и др.);

• информация о связях не учитывала ни силу связи (напр., два человека только вчера познакомились или дружат уже давно), ни её качество (напр., связаны ли люди просто знакомством или они являются сексуальными партнёрами).

Однако, в целом, эта работа демонстрирует ряд возможностей сетевого анализа, которые в дальнейшем могут быть применены к анализу структуры скрытого от посторонних глаз сообщества.

Примечание: первая попытка проанализировать данные была сделана в публикации

Касянчук М. Г. и др. «Сеть» и сети: отчёт об исследовании «Структура социальной сети МСМ Донецка и прилегающих городов» / М. Г. Касянчук, Е. Б. Лещинский, Г. А. Журбий, Р. В. Сидорченко, Ю. Н. Миготин («Донбасс-СоцПроект», Центр «Наш мир»). — Донецк: Компьютерная типография, 2009. — 80 c.

При подготовке нынешнего текста все цифры проверены, устранены неточности.


Читать далее

25 окт. 2012 г.

Упражнения­ по экспоненци­альному моделирова­нию случайных графов на примере флирта в сериале Grey’s Anatomy

Перевод поста http://badhessian.org/lessons-on-exponential-random-graph-modeling-from-greys-anatomy-hook-ups/

Я недавно нашёл прекрасный­ пост Gary Weissman’а Grey’s Anatomy Network of Sexual Relations (перевод на русский тут) и вдохновилс­я им. Для тех, кто ничего не слышал об этом телесериал­е, сообщаю, что он чрезвычайн­о популярен,­ отмечен наградами как лучшая медицинска­я драма, транслируе­мая ABC. Идя навстречу ожиданиям зрителей, шоу регулярно показывает­, как его герои флиртуют друг с другом.

Пытаясь дать студентам-медикам ряд простейших­ концепций анализа социальных­ сетей, Weissman создал набор сетевых данных о сексуальны­х контактах героев этого сериала. Хотя я особо не интересуюс­ь ни этим шоу, а сексуальны­е или воображаем­ые сети лежат вдали от моих исследовательских интересов,­ пост Weissman’а мне кажется отличной демонстрац­ией анализа социальных­ сетей в педагогиче­ских целях.

Я бы хотел, ради развлечения, вернуться к этим данным и рассмотреть их с помощью экспоненциального моделирования случайных графов (ERGM) в аспекте образования связей. Прежде чем я продолжу, я бы хотел сказать, что самые лучшие пособия по ERGM созданы их авторами и доступны на сайте. Моим любимым пособием из-за его прикладной направленности является серия презентаций на февральской конференции Sunbelt Workshop 2011 г. Если вы всерьёз настроены изучить ERGM, то указанные публикации должны стать вашими настольными книгами. Тем не менее, я думаю, что существует та аудитория, которая с бОльшим восторгом наблюдает за приключениями сексуальных врачей на телевидении, чем читает о брачных сетях во Флоренции 16 века.

Экспоненциальные модели случайных графов являются способом понять процесс возникновения сетевой структуры, процесс образования в ней сетей. В нашем примере «образование сетей» и «снять потрахаться» являются синонимами. Эти модели работают, измеряя некий набор известных сетевых характеристик и используя распределение их значений для генерации случайных сетей. Такие случайные сети затем сравниваются с сетью наблюдаемой, чтобы оценить правдоподобие модели. Хорошие ERG-модели продуцируют сети, изоморфно похожие на наблюдаемую сеть, и пользуются небольшим набором характеристик. Плохие ERG-модели продуцируют сети, которые слабо похожи на наблюдаемую сеть, но при этом используется много ненужных характеристик.

Какими характеристикам следует пользоваться? Число рёбер (т. е. «связей», «отношений») является одной из самых важных. Если мы занимаемся образованием связи, то очень важно знать число этих связей. Кроме того, в посте Weissman’а некоторые комментаторы упоминали важность пола персонажей или, к примеру, их должность в больнице. Узлы (т. е., «акторы», «вершины») могут иногда характеризоваться атрибутами, такими как пол, возраст, должность или астрологический знак. При моделировании сети можно использовать атрибуты узлов, чтобы оценить такие ассортативные эффекты как общая гомофилия («Спят ли члены больничных коллективов с сотрудниками, занимающими такие же должности?»), дифференциальная гомофилия («Спят ли штатные врачи с другими такими же? Делают ли они это чаще, чем интерны с другими интернами?») и ассортативное смешивание («Do resident-attending couples occur more frequently than we’d expect vis-à-vis nurse-attending couples?»). Можно анализировать и другие свойства сетей, но это зависит от доступности данных, типа анализируемой сети (направленная, ненаправленная, бимодальная), а также от сходимости модели.

Использованные здесь данные восходят к тем, которые Weissman сделал доступными. Я добавил узлы и рёбра по информации, найденной при просмотре Wikipedia. Я включал лишь те персонажи, которые переспали с одним или несколькими другими персонажами в сериале. Я также добавил такие атрибуты, как пол персонажа, расу, должность в больнице, приблизительный возраст, номер сезона, в котором он появился, и астрологический знак, под которым родился актёр. Я собрал эти атрибуты из Wikipedia и IMDB. Для простоты я кодировал расу каждого персонажа как чёрный (black), белый (white) или другой (other). Хотя я не люблю рассматривать расу именно в этих терминах, однако число персонажей и их разнообразие невелико, чтобы вдаваться в нюансы этого вопроса. Что касается приблизительного возраста персонажей, то я пользовался возрастом актёров, их играющих, а в двух случаях мне пришлось самому сделать предположения. Как у Weissman’а, нынешние данные, вероятно, не содержат какой-то информации об отношениях, узлах, упрощают описание персонажей и их взаимоотношений.

Для начала откройте R-терминал. Установите и загрузите пакеты ergm и RCurl, если вы не сделали этого раньше.

install.packages("RCurl"); install.packages("ergm")

library(RCurl); library(ergm)


Пакет RCurl будет использован для того, чтобы загрузить данные из моего файла на Google Docs. Пакет ergm включает несколько других пакетов, таких как network, поскольку ERGM использует объекты, созданные последним.

Далее, прочтите данные и создайте объект класса network.

#First, read in the sociomatrix

ga.mat<-getURL("https://docs.google.com/spreadsheet/pub?key=0Ai--oOZQWBHSdDE3Ynp2cThMamg1b0VhbEs0al9zV0E&single=true&gid=0&output=txt",ssl.verifypeer = FALSE)


ga.mat<-as.matrix(read.table(textConnection(ga.mat), sep="\t",header=T, row.names=1, quote="\""))

#Second, read in the network attributes

ga.atts<-getURL("https://docs.google.com/spreadsheet/pub?key=0Ai--oOZQWBHSdDE3Ynp2cThMamg1b0VhbEs0al9zV0E&single=true&gid=1&output=txt",ssl.verifypeer=FALSE)


ga.atts<-read.table(textConnection(ga.atts), sep="\t", header=T, quote="\"",stringsAsFactors=F, strip.white=T, as.is=T)

#Third, create a network object using the sociomatrix and its corresponding attributes

ga.net<-network(ga.mat,vertex.attr=ga.atts,vertex.attrnames=colnames(ga.atts),directed=F,hyper=F,loops=F,multiple=F,bipartite=F)


Теперь, когда вы получили данные, мы можем поиграть с ними. Прежде чем перейти к моделированию, давайте посмотрим на схему сети, отметив розовым цветом узлы, означающие женщин, и голубым — мужчин.

plot(ga.net,vertex.col=c("blue","pink")[1+(get.vertex.attribute(ga.net,"sex")=="F")],label=get.vertex.attribute(ga.net,"name"), label.cex=.75)

Расположение узлов на вашем рисунке может несколько отличаться. Здесь то, что получилось у меня:



Следует отметить несколько интересных особенностей этой сети.

Во-1, с точки зрения связности у нас есть большой связный компонент,но в целом граф поделён на четыре отдельных компонента. Если бы шоу продолжалось без появления новых персонажей, я бы думал, что один из самых маленьких компонентов должен бы «соединиться» с самым большим компонентом.

Во-2, большая часть сексуальных отношений в сериале суть гетеросексуальны. Только два ребра (torres-arizona и torres-hahn) были однополыми. По всей видимости, здесь нет нечётно-численных циклов: в сексуальных сетях циклы из трёх, пяти, семи и др. элементов содержат как минимум одну однополую связь внутри цикла.

В-3, в отражение способа построения выборки сеть не содержит сексуально-одиноких изолятов. Минимальная степень (число связей, падающих на узел) равна единице. В-четвёртых, сеть оказывается уязвимой перед табу «бывший бывшей бывшего». В одном из исследований сексуальных сетей учёные обнаружили запрет на создание пары с бывшим партнёром бывшего партнёра бывшего партнёра из-за возможных осложнений. Кажется, что здесь есть как минимум три цикла, отвечающих критериям этого табу. Вместе с тем, также хорошо известно, что нежелательные последствия, возникающие от сексуальных отношений с другими, делают шоу правдоподобным.

Давайте начнём наш формальный анализ с базовой модели, которая включает только число рёбер и, как второй предиктор, nodematch("sex"), который схватывает гетеросексуальную тенденцию сети.

ga.base<-ergm(ga.net~edges+nodematch("sex")) #Estimate the model summary(ga.base) #Summarize the model

Вот выдача команды summary(ga.base):

==========­==========­======
Summary of model fit
==========­==========­======

Formula: ga.net ~ edges + nodematch(“sex”)

Iterations: 20

Monte Carlo MLE Results:

Estimate Std. Error MCMC % p-value

edges -2.3003 0.1581 NA <1e -04="-04" -3.1399="-3.1399" 0.001="0.001" 0.01="0.01" 0.05="0.05" 0.1="0.1" 0.7260="0.7260" 0="0" 1311.43="1311.43" 1="1" 2="2" 320.47="320.47" 324.47="324.47" 334.17="334.17" 944="944" 946="946" 990.97="990.97" aic:="aic:" bic:="bic:" code="code" codes:="codes:" degrees="degrees" deviance:="deviance:" e-04="e-04" freedom="freedom" na="na" nodematch.sex="nodematch.sex" null="null" of="of" on="on" residual="residual" signif.="signif."


В согласии с ожиданиями число рёбер и гетеросексуальность суть значимые предикторы образования связей, поскольку p-значение существенно меньше, чем условный уровень значимости 0.05. Колонка «MCMC%» слева указана как пропущенная (NA), поскольку эта модель не требует оценки марковских цепей по методу Монте-Карло. Коэффициенты, −2.30 и −3.14, показывают условные логарифмы шансов (log-odds), таким образом логарифмы шансов того, что два персонажа вступили в сексуальные отношения, равны (-2.30)*увеличение числа связей на единицу + (-3.14)*увеличение числа однополых отношений. Логарифм шансов того, что одна гетеросексуальная связь образуется внутри сети, равен −2.30, что даёт её вероятность exp(-2.30)/(1+exp(-2.30)) = 0.09. Аналогично, логарифм шанса образования гомосексуальной связиравен −2.30-3.14 = 5.44, что соответствует вероятности 0.004 = exp(-5.44)/(1+exp(-5.44)).

Давайте посмотрим, какую случайную, расчётную сеть эта модель могла бы создать.

plot(simulate(ga.base),vertex.col=c("blue","pink")[1+(get.vertex.attribute(ga.net,"sex")=="F")])

Ваша картинка может несколько отличаться от того, что получилось у меня:


Эта сеть точно отражает как число рёбер, так и склонность к образованию гетеросексуальных связей, однако здесь не всё в порядке: некоторые из наших узлов суть изоляты. Иными словами, расчёт предсказывает существование в сети сексуально-воздерживающихся индивидов. Поскольку никаких таких людей в нашей реальной сети нет из-за особенностей формирования выборки, построенная модель неудовлетворительна.

Хотя у нас есть значения критерия согласия (goodness of fit), данного функцией правдоподобия, один обычный, систематический способ определения критерия согласия — это сравнение параметров немоделированной, наблюдаемой сети с такими же параметрами рассчитанных ERGM сетей.

ga.base.gof<-gof(ga.base)

summary(ga.base.gof) #Summarize the goodness of fit

par(mfrow=c(3,1)); plot(ga.base.gof) #Plot three windows. It's OK to ignore the warning.


Рисунок воспризводит ту же информацию, которую выдаёт команда summary(). p-Значения в правых колонках суть вероятности того, что рассчитанные сети точно совпадают с сетью наблюдаемой в ряду данных параметров. Мы видим, что в терминах of the edgewise shared partner and minimum geodesic distance measurements represent the data quite well. Однако, если мы посмотрим на такой параметр как центральность, то увидим то, что согласуется с нашими выводами из рисунков — число воздерживающихся изолятов (узлов с центральностью 0) больше, чем нужно, число узлов с центральностью 1 (моногамистов) — меньше, и что нет оценок для узлов с центральностью 3 и 9.

Мы сейчас добавим в модель параметр, контролирующий эффект моногамии (центральность 1).

ga.base.d1<-ergm(ga.net~edges+nodematch("sex")+degree(1)) summary(ga.base.d1) plot(simulate(ga.base.d1),vertex.col=c("blue","pink")[1+(get.vertex.attribute(ga.net,"sex")=="F")]) ga.base.d1.gof<-gof(ga.base.d1); summary(ga.base.d1.gof) par(mfrow=c(3,1)); plot(ga.base.d1.gof)

Если принять значение BIC предыдущей модели 334.17 как исходное, то мы увидим, что модель ga.base.d1 лучше — её BIC равен 316.56. Эффект моногамии также является статистически значимым. Рисунок демонстрирует меньше изолятов, что подтверждает команда gof(). Судя по значениям критерия согласия, модель кажется разумным приближением к реальности, если не принимать во внимание персонаж шоу с девятью сексуальными партнёрами.

В отличие от предыдущей модели, эта использует методику оценки марковских цепей (MCMC). Мы можем оценить результаты MCMC.

mcmc.diagnostics(ga.base.d1)

В выводе следует сначала глянуть на второй пункт, в котором сравниваются параметры расчётной и наблюдаемой моделей.

Are sample statistics significantly different from observed?

edges nodematch.sex degree1 Overall (Chi^2)

diff. -0.0968000 0.0232000 0.0534000 NA
test stat. -0.2942081 0.8328180 0.3379779 1.086016
P-val. 0.7685989 0.4049474 0.7353798 0.780451


Вроде бы всё в порядке: рассчитанные при помощи MCMC графы значимо не отличаются от наблюдаемого. Давайте посмотрим по-другому:

Sample statistics auto-correlation:
Chain 1

edges nodematch.sex degree1

Lag 0 1.0000000 1.00000000 1.0000000
Lag 100 0.8476292 0.47956824 0.7334256
Lag 200 0.7332856 0.26641687 0.6116231
Lag 300 0.6371281 0.17109432 0.5198955
Lag 400 0.5587029 0.12489565 0.4480439
Lag 500 0.4883954 0.08496445 0.3860807

Sample statistics burn-in diagnostic (Geweke):
Chain 1

Fraction in 1st window = 0.1
Fraction in 2nd window = 0.5

edges nodematch.sex degree1

-1.590 -1.068 1.372

P-values (lower = worse):

edges nodematch.sex degree1

0.1117691 0.2856841 0.1701817


В целом, нет ничего подозрительного в результатах диагностики MCMC. Параметр автокорелляции между лагами несколько больше, чем предпочитаемый мною (лаги должны быть ближе к нулю и дальше от единицы, за исключением нулевого лага). Кроме того, статистика Geweke, приблизительно соответствующая z-статистике, когда её p-значения незначимы, должна быть значительно ближе к нулю. К счастью, мы можем так изменить некоторые параметры по умолчанию в MCMC для того, чтобы получить более приемлемый результат.

ga.base.d1<-ergm(ga.net~edges+nodematch("sex")+degree(1),control=control.ergm(MCMC.burnin=50000, MCMC.interval=5000))

При увеличении MCMC.burnin с 10,000 (по умолчанию) до 50,000 должен уменьшаться параметр Geweke. При увеличении MCMC.interval со 100 (по умолчанию) до 5000 должна уменьшаться автокорреляция между лагами. Если бы параметры нашего расчётного образца действительно значимо отличались от наблюдаемых, мы бы увеличили размер выборки в MCMC с 10,000 (по умолчанию) до 20,000 или даже 50,000.

ga.base.d1<-ergm(ga.net~edges+nodematch("sex")+degree(1),control=control.ergm(MCMC.burnin=50000,MCMC.interval=5000, MCMC.samplesize=50000))

Нам следовало бы поупражняться в увеличении этих параметров MCMC, но это может резко увеличить время расчётов.

summary(ga.base.d1) #The figures are mostly the same

mcmc.diagnostics(ga.base.d1)

Ура! MCMC диагностика заметно улучшилась, что указывает на большую жёсткость нашей последней модели.

Теперь, когда мы понимаем чуть больше, как оценивать качество модели, мы можем вернуться к интригующему вопросу секса! Только что мы моделировали сеть по числу рёбер, склонности к гетеросексуальности и по моногамии, но могут ли другие аспекты привнести смысл в анализ? Я бы предложил начать с возраста, поскольку большинство любовных связей возникают между сверстниками.

ga.base.d1.age<-ergm(ga.net~edges+nodematch("sex")+degree(1)+absdiff("birthyear"),control=control.ergm(MCMC.burnin=50000, MCMC.interval=5000))

summary(ga.base.d1.age)

mcmc.diagnostics(ga.base.d1.age)

summary(gof(ga.base.d1.age))

Кажется, модель ощутимо улучшилась! Значение BIC снизилось с 316.56 до 297.51, MCMC-диагностика выглядит хорошо, значение критерия согласия выглядит, в целом, разумным, а разница в возрасте значима и отрицательна, что указывает на то, что чем больше разница в возрасе акторов, тем меньше шансы у них флиртовать друг с другом.

Наконец, давайте рассмотрим ассортативность с точки зрения группировки по расам. Предыдущие исследования юношеских сексуальных и любовных сетей открыли такую ассортативность. Создательница сериала, Shonda Rhimes, сознательно построила отбор актёров так, чтобы представить расовое разнообразие. Поскольку шоу включает ряд афроамериканских (наряду с обилием других не-белых) персонажей, можно попытаться установить, привело ли такое разнообразие при отборе персонажей к расовому разнообразию в сексуальных отношениях. Для начала, давайте попробуем построить модель общей гомофилии по расе.

ga.base.d1.age.race<-ergm(ga.net~edges+nodematch("sex")+degree(1)+absdiff("birthyear")+nodematch("race"),control=control.ergm(MCMC.burnin=50000,MCMC.interval=5000))

summary(ga.base.d1.age.race)

mcmc.diagnostics(ga.base.d1.age.race)

summary(gof(ga.base.d1.age.race))

Мы в самом деле нашли эффект расового отбора, предполагающий, что образование связи более вероятно между персонажами одной и той же расы. В этом шоу сексуальные отношения являются скорее внутри-, нежели межрасовыми по сравнению с тем, что было бы, если бы персонажи разных рас комбинировались совершенно случайно. MCMC-диагностика выглядит хорошо, а измерения критерия согласия в пределах разумного. Хотя полученная модель выглядит хорошо по многим индикаторам, но заметно небольшое увеличение BIC (298.21) по сравнению с предыдущей моделью (297.51). Если бы нам были интересны только параметры сети, то предыдущая модель даёт лучшие значения.

Но возможно, что белые персонажи проявляют большую гомофилию, а чёрные — меньшую? Или наоборот? Мы можем посмотреть на это как на дифференциальную гомофилию. В модель добавляем параметр diff=T к слагаемому nodematch("races").

ga.base.d1.age.racediff<-ergm(ga.net ~ edges + nodematch("sex") + degree(1) +absdiff("birthyear") + nodematch("race", diff=T), control=control.ergm(MCMC.burnin=50000,MCMC.interval=5000))

summary(ga.base.d1.age.racediff)

Хотя мы можем моделировать дифференциальную гомофилию, ergm() не смог интерпретировать категорию «other», поскольку в наблюдаемой сети нет сексуальных отношений между латиноамериканцами и азиатоамериканцами. ergm() указывает на эту сложность следующей фразой:

Observed statistic(s) nodematch.race.Other are at their smallest attainable values. Their coefficients will be fixed at -Inf.

Аналогично, the AIC, BIC, отклонение и эффекты nodematch.race.Other помечены как NA в summary. Давайте попробуем создать новую модель, исключив гомофилию между латиноамериканцами и азиатоамериканцами. Чтобы это сделать, мы включаем параметр keep=c(1,3) в слагаемое nodematch("race"), поскольку «Black» и «White» были первой и третьей категориями, перечисленными в summary(ga.base.d1.age.racediff).

ga.base.d1.age.racediff<-ergm(ga.net~edges+nodematch("sex")+degree(1)+absdiff("birthyear")+nodematch("race", diff=T, keep=c(1,3)),control=control.ergm(MCMC.burnin=50000, MCMC.interval=5000))

summary(ga.base.d1.age.racediff)

mcmc.diagnostics(ga.base.d1.age.racediff)

summary(gof(ga.base.d1.age.racediff))

Как и в предыдущей модели, мы видим значимую ассортативность по расовым группам в сериале. Как чёрные, так и белые персонажи проявляют склонность к расовой гомофилии бОльшую, чем можно было бы ждать, если бы выбор партнёра был случайным. Эта модель также указывает, что эффекты гомофилии сильнее среди афроамериканских персонажей (на это указывает более высокий коэффициент и меньшее p-значение при nodematch.race.Black по сравнению с nodematch.race.White term). Проверка MCMC-диагностики и статистик критерия согласия говорит, что полученная модель является хорошим отражением оригинальной сети. Вместе с тем, BIC ещё больше сдвигается к 300.73, указывая что модель менее экономна по сравнению с моделью общей гомофилии и модели с возрастом.

Давайте посмотрим на картинку.

plot(simulate(ga.base.d1.age.racediff),vertex.col=c("blue","pink")[1+(get.vertex.attribute(ga.net,"sex")=="F")])


Ваша может выглядеть несколько иначе, но в целом, кажется, эта модель воспроизводит оригинальные данные достаточно хорошо. Результат расчётов отличается наличием большого компонента, небольшим количеством изолятов (их даже может не быть), несколькими небольшими компонентами и, хотя отношения на ней преимущественно гетеросексуальны, мы видим четыре однополых связи (в оригинальных данных их было две).

Хотя число съёмов в сериале Grey’s Anatomy может казаться удивительным, в аспекте образования диад видно скорее традиционное восприятие сексуальных отношений: доминируют нормы моногамии, а бОльшая часть связей суть гетеросексуальны и соединяют пары близкого возраста и одной расы. Следует, однако отметить, что описанный анализ обошёл ряд альтернативных версий, которые могли бы лучше отразить свойства сети. Я приглашаю читателей самостоятельно поиграть с данными и с другими моделями. Несколько дополнительных примеров:

#Perhaps men and women have different tendencies to form sexual partnerships?

ga.base.d1.age.sex<-ergm(ga.net~edges+nodematch("sex")+degree(1) +absdiff("birthyear")+nodefactor("sex"), control=control.ergm(MCMC.burnin=100000, MCMC.interval=5000)) #Maybe less "traditional" than previously concluded?


#Perhaps you're interested in the assortative mixture among roles in the hospital?
#Resident-resident sexual contacts (28) are the reference group,
#and unobserved pairings between positions (3-5, 9, 12-15, 17-21, 24, 27) are omitted.

ga.base.d1.age.rolemix<-ergm(ga.net~edges+nodematch("sex")+degree(1)+absdiff("birthyear") +nodemix("position", base=c(3:5, 9, 12:15, 17:21, 24, 27, 28)), control=control.ergm(MCMC.burnin=50000, MCMC.interval=5000))


list.vertex.attributes(ga.net) #List the different vertex attributes in the network object

get.vertex.attribute(ga.net, "sign") #Provides each actor's astrological sign.

?ergm.terms #This command will provide a list of other terms that ergm() can model

?control.ergm #This command will present different options on the estimation methods.



Читать далее

Видеоролик к выборам


Читать далее

16 окт. 2012 г.

Права меншин або танці на кістках замість діалоґу

Весь досвід українських нецивілізованих, диких виборів свідчить про те, що учасники перегонів за хліб з варенням не ґребують нічим. Можна позиціонувати себе своїми досягненнями, але набагато легше помиїти конкурентів. Шкода, але при цьому отой хліб з варенням — майбутні депутатські вигоди — повністю заступають якісь елементарні людські цінності. Про права людини, зокрема право на гідність, годі й згадувати.

Два свіжих приклади з близької області.

Перший: прийняття законопроекту 8711 Радою — жодна партія і жодна політична сила не голосували проти. Але як здійнявся суспільний галас, представниця опозиційної партії УДАР вголос засудила голосування. Але ж де ти, розумнице, була під час самого голосування? Політичний цинізм? — Авжеж, так!

Другий: Донецьк, на Форум розмаїття в Прес-клубі запрошено представників партій і пересічних ЛҐБТ-виборців. Виборці з’явились, журналісти з’явились, партії натомість прийти злякались (бо ж, звісно, треба буде відповідати на вельми незручні питання) і не прийшли. Один-єдиний голова передвиборчого штабу одіозно-фашистської Свободи прийшов, але інкогніто — теж боягуз. А от після заходу на сайті УДАРу з’являється дуже скандальний матеріал і менш ніж за добу щезає, де пишеться якась дурня «голосуйте за нас и мы легализируем гомосексуализм». Може сам УДАР і непричетний до цього, адже цей матеріал швиденько зацитували його конкуренти, але де ж офіційна заява керівництва?

Гра з правами тої ґрупи, яка потребує захисту, гра з людською гідністю в такий спосіб нічого крім огиди до ВСІХ учасників передвиборчого процесу не залишає.

Що більше це спостерігаю, то міцнішим стає моє переконання: навіть факт приходу на виборчу дільницю бруднить нормальну людину. Не ходив і не піду на ваші вибори — плескайтесь в лайні самі.

Читать далее

Форум разнообразия: избиратели особенные — проблемы общие: Пост-релиз, 15 октября 2012 г.

Ни одна партия не прислала, несмотря на неоднократные приглашения, своих представителей на встречу с избирателями.

12 октября 2012 г. в Донецком пресс-клубе состоялся анонсированный заранее Форум разнообразия, на котором ЛГБТ1-сообщество Донецкой области, общественные организации области (в т. ч. право-консервативного толка) и журналисты обсудили актуальные для социальных меньшинств вопросы.

На форуме были представлены результаты первого в Украине исследования электоральных предпочтений ЛГБТ-сообщества, оценена численность ЛГБТ-избирателей в Донецкой области (25000 чел.), состоялась дискуссия о пресловутом законопроекте № 8711 и прошла выставка картин художника СЕВЕРИНА. Но самое главное — обычные, «рядовые» ЛГБТ высказали своё мнение, пожелания к партиям.

«Порядок на улице, проблемы малого бизнеса, образование, здравоохранение, ЖКХ — вот что волнует ЛГБТ-сообщество, впрочем, как и большинство избирателей Украины, — говорит руководитель исследования Надежда ВЕЛИЧКО, — реальная жизнь и реальные заботы. Почему же политики хотят, чтобы геи и лесбиянки стали людьми вне закона? Чем любовь мешает государству? Всех волнует законопроект 8711. Ведь с его принятием и без того непростая жизнь в нашем обществе, где зашкаливает уровень ксенофобии и которое скатывается к фашизму, станет ещё сложнее».

«Мы с возмущением констатируем, — говорит М. КАСЯНЧУК, руководитель ЛГБТ-центра „Донбас-СоцПроект“, — что все политические силы, претендующие на место в парламенте, трусливо игнорируют требования огромного количества своих избирателей, боятся посмотреть в глаза тем людям, которые содержат их своими налогами».

Результатом форума станет обращение к политическим партиям с требованием неотступно следовать букве Конституции Украины, гарантирующей всем гражданам равные права, не допускать сужения предусмотренного ей перечня гражданских свобод в угоду сиюминутным политическим амбициям, принимать во внимание не только «интересы большинства», но и потребности миноритизированных социальных групп, бороться с разжиганием вражды и ненависти.

Напоминаем, что «Особенные избиратели: голоса меньшинств в парламентской избирательной кампании 2012» — проект Молодёжного инновационного центра «Медиа-М» при финансовой поддержке Европейского Союза. Цель проекта — представить общественности голоса уязвимых социальных групп и меньшинств во время предвыборной кампании, привлечь внимание общества и политиков к проблемам и интересам этих групп, сделать их видимыми в местных общинах.

В течение сентября—октября 2012 года в рамках проекта идут Форумы разнообразия и кампании социальной рекламы в шести городах (Черкассы, Белогорск, Ужгород, Донецк, Бердичев и Луганск). Главные участники форумов — люди с инвалидностью, ромы, геи и лесбиянки, социальные сироты, представители исламских и христианских радикальных общин. Весной 2013-го в этих же городах пройдёт второй цикл форумов — будут обсуждаться изменения в положении меньшинств и уязвимых групп, а также то, насколько их пожелания были учтены депутатами новоизбранной Верховной Рады.

Партнёром МИЦ «Медиа-М» в Донецкой области является общественная организация «Межрегиональный центр ЛГБТ-исследований Донбас-СоцПроект».

Пресс-служба ЛГБТ-центра «Донбас-СоцПроект»

Реакция в СМИ:

http://progorod.info/story/70880#.UH6Q-lb1dqw

Читать далее

14 окт. 2012 г.

Форум в Донецке: то, что осталось за кадром

Утро 12 октября 2012 года началось с тревожного звонка из пресс-клуба: «Начало Форума у Вас в 12.00? Так знайте, что с 10.00 до 12.00 в этом зале будут заседать члены Компартии. Мы видим, как заходят туда молодые крепкие парни». Этот факт, конечно, мог ничего не означать. Ну, арендовали КПУ свободное время для своего собрания, ну, и что? Но странный факт, еще за 2 дня до нашего форума, я спрашивала, можно ли до форума подготовить зал? Хотя бы за полчаса до 12 часов. Дирекция —"да, без проблем, хоть за час«. Разобраться и расставить акценты решила на месте. Директор, пожилая мадам, встретила меня достаточно враждебно. «Так это вы — геи и лесбиянки? Почему вы об этом не сказали? Я бы отказала вам в аренде сразу». «Позвольте? В счёте четко было написано «...центр ЛГБТ — исследований... ЛГБТ — это лесбиянки, геи, бисексуалы, трансгендеры». Атмосфера накалялась, и я внятно объяснила, что у нас на форуме будут представители СМИ, гости из Киева, Европарламента, иностранцы. Любая провокация со стороны КПУ или других «нетерпимых слоев населения» будет зафиксирована. Поэтому пока не поздно, разрулите ситуацию. Со своей стороны я предупредила милицию. «Зачем милиция? Нам еще милиции не хватало!, — кипишевала директор. «Для охраны правопорядка», — ответила я.

Мы не смогли подготовить помещение так, как хотели, времени не хватило. Открывали зал уже когда в коридоре столпилось большое количество нетерпеливых журналистов.

Ребята (геи) всегда настороженно принимают журналистов. Фотография с определенными комментариями могут не просто «подпортить имидж», но и стоить жизни. В нашем гомофобном обществе, ребята с нетрадиционной ориентацией легко могут стать жертвой агрессивно настроенных особей (по-другому их назвать трудно), которые просто не знают куда деть свою ярость. А тут как раз законом 8711 показали направление. Вот они! Туда! Геи во всех твоих бедах виноваты! Перефразируя известную фразу «Бей жидов — спасай Россию», этим законом говорят: «Бей геев — спасай Украину»! Они виноваты в кризисе власти, экономики, морали, наконец! Бред. Но ... это наша жизнь. Журналисты были недовольны ограничениями в съемках. «Это медийное мероприятие!!» «Но есть еще закон о конфиденциальной информации». Со мной не стали спорить, а я все мероприятие контролировала, куда направлены нескромные объективы.

Не все пришедшие на форум геи зашли в конференц-зал. Человек 10 гуляли по коридору, пили кофе, рассматривали картины, выставленные здесь же. Они очень боялись телевизионщиков. Такой «камин-аут» не входил в их жизненные планы («камин-аут» — означает открыто заявить о своїй ориентации). Некоторые приехали из дальних городов Донецкой области, но так и ушли, не замеченные.

Это очень трудно быть не таким как все. Хотелось бы, чтобы те, кто устраивают травлю, любители «поохотиться за ведьмами», когда-нибудь сами ощутили это состояние. Как это — быть без вины виноватым?

Этого хотелось бы не из мести, а для понимания.

Надежда ВЕЛИЧКО, Центр ЛГБТ-исследований «Донбасс-СоцПроект»

Читать далее

13 окт. 2012 г.

Форум разнообразия

12 октября 2012 г. в Донецком пресс-клубе состоялся «Форум разнообразия». ЛГБТ-сообщество Донецкой области, общественные организации Украины (в т. ч. право-консервативного толка), глава предвыборного штаба ВО «Свобода» и журналисты обсудили актуальные для социальных меньшинств, в целом, и ЛГБТ, в частности, вопросы.



На форуме были представлены результаты первого в Украине исследования электоральных предпочтений ЛГБТ-сообщества, оценена численность ЛГБТ-избирателей в Донецкой области (а эта цифра, 25000 чел. очень близка к численности населения г. Дебальцево), состоялась дискуссия о пресловутом законопроекте 8711 и, наконец, прошла выставка картин художника СЕВЕРИНА. Но самое главное — обычные, «рядовые» ЛГБТ высказали своё мнение, высказали пожелания к партиям.



К сожалению, кроме Свободы ни одна политсила не откликнулась на неоднократные приглашения...




Отзывы прессы:

http://www.62.ua/article/202659
http://novosti.dn.ua/details/188288/
http://donetsk.comments.ua/news/2012/10/12/171248.html
http://www.svoboda.org.ua/diyalnist/novyny/033524/
http://062.ua/news/v-donecke/16547-gomoseksualisty-kak-osobaya-gruppa-izbirateley-kak-k-etomu-otnosit-sya
http://dennislapin.livejournal.com/162712.html
http://mungaz.net/main/3656-doneckie-gei-i-lesbiyanki-hotyat-zapustit-socialnuyu-reklamu-fotoreportazh.html
http://c-pod.molode.com.ua/2012/10/14/lhbt-spilnota-donechchyny-naperedodni-vyboriv/
http://capricios.livejournal.com/1296138.html
http://www.bbc.co.uk/ukrainian/ukraine_in_russian/2012/10/121017_ru_s_gay_forum_donetsk.shtml
http://panorama.dn.ua/news/politics/9255-2012-10-12-13-41-41
http://panorama.dn.ua/news/politics/9254-2012-10-12-13-27-00
http://telegraf.dn.ua/analytics/raduzhne-skachki-verhovnoj-rad-nakanune-vborov/
http://realityinua.com/category/news/news_4996.html
http://mk-donbass.com.ua/index.php?id=8058&show=news&newsid=50978
http://union.ua/ru/politics/15_10_2012_predstaviteli_netraditsionnykh_seks_menshinstv_obsudili_vybory.html
http://www.lkyiv.com/modules/weblog/details.php?blog_id=4379


Читать далее

ВО «Свобода» вивчає життя ЛГБТ-спільноти


Голова виборчого штабу ВО «Свобода» в Донецьку, номер 34 списку партії, Юрій НОЄВИЙ відвідав «Форум Різноманіття» ЛГБТ-Центра «Донбас-СоцПроект».

Під час дискусій кандидат від Свободи повідомив, що регулярно відвідує геївське кафе «Їжаки» в Симеїзі. «ЛГБТ-Центр „Донбас-СоцПроект“, — каже його голова М. КАСЯНЧУК,  — вітає цікавість ВО „Свобода“ до повсякденного життя ЛГБТ-спільноти. Саме це, як відомо із соціології, сприяє руйнації фальшивих стереотипів і встановленню тісних, глибинних зв’язків між людьми».

Нагадаємо, раніше посаду голови ВО «Свобода» в Донецькій області займав Артур ШЕВЦОВ. Однак він був звільнений з неї через «недалекоглядність політичних прогнозів».
Читать далее

1 окт. 2012 г.

Быстро построить линейную модель

Быстро построить картинку линейной зависимости двух непрерывных переменных можно так:

plot(Y~X)
abline(lm(Y~X))


Ну а параметры этой модели выводятся на экран как обычно: summary(lm(Y~X))
Читать далее