Social Network Analysis: он-лайн курс по анализу социальных сетей от Coursera

Coursera SNA На Coursera стартовал второй сезон курса по анализу социальных сетей. Насколько я знаю, на данный момент это единственный он-лайн курс по сетевому анализу, поэтому всем, кто интересуется данной темой, имеет смысл обратить на него внимание. Я прошёл его в прошлый раз и поделюсь тут своими впечатлениями.

Несмотря на то, что курс озаглавлен как Social Network Analysis, социологической составляющей в нём не так много, как хотелось бы. Читает его Lada Adamic, обессмертившая себя визуализацией американской политической блогосферы накануне выборов 2004 года. Лада относится к молодому поколению исследователей социальных сетей, которое, как правило, представлено выходцами из математики, физики и Computer Science и в силу своего образования тяготеющего к математическим, вычислительным и алгоритмическим аспектам сетевого анализа. А с появлением “библии” данного направления — книги Марка Ньюмена “Networks: Introduction” — и журнала “Network Science”, данная область стала отличаться от анализа социальных сетей также и институционально.

Lada Adamic usa political blog network
Если бы Лада получала royalty за каждое использование данной визуализации, она бы уже давно могла бросить работу и жить на отчисления. Впрочем, судя по тому, что она не использовала её в качестве логотипа своего курса, возможно эти права принадлежат кому-то другому.

Собственно поэтому, несмотря на то, что в курсе покрыты стандартные для SNA темы центральностей, выявления сообществ, визуализаций и т.д., всё-таки заметен уклон в сторону математических моделей (Erdos-Renyi, Scale-Free, preferential attachment), симуляций (в одном из домашних заданий нужно было написать фрагмет кода на SCALA для NetLogo), анализа и визуализации сетей, узлами которых не являются люди (например, та же сеть рецептов) и всего того, что логичнее относить к области Network Science.

В общем и целом, курс оставил впечатление довольно сырого (система не смогла распознать одну из моих домашек и её мне не засчитали) и не очень хорошо структурированного (в отличие от Networked Life, о котором я недавно писал).

К плюсам можно отнести видео-интервью с людьми, которые занимаются анализом социальных сетей в таких компаниях как Facebook (Cameron Marlow), LinkedIn (Sébastien Heymann, по совместительству создатель Gephi).

Впрочем, от обзорного курса сложно требовать что-то большее. Тем более, когда он является единственным в своём роде.

Мастер-класс по анализу социальных сетей в СЛОНе

В начале апреля побывал с мастер-классом в Научно Учебной Лаборатории Социологии Образования и Науки Санкт-Петербургского филиала НИУ ВШЭ или, как его чаще называют, СЛОНе. Программа была заявлена следующая: введение в статистическое моделлирование социальных сетей на на примере ERGM (p*) моделей и воркшоп в ORA. Считаю, что с обоими пунктами справился. Только не за 2,5 часа, как предполагалось, а за 4.

Само мероприятие было приурочено к приезду Кристиана Штеглиха и Марайтье Ван Дуийн из университета Гренинген (Голландия), которые являются учениками самого Тома Снайдерса. Они провели два дня занятий по статистическому моделлированию сетей и модели p2 в частности. Т.е. я фактически выступал у них "на разогреве". О моём выступлении можно почитать тут, а о мероприятиях с участием голландских коллег — тут.

В целом, заметка о моём выступлении написана очень толково (чуть ли не лучше самого выступления). Однако, там есть пара неточностей. Одна из них фактическая: я уже не являюсь аспирантом НИУ ВШЭ, а всего лишь скромный преподаватель там же. Вторая — содержательная, но тут полностью моя вина, т.к. не смог хорошо донести данный пункт. Под “забавным исследованием социальных связей между шимпанзе и макаками” подразумевалась фундаментальная работа K. Faust и J. Skvoretz “Сomparing networks across space and time, size and species” в которой авторы предложили методологию сравнения между собой сетей, отличающихся не только размером и типом социальных отношений, но и биологическими видами акторов. Так, среди акторов 42 социальных сетей, проанализированных авторами, были не только люди, но также и приматы, млекопитающие и птицы. “Забавность” же данному исследованию придал тот факт, что сеть ко-спонсорства (co-sponsorship) в 93м Сенате США очень похожа на то, как структурированы отношения взаимного вылизывания у коров c точки зрения социальных сетей. Подробнее с методологией и результатами данного исследования можно ознакомиться тут (pdf).

Несмотря на то, что я пообещал выслать организаторам слайды своего выступления, я до сих пор не привёл их в хоть сколько-нибудь информативный вид, т.е. читабельными без присутствия и суфлёрства автора. Надеюсь, что рано или поздно это сделаю и выложу тут.

25 Hottest Articles in Social Sciences

В рейтинге самых популярных статей в социальных науках (по состоянию на декабрь 2010 года) Facebook упоминается в 6 (причём две из них занимают первую и третью строчку), а ещё 7 так или иначе связаны с он-лайн социальными сетями. Вот эти статьи.

College students’social networking experiences on Facebook • Article
Journal of Applied Developmental Psychology, Volume 30, Issue 3, 1 May 2009, Pages 227-238
Pempek, T.A.; Yermolayeva, Y.A.; Calvert, S.L.

Facebook(R) and academic performance • Article
Computers in Human Behavior, Volume 26, Issue 6, 1 November 2010, Pages 1237-1245
Kirschner, P.A.; Karpinski, A.C.

Social network use and personality • Article
Computers in Human Behavior, Volume 26, Issue 6, 1 November 2010, Pages 1289-1295
Amichai-Hamburger, Y.; Vinitzky, G.

All about me: Disclosure in online social networking profiles: The case of FACEBOOK • Article
Computers in Human Behavior, Volume 26, Issue 3, 1 May 2010, Pages 406-418
Nosko, A.; Wood, E.; Molema, S.

Personality and motivations associated with Facebook use • Article
Computers in Human Behavior, Volume 25, Issue 2, 1 March 2009, Pages 578-586
Ross, C.; Orr, E.S.; Sisic, M.; Arseneault, J.M.; Simmering, M.G.; Orr, R.R.

Identity construction on Facebook: Digital empowerment in anchored relationships • Article
Computers in Human Behavior, Volume 24, Issue 5, 1 September 2008, Pages 1816-1836
Zhao, S.; Grasmuck, S.; Martin, J.

Tastes, ties, and time: A new social network dataset using Facebook.com • Article
Social Networks, Volume 30, Issue 4, 1 October 2008, Pages 330-342
Lewis, K.; Kaufman, J.; Gonzalez, M.; Wimmer, A.; Christakis, N.

Social capital, self-esteem, and use of online social network sites: A longitudinal analysis • Article
Journal of Applied Developmental Psychology, Volume 29, Issue 6, 1 November 2008, Pages 434-445
Steinfield, C.; Ellison, N.B.; Lampe, C.

Can learning be virtually boosted? An investigation of online social networking impacts • Article
Computers & Education, Volume 55, Issue 4, 1 December 2010, Pages 1494-1503
Yu, A.Y.; Tian, S.W.; Vogel, D.; Chi-Wai Kwok, R.

Online and offline social networks: Use of social networking sites by emerging adults • Article
Journal of Applied Developmental Psychology, Volume 29, Issue 6, 1 November 2008, Pages 420-433
Subrahmanyam, K.; Reich, S.M.; Waechter, N.; Espinoza, G.

Internet social network communities: Risk taking, trust, and privacy concerns • Article
Computers in Human Behavior, Volume 25, Issue 1, 1 January 2009, Pages 153-160
Fogel, J.; Nehmad, E.

Findings on Facebook in higher education: A comparison of college faculty and student uses and perceptions of social networking sites • Article
The Internet and Higher Education, Volume 13, Issue 3, 1 June 2010, Pages 134-140
Roblyer, M.D.; McDaniel, M.; Webb, M.; Herman, J.; Witty, J.V.

По мере свободного времени и сил буду выкладывать сюда резюме этих статей.

Workshop on ERGM (p*) in statnet

ERGM (Exponential Random Graph Models) или p* models — это семейство моделей, основанных на случайных графах, с помошью которых можно выявлять наличие (или отсутствие) различных структурных эффектов (реципрокность, транзитивность, цикличность, гомофилия и т.д.) в сети. Т.е. мы можем сказать, является ли наблюдаемая сеть результатом повышенной/пониженной взаимности социальных отношений (реципрокность), действует ли в ней правило "друг моего друга — мой друг" (транзитивность) и склонны ли акторы этой сети выбирать контрагентов со схожими характеристиками (гомофилия). Данная тема составляет значительную часть моей диссертации, поэтому наверняка она ещё не раз тут всплывет.

С этой методикой я познакомился на летней школе в Эссексе, но распробовал все её достоинства не сразу. Но было уже поздно и поэтому пришлось вгрызаться в дебри формул и статистических подробностей самостоятельно. Однако, на помощь мне пришло видео, где David Hunter и Steve Goodreau – одни из ключевых авторов по данной тематике — 5 часов к ряду объясняют как начинку, так и реализацию ERGM в statnet. Это единственное видео подобной длины, которое я не только внимательно просмотрел, но и законспектировал. На прошедшем Sunbelt Стив постоянно курсировал в холле, но я так и не решился подойти к нему и поблагодарить. О чем сейчас жалею.

Goudreau-Hunter Political Networks 2009 1 of 5 from David Lazer on Vimeo.

Остальные части записи можно найти там же.

Не все анализы сетей одинаково социальны

Brian Keegan — единственный человек, чьи доклады на Sunbelt я посетил дважды — по итогам выступления С. Вассермана на одной конференции написал небольшое эссе об междисциплинарности (скомпилированное из его же твиттов, по совету самого Вассермана). Увы, этот предмет мне не настолько интересен, чтобы продираться сквозь не самую тривиальную лексику автора, поэтому это сомнительное удовольствие я оставлю другим.

Меня же заинтересовало другое. Во-первых, состав участников конференции. Даже краткий их список какбе намекает: Adamic, Barabasi, Berners-Lee, Burt, Castells, Newman, Powell, Uzzi, Wasserman, Watts. Во-вторых, основная идея доклада о том, что набежавшие ныне в сетевой анализ математики, физики и computer scientists “тупо” изобрели заново математическую и методологическую машинерию исследований в области “small world”, вместо того, чтобы воспользоваться уже имеющимися наработками социологов, антропологов и прочих ранних пташек анализа социальных сетей, и развивать это направление вместе.

Сей аргумент наглядно (что в последнее время редко случается в сетевых визуализациях) продемонстрирован на нижеследующей картинке, отображающей сети цитирования статей, посвящённых исследованиям “small world”. В тексте статьи это не прописано явно, но я подозреваю, что цвет узлов обозначает деление на два лагеря: ранних (социологи, психологи, антропологи) и поздних (математики, физики, компьютерщики) исследователей социальных сетей.
small world citation

От себя по теме имею заявить следующее. Недавно пересёкся на Мясницкой с PhDшником, с недавних пор читающим в Вышке курс по сетевому анализу в экономике. Начал было рассказывать ему о том, что съездил на Sunbelt, да быстро осёкся, т.к. мой собеседник не был знаком с данным мероприятием. На что я, удивившись, начал называть ему ключевые фамилии, ни одна из которых также не была ему знакома. Он пришёл в эту область из эконометрики, поэтому у них совершенно иные ключевые фигуры и работы. По большому счёту, ничего удивительного в этом нет. Когда я сам листал книжки по сетевому анализу в экономике (типа этой или этой), ловил себя на мысли о том, что они вообще о другом. Да и на занятии у вышеозначенного человека я понял чуть меньше чем ничего.

И слава Богу! Как известно, разделение труда — один из основных признаков зарождения цивилизации.