Как Forbes попутал анализ социальных сетей с Network Science

Днём запостил в твиттер ссылку на относительно свежую статью из Forbes, в которой правильные вещи преподносятся под неправильными брендами. А именно — “открытия” 30летней давности из Social Network Analysis выдаются за откровения от Network Science.

Я уже неоднократно говорил и писал о различиях между этими дисциплинами, поэтому сейчас органичусь простой иллюстрацией.

В самом начале статьи автор утверждает следующее:

Over the last half century, a field of academic study called network science has turned traditional relationship building on its head.

Из данного предложения можно заключить как минимум то, что Network Science не только существовала на протяжении последних 50 лет, но и чем-то даже всё это время занималась. Для проверки данного утверждения обратимся к сервису Google NGrams, предоставляющему доступ к поиску по текстам гигантского количества книг.

Если верить данному графику, число упоминаний данной “науки” до середины 90-х годов было ничтожным. Ситуация изменилась лишь к концу 90-х, когда физики/математики/программисты дорвались до “большых данных”, которые в то время, естественно, ещё так не назывались. В этом вы можете убедиться самостоятельно, добавив на тот же график столь популярное ныне словосочетание.

Кстати говоря, не менее любопытные результаты приносит аналогичное упражнение с поискам по трендам запросов в Google:


Для меня данный график был большим сюрпризом, т.к. по моему впечатлению популярность Network Science за последние годы должна была только увеличиться и выход одноимённого журнала весной этого года лишь подтверждал данное мнение. Однако данный график говорит об обратном: популярность новоиспечённой дисциплины снижается, в то время как популярность “классики” остаётся величиной неизменной.

В заключение хотелось бы обратить внимание на то, что согласно графику из Google Trends факт использования анализа социальных сетей пресловутым Агентством Национальной Безопасности всплывал ещё в 2006 году (новость, помеченная буквой H на синем графике). Но кричать об этом принялись лишь тогда, когда это стало модным.

В общем, я оставил соответствующий комментарий к статье на сайте Forbes в надежде на то, что автор одумается и исправит эту неточность.

P.S. Автор отреагировал молниеносно, но не так, как хотелось бы:

Thanks for making the distinction more clear Alexander. I appreciate it.

Визуализация социальных сетей: мои первые шаги

Вчера по приглашению бывшей студентки вещал про социальные сети на Научно Исследовательском Семинаре родной кафедры НИУ ВШЭ. Т.к. создание слайдов de facto стало одной из моих основных должностных обязанностей, решил выступить по старинке, без отвлекающих картинок. Ибо на мой взгляд для объяснения о Social Network Analysis нет ничего вреднее, чем мельтешащие “волосяные шары”

Однако сейчас, проспавшись и образумев, решил что иная крайность также вредна, и стал собирать в одну пачку слайдов иллюстрации к той слабоструктурированной лавине материала, которую я успел выдать за 2,5 часа непрерывного чесания языком. Т.к. выступление основывалось на моём опыте исследований и проектов, связаных с Social Network Analysis в Живом Журнале, Твиттере, Вконтакте и Фейсбуке, то некоторые картинки пришлось разыскивать в самых отдалённых уголках Живого Журнала и жесткого диска.

По ходы обнаружились визуализации, на которые сейчас можно смотреть разве что с умилением, как на первые детские рисунки. Но в том-то и кроется их прелесть. Поэтому для адекватного восприятия следующих картинок стоит настроить себя на лирическое настроение, которое возникает каждый раз, когда открываешь альбом со старыми фотографиями или пачку школьных тетрадей.

06_09a06_09b

Лето 2009 года. Это я решил поиграться с очередной задумкой то-ли провизора то-ли прохиндея от SNA Питера Глура. Того самого, который сейчас продолжает навешивать на людей в офисах электронные маячки, анализируя затем полученные сети коммуникации. Об этом у меня была заметка на WebScience а также на прошлом Sunbelt я сфотографировал Питера с таким маячком на фоне его постера, который и послужил поводом для написания той статьи.

Сервис, в котором сделаны эти картинки, назывался, кажется, Coolhunter и уже приказал долго жить. И если честно, то я навскидку не скажу, существует ли подобный функционал в какой либо из современных систем мониторинга и аналитики в Social Media.

Впрочем, деталей работы этого сервиса я тоже не помню – может быть что-то всплывало в комментариях к посту в Живом Журнале, где эти картинки были опубликованы впервые. Ну или прочитать книжку “Coolhunting: Chasing Down the Next Big Thing“, где подход и технология расписаны достаточно подробно, чтобы продать, но не настолько, чтобы воспроизвести “с нуля”.

Продолжение следует…

Фрагмент вебинара по курсу “Анализ Социальных Сетей”

“Университет без Границ” выложил видеофрагмент первой лекции по курсу “Анализ Социальных Сетей”.

Запись на курс ещё открыта.

Social Network Analysis: он-лайн курс по анализу социальных сетей от Coursera

Coursera SNA На Coursera стартовал второй сезон курса по анализу социальных сетей. Насколько я знаю, на данный момент это единственный он-лайн курс по сетевому анализу, поэтому всем, кто интересуется данной темой, имеет смысл обратить на него внимание. Я прошёл его в прошлый раз и поделюсь тут своими впечатлениями.

Несмотря на то, что курс озаглавлен как Social Network Analysis, социологической составляющей в нём не так много, как хотелось бы. Читает его Lada Adamic, обессмертившая себя визуализацией американской политической блогосферы накануне выборов 2004 года. Лада относится к молодому поколению исследователей социальных сетей, которое, как правило, представлено выходцами из математики, физики и Computer Science и в силу своего образования тяготеющего к математическим, вычислительным и алгоритмическим аспектам сетевого анализа. А с появлением “библии” данного направления — книги Марка Ньюмена “Networks: Introduction” — и журнала “Network Science”, данная область стала отличаться от анализа социальных сетей также и институционально.

Lada Adamic usa political blog network
Если бы Лада получала royalty за каждое использование данной визуализации, она бы уже давно могла бросить работу и жить на отчисления. Впрочем, судя по тому, что она не использовала её в качестве логотипа своего курса, возможно эти права принадлежат кому-то другому.

Собственно поэтому, несмотря на то, что в курсе покрыты стандартные для SNA темы центральностей, выявления сообществ, визуализаций и т.д., всё-таки заметен уклон в сторону математических моделей (Erdos-Renyi, Scale-Free, preferential attachment), симуляций (в одном из домашних заданий нужно было написать фрагмет кода на SCALA для NetLogo), анализа и визуализации сетей, узлами которых не являются люди (например, та же сеть рецептов) и всего того, что логичнее относить к области Network Science.

В общем и целом, курс оставил впечатление довольно сырого (система не смогла распознать одну из моих домашек и её мне не засчитали) и не очень хорошо структурированного (в отличие от Networked Life, о котором я недавно писал).

К плюсам можно отнести видео-интервью с людьми, которые занимаются анализом социальных сетей в таких компаниях как Facebook (Cameron Marlow), LinkedIn (Sébastien Heymann, по совместительству создатель Gephi).

Впрочем, от обзорного курса сложно требовать что-то большее. Тем более, когда он является единственным в своём роде.

Форум Исследователей Social Network Analysis (ФИSNA)

FISNAВ прошлую среду выступил на Форуме Исследователей Social Network Analysis (ФИSNA), организованном Лабораторией Цифрового Общества с докладом о том, почему анализ социальных сетей в том виде, в котором я им занимаюсь, не стоит морщинки на лице Тома Снайдерса.

По формату требовалось вкратце рассказать о себе и своих достижениях, однако я решил поделиться неудачей

Таковой неудачей я считаю сетевой анализ данных из твиттера, собранных 24 декабря 2011 года, по результатам которого я уже успел доложиться на нескольких конференциях. А заключается она в том, что финальную версию этого доклада, я не стал подавать на грядущий Sunbelt. Даже несмотря на то, что с содержательной точки зрения, его результаты — пожалуй, самое интересное, что у меня пока получалось на этой ниве.

Почему я этого не сделал? Тому как минимум 4 причины:

  • Тема доклада на данный момент безусловно горяча и актуальна. Но мой двигал скорее общий интерес, нежели чётко сформулированные исследовательские вопросы и гипотезы.
  • Данные были уникальнми и достаточно репрезентативными, однако, как выяснилось, при их сборе я не учёл всех нюансов языка запросов в Твиттеру, что привело к значительному искажению содержательных результатов (об этом напишу отдельным постом).
  • Были применены довольно продвинутые методы сетевого анализа, однако я до сих пор не уверен в том, что Louvain algorithm является наиболее адекватным методом для тех задач, к которым я его применил.
  • Там даже была цветная визуализация спагетти-style, сделанная в Gephi, каковых сейчас десятки, если не сотни.

Все вышеперечисленные (а также и некоторые другие) недостатки привели к тому, что проделанная работа не может претендовать на статус “научной”. Более того, она не является и “исследованием”. Её жанр и ниша — разрозненный “эксплораторный” анализ данных, который, безусловно, имеет полное право на существование, но не может считаться результатом “анализа социальных сетей” в том виде, в каком понимаю его я.

В моём понимании, анализ социальных сетей (как и всякий анализ данных) — это искусство давать понятные ответы на чётко сформулированные и актуальные вопросы с помощью применения адекватных методов к релевантным данным.

Слайды и видеозаписи выступлений, можно посмотреть на сайте Лаборатории Цифрового Общества.

Видеозапись человека, похожего на  моего выступления в двух частях:

P.S. Как меня совершенно корректно подправили, Лазарсфельд с Мертоном написали о гомофилии в 60-х. Если не ошибаюсь, тут: Lazarsfeld, Paul F., and Robert K. Merton. “Friendship as a social process: A substantive and methodological analysis.” Freedom and control in modern society 18.1 (1954): 18-66.

Впредь буду внимательнее.