خانه » مقدمه ای بر تحلیل شبکه های اجتماعی

مقدمه ای بر تحلیل شبکه های اجتماعی

در دنیای امروز بیشتر افراد به شبکه های اجتماعی اعتیاد پیدا کرده اند. همچنین ، می دانیم که تقریباً هر سیستمی که افراد در آن تعامل داشته باشند ، می تواند به عنوان یک شبکه اجتماعی دسته بندی شود. به تازگی یم مطالعه موردی در مورد سریال محبوب بازی تاج و تخت در سایت DataCamp انجام شده است. در این مطالعه به بررسی شخصیت های این سریال پرداخته شده و چگونگی تغییر اهمیت شخصیت ها در این مجموعه پرداخته شده است. می توایند از اینجا اطلاعات بیشتری راجع به این مطالعه بدست آورید.

تحلیل شبکه اجتماعی


تجزیه و تحلیل شبکه های اجتماعی (SNA) فرآیند بررسی ساختارهای اجتماعی از نظر گره ها (راس ها) و لبه هایی (یال ها) است که آنها را از طریق استفاده از شبکه ها و نظریه گراف به یکدیگر متصل می کند.

نظریه گراف


یک گراف از رئوس ساخته شده است که توسط یال ها به هم متصل می شوند. یال ها می توانند یک طرفه یا دو طرفه باشند. همچنین یال ها می توانند وزن دار باشند یا بدون وزن.

اندازه گیری گراف

۴ معیار برای اندازه گیری یک گراف مورد استفاده قرار می گیرد

ابعاد گراف: اندازه یک شبکه گراف می تواند به تعداد گره های N یا تعداد لبه های E اشاره داشته باشد.

تراکم: تراکم در یک گراف با D نمایش داده می شود که برابر است با تعداد گره یا تقسیم بر تعداد یال های ممکن

تراکم گراف

قطر: حداکثر کوتاهترین فاصله بین تمام جفتهای گره در نمودار.

کوتاهترین مسیر: برای فاصله بدون وزن ، تعداد لبه های بین دو گره و برای فاصله وزنی ، مجموع وزن بین دو گره را محاسبه می کنیم. برای یافتن کوتاهترین مسیر نیز دو الگوریتم داریم

  • جستجوی اول عرض (BFS) – از گره ریشه شروع می کنیم و قبل از رفتن به گره ها در سطح بعدی ، همه گره های همسایه را در عمق فعلی کاوش می کنیم.
  • جستجوی اول عمق (DFS)- از گره ریشه شروع می کنیم و قبل از رفتن به شاخه ها در سطح بعدی ، تا آنجا که ممکن است در امتداد هر شاخه کاوش می کنیم.
کوتاه ترین مسیر در گراف

اندازه گیری گره

درجه مرکزیت: برابر است با تعداد یال هایی که یک گره دارد. هرچه تعداد یال های یک گره بیشتر باشد درجه آن گره بیشتر است.

خاصیت مرکزیت: این معیار تلاش می کند گره هایی که در مرکز ارتباطات در شبکه گراف هستند را مشخص کند.

مرکزیت نزدیکی: در این معیار هرچه گره ها به یکدیگر نزدیک تر باشند دجه بالاتری خواهند داشت.

مرکزیت بینابینی -هر چه یک گره در مسر دو گره بیشتر قرار بگیرد درجه بینابینی بیشتری دارد.

اندازه گیری گره گراف

مطالعه موردی: تحلیل شبکه Game of Thrones


بازی تاج و تخت (Game of Thrones) مجموعه تلویزیونی بسیار محبوب HBO است که بر اساس مجموعه کتاب های معروف A Song of Ice and Fire ساخته George R.R. Martin است. مجموعه داده شامل مجموعه کتاب های فصول اول تا پنجم است. ما همچنین از این مجموعه داده برای تجزیه و تحلیل شبکه همبستگی شخصیت های کتاب های بازی تاج و تخت استفاده خواهیم کرد.
ما فقط اولین کتاب A Game of Thrones را لود می کنیم تا نام ستون ها را بررسی کنیم.

کتاب اول شامل 5 ستون است: منبع ، هدف ، نوع ، وزن و کتاب. منبع و هدف دو گره هستند که توسط یک لبه به هم متصل می شوند. ویژگی وزنی هر لبه به ما تعاملات متقابل شخصیت ها در کتاب را می گوید.
وقتی داده ها را برای ایجاد یک شبکه در اختیار داشتیم ، از networkx ، یک کتابخانه تجزیه و تحلیل شبکه ، و برای اولین کتاب یک شی گراف ایجاد خواهیم کرد.

در حال حاضر ، نمودار گراف G_book1 خالی است. بنابراین باید آن را با یال های کتاب اول پر کرده و در بقیه کتابها بارگذاری کنیم.

درجه مرکزیت برای یافتن مهمترین شخصیت


ابتدا از مرکزیت درجه برای اندازه گیری اهمیت گره در شبکه با نگاهی به تعداد همسایگان و تعداد گره های متصل به آن استفاده می کنیم.

با توجه به مرکزیت درجه ، ما اهمیت تغییرات کاراکترها را در طول زمان درک می کنیم ، بنابراین می خواهیم سیر تحول درجه یک شخصیت را بررسی کنیم.

نمودار تحلیل شخصت

با ترسیم نمودار ، می توان دریافت که با پیشرفت سری کتاب ، اهمیت ادارد استارک کاهش می یابد. جان اسنو ، در کتاب چهارم افت می کند ، اما در کتاب پنجم افزایش ناگهانی وجود دارد.

مرکزیت بینابینی برای یافتن مهمترین شخصیت


ما مرکزیت بینابینی را برای یافتن شخصیت های مهم در کتاب Game of Thrones پیاده سازی می کنیم و تحول مرکزیت این شبکه را در پنج کتاب ترسیم می کنیم.

تحلیل گراف

ما می توانیم با پیشرفت مجموعه کتاب ، افزایش ویژه ای از اهمیت استنیس باراتئون را مشاهده کنیم. در کتاب پنجم ، او از اهمیت بیشتری نسبت به شخصیت های دیگر شبکه برخوردار است.

الگوریتم PageRank برای یافتن مهمترین شخصیت


اکنون ، PageRank را امتحان می کنیم تا شخصیت های مهم را در Game of Thrones بیابیم و تحولات PageRank این شبکه را در پنج کتاب ترسیم کنیم. PageRank الگوریتمی است که توسط جستجوی Google برای رتبه بندی صفحات وب در نتایج موتور جستجوی خود استفاده می کند و روشی برای اندازه گیری اهمیت صفحات وب سایت است.

الگوریتم Pagerank

بر اساس الگوریتم PageRank ، استنیس باراتئون و جان اسنو مهمترین شخصیت های کتاب پنجم هستند.

همبستگی بین معیارهای مختلف


ما سه معیارمختلف را برای محاسبه اهمیت گره در شبکه مشاهده کرده ایم ، اما می خواهیم با استفاده از همبستگی پیرسون ارتباط بین PageRank ، مرکزیت بینابینی و مرکزیت درجه را مشاهده کنیم.

معیار همبستگی

می توان نتیجه گرفت که بین این سه معیار همبستگی زیادی برای شبکه همزمانی شخصیت ما وجود دارد.

نتیجه


با توجه به مرکزیت درجه و PageRank ، جان اسنو مهمترین شخصیت کتاب پنجم است. و برای مرکزیت بین یکدیگر ، در کتاب پنجم ، استنیس-باراتئون به طور قابل توجهی از شخصیت های دیگر شبکه مهمتر است.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

*

code

به بالای صفحه بردن