1. مقدمه
گسترش خدمات مبتنی بر مکان، رشد انفجاری داده های رسانه های اجتماعی گسترده با اطلاعات موقعیت جغرافیایی را ایجاد کرده است. کاربران شبکه های اجتماعی نه تنها گیرنده بلکه ناشر و انتشار دهنده اطلاعات نیز هستند. این فناوریهای رو به رشد، کمهزینه و پرکاربرد «حسگر انسانی» فرصتی بیسابقه برای درک رفتار انسان و چگونگی تغییر آن در فضا و زمان فراهم کردهاند [ 1 ، 2 ، 3 ]. رفتار انسان به عنوان “کاری انجام شده، احساس یا فکر در پاسخ به یک موقعیت یا رویداد، که نه تنها شامل اعمال مستقیم، بلکه شامل عناصر مربوط به شناختی و ادراکی است” تعریف می شود .]. استخراج معناشناسی از متن رسانه های اجتماعی برای استنباط رفتار انسانی، دوره های بالقوه عمل و افکار عمومی بسیار مفید است [ 5 ]. در سالهای اخیر، تحقیقات بیشتر و بیشتری بر روی استفاده از اطلاعات معنایی در دادههای رسانههای اجتماعی برای تقویت واکنشها به رویدادهای بحرانی (مانند بلایای طبیعی، حملات تروریستی و رویدادهای بهداشت عمومی) متمرکز شدهاند. محققان معمولاً از روشهای پردازش زبان طبیعی برای استخراج متن رسانههای اجتماعی و به دست آوردن نظرات مردم [ 6 ، 7 ، 8 ، 9 ]، تجزیه و تحلیل احساسات عمومی [ 10 ، 11 ، 12 ] و بررسی الگوهای رفتاری انسان استفاده میکنند [ 4 ، 13 ،14 ]. با این حال، به دلیل فقدان روششناسی مناسب، چالش بزرگی در مورد تحول معنایی رفتار کاربران رسانههای اجتماعی و چگونگی تغییر آن در فضا و زمان جغرافیایی وجود دارد.
در موقعیتهای اضطراری، رفتار کاربران رسانههای اجتماعی با غیرمنطقی بودن، عفونتپذیری شدید و همنوایی مشخص میشود. ظهور اطلاعات انبوه در طول حوادث فاجعه، مردم را تحت تاثیر قرار می دهد و باعث می شود نظرات آنها با توسعه رویداد فاجعه تغییر کند. تحقیقات موجود که تکامل معنایی را تجزیه و تحلیل میکند، بر حوزه متن کاوی و انتشار اطلاعات متمرکز شده است، ویژگیهای جغرافیایی و زمانی رفتار کاربران را نادیده میگیرد و تحلیل دقیقی از تحول معنایی موضوعی، بهویژه برای رویدادهای فاجعهبار ندارد. نیاز اساسی به استخراج الگوهای موضوعی و زمانی- مکانی رفتار عمومی در طول حوادث فاجعه وجود دارد. در نظر گرفتن COVID-19 به عنوان یک مطالعه موردی، هدف این مقاله توصیف تکامل معنایی و مکانی-زمانی پاسخهای رفتاری توسط کاربران Weibo در چین است. با ترکیب شبکههای پیچیده، مدلهای موضوعی و GIS، این مقاله (1) از یک مدل استخراج و طبقهبندی موضوعی که توسط کارهای قبلی ما پیشنهاد شده بود استفاده میکند.8 ، 9 ] برای استخراج موضوعات از متون Weibo در طول شیوع COVID-19. (2) یک مدل تکامل معنایی کاربر برای توصیف و تحلیل تغییر معنایی عمومی ایجاد می کند. (3) ویژگیهای تکامل مکانی-زمانی معناشناسی عمومی را در سراسر بحران COVID-19 تجسم و تجزیه و تحلیل میکند.
2. کارهای مرتبط
داده های رسانه های اجتماعی به طور فزاینده ای برای کمک به مدیریت بلایا از دیدگاه انسان محوری مورد استفاده قرار گرفته اند [ 15 ، 16 ، 17 ، 18 ]. Scheele [ 19 ] یک روش متن کاوی آگاه از زمینه جغرافیایی را پیشنهاد کرد که ویژگیهای متنی مکانی-زمانی رسانههای اجتماعی را برای طبقهبندی پستهای مرتبط با طوفان سندی در توییتر یکپارچه میکند. چن [ 20 ] از دو معیار کمی استفاده کرد – کسری از توییت های مرتبط با رویداد (FET) و احساسات مثبت خالص (NPS) برای بررسی ابعاد شدت و جهت افکار عمومی در مورد بازگشایی جامعه در بحبوحه COVID-19 برای تصمیم گیری در حوادث اضطراری. . گروبنر [ 21] ویژگی های زمانی و مکانی احساسات منفی عمومی را قبل، حین و بعد از ابرطوفان سندی از داده های توییتر تحلیل کرد. Gongora-Svartzman [ 22 ] روشی را با ترکیب تکنیک های پردازش متن و تجزیه و تحلیل شبکه نموداری برای اندازه گیری انسجام اجتماعی از طریق شبکه های رسانه های اجتماعی معرفی کرد. شی [ 23] یک روش استخراج احساسات متنی را بر اساس فرهنگ لغت هستی شناسی عاطفی برای تجزیه و تحلیل سیر تکاملی افکار عمومی آنلاین در Weibo در طول همه گیری COVID-19 در چین ساخت. اگرچه تعداد فزاینده ای از مطالعات بر استخراج معنایی از رسانه های اجتماعی برای تجزیه و تحلیل افکار عمومی، احساسات و رفتارها در هنگام فاجعه متمرکز شده اند، تحقیقات کمتری در مورد تغییر معنایی در رسانه های اجتماعی در طول زمان-فضا در طول یک رویداد فاجعه انجام شده است.
2.1. استخراج و تکامل معنایی
مدلهای موضوعی (به عنوان مثال، تخصیص دیریکله نهفته [LDA]، تحلیل معنایی پنهان) و یادگیری ماشین (مانند ماشین بردار پشتیبانی [SVM] و جنگل تصادفی [RF]) با موفقیت برای استخراج موضوعات از رسانههای اجتماعی، تجزیه و تحلیل موضوعات مختلف استفاده شده است. فضا و زمان و توصیف رفتارهای عمومی. با این حال، مطالعات در مورد تحول معنایی موضوعات کاربران کافی نیست. Resch [ 7 ] از LDA برای استخراج اطلاعات معنایی از توییتر استفاده کرد و تجزیه و تحلیل مکانی-زمانی را برای تخمین ردپای و خسارت زلزله ناپا (CA، ایالات متحده آمریکا) در سال 2014 انجام داد. Dahal [ 10 ] با استفاده از LDA و تجزیه و تحلیل احساسات، توییت های مرتبط را تجزیه و تحلیل کرد. تغییرات اقلیمی برای مقایسه ویژگی های بحث تغییر اقلیم بین کشورهای مختلف و دوره زمانی. وانگ [6 ] از LDA و SVM برای استخراج موضوعات از متون Weibo در طوفان باران پکن 2012 استفاده کرد و الگوی توزیع موضوعات مختلف را بررسی کرد. Zong [ 24 ] محتوا و ویژگی های زمانی پاسخ های توییت به انفجارهای یک کارخانه شیمیایی در تیانجین، چین را در سال 2015 تجزیه و تحلیل کرد. Burnap [ 25 ] اندازه و بقای جریان اطلاعات را در طول رویداد تروریستی Woolwich در لندن، در سال 2013، توسط پیش بینی کرد. تجزیه و تحلیل احساسات کاربران و فراوانی اطلاعات ارسال شده در توییتر. Ye [ 26 ] LDA را برای طبقهبندی پستهای Weibo مربوط به «دنگی» به پنج طبقهبندی پذیرفت و رابطه بین بحث آنلاین و شیوع بیماری در Weibo را تحلیل کرد.
بیشتر تحقیقات موجود در مورد تکامل موضوع در زمینه متن کاوی است. یک مدل احتمال، یک الگوریتم خوشهبندی و معیارهای شباهت موضوع برای ساخت یک مدل تکامل موضوع [ 27 ] ترکیب شدند. Blei و Lafferty [ 28 ] یک مدل موضوع پویا با تمرکز بر تغییر ترکیب موضوع، یعنی توزیع کلمات ارائه کردند. احمد و زینگ [ 29 ] یک مدل موضوع پویا نامتناهی را معرفی کردند که میتوانست تکامل تعداد، توزیع و محبوبیت موضوعات در ساختار پنهان را در خود جای دهد. هان [ 30 ] مدل موضوعی را توسعه داد که توسط ابرداده های تطبیقی و متغیر با زمان پشتیبانی می شد و آن را در مجموعه داده بزرگ Weibo اعمال کرد. او [ 31] چارچوب «شبکه تغییر توجه» را برای تحلیل پویایی توجه جمعیت مرتبط با بلایا با ردیابی هشتگهای توییتر پیشنهاد کرد. با این حال، تحقیقات موجود ویژگیهای مکانی-زمانی دادههای رسانههای اجتماعی را نادیده میگیرد و فاقد یک تحلیل دقیق از تحول معنایی موضوع است.
2.2. شبکه های پیچیده و رسانه های اجتماعی
شبکههای پیچیده شبکههایی هستند که برخی یا همه ویژگیهای زیر را دارند: خود سازماندهی، خود تشابهی، بدون مقیاس بودن، یک شبکه جذبکننده یا یک شبکه جهانی کوچک بودن [ 32 ، 33 ]. ساختار توپولوژیکی یک شبکه پیچیده را می توان با یک نمودار نشان داد که افراد واقعی را به عنوان گره و روابط بین افراد را به عنوان لبه های متصل بین گره ها انتزاع می کند. یک شبکه پیچیده منفرد را می توان به طور رسمی به صورت G = (N, E) تعریف کرد که شامل گره های مجموعه N و یال های E است. تمام لبه ها دو طرفه ساخته شده اند [ 34]. در مقابل، شبکه ای که لبه های آن در جهت خاصی قرار می گیرند، شبکه جهت دار نامیده می شود.
از دیدگاه شبکه های پیچیده، رسانه های اجتماعی نمونه ای از یک شبکه اجتماعی پیچیده است که برای بیان و انتشار احساسات، نگرش ها و نظرات کاربران استفاده می شود [ 35 ]. یک دیدگاه شبکه پیچیده می تواند به درک عمیق تری از رسانه های اجتماعی دست یابد و اطلاعات بالقوه بیشتری را کشف کند [ 36 ]. مطالعات موجود در زمینه انتشار اطلاعات هستند، جایی که محققان مدل هایی از انتشار اطلاعات را برای شایعات، افکار عمومی و سایر موضوعات ایجاد کرده اند [ 37 ، 38 ]. برخی از شبکه های اجتماعی مدل های انتشار اطلاعات افکار عمومی را ساخته اند، عوامل موثر بر ارتباطات افکار عمومی اجتماعی را بررسی کرده اند [ 39 ، 40 ]]، و جوامع یک شبکه اجتماعی را شناسایی کرد [ 41 ، 42 ]. این مطالعات عمدتاً بر گسترش افکار عمومی در شبکه های اجتماعی و درک مکانیسم ها و عوامل مؤثر بر انتشار اطلاعات متمرکز بود. با این حال، کار کمی برای تجزیه و تحلیل سیستماتیک از تکامل موضوعات کاربران رسانه های اجتماعی ترکیبی از شبکه های پیچیده و GIS وجود دارد.
3. داده ها و روش ها
3.1. چارچوب فنی
شکل 1 چارچوبی را برای استخراج تکامل موضوعی و الگوی زمانی- مکانی رفتار رسانه های اجتماعی نشان می دهد. چارچوب عمدتاً از سه بخش به شرح زیر تشکیل شده است: (1) استخراج موضوع. ما متون Weibo را برای یک دوره معین با محوریت یک رویداد جمع آوری کردیم، پس از اینکه فیلتر متن، مدل LDA و الگوریتم جنگل تصادفی هر کدام برای استخراج سلسله مراتبی موضوعات و موضوعات فرعی پیاده سازی شدند [ 8 ]]. (2) مدل تغییر معنایی. بر اساس شبکه پیچیده، موضوعات فرعی کاربران به مجموعه دادههای تغییر معنایی منتقل شدند و جفتهای موضوع را به عنوان گرهها و لبهها شناسایی کردند. علاوه بر این، مجموعه داده تغییر معنایی توسط یک پنجره زمانی مناسب برای ساخت شبکههای تغییر معنایی در هر پنجره زمانی تقسیم شد. (3) تجسم و تجزیه و تحلیل. ما به تجسم همه شبکههای تغییر معنایی دست یافتیم، تحول موضوعی و تغییر ساختار شبکه را تجزیه و تحلیل کردیم، و تحلیل مکانی-زمانی تغییرات معنایی کاربر را انجام دادیم.
3.2. داده ها و پیش پردازش
با استفاده از APIهای Sina Weibo، دادههای Weibo را دریافت کردیم که حاوی کلمات کلیدی «پنومونی» و/یا «کرونا ویروس» مربوط به COVID-19 از ساعت 00:00 در 9 ژانویه 2020 تا ساعت 24:00 در 10 مارس 2020 بود. اطلاعات فراداده شامل شناسه کاربر بود. اطلاعات زمان، متن و مکان.
برای پیش پردازش، ابتدا متون تکراری یا/و بسیار کوتاه (کمتر از چهار کلمه) Weibo را فیلتر کردیم. سپس دادههای نویز (به عنوان مثال، لینکها، فاصلهها، علائم نگارشی، هشتگها و نامهای کاربر @) حذف شدند. پس از فیلتر کردن متن، ما با مجموعه داده متعارفی از 3,427,933 متن Weibo که توسط 986,217 کاربر منحصر به فرد Weibo ارسال شده بود، باقی ماندیم که شامل 197,118 متن با مختصات جغرافیایی است که توسط 98,507 کاربر منحصر به فرد Weibo ایجاد شده است.
3.3. مدل استخراج و طبقه بندی موضوع
الگوریتم LDA و RF برای ساخت مدل استخراج و طبقهبندی موضوع برای پردازش سلسله مراتبی متون Weibo مربوط به COVID-19، بر اساس کار قبلی ما، ترکیب شدند [ 8 ، 9 ]. در مرحله اول، از حالت LDA برای پردازش نمونه Weibo برای تعمیم موضوعات استفاده شد و هر نمونه Weibo را به یک موضوع اختصاص داد، که برای آموزش مدل RF استفاده شد. سپس از مدل RF آموزش دیده برای طبقه بندی کل مجموعه داده Weibo استفاده شد. در نهایت، متون Weibo مربوط به COVID-19 در هفت موضوع تعمیم داده شد. عناوین «پاسخ شخصی»، «نظرات و احساسات» و «کمک جویی» با اجرای یک طبقهبندی ثانویه به 15 موضوع فرعی دقیقتر تقسیم شدند. جزئیات موضوع و موضوعات فرعی در شکل 2 نشان داده شده است.
در این آزمایش، 8500 متن Weibo به طور تصادفی انتخاب شدند تا هفت موضوع را با مدل LDA تعمیم دهند که توسط بسته “Gensim” در پایتون پیاده سازی شد. از طریق آزمایشهای مکرر، تعداد بهینه موضوعات اولیه 20 تعیین شد. ما هر متن Weibo را به موضوعی اختصاص دادیم که با توجه به احتمالات موجود در فهرست موضوعات سند، بیشترین شباهت را داشت. بر اساس فهرستهای موضوع-اصطلاحات، بیست موضوع با ادغام موضوعات مشابه و کنار گذاشتن موضوعات نامربوط به هفت موضوع («پانزده» در طبقهبندی ثانویه) تعمیم داده شد.
الگوریتم RF با استفاده از یک بسته یادگیری ماشینی به نام “scikit-learn” در پایتون پیاده سازی شد. بر اساس فهرست موضوعات سند، 7000 متن حاشیه نویسی Weibo به عنوان نمونه آموزشی و 1500 متن حاشیه نویسی Weibo به عنوان مجموعه تست استفاده شد. ما از خروجیهای خارج از کیسه (OOB) برای تعیین تعداد درختان طبقهبندی (n برآوردگر) در 400 مورد استفاده کردیم. در طبقهبندی ثانویه، 10000 متن Weibo را بهطور تصادفی از موضوعات «پاسخ شخصی»، «نظرات و احساسات» انتخاب کردیم. ‘، و ‘در جستجوی کمک’ برای تعمیم 15 موضوع فرعی. 8000 نمونه آموزشی و 2000 نمونه تست برای آموزش مدل RF وجود داشت. تعداد درختان طبقه بندی (n برآوردگر) 400 درخت بود.
3.4. مدل تغییر معنایی
3.4.1. اقدامات شبکه
بر اساس شبکه های پیچیده، ما یک شبکه تغییر معنایی را پیشنهاد کردیم (برای تعریف دقیق به 3.4.2 مراجعه کنید)، موضوعات را به عنوان گره ها و تغییرات موضوع را به عنوان لبه های هدایت شده تنظیم می کنیم. شبکه تغییر معنایی به ما این امکان را می دهد که با تجزیه و تحلیل ساختار توپولوژی شبکه پیچیده، فرآیند تکامل معنایی کاربران رسانه های اجتماعی در طول COVID-19 را به صورت کمی ثبت کنیم. ما چندین معیار مهم شبکه را انتخاب کردیم، از جمله اندازه شبکه، درجه، میانگین وزنی درجه، و ضریب تجمع.
اندازه شبکه: اندازه شبکه تعداد موضوعات (گره ها) در شبکه تغییر معنایی است.
درجه: درجه گره تعداد لبه های متصل به آن گره است [ 34 ]. در شبکه بدون جهت، درجه یک گره تعداد لبه هایی است که به آن متصل می شوند. در نمودارهای جهت دار، دو معیار درجه وجود دارد: درجه و درجه خارج. درون درجه تعداد یال هایی است که وارد گره می شوند، در حالی که درجه بیرونی تعداد لبه هایی است که از گره به سمت خارج به سمت گره های دیگر حرکت می کنند. مجموع درجات تحصیلی و برون درجه به شما درجه کل گره را می دهد. در این مطالعه اندازه گره ها با درجه وزنی تعیین شد.
میانگین درجه وزنی: وزنهای لبه نشاندهنده تعداد کاربرانی است که متنهای Weibo آنها از یک موضوع به موضوع دیگر از نظر معنایی تغییر کرده است. میانگین درجه وزنی شبکه تغییر معنایی، فرکانس تغییرات معنایی را منعکس می کند. اجازه دهید کمندرجه وزنی گره باشد من. میانگین درجه وزنی با رابطه (1) تعریف می شود:
میانگین ضریب خوشهبندی : از ضریب خوشهبندی برای نشان دادن درجه خوشهبندی بین گرههای شبکه استفاده میشود. میانگین ضریب خوشه بندی به طور خاص تمایل گره ها به تولید مثلث در شبکه ها است [ 31 ]. یک گره داده شده است مندر شبکه G، این احتمال وجود دارد که کمنگره های متصل به گره منهمچنین با رابطه (2) به یکدیگر متصل می شوند:
لمنمجموعه ای از لبه های متصل به گره را نشان می دهد منو کمننشان دهنده درجه گره است من. میانگین ضریب خوشه بندی با استفاده از رابطه (3) محاسبه می شود.
3.4.2. شبکه تغییر معنایی
بر اساس یک شبکه پیچیده، ما یک شبکه تغییر معنایی ساختیم تا فرآیند تغییر معنایی در نظرات کاربران Weibo در مورد پاسخ به شرایط اضطراری را توصیف کنیم. در شبکه، یک گره یک موضوع را نشان می دهد و لبه جهت دار نشان دهنده موضوعات در حال تغییر است. هنگامی که استفاده از مبحث A که به B تغییر می کند در جدول زمانی یک کاربر ظاهر می شود، یک یال از گره A به گره B اضافه می شود. وزن یال نشان می دهد که چند کاربر تبدیل موضوعی از مبحث A به B ایجاد می کنند. تعاریف دقیق به شرح زیر است.
رفتار معنایی کاربر: رفتار معنایی کاربر به این معنی است که کاربر یک پیام Weibo را ارسال می کند که در این مورد مربوط به رویدادهای فاجعه است. ما رفتار معنایی کاربر را به صورت یک تاپل مشخص می کنیم r=(تو،تی،g،س)، شامل چهار جنبه است که رفتار را توصیف می کند: توکاربری است که متن را ارسال کرده است (شناسه کاربری)؛ تیزمان رفتار است (زمانی که متن Weibo پست شد)؛ gموقعیت مکانی رفتار (مختصات جغرافیایی) است. و سویژگی های موضوعی رفتار است (موضوع متن Weibo).
رویداد تغییر معنایی کاربر: رویداد تغییر معنایی یک کاربر تویک تبدیل بین دو است تورفتارهای معنایی، به عنوان همنj=((تو،تیمن،gمن،سمن)،(تو،تیj،gj،سj))، جایی که تیمن<تیj، سمن≠سj. هنگامی که موضوع منتشر شده توسط یک کاربر از مبحث A به B تغییر کرد، در نظر گرفته می شود که کاربر یک رویداد تغییر معنایی ایجاد کرده است.
شبکه تغییر معنایی: یک شبکه تغییر معنایی یک نمودار وزن دار و جهت دار است TG=(تیV،تیE)همانطور که در شکل 3 نشان داده شده است. با توجه به مجموعه ای از کاربران U و متون Weibo آنها در یک دوره زمانی محدود تی=(تیتی،تیتی+δ] برای δ>0، تیVمجموعه گره (یا مجموعه موضوع)، شامل تمام موضوعات معنایی تولید شده توسط کاربران در دوره زمانی است تی. تعداد گره ها نشان دهنده اندازه شبکه است. اندازه گره ها نشان دهنده تعداد لبه هایی است که وارد گره می شوند. تیEمجموعه ای از لبه ها است که به عنوان نشان داده می شود تیE={((تو،تیمن،gمن،سمن)،(تو،تیj،gj،سj)):∀تو∈U،∀تیمن∈تی∧∀تیj∈تی}. هر یال مربوط به یک رویداد تغییر رفتار معنایی است. وزن لبه نشان می دهد که این رفتار معنایی چند بار در دوره زمانی رخ می دهد تی. تیEشامل تمام رویدادهای تغییر معنایی تولید شده توسط کاربران در دوره زمانی است تی.
بر اساس تعریف فوق، یک شبکه تغییر معنایی با مراحل زیر ساخته شد: (1) ابتدا متون Weibo را به ترتیب زمانی مرتب کردیم و موضوعات را از آنها استخراج کردیم. (2) برای تک تک کاربران، ما همه موضوعات مختلفی را که در جدول زمانی کاربر بهعنوان جفت رئوس ظاهر میشد، به دست آوردیم، که در میان آنها دو موضوع مجاور در زمان، یک جفت موضوع را تشکیل میدهند که لبه آن به موضوع اخیراً استفاده شده اشاره میکند. به این ترتیب مجموعه داده رویداد تغییر معنایی کاربر تولید شد. (3) برای تجسم بهتر تغییرات معنایی پویا در یک سری زمانی طولانی، همه شبکهها با یک پنجره زمانی کشویی ساخته شدند. هر شبکه با طول پنجره n روز ساخته شده است. شبکه مربوطه در نقطه زمانی تیتیتوسط رویدادهای تغییر معنایی تولید شده توسط کاربران در طول دوره زمانی تعیین می شود تی=(تیتی،تیتی+n]. روش تعیین یک پنجره زمانی مناسب n در بخش 3.4.3 ارائه شده است . (4) با شروع از زمان اولیه، مجموعه داده رویداد تغییر معنایی کاربر توسط پنجره زمانی n به چندین زیر مجموعه داده تقسیم شد. سپس همه رئوس و یالها را از هر زیر مجموعه داده برای ساختن شبکههای تغییر معنایی یکپارچه کردیم. ما از Gephi (کنسرسیوم Gephi، پاریس، فرانسه)، یک نرم افزار منبع باز و رایگان برای طراحی انواع نمودارها و شبکه ها، برای تجسم شبکه تغییر معنایی استفاده کردیم.
پانزده پاسخ موضوع فرعی به COVID-19 برای ساخت شبکه تغییر معنایی انتخاب شد. از آنجایی که نام موضوعات فرعی طولانی بود، نام های فرعی را در ساخت شبکه، همانطور که در جدول 1 نشان داده شده است، کدگذاری کردیم .
3.4.3. تعیین پنجره زمانی
یک پنجره زمانی مناسب یک پارامتر مهم در ساخت شبکه های تغییر معنایی است. پنجره زمانی هم بر اساس تعداد کاربران و هم فراوانی موضوعاتی که در مجموعه های کاربری مختلف تغییر می کنند تعیین می شود. اگر پنجره زمانی خیلی کوتاه باشد، شبکه های معنایی بسیار پراکنده خواهند بود و در نتیجه گره ها و لبه های کافی برای پشتیبانی از ساختار شبکه وجود ندارد. از سوی دیگر، اگر بازه زمانی بیش از حد طولانی باشد، شبکه های معنایی مجاور مشابه خواهند بود، که تشخیص تغییرات در ساختار شبکه را دشوار می کند و به دلیل حجم زیاد هر شبکه منجر به هدر رفتن منابع محاسباتی می شود.
در این تحقیق از دو شاخص میانگین تعداد رویدادهای تغییر معنایی و میانگین افزایش رویدادهای تغییر معنایی برای تعیین بازه زمانی استفاده شد. طبق تعریف ما، یک رویداد تغییر معنایی انتقالی بین دو موضوع کاربر است. جفت موضوع ( سمن،سj) جفت تغییری است که این رویداد تغییر معنایی را القا می کند. میانگین تعداد رویدادهای تغییر معنایی ، میانگین تعداد لبهها در تمام شبکههای تغییر معنایی در یک پنجره زمانی معین است. میانگین افزایش رویدادهای تغییر معنایی نسبت جفت تغییر موضوع جدید بین دو شبکه معنایی مجاور است.
زمانی که پنجره زمان n∈[0.5،10]برای نقطه زمانی معین ثابت است داز 9 ژانویه 2020 تا 10 مارس 2020، اجازه دهید اسد،nتمام جفت های موضوع را در آن نشان دهید [د،د+n]. ما افزایش رویدادهای تغییر معنایی را بین آنها محاسبه کردیم اسد،nو اسد+n/2،n، که تعریف میشود (اسد+n/2،n-اسد،n)/اسد،n. سپس از میانگین تمامی نتایج برای به دست آوردن میانگین افزایش رویدادهای تغییر معنایی استفاده شد. به طور مشابه، ما میانگین تعداد رویدادهای تغییر معنایی را با محاسبه میانگین همه به دست آوردیماسد،n.
همانطور که در شکل 4 نشان داده شده است ، میانگین افزایش رویدادهای تغییر معنایی بین دو شبکه متوالی با افزایش پنجره زمانی به سرعت کاهش می یابد، که نشان می دهد هر چه پنجره زمانی بزرگتر باشد، شبکه های مجاور مشابه تر هستند، که انعکاس واضح تغییرات معنایی را دشوار می کند. میانگین تعداد رویدادهای تغییر معنایی با افزایش پنجره زمانی در شکل 5 افزایش مییابد ، که نشان میدهد هر چه پنجره زمانی بزرگتر باشد، تغییرات معنایی غنیتر است. بنابراین، از ناحیه آرنج در شکل 4 ، که در آن n = 2 روز، به عنوان پنجره زمانی بهینه استفاده کردیم.
4. نتایج
4.1. توضیحات موضوع
موضوعات و موضوعات فرعی مرتبط با COVID-19 شمارش شده و در شکل 6 ارائه شده است. «نظرات و احساسات» 32.89 درصد از کل موضوعات را به خود اختصاص دادند و پس از آن «پاسخ دولت» و «اعلان رویدادها» به ترتیب 20.64 درصد و 17.08 درصد بودند. «انتشار پیشگیری و درمان» و «پاسخ شخصی» 12/14 درصد و 57/11 درصد را تشکیل میدهند. «کمک جویی» و «کمک مالی» 1.47 درصد و 2.23 درصد را به خود اختصاص داده است.
برای موضوعات فرعی، مقادیر «انتشار مثبت و تشویق»، «نظرات واقعی» و «در خانه ماندن و رعایت نکات احتیاطی» به ترتیب با 20.22 درصد، 16.23 درصد و 14.35 درصد بیشترین میزان را داشتند. نسبت «انتقاد از عادات بد»، «اقدامات حفاظتی علمی» و «ترسها و نگرانیها» 12.12 درصد، 9.24 درصد و 9.02 درصد بوده است. ‘نگرانی های جهانی همه گیری’ و ‘تقاضای کمک برای بیماران’ به ترتیب 5.52% و 3.38% بودند. بقیه موضوعات کمتر از 3 درصد بودند.
4.2. تحلیلهای تحول مکانی-زمانی و معنایی
4.2.1. تجسم شبکه تغییر معنایی
شکل 7 و شکل 8 روند تغییرات معنایی موضوعات مرتبط با COVID-19 کاربران رسانه های اجتماعی را از 9 ژانویه تا 10 مارس 2020 نشان می دهد. تغییرات شبکه معنایی در دوره های زمانی مختلف مورد تجزیه و تحلیل قرار گرفت.
از 9 ژانویه تا 19 ژانویه، پستهای Weibo مربوط به COVID-19 کمی وجود داشت، بنابراین شبکه تغییر معنایی پراکنده بود. با گذشت زمان، تعداد گره های شبکه (تعداد موضوعات) از 5 اولیه به 11 تغییر یافت. تغییر معنایی موضوعات عمدتاً بر روی “S5-اقدامات حفاظتی علمی”، “S10- ماندن در خانه و انجام اقدامات احتیاطی لازم” متمرکز شد. ، ‘S6- انتشار مثبت و تشویق’، ‘S4- نظرات واقعی’ و ‘S1-ترس ها و نگرانی ها’.
از 20 ژانویه تا 4 فوریه، میزان رویدادهای تغییر معنایی کاربر در 20 ژانویه به شدت افزایش یافت، در 21 ژانویه به اوج رسید، کاهش یافت اما تا 29 ژانویه در نوسان بود، در 30 ژانویه به طور قابل توجهی افزایش یافت و در 1 فوریه به اوج جدیدی رسید. سپس در طی 2-4 فوریه به آرامی نوسان کرد. با تغییر تعداد موضوعات از 11 به 13، شبکه معنایی به طور فزاینده ای متراکم شد. موضوعات “S7-درخواست کمک برای بیماران” و “S3-انتقاد عادات بد” ظاهر شد. در مراحل اولیه، افکار عمومی عمدتاً بین «S10- ماندن در خانه و انجام اقدامات احتیاطی لازم»، «S6- انتشار مثبت و تشویق»، «S5- اتخاذ اقدامات حفاظتی علمی»، «S4-نظرات واقعی» و «S1» تغییر کرد. -ترس ها و نگرانی ها. سپس موضوعات کاربران به «S3-Criticising عادات بد» تغییر یافت،
از 5 فوریه تا 24 فوریه، افکار عمومی شروع به تغییر به “S1- ترس ها و نگرانی ها” کرد. همگرایی «اقدامات حفاظتی علمی S5-Taking» کاهش یافت. در 9 فوریه، تغییر موضوع عمدتاً بر روی «S10- ماندن در خانه و انجام اقدامات احتیاطی لازم»، «S6- انتشار مثبت و تشویق» و «S4-نظرات واقعی» متمرکز شد. «S5- اتخاذ اقدامات حفاظتی علمی» و «S1-ترس ها و نگرانی ها» در رتبه دوم قرار گرفتند. در 10 فوریه، تعداد موضوعات از 13 به 15 افزایش یافت. موضوع “S14- درخواست برای توجه خارج از کشور” و “S15- نگرانی های همه گیر جهانی” ظاهر شد. تغییرات موضوع حول محور «S3- انتقاد از عادات بد» و «S15- نگرانی های همه گیر جهانی» جمع شد. ‘S10- ماندن در خانه و انجام اقدامات احتیاطی لازم’ و ‘S5- انجام اقدامات حفاظتی علمی’ کاهش یافت.
از 25 فوریه تا 10 مارس، تغییرات معنایی همچنان به سمت “نگرانی های همه گیر S15-Global” همگرا شد. ‘S10- ماندن در خانه و انجام اقدامات احتیاطی لازم’ و ‘S5- اتخاذ تدابیر حفاظتی علمی’ همچنان رو به کاهش است، در حالی که همگرایی در مورد ‘S14- درخواست برای توجه خارج از کشور’ افزایش یافته است. در نهایت، تغییرات عمدتاً مربوط به «نگرانیهای همهگیر جهانی S15»، «S6- گسترش مثبت و تشویق»، «S4-نظرات واقعی» و «S3-محکوم کردن عادات بد» و به دنبال آن «S5- اتخاذ اقدامات حفاظتی علمی»، « S10-در خانه ماندن و اقدامات احتیاطی لازم، S1-ترس ها و نگرانی ها، و S14- درخواست برای توجه خارج از کشور.
بر اساس تغییرات در ساختار شبکه ( شکل 9 )، ویژگیهای الگوی تغییر معنایی کاربر را در طول شیوع COVID-19 خلاصه کردیم. همانطور که در شکل 9 a,b نشان داده شده است، الگوی تغییر موضوعات کاربران از گسترده به پایدار بود. میانگین درجه وزنی ( شکل 9الف) با زمان در نوسان است و با رویدادهای اجتماعی کلیدی به طور قابل توجهی افزایش یافته است، که نشان می دهد نرخ تغییر موضوع کاربر افزایش یافته است. میانگین ضریب تجمع در مراحل اولیه به طور قابل توجهی افزایش یافت و سپس تثبیت شد. میانگین ضریب تجمع بالاتر نشان میدهد که موضوعات کاربران راحتتر تغییر کرده و یک حلقه بسته از تغییرات مکرر در میان چندین موضوع تشکیل میشود. می توان مشاهده کرد که در پروفاز COVID-19، موضوعات کاربران رسانه های اجتماعی به طور مکرر تغییر می کرد. با توسعه رویداد، تغییرات در موضوعات کاربران به سمت ثبات گرایش پیدا کرد و در چند موضوع متمرکز شد. شکل 9c،d نشان می دهد که شبکه تغییر معنایی در مراحل اولیه قابلیت بسط پذیری واضحی داشته است. تعداد رویدادهای تغییر معنایی جدید در ابتدای شیوع کووید-19 به طور قابل توجهی افزایش یافت، در طول پیگیری پایدار بود و در چندین رویداد اجتماعی کلیدی افزایش یافت.
4.2.2. تحلیل فضایی شبکه تغییر معنایی
تجزیه و تحلیل آماری ( شکل 10 ) در مجموع 1,544,109 رفتار معنایی کاربر ایجاد شده توسط 118,137 کاربر و 324,900 رویداد تغییر معنایی کاربر (شامل 24,328 رویداد با مختصات جغرافیایی) را نشان داد. سه رویداد اصلی تغییر معنایی عبارت بودند از (“S6- گسترش مثبت و تشویق” به “S3-محکوم کردن عادات بد”)، (“S6-انتشار مثبتاندیشی و تشویق” به “نظرات S4-Factual”) و (“S10-Staying” در خانه و انجام اقدامات احتیاطی لازم برای «S6-Spreading Positivity and تشویق»)، به ترتیب با 21,022، 20,929 و 20,644 تغییر.
توزیع فضایی رویدادهای تغییر معنایی در شکل 11 نشان داده شده است . بیشترین تغییرات در موضوعات کاربر بر روی منطقه پکن-تیانجین-هبی، منطقه دلتای رودخانه یانگ تسه، و استان های هوبی، سیچوان و گوانگدونگ متمرکز بود. شکل 12تجزیه و تحلیل دقیق تری از پنج منطقه فوق را نشان می دهد. در منطقه پکن-تیانجین-هبی، تغییرات معنایی کاربر عمدتاً در پکن، تیانجین و شیجیاژوانگ متمرکز بود. در منطقه دلتای رودخانه یانگ تسه، شانگهای و هانگژو شهرهایی بودند که بیشترین تعداد تغییرات موضوع را داشتند و پس از آن نینگبو، نانجینگ، هفی و سوژو قرار گرفتند. رویدادهای تغییر معنایی در استان هوبی عمدتاً در ووهان، هوانگانگ، شیائوگان، شیانگ یانگ و ییچانگ توزیع شدند. گوانگژو، شنژن و شهرهای اطراف آنها شهرهای اصلی رویدادهای تغییر معنایی در استان گوانگدونگ بودند. تغییرات در استان سیچوان عمدتاً در چنگدو، میانیانگ و نانچونگ متمرکز بود.
سپس شبکههای تغییر معنایی را برای پنج ناحیه شناساییشده ساختیم ( شکل 12). تغییرات معنایی در منطقه پکن – تیانجین – هبی عمدتا بر روی «S6- گسترش مثبتاندیشی و تشویق»، «S10-در خانه ماندن و انجام اقدامات احتیاطی لازم»، «S3-محکوم کردن عادات بد»، «S4-نظرات واقعی» متمرکز شده است. ‘S1-ترس ها و نگرانی ها’، ‘S5- اتخاذ اقدامات حفاظتی علمی’، و ‘S15- نگرانی های اپیدمی جهانی’. دلتای رودخانه یانگ تسه تحت تسلط «S6- انتشار مثبت و تشویق»، «S10- ماندن در خانه و انجام اقدامات احتیاطی لازم»، «S3-محکوم کردن عادات بد»، «S4-نظرات واقعی»، «S5- انجام اقدامات حفاظتی علمی» بود. و S1-ترس ها و نگرانی ها. موضوعات استان هوبی عمدتاً در میان «S6- گسترش مثبتاندیشی و تشویق»، «S10-در خانه ماندن و انجام اقدامات احتیاطی لازم»، «S3-محکوم کردن عادتهای بد»، «S4-نظرات واقعی»، «S1-ترسها و نگرانیها» تغییر کرده است. ‘، و S5-در نظر گرفتن اقدامات حفاظتی علمی. تغییرات معنایی در استان گوانگدونگ عمدتاً بر روی «S10-در خانه ماندن و انجام اقدامات احتیاطی لازم»، «S6-انتشار مثبتاندیشی و تشویق»، «S3-محکوم کردن عادات بد»، «S4-نظرات واقعی»، «S5-گرفتن» متمرکز بود. اقدامات حفاظتی علمی، S1-ترس ها و نگرانی ها، و S15-نگرانی های اپیدمی جهانی. استان سیچوان تحت سلطه «S6- گسترش مثبت و تشویق»، «S10-در خانه ماندن و انجام اقدامات احتیاطی لازم»، «S3-محکوم کردن عادات بد»، «S4-نظرات واقعی» و «S5- اتخاذ تدابیر حفاظتی علمی» بود. ‘. ‘S5- اتخاذ اقدامات حفاظتی علمی’، ‘S1-ترس ها و نگرانی ها’، و ‘S15- نگرانی های اپیدمی جهانی’. استان سیچوان تحت سلطه «S6- گسترش مثبت و تشویق»، «S10-در خانه ماندن و انجام اقدامات احتیاطی لازم»، «S3-محکوم کردن عادات بد»، «S4-نظرات واقعی» و «S5- اتخاذ تدابیر حفاظتی علمی» بود. ‘. ‘S5- اتخاذ اقدامات حفاظتی علمی’، ‘S1-ترس ها و نگرانی ها’، و ‘S15- نگرانی های اپیدمی جهانی’. استان سیچوان تحت سلطه «S6- گسترش مثبت و تشویق»، «S10-در خانه ماندن و انجام اقدامات احتیاطی لازم»، «S3-محکوم کردن عادات بد»، «S4-نظرات واقعی» و «S5- اتخاذ تدابیر حفاظتی علمی» بود. ‘.
5. بحث
با ادغام استخراج موضوع، شبکه های پیچیده و GIS، این چارچوب به طور شهودی تکامل مکانی، زمانی و معنایی موضوعات پاسخ های کاربران Weibo به COVID-19 را نشان می دهد. در طول دوران شیوع کووید-19، شبکههای تغییر معنایی کاربران Weibo قابلیت گسترش آشکاری داشتند. افزایش میانگین وزنی و میانگین ضریب خوشهبندی منعکسکننده تغییرات مکرر و مکرر کاربران رسانههای اجتماعی بین موضوعات مختلف است که نشاندهنده نگرانی کاربرانی است که سعی در درک همه جوانب و جزئیات رویدادها داشتند. با گذشت زمان، تغییر معنایی موضوعات کاربران شبکه های اجتماعی به تدریج بر روی چند موضوع متمرکز شد و شاخص های شبکه تثبیت شد. این یافته ها با یافته های مطالعات قبلی در مورد حوادث مختلف فاجعه سازگار است. او [ 31] دریافت که کاربران رسانه های اجتماعی به احتمال زیاد بلافاصله بعد از یک رویداد موضوع را در توییت های خود تغییر می دهند. ژانگ [ 43 ] دریافت که توجه عمومی در مراحل اولیه حوادث فاجعه به سرعت گسترش می یابد و سپس به تدریج کاهش می یابد، تا اینکه در نهایت مردم دیگر توجهی به فاجعه نمی کنند.
از منظر روش شناختی، مطالعات قبلی پویایی معنایی بر تجزیه و تحلیل تغییرات زمانی- مکانی تعداد یا موضوعات موضوعات [ 7 ، 24 ، 25 ] یا بهبود الگوریتم مدل های موضوعی از منظر پردازش زبان طبیعی تمرکز کرده اند [ 30 ].]. در این مقاله، فرآیند تکامل معنایی پیچیده کاربران Weibo به یک شبکه پیچیده نگاشت میشود و تغییرات در معنایشناسی کاربر به تغییراتی در ساختار شبکه تبدیل میشود. با در نظر گرفتن ویژگیهای مکانی و زمانی دادههای رسانههای اجتماعی، شبکه تغییر معنایی را به طور سیستماتیک تعریف کردیم و ویژگیهای زمانی، مکانی و معنایی پویا رفتار عمومی را در طول شیوع COVID-19 توصیف کردیم.
از دیدگاه معناشناسی، این مقاله تحلیلی از تکامل موضعی عمومی در طول کووید-19 در چین را ارائه میکند. از 9 ژانویه 2020 تا 10 مارس 2020، روند کلی افکار عمومی چین منطقی و مثبت است. با توجه به تمرکز مختلف موضوعات، تکامل معنایی کاربر را می توان به چهار مرحله تقسیم کرد که با توسعه رویداد COVID-19 مطابقت دارد. در مرحله اول موضوعات کمتر و شبکه پراکنده بود. تغییرات معنایی عمدتاً در S5 همگرا شدند. در مرحله دوم، تعداد متون مرتبط Weibo و رویدادهای تغییر معنایی به شدت افزایش یافت. تغییرات اصلی در این مرحله روی S10، S6، S4 و S5 متمرکز شد. در مرحله سوم، وضعیت اپیدمی داخلی در چین شروع به بهبود کرد و وضعیت اپیدمی خارجی شروع به تخمیر کرد. تغییرات موضوع عمدتاً روی S3 متمرکز است، S6 و S4. پس از 10 فوریه، S14 و S15 ظاهر شدند. مرحله چهارم زمانی بود که وضعیت اپیدمی در چین تثبیت شد در حالی که تعداد موارد تایید شده در جهان افزایش مداوم داشت. در این مرحله تغییرات معنایی اصلی بین S15، S6، S4 و S3 بوده است. نتایج ما با کارهای قبلی سازگار است، که در آن احساسات عمومی به شدت با عناصر بیرونی مرتبط بود، به عنوان مثال، تأثیر رسانه های رسمی، رویدادهای اجتماعی مهم، آب و هوای خشونت آمیز، و تعطیلات عمومی [12 ، 44 ].
از نظر توزیع فضایی، منطقه پکن-تیانجین-هبی، منطقه دلتای رودخانه یانگ تسه، استان هوبی، استان سیچوان، و استان گوانگدونگ مناطقی بودند که موضوعات کاربران اغلب تغییر میکردند و عمدتاً در میان S6، S10، S3 و S4 تغییر میکردند. با این حال، تمرکز افکار عمومی در مناطق مختلف متفاوت بود. تغییرات بین S1، S5 و S15 در منطقه پکن-تیانجین-هبی و استان گوانگدونگ بسیار مکرر بود، در حالی که تغییرات موضوعی S1 و S5 در دلتای رودخانه یانگ تسه و استان هوبی برجستهتر بود و تنها S5 در منطقه برجسته بود. استان سیچوان
با این وجود، این مطالعه دارای محدودیت هایی است. اول، جمعیت شناسی کاربران رسانه های اجتماعی ساختار سنی جوان تر را نشان می دهد [ 14]، که باعث می شود آن را نماینده جمعیت عمومی نباشد. علاوه بر این، همه دادههای Weibo شامل مختصات جغرافیایی نیستند، بنابراین تجزیه و تحلیل فضایی نمیتواند برای همه دادهها اعمال شود. دوم، به دلیل محرمانه بودن، این مطالعه رابطه جغرافیایی-اجتماعی بین کاربران را نادیده می گیرد، که برای تجزیه و تحلیل ویژگی های مکانی و زمانی تغییرات معنایی مهم است. تحقیقات آتی باید بر سوگیری جغرافیایی رسانه های اجتماعی متمرکز شود و الگوی تکامل مکانی، زمانی و معنایی افکار عمومی در شبکه های اجتماعی را بررسی کند. ثالثاً، در شرایط عادی (وضعیت غیر اضطراری)، موضوعات ارتباطی در رسانه های اجتماعی (مثلا توییتر) مربوط به روال زندگی روزمره، فعالیت های انسانی و علایق مانند مدرسه، کار، ورزش، قرار ملاقات، لباس پوشیدن، موسیقی، و غذا [ 2 ، 3]. در شرایط اضطراری، رفتارهای عمومی مرتبط با بلایا در مدت زمان کوتاهی به تعداد زیاد بروز میکند. تفاوتهای اجتماعی-جغرافیایی رفتار عمومی بین وضعیت عادی و غیرعادی شایسته تحقیقات بیشتر است.
6. نتیجه گیری
از دیدگاه روششناختی برای توصیف پویایی واکنشهای رفتاری کاربران رسانههای اجتماعی به رویدادهای فاجعهبار در زمان، مکان و معناشناسی، این مقاله یک چارچوب تحلیلی جدید از کاربران رسانههای اجتماعی، متشکل از استخراج موضوع، مدل تکامل معنایی کاربر و GIS پیشنهاد میکند. تحلیل فضایی مدل تکامل معنایی کاربر به طور سیستماتیک تغییرات معنایی کاربران رسانه های اجتماعی را تعریف می کند. نگاشت تکامل معنایی موضوعات کاربر به فضا-زمان جغرافیایی؛ و ویژگیهای تکامل مکانی، زمانی و معنایی پویا موضوعات کاربر را در طول یک رویداد فاجعه نشان داد. با توجه به رویداد COVID-19، این مطالعه عملی بودن و اثربخشی چارچوب را بر اساس دادههای Sina Weibo تأیید کرد. چارچوب پیشنهادی با ویژگیهای عمومیت و قابل اجرا برای سایر دادههای رسانههای اجتماعی است. این یک مبنای روش شناختی برای استخراج جامع و تجزیه و تحلیل رفتار کاربران رسانه های اجتماعی در طول حوادث فاجعه فراهم می کند. در شرایط اضطراری، این چارچوب می تواند ارزیابی موقعیت را بهبود بخشد، به تصمیم گیرندگان کمک کند تا افکار عمومی را بهتر درک کنند و از تحلیلگران در تخصیص مناسب منابع حمایت کند.
این تحقیق را می توان در چند جهت گسترش داد. اول، تحقیقات آینده می تواند تحلیل تغییر معنایی را از دیدگاه کاربران عمیق تر کند. با مشاهده تغییر معنایی تک تک کاربران و تلفیق آنها با روابط جغرافیایی و اجتماعی میان آنها، می توان تغییرات معنایی کاربران گروهی را جمع آوری کرد تا الگوی تغییر معنایی گروهی را در طول حوادث فاجعه بررسی کند. دوم، برای نتایج تجزیه و تحلیل و تجسم، لازم است یک پلت فرم تجزیه و تحلیل تجسم جغرافیایی تغییر معنایی کاربر تعاملی ایجاد شود که بتواند به صورت بصری توزیع مکانی- زمانی تغییرات معنایی کاربر، شبکه های اجتماعی جغرافیایی کاربر، الگوهای تغییر معنایی کاربر را نمایش دهد و به صورت تعاملی تجزیه و تحلیل کند. و اطلاعات آماری در حوادث بلایا. سوم، ما هر متن Weibo را با توجه به احتمالات موجود در لیست موضوعات سند تولید شده توسط مدل LDA در این مطالعه، به موضوعی که بیشتر شبیه آن بود، اختصاص دادیم. در واقع، یک پست Weibo ممکن است حاوی چندین موضوع باشد. موضوعات متعدد متون رسانه های اجتماعی نیز موضوعی جالب و معنادار است که ارزش مطالعه عمیق را دارد.
بدون دیدگاه