چکیده
:
داده های رسانه های اجتماعی حاوی اطلاعات بیان شده در زمان واقعی، از جمله متن و موقعیت جغرافیایی است. به عنوان یک منبع داده جدید برای تحقیقات رفتار جمعی در عصر کلان داده، می تواند برخی از جنبه های رفتار ساکنان را منعکس کند. در این مطالعه، یک مدل طبقهبندی متن بر اساس چارچوب BERT و Transformers ساخته شد که برای طبقهبندی و استخراج بیش از 210000 فعالیت جشنواره ساکنان بر اساس 1.13 میلیون داده Sina Weibo (تویتر چینی) جمعآوریشده از پکن در سال استفاده شد. داده های 2019 بر این اساس، آمار بسامد کلمه، تحلیل بخشی از گفتار، مدل موضوع، تحلیل احساسات و روشهای دیگر برای درک انواع مختلف فعالیتهای جشنواره و تحلیل کمی تفاوتهای فضایی انواع جشنوارهها مورد استفاده قرار گرفت. نتایج نشان میدهد که فرهنگ سنتی به طور قابلتوجهی بر جشنوارههای ساکنان تأثیر میگذارد، که نشاندهنده انگیزه ساکنان برای شرکت در جشنوارهها و نحوه شرکت ساکنان در جشنوارهها و ابراز احساساتشان است. تفاوت های فضایی آشکاری بین ساکنین در شرکت در فعالیت های جشنواره وجود دارد. فعالیت های اصلی جشنواره در منطقه مرکزی در جاده حلقه پنجم در پکن توزیع می شود. در مقابل، ابراز احساسات در طول جشنواره عمدتاً در خارج از جاده کمربندی پنجم در پکن توزیع می شود. این تحقیق فناوری پردازش زبان طبیعی، تحلیل مدل موضوعی، تحلیل آماری فضایی و سایر فناوریها را ادغام میکند. همچنین می تواند زمینه کاربرد داده های رسانه های اجتماعی، به ویژه داده های متنی را گسترش دهد. که یک الگوی تحقیقاتی جدید برای مطالعه فعالیتهای جشنواره ساکنان ارائه میکند و درک ساکنان از جشنواره را اضافه میکند. نتایج تحقیق مبنایی برای طراحی و مدیریت سیستم جشنواره چینی فراهم می کند.
کلید واژه ها:
داده های رسانه های اجتماعی ؛ فعالیت های جشنواره ; ادراکات شهروندان ; تحلیل فراوانی کلمه ; تجزیه و تحلیل موضوع
1. مقدمه
جشنواره ها یکی از فرهنگ های معرف یک کشور، ملت یا منطقه هستند. آنها کارکردهای متعددی مانند جمع آوری اجماع اجتماعی، به ارث بردن فرهنگ سنتی و غنی سازی زندگی معنوی دارند [ 1 ]. در روند نوسازی و جهانی شدن و با رشد اقتصادی، شرایط زندگی مدنی به تدریج بهبود یافته است. در ارتباط با این موضوع، استقلال زندگی ساکنان شهر افزایش یافته است و گزینهها برای فعالیتهای جشنواره افزایش یافته است [ 1 ، 2 ]. چگونگی دسترسی کامل به فرهنگ و عملکردهای متنوع جشنوارههای سنتی چین و احیای فرهنگ سنتی چینی و غنیسازی آن، موضوعاتی هستند که در حال حاضر مورد توجه عموم جامعه چین هستند.
در روند جهانی شدن و مدرن شدن، تضادها و مبادلات بین فرهنگ های مختلف به تدریج افزایش یافته است. مطالعات نسبتا کمی در مورد استفاده از کلان داده برای درک فرهنگی جشنواره وجود دارد. چارچوبهای تحقیقاتی رایجتر مورد استفاده برای بررسی آداب و رسوم عامیانه و فعالیتهای اجتماعی مبتنی بر تجزیه و تحلیل در طول وضعیت واقعی، همراه با تحلیل نظری است، و سپس برای پیشنهاد گزینههای مدیریتی استفاده میشود [ 3 ، 4 ]]. مطالعات زیادی در مورد میراث و توسعه جشنوارههای چینی از دیدگاهها انجام شده است و این موارد پیشرفتهایی را ارائه کردهاند. ژانگ پیشنهاد کرد که جشنوارههای چینی در دوران توسعه هستند و پیشنهاداتی در مورد طراحی جشنوارههای چینی از منظر تاریخ و فولکلور ارائه کرد [ 1 ]. وانگ به طور مختصر میراث و توسعه جشنواره های سنتی چینی در هنگ کنگ، ماکائو و تایوان را مرور کرد [ 5 ]. لی از روش هایی مانند تحقیقات میدانی، نظرسنجی پرسشنامه و مطالعات ادبیات برای تجزیه و تحلیل وضعیت جشنواره های سنتی چین و پیشنهاد پیشرفت های بیشتر استفاده کرد [ 6 ]]. اما باید توجه داشت که روش جمع آوری اطلاعات مربوطه بر اساس سفرهای میدانی، نظرسنجی پرسشنامه یا مصاحبه هزینه های زمانی و مالی بالایی دارد و تابع پرسشنامه است [ 7 ]. محدودیت در طراحی، قوانین مصاحبه و عوامل ذهنی شخصی به شدت بر صحت داده ها تأثیر گذاشته بود و از آنجایی که مقیاس زمانی و مکانی پوشش نمونه کوچک بود، خطر خاصی برای قابلیت اطمینان داده ها و نتیجه گیری وجود داشت. از آنجایی که بیشتر تحقیقات در مورد جشنوارهها و روشهای پژوهشی فرهنگ مبتنی بر سفرهای میدانی، نظرسنجی پرسشنامه، تحقیق ادبیات و سایر روشها بود [ 8 و 9 ].
با پذیرش گسترده دستگاه های تلفن همراه و خدمات مبتنی بر مکان، داده های رسانه های اجتماعی به طور فزاینده ای توجه محققان را به دلیل پایگاه کاربر بزرگ، اطلاعات مکانی و زمانی و معنایی غنی و هزینه کم دسترسی به خود جلب کرده است [ 10 ، 11 ]. در همین حال، درک اینکه چگونه گفتمان محاورهای در شبکههای اجتماعی آنلاین از نظر معنایی و جغرافیایی در طول زمان تغییر میکند، به آشکار کردن تغییرات پویای روابط بین فردی و ردپای دیجیتالی رویدادهای اجتماعی کمک میکند [ 12 ].]. Xie و دیگران از دادههای ورود به سیستم پلت فرم رسانه اجتماعی Sina Weibo در پکن در سال 2016 استفاده کردند. آنها از الگوریتم TF-IDF (اصطلاح فرکانس معکوس سند فرکانس) بر اساس اطلاعات موقعیت جغرافیایی و خوشهبندی فضایی برای مکانیابی نقاط داغ در پکن استفاده کردند. به منظور بررسی تفاوت های اجتماعی و فرهنگی و رفتارهای جمعیتی بین مناطق مختلف پکن [ 13 ].
مطالعه رفتار مردم برای برنامه ریزی و طراحی شهری و بهبود استانداردهای زندگی ساکنان اهمیت زیادی دارد [ 14 ، 15 ]. روشهای سنتی جمعآوری دادههای رفتار انسانی مانند نظرسنجیها فقط برای پروژههای تحقیقاتی نمونه کوچک مناسب هستند. علاوه بر این، این روشها زمانبر و پرهزینه هستند و بهروزرسانی نتایج بهدستآمده دشوار است. در سالهای اخیر، مردم تمایل دارند اطلاعات شخصی مفیدی را در رسانههای اجتماعی فاش کنند [ 16]. چگونگی استخراج کامل دادههای رسانههای اجتماعی برای به دست آوردن نظرات ساکنان در مورد جشنوارهها به موضوع مهم تحقیقات فعلی تبدیل شده است. گارای از رسانه های اجتماعی (به ویژه توییتر) برای تجزیه و تحلیل سهم بالقوه جشنواره ها در تولید تصویر مقصد جشنواره استفاده کرد، اما اهداف تحقیقاتی آنها بیشتر بر ارزش تجاری جشنواره ها متمرکز بود [ 17 ]. ژو داده های Sina Weibo را از سال 2012 تا 2014 مربوط به پنج جشنواره سنتی جشنواره بهار، جشنواره فانوس، جشنواره Qingming، جشنواره قایق اژدها و جشنواره نیمه پاییز انتخاب کرد. درک مردم از جشنوارههای سنتی چین و تفاوتهای منطقهای در درک آنها از جشنوارههای سنتی با استفاده از تحلیل بسامد کلمه و تحلیل تم LDA [ 18 ] مورد بررسی قرار گرفت.
تحقیقات مرتبط موجود به نتایج مهمی در تحقیقات در مورد فعالیت های جشنواره و ادراکات انسانی دست یافته است [ 10 ، 19 ]. لیو و دیگران از داده های رسانه های اجتماعی برای مطالعه فعالیت های روزانه ساکنان استفاده کردند. بر این اساس، چارچوب پیشنهادی تجزیه و تحلیل معنایی متنی، روش آماری و تکنیکهای فضایی را ادغام میکند، حوزههای کاربردی دادههای رسانههای اجتماعی، بهویژه دادههای متنی را گسترش میدهد و الگوی جدیدی برای تحقیق در مورد فعالیتهای ساکنان و رفتار فضایی-زمانی ارائه میکند [ 20 ].]. با این حال، مطالعات نسبتا کمی در مورد تجزیه و تحلیل فعالیت های جشنواره ساکنان از دو جنبه، متن کاوی و تحلیل فضا وجود دارد. بنابراین، هنوز جای زیادی برای تحقیق در مورد فعالیت های جشنواره بر اساس داده های رسانه های اجتماعی وجود دارد. ما دادههای غیرقابل پیشبینی، پراکنده و نامنظم را که در شبکههای اجتماعی مبتنی بر مکان ظاهر میشوند، پردازش میکنیم و این دادههای نامشخص و پر سر و صدا با برچسبگذاری جغرافیایی را به اطلاعات مفید و با ساختار خوب در سطح بالا تبدیل میکنیم [ 21 ، 22 ] (به عنوان مثال، فضا برای رویدادهای جشنواره توزیع می شود). Minatel پیشنهاد کرد که هنگام استفاده از نقاط ماندن برای ساخت LBSN، اطلاعات بسیار بیشتری را ارائه می دهد زیرا سیاهههای GPS اطلاعات تحرک بیشتری را به کاربران منتقل می کنند [ 23 ]]. توضیح آسان این موضوع، تصمیم گیری بهتر برای ساخت جشنواره بیشتر، کار بسیار چالش برانگیزی است. تحقیقات نسبتا کمی با استفاده از داده های بزرگ از این منظر وجود داشت. بنابراین، هنوز جای زیادی برای تحقیق در مورد فعالیت های جشنواره بر اساس داده های رسانه های اجتماعی وجود دارد.
در مقیاس کوچک، مانند منطقه یا شهر، مقایسه برداشت ساکنان از جشنواره های مختلف نیاز به تحقیقات بیشتری دارد. با پذیرش گسترده دستگاه های تلفن همراه و خدمات مبتنی بر مکان، داده های رسانه های اجتماعی به طور فزاینده ای توجه محققان را به دلیل پایگاه کاربر بزرگ، اطلاعات مکانی و زمانی و معنایی غنی و هزینه کم دسترسی به خود جلب کرده است [ 10 ، 11 ]. در همین حال، درک اینکه چگونه گفتمان محاورهای در شبکههای اجتماعی آنلاین از نظر معنایی و جغرافیایی در طول زمان تغییر میکند، به آشکار کردن تغییرات پویای روابط بین فردی و ردپای دیجیتالی رویدادهای اجتماعی کمک میکند [ 12 ].]. Xie و دیگران از دادههای ورود به سیستم برای پلت فرم رسانه اجتماعی Sina Weibo در پکن در سال 2016 استفاده کردند. آنها از الگوریتم TF-IDF (اصطلاح فرکانس معکوس سند فرکانس) بر اساس اطلاعات موقعیت جغرافیایی و خوشهبندی فضایی برای مکانیابی نقاط داغ در پکن استفاده کردند. به منظور بررسی تفاوت های اجتماعی و فرهنگی و رفتارهای جمعیتی بین مناطق مختلف پکن [ 13 ].
با استفاده از تجزیه و تحلیل داده های بزرگ و روش های تحقیق متن کاوی، می توان نگرش ها، فعالیت ها و ترجیحات افراد در مناطق مختلف یک شهر را بررسی کرد و ویژگی های اجتماعی، فرهنگی و عملکردی نقاط داغ را آشکار کرد [ 24 ، 25 ]. چنین روشهای تحقیقی همچنین میتواند برای تقویت ادراک فرهنگی، کشف مفاهیم فرهنگی جشنوارههای سنتی چینی به منظور احیای جشنوارههای سنتی چینی، و ارائه پیشنهادات و راهحلهایی برای برآورده کردن الزامات عصر حاضر مورد استفاده قرار گیرد [ 26 ].
با استفاده از دادههای رسانههای اجتماعی از پلتفرم Sina Weibo، بر اساس متن و اطلاعات زمانی مکانی، فعالیتهای جشنواره ساکنان از دو جنبه بررسی میشود: متن کاوی و تحلیل فضایی. از طریق ادغام فناوری پردازش زبان طبیعی، تجزیه و تحلیل فضایی، تجزیه و تحلیل آماری و سایر ابزارهای فنی، یک الگوی تحقیقاتی جدید برای تحقیقات فرهنگ جشنواره ارائه می کند. این تحقیق بر ویژگی های رفتاری فعالیت های جشنواره ساکنان پکن و درک آنها از انواع جشنواره ها متمرکز است. ابتدا رفتارهای فعالیت های جشنواره با استخراج کلمات کلیدی و سایر اطلاعات از متن Weibo طبقه بندی می شود. سپس الگوهای فضایی اقدامات مختلف نقشه برداری می شوند. این پژوهش به بررسی ویژگیهای حسی و فضایی فعالیتهای جشنواره ساکنان میپردازد.
بقیه این مقاله به شرح زیر است. در بخش 2 ، جمع آوری داده ها و روش های تحقیق معرفی شده است. در بخش 3 ، نتایج مرتبسازی و طبقهبندی اطلاعات فعالیتهای جشنواره ساکنان تشریح شده و ویژگیهای معنایی، محتوای درک شده و الگوهای زمانی و مکانی فعالیتهای جشنواره ساکنان مورد تجزیه و تحلیل قرار میگیرد. در بخش 4 ، مزایا و معایب روش های تحقیق مورد استفاده در این مقاله مورد بحث قرار گرفته است. در نهایت، در بخش 5 ، مطالعه خود را خلاصه میکنیم، نتیجهگیری میکنیم و مسیرهای تحقیقاتی آینده را پیشنهاد میکنیم.
2. داده ها و روش ها
2.1. منطقه مطالعه
پکن پایتخت جمهوری خلق چین، یک شهر مرکزی ملی و یک شهر بزرگ است. مرکز سیاسی چین، مرکز فرهنگی، مرکز تبادل بین المللی و مرکز نوآوری علم و فناوری که توسط شورای دولتی تایید شده است. تا سال 2018، این شهر دارای 16 منطقه با مساحت 16410 کیلومتر مربع بود. در پایان سال 2019، جمعیت دائمی 21.536 میلیون نفر و جمعیت شهری 18.65 میلیون نفر بوده است. نرخ شهرنشینی 86.6 درصد بود. تولید ناخالص داخلی منطقه پکن 3537.13 میلیارد یوان بود. ارزش افزوده صنعت ثالث 83.5 درصد از تولید ناخالص داخلی منطقه را تشکیل می دهد [ 27 ]. پکن توسط شبکه تحقیقاتی جهانی سازی و شهرهای جهان (GaWC) به عنوان شهر درجه اول جهان رتبه بندی شد [ 28 ]]. طبق دادههای هفتمین سرشماری ملی چین، از مجموع 21.893 میلیون ساکن دائمی پکن، جمعیت 0 تا 14 ساله 11.9٪ است. جمعیت 15 تا 59 ساله 68.5٪ است. و جمعیت 60 ساله و بالاتر 19.6 درصد است [ 29 ]. پکن پایتختی باستانی با بیش از 3000 سال سابقه و دارای میراث تاریخی و فرهنگی غنی است. این شهر همچنین نماد و تصویر چین و دریچه اصلی برای نشان دادن چین به جهان است. همیشه در داخل و خارج از کشور توجه زیادی را به خود جلب کرده است.
2.2. داده ها
Sina Weibo یک پلتفرم رسانه اجتماعی با حجم زیادی از داده های رسانه های اجتماعی است. بر اساس گزارش توسعه کاربر Sina Weibo در سال 2020 [ 30 ]، تعداد کاربران فعال ماهانه این نرم افزار به 511 میلیون نفر رسید. آمار مرکز داده Weibo در دسامبر 2020 نشان می دهد که سینا ویبو در شهرهای درجه یک مانند پکن، شانگهای، گوانگژو و شنژن دارای نرخ پوشش بسیار بالایی از جمعیت شهر است [ 30 ].]. داده های سینا ویبو حاوی مقدار قابل توجهی از اطلاعات جغرافیایی مختلف است. از طریق نرم افزار Sina Weibo و ابزار خزنده وب، داده های Sina Weibo را برای سال 2019 از پکن به دست آوردیم و محتوای پست های Weibo را به صورت هدفمند ضبط کردیم. این داده ها شامل شناسه Weibo، طول و عرض جغرافیایی، زمان، پایانه تلفن همراه، منطقه، محتوای متنی و اطلاعات دیگر بود. در مجموع، بیش از 1.13 میلیون تکه داده به عنوان منبع داده برای این مطالعه به دست آمد ( شکل 1 ).
2.3. مواد و روش ها
2.3.1. طبقه بندی و استخراج Weibo مبتنی بر معنایی
در این تحقیق یک مدل طبقه بندی متن بر اساس چارچوب BERT و Transformers ساخته شد. مدل BERT نوعی رمزگذار زبان بود که توسط گوگل در سال 2018 منتشر شد و قادر بود جملات یا پاراگراف های ورودی را به ویژگی های معنایی متناظر ترجمه کند، که به طرز شگفت انگیزی عملکرد خوبی داشته و به یک پیشرفت مهم اخیر در NLP تبدیل شده است [ 31 ]. در این تحقیق، ما از کتابخانه Transformers ساده [ 32 ] که بر اساس کتابخانه Transformers توسط HuggingFace [ 33 ] است، برای ساخت مدل خود استفاده کردیم. مدل را می توان به سرعت آموزش و ارزیابی کرد.
ابتدا، بر اساس پاکسازی ۱٬۱۳۶٬۱۲۵ پست Weibo (حذف برچسبها، پیوست کردن ایمیلها، ارسال لینکها، عبارات، ویدیوها، اشتراکگذاری تصاویر و سایر اطلاعات غیرمرتبط با محتوای متن)، مدل از پیش آموزشدیده شده BERT-base-Chinese برای انجام طبقه بندی باینری راه اندازی شد. در مرحله دوم، 7000 پست به صورت تصادفی انتخاب شده به عنوان نمونه آموزشی برای آموزش مدل استفاده شد. برای هر پست، اگر مربوط به فعالیتهای جشنواره ساکنان بود، به عنوان 1 علامتگذاری میشد، در غیر این صورت 0 علامتگذاری میشد. سپس یادگیری ماشینی و مدل BERT اصلی برای تأیید صحت طبقهبندی استفاده شد. با تنظیم پارامترهای مربوطه و تعداد تکرارهای چند بار تحت آزمایش، یک مدل چند طبقهبندی متن آموزشدیده به دست آمد (دقت مدل به 97 درصد رسید). سوم، بر اساس طبقه بندی کننده مشتق شده، تمام ورودیهای Weibo برای طبقهبندی Weibo با ساکنان به BERT وارد شدند. پس از طبقه بندی و استخراج، 213649 پست در شبکه های اجتماعی مربوط به جشنواره بود.
2.3.2. آمار فراوانی کلمه
آمار فراوانی کلمه بر اساس الگوریتم TF-IDF برای ارزیابی اهمیت یک کلمه برای یک متن است. اگر یک کلمه یا عبارت خاص به طور مکرر در یک مقاله ظاهر می شود، و در مجموعه اسناد در پایین ظاهر می شود، این کلمه یا عبارت دارای توانایی خوبی برای تشخیص دسته ها در نظر گرفته می شود [ 34 ].
به طور خاص، ابتدا داده های Weibo بر اساس Jieba تقسیم بندی شدند. هدف این است که کلمات را در متن تقسیم کرده و متن را به ترتیب به چند کلمه تبدیل کنید. تقسیم بندی کلمات معادل استخراج ویژگی بود و کلمات استخراج شده را کلمات ویژگی می نامیدند. پس از به دست آوردن کلمات مشخصه، این تحقیق سپس از فرهنگ لغت سفارشی و پایگاه داده کلمات توقف استفاده کرد تا برخی از حروف اضافه و نمادها را فیلتر کند زیرا متن پیچیده تر و محتوای کلمه بزرگ بود. در نهایت واژههای مشخصهای که نقش عمدهای در طبقهبندی متن و تحلیل موضوع داشتند انتخاب شدند و به ترتیب اهمیت رتبهبندی شدند.
2.3.3. مدل موضوع LDA
تخصیص دیریکله نهفته (LDA) یکی از مدل های معمولی “کیسه کلمات” [ 34 ] است و دارای طیف گسترده ای از کاربردها است [ 35 ]. این یک مدل موضوع استاندارد است که می تواند با داده های رسانه های اجتماعی در جایی که مشکل متن کوتاه و پراکندگی زیاد وجود دارد کار کند [ 36 ]. ایده اصلی آن این است که متن به طور تصادفی مخلوط شده و از موضوعات ضمنی تولید می شود و هر موضوع مربوط به توزیع کلمه خاصی است [ 37 ].
این مطالعه یک ساختار بیزی سه لایه از “متن-موضوع-کلمه” را بر اساس داده های رسانه های اجتماعی ساخت. موضوع هر متن در مجموعه متن به صورت توزیع احتمال داده شده است تا موضوعات را بر اساس توزیع موضوع طبقه بندی کنیم. این تحقیق سعی در ایجاد فهرستی از موضوعات از طریق نتایج برای بررسی ویژگیهای فضایی فعالیتهای جشنواره ساکنان پکن و تجسم نتایج داشت [ 38 ].
2.3.4. تحلیل فضایی
تحلیل فضایی یک روش تحلیلی پرکاربرد در جغرافیا است [ 39 ]. در این تحقیق تمرکز اصلی بر توزیع مکانی داده ها است. روشهای مرتبط شامل تحلیل چگالی، تحلیل درونیابی فضایی، تجسم فضایی و اندازهگیری توزیع جغرافیایی [ 40 ] است. محتوای Weibo مربوط به جشنواره از طریق خوشه بندی موضوعی در فضا نمایش داده شد و تجزیه و تحلیل چگالی هسته برای مشاهده نقاط داغ در فضا انجام شد.
3. نتایج
3.1. آمار فراوانی کلمه رویداد جشن
جشنواره هایی با بیش از 10000 پست Weibo عبارت بودند از روز ملی، جشنواره نیمه پاییز، روز سال نو، روز کریسمس، جشنواره فانوس و شب کریسمس ( جدول 1 ). از آنجایی که سال 2019 هفتادمین سالگرد تأسیس جمهوری خلق چین بود، بیشتر پستهای Weibo مربوط به روز ملی بود. جایگاه خانواده در مفهوم مردم چین از جشنواره از نظر فرهنگی مهم است و از این رو جشنواره نیمه پاییز با موضوع دیدار مجدد خانوادگی دومین محتوای بزرگ مرتبط با جشنواره Weibo در سال 2019 بود.
همه 213649 پست Weibo مربوط به جشنواره از پکن در سال 2019 بر اساس آمار فراوانی کلمه مرتب شده اند ( شکل 3 ). از آنجایی که سال 2019 هفتادمین سالگرد تأسیس جمهوری خلق چین بود، فراوانی کلمات مربوط به روز ملی مانند «میهن»، «تولدت مبارک»، «70» زیاد بود. تعداد ورودی های مربوط به جشنواره نیمه پاییز نیز زیاد بود. در فعالیتهای جشنوارههای چینی، خوردن غذا به وضوح یک رفتار ضروری و راه اصلی شرکت مردم در جشنوارهها بود.
بر اساس تمام محتوای Weibo مربوط به جشنواره در سال 2019، محتوای اصلی درک ساکنان از جشنوارهها و روشهای اصلی شرکت در جشنوارهها در نمودارهای ابری word منعکس شد ( شکل 4 ). کلمات با فرکانس بالا با جشنوارههایی با تعداد زیادی پست Weibo در سال 2019 مطابقت دارد. برای مثال، کلماتی مانند “سرزمین مادری”، “چین” و “تولدت مبارک” نیز در نقشههای ابری کلمه برای روز ملی، اواسط پاییز منعکس شده است. جشنواره، سال نو، و سایر کلمات مرتبط. کلماتی مانند “خوردن” و “خوشمزه” نشان دهنده راه های اصلی شرکت ساکنان در جشنواره ها بود.
جشنواره ها به سه دسته جشنواره های سنتی، جشنواره های خارجی و جشنواره های مدرن تقسیم شدند که بر اساس تعداد پست های مرتبط از بیشترین به کمترین مرتب شدند و نسبت تعداد پست های انواع جشنواره در کل داده ها محاسبه شد. . نتایج در جدول 2 نشان داده شده است.
ساکنان پکن بیشترین تعداد پست های Weibo مربوط به جشنواره های سنتی را با 40.46 درصد ارسال کردند. در میان جشنهای سنتی، جشن نیمه پاییز با مضمون گردهمایی خانوادگی بیشتر مورد اشاره قرار گرفت. با این حال، تعداد پست های Weibo مربوط به جشنواره بهار نسبتا کم بود. این به این دلیل بود که بازه زمانی جشنواره بهار طولانی بود. فقط دادههای Weibo در روز تعطیل در اینجا استخراج شد، بنابراین انحراف در تعداد پستهای Weibo وجود داشت. علاوه بر این، کاربران Weibo معمولا جوان هستند و از این رو داده های پست Weibo ممکن است احساسات افراد میانسال و مسن را منعکس نکند.
جشنواره های سنتی ارتباط نزدیکی با تاریخ و فرهنگ چین دارند. به منظور بررسی میزان توجه به فرهنگ سنتی در Weibo، لازم است برخی از کلمات نسبتاً کم بسامد در کلمات مشخصه مورد تجزیه و تحلیل قرار گیرند ( جدول 3 ). فعالیت های جشنواره ساکنان به شدت تحت تأثیر فرهنگ سنتی است. این نه تنها در لباسها و مکانهایی مانند «هنفو» و «معبد کنفوسیوس» منعکس میشود. در جشنواره های سنتی تأثیر فرهنگ سنتی بیشتر نمایان است. “تا زمانی که بتواند زندگی کند!”، “از دور این لحظه را با من تقسیم می کنی.” و عبارات دیگر مربوط به جشنواره نیمه پاییز بیشتر ظاهر می شوند.
جشنوارههای خارجی 20.40 درصد از دادههای Weibo در روز جشنواره را تشکیل میدهند، که نشان میدهد جشنوارههای سنتی همچنان بر درک ساکنان از جشنوارهها غالب هستند. علاوه بر اینکه کریسمس و شب کریسمس نکات کلیدی احساس ساکنان از جشنواره های خارجی است، جشنواره های خارجی جایگاه مرکزی احساس ساکنان از جشنواره ها را اشغال نمی کنند. برای جشنواره های مدرن، تعداد پست های مربوط به روز ملی، که در آن ساکنان احساسات میهن پرستانه خود را بیان می کردند، حدود یک سوم از تعداد کل پست ها را تشکیل می داد.
همچنین دریافتیم که برخی از فعالیت های جشنواره، به ویژه برخی از جشنواره های خارجی، ارتباط خاصی با دین دارند ( جدول 4 ). در اطلاعات متنی منتشر شده نه تنها نام اعتقادات مذهبی به وضوح ذکر شده است، بلکه نام اماکن مذهبی در روز جشن به طور نسبی به چشم می خورد.
3.2. حس معنایی فعالیت های جشنواره
شکل 5 نسبت های داخلی انواع مختلف انواع مختلف داده های جشنواره و یک مقایسه طولی از همان نوع داده را نشان می دهد. میتوانید نوع یکسانی از دادههای جشنواره، نسبت بخشهای مختلف گفتار و انواع مختلف را بیابید. به خصوص در جشنواره های سنتی، افعال بیشترین نسبت کلمات را تشکیل می دهند که تفاوت قابل توجهی با سایر انواع جشنواره ها دارد. شکل 6 مقایسه افقی انواع مختلف داده های جشنواره مربوط به بخش های سخنرانی مشابه است. فستیوالهای مدرن بیشترین ویژگیهای تعطیلات را در اسمها دارند و جشنوارههای سنتی «خوردن» را به عنوان رایجترین فعل دارند.
اسامی منعکس کننده درک ساکنان از جشنواره ها، به ویژه نمادها و عناصر نماینده جشنواره ها بودند، به عنوان مثال، اسم های “کیک ماه”، “زونگزی” و “تانگیوان”، زیرا این غذاهای سنتی چینی در رابطه با جشنواره های سنتی استفاده می شد. به عنوان مثال، جشنواره نیمه پاییز، جشنواره قایق اژدها، و جشنواره فانوس، به ترتیب. واژههایی مانند بابا نوئل، هدیه کریسمس و سیب مربوط به جشنهای خارجی، یعنی کریسمس و شب کریسمس استفاده میشد. برای جشنواره های مدرن، کلماتی مانند “کشور مادر” و “چین” که مربوط به روز ملی است، اغلب استفاده می شد.
صرف نظر از نوع جشنواره، کلمه “شهر ممنوعه” اغلب ظاهر می شود. این نشان میدهد که جاذبههای محلی شهر ممنوعه به بخشی ضروری از جشنوارهها در نگرش ساکنان پکن تبدیل شده است و یک حمایت عاطفی و نماد فرهنگی ارائه میکند. در نهایت، نسبت اصطلاحات Weibo در هر نوع جشنواره نشان داد که نسبت جشنوارههای سنتی بزرگترین، تا 59 درصد است که نشان میدهد ساکنان بیشترین درک را از جشنوارههای سنتی دارند.
كليه كلمات با بسامد بالا بر حسب بخشي از گفتار و محتواي معنايي به چهار دسته تقسيم شدند. به عنوان مثال، مانند “خوردن”، “نوشیدن” و غیره در فعل گروهی. به منظور جمع بندی بهتر این گونه فعالیت ها، نام این واژه ها را «خوردن» گذاشتیم. به فعالیت هایی که در زندگی روزمره نیز می توان انجام داد، مانند «چک این» و «پیاده روی»، «فعالیت های اوقات فراغت» می گویند. به دلیل فضای محدود طبقه بندی های دیگر واژه ها، توضیح زیادی وجود ندارد. افعال منعکس کننده رفتارهای اصلی ساکنان شرکت کننده در جشنواره ها هستند. از فراوانی کلمات، رفتار ساکنان پکن که در جشنوارهها شرکت میکنند در بین انواع جشنوارهها نسبتاً یکنواخت به نظر میرسد ( شکل 6).). به عنوان مثال، کلماتی مانند “خوردن” و “چک این” نشان می دهد که رفتارهای اصلی ساکنان شرکت کننده در جشنواره ها با غذا خوردن مرتبط است. به نظر می رسد که «اعلام حضور» در فروشگاه های سلبریتی آنلاین به روشی مهم برای ساکنان پکن برای شرکت در جشنواره ها تبدیل شده است.
صفت ها عمدتاً بیان عاطفی ساکنان نسبت به جشنواره ها را نشان می دهند و انواع مختلف جشنواره ها با عبارات احساسی متفاوت مطابقت دارند. “چینگ مینگ” در جشنواره های سنتی با جشنواره چینگ مینگ مطابقت دارد. واژههایی مانند «آرامشآمیز»، «هموار» و «کامل» جلوههای فرهنگی جشنوارههای سنتی بودند. کلمه “صلح آمیز” در جشنواره های خارجی بیشتر ظاهر می شود که با آرزوی مردم برای صلح در شب کریسمس مطابقت دارد. صفتهای پرمصرف که برای جشنوارههای مدرن استفاده میشود، تمرکز ساکنان را در روز ملی منعکس میکند، به میهن ابراز غرور میکند و نظرات مثبتی را در مورد وضعیت موجود سرزمین مادری با صفاتی مانند “ایمن”، “قوی” و “کامیابی” نشان میدهد. “.
3.3. ویژگی های توزیع فضایی فعالیت های جشنواره
شکل 7 نقشه توزیع چگالی هسته پست های Weibo ساکنان پکن مربوط به جشنواره ها در سال 2019 را به طور کلی و بر اساس نوع جشنواره نشان می دهد. توزیع تراکم جشنوارههای سنتی تفاوت چندانی با جشنوارههای مدرن نداشت، اگرچه تراکم مرکزی پستهای ساکنان مربوط به جشنوارههای سنتی متراکمتر از جشنوارههای مدرن بود. تراکم جشنوارههای خارجی بسیار کمتر از جشنوارههای سنتی یا مدرن به نظر میرسد، اما به نظر میرسد مناطق زیادی بدون پست وجود دارد، که نشان میدهد جشنوارههای سنتی هنوز جایگاه اصلی رفتار و فرهنگ تعطیلات ساکنان چین را اشغال میکنند. این در تضاد با این تصور است که جشنواره های سنتی به طور قابل توجهی تحت تأثیر جشنواره های خارجی قرار گرفته اند.
3.4. حس موضوعی فعالیت های جشنواره
در بین 29 جشنواره در سال 2019، مدل تم LDA پست های مربوط به جشنواره را به سه نوع تقسیم کرد: بیان احساسی پست ها؛ رفتار خاص ساکنان؛ و فرهنگ نماینده جشنواره مربوطه. فعالیتهای جشنواره ساکنان تقریباً به دو دسته تقسیم میشد: غذا خوردن با اقوام و دوستان و رفتن به رستورانهای مختلف برای چکاین. رفتن به جاذبه های گردشگری متعدد و فعالیت های جشنواره. تحلیل مدل LDA برای سه نوع جشنواره اعمال شد. مدرن، سنتی، و خارجی، و نتایج به ArcGIS برای تجزیه و تحلیل فضایی موضوعی وارد شدند.
در 5 موضوع، هر موضوع به طور مساوی در فضا توزیع شد، اما مبحث 2 بیشترین توزیع را در فضا داشت ( شکل 8 ). با مقایسه جدول 5 ، کلمات پر بسامد مبحث 2 عمدتاً با جشنواره نیمه پاییز و جشنواره بهار مطابقت دارند، مانند «کیک ماه»، «تجمع مجدد»، «سال خوک» و «موفق باشید».
توزیع فضای موضوعی جشنواره های خارجی به اندازه جشنواره های سنتی گسترده نبود، اما تفاوت های فضایی آشکاری در توزیع فضای موضوعی وجود دارد ( شکل 9 ). موضوع 1 عمدتاً در منطقه خارج از جاده کمربندی پنجم در پکن توزیع شده است و موضوع 4 عمدتاً در منطقه داخل جاده حلقه پنجم توزیع شده است. با توجه به موضوع کلمات با بسامد بالا در جدول 6موضوع 1 عمدتاً با ادراک عاطفی ساکنین و بیان آن از جشنواره با کلماتی مانند “شادی”، “امید” و “آرامش” مرتبط بود. موضوع 4 عمدتاً مربوط به رفتارهای خاص ساکنان شرکت کننده در جشنواره ها بود، مانند “هدایای کریسمس” و “سیب”، به این معنی که ساکنان شرکت کننده در کریسمس عمدتا هدایایی و سیب می دهند تا توجه خود را به اقوام و دوستان ابراز کنند.
تم 2 و موضوع 3 برای جشنواره های مدرن نیز تفاوت های فضایی قابل توجهی را نشان دادند ( شکل 10 ). ترکیب با کلمات با بسامد بالا در جدول 7 ، کلمات با بسامد بالا در موضوع 2 شامل «سال نو مبارک»، «رژه نظامی»، «امید»، «آتش بازی»، «میدان تیانآنمن» و کلمات دیگر، که برخی از آنها بهترین آرزوها را برای اهالی در طول جشنواره بیان کرد. بخش دیگر عمدتاً به تشریح نمادهای نماینده و عناصر تشکیل دهنده جشنواره ها به ویژه روز ملی پرداخت. واژههای با بسامد موضوع 3، مانند «خوشمزه»، «چک این» و «طعم» با غذا و خوردن مرتبط بودند.
با تلفیق تفاوتهای توزیع فضایی موضوع جشنوارههای خارجی، میتوان نتیجه گرفت که نحوه اصلی شرکت ساکنان در جشنوارهها با کمال زیرساختها ارتباط دارد. در رفتارهای خاص جشنواره، ساکنان شهر مرکزی پکن می توانند در فعالیت های مختلف جشنواره شرکت کنند، بنابراین بیشتر محتوای موجود در Weibo رفتارهای خاص جشنواره را منعکس می کند. ساکنانی که در حومه پکن زندگی می کنند ممکن است به دلیل دسترسی به چنین زیرساخت هایی محدود شده باشند. بنابراین، مردم با توجه به جشنواره یا مفهوم فرهنگی خود جشنواره، خواسته های بیشتری را در مورد محتوای Weibo ابراز کردند.
4. بحث
بیشتر تحقیقات جاری در مورد جشنواره ها و فرهنگ از طریق نظرسنجی و سفرهای میدانی انجام می شود و به ندرت از داده های بزرگ برای تجزیه و تحلیل موضوعات مرتبط استفاده می شود. بنابراین، بسیاری از محققان به ضرورت استفاده از داده های رسانه های اجتماعی برای انجام تحقیقات در مورد فعالیت های جشنواره پی برده اند [ 4 ]. برای مثال، تحقیقات ژو عمدتاً از آمار فراوانی کلمات و مدلهای تم LDA برای شناسایی درک ساکنان از جشنوارههای سنتی و تفاوتهای منطقهای استفاده میکند [ 18 ]. طبق نتایج تحقیقات آنها، طبقه بندی موضوع LDA بدیهی است که روشی قدرتمند برای تجزیه و تحلیل داده های رسانه های اجتماعی، متن کاوی و آشکارسازی ویژگی های مکانی-زمانی فعالیت های مرتبط است. مطالعه ای توسط لیو [ 41] ویژگی های عاطفی گردشگران چینی به استرالیا را بر اساس تجزیه و تحلیل متن کلان داده و برچسب گذاری بخشی از گفتار مورد مطالعه قرار داد. این روش ها همگی تحلیل متنی فعالیت های جشنواره را گسترش می دهند. با این حال، تحقیق فوق فاقد کاوی جامع از اطلاعات معنایی غنی و اطلاعات مکانی-زمانی در داده های رسانه های اجتماعی است. بنابراین، این تحقیق از فناوری NLP برای شناسایی پستهای Weibo مرتبط با جشنواره استفاده میکند و آمار فراوانی کلمات، برچسبگذاری متن، مدلهای موضوع LDA و روشهای تحلیل فضایی GIS را برای تجزیه و تحلیل ویژگیهای درک ساکنان از جشنوارهها و فعالیتها ترکیب میکند.
جودیت مایر و کارین وبر [ 3] خاطرنشان کرد: بسیاری از مطالعات در زمینه تحلیل جشنواره رویکرد مطالعه موردی را اتخاذ کرده اند. بنابراین تحقیق در مورد جشنواره های ویژه نسبتاً کافی است، اما مطالعه تطبیقی جامع بسیاری از جشنواره ها وجود ندارد. می توان گفت که این امر دامنه و مقیاس درک ما از جشنواره را محدود می کند. بنابراین، امیدواریم با گسترش دامنه تحقیقات در مورد انواع جشنواره ها، درک ساکنین از جشنواره های مختلف را بهبود بخشیم. از طریق مقایسه انواع مختلف جشنواره ها، این تحقیق نشان داد که متون Weibo نشان دهنده توجه بیشتر ساکنان به جشنواره های مختلف است. جشنوارههای سنتی همچنان مورد توجه گستردهتری قرار میگیرند. از تحلیل موضوعی می توان دریافت که ویژگی های مشترکی بین انواع مختلف جشنواره ها وجود دارد. مثلا، توجه به فعالیت های اوقات فراغت و غذا بسیار برجسته است. همچنین ابراز تبریک به خانواده و دوستان از طریق جشنواره ها جهانی است. با این حال، همچنین می توان دریافت که در بین انواع مختلف جشنواره ها، جشنواره های سنتی بیشتر با تاریخ و فرهنگ مرتبط هستند، در حالی که جشنواره های مدرن بیشتر با اوقات فراغت و مصرف مرتبط هستند. جشنواره های غربی بیشتر با مصرف و سرگرمی مرتبط بوده اند و در عین حال برخی آثار مذهبی را حفظ کرده اند. چنین مطالعه جامعی برای درک عمیق مفاهیم جشنواره ها و توسعه اجتماعی و اقتصادی اهمیت زیادی دارد. جشنواره های سنتی بیشتر با تاریخ و فرهنگ مرتبط هستند، در حالی که جشنواره های مدرن بیشتر با اوقات فراغت و مصرف مرتبط هستند. جشنواره های غربی بیشتر با مصرف و سرگرمی مرتبط بوده اند و در عین حال برخی آثار مذهبی را حفظ کرده اند. چنین مطالعه جامعی برای درک عمیق مفاهیم جشنواره ها و توسعه اجتماعی و اقتصادی اهمیت زیادی دارد. جشنواره های سنتی بیشتر با تاریخ و فرهنگ مرتبط هستند، در حالی که جشنواره های مدرن بیشتر با اوقات فراغت و مصرف مرتبط هستند. جشنواره های غربی بیشتر با مصرف و سرگرمی مرتبط بوده اند و در عین حال برخی آثار مذهبی را حفظ کرده اند. چنین مطالعه جامعی برای درک عمیق مفاهیم جشنواره ها و توسعه اجتماعی و اقتصادی اهمیت زیادی دارد.
در مقیاس فضایی، این مطالعه پدیده جالبی را در الگوی فضایی فعالیت های جشنواره ساکنان در یک شهر غول پیکر یافت. اگرچه مناطق تجمع برای انواع مختلف جشنواره ها در مراکز شهری پرجمعیت متمرکز شده است، فعالیت های جشنواره های سنتی و دامنه توزیع جشنواره های مدرن به طور قابل توجهی بیشتر از جشنواره های خارجی در غرب است. ما معتقدیم نحوه شرکت ساکنان در جشنواره ها به میزان زیرساخت ها به ویژه تعداد امکانات تفریحی مانند پذیرایی و خدمات مرتبط است. در عین حال، تفاوت منطقه ای فعالیت های جشنواره در داخل شهر نیز عدم تعادل در ساختار شهری پکن را ثابت می کند، یعنی قسمت شمالی شهر پراکنده تر از ناحیه جنوبی است.شکل 7 ) [ 42 ]. همانطور که ویلسون [ 4 ] بر نقش مهم جشنواره ها برای جوامع محلی تاکید کرد. با افزایش امکانات مرتبط با جشنواره در مناطق توسعه نیافته شهری، می توان توسعه متوازن شهر را نیز ارتقا داد. اما این تحقیق چالش جدیدی را نیز مطرح می کند، یعنی تفاوت شرق و غرب شهر نیز آشکارتر است. این بخش از دلیل نیاز به بررسی عمیق دارد.
نتایج این تحقیق نشان میدهد که میتوان با استفاده از دادههای بزرگ رسانههای اجتماعی، برداشت ساکنان از جشنوارهها را درک کرد. با این حال، طبق گزارش توسعه کاربران Weibo 2020، کاربران Weibo عمدتاً افراد 20 تا 30 ساله هستند و نزدیک به 80٪ از کاربران را تشکیل می دهند [ 23 ]. بنابراین، دادههای رسانههای اجتماعی بیشتر یک گروه نسبتاً جوان هستند و دادهها با سوگیری نمونه و نمایندگی مشکل دارند. برای حل این مشکل، در تحقیقات بعدی می توان از پرسشنامه های سنتی و روش های دیگر برای تکمیل نمونه های پژوهش با ترکیب منابع متعدد داده ها برای جبران مشکل انحراف نمونه داده های رسانه های اجتماعی استفاده کرد.
5. نتیجه گیری ها
این مطالعه از دادههای رسانههای اجتماعی برای مطالعه درک ساکنان از جشنوارهها و ویژگیهای فضایی فعالیتها استفاده میکند. با استفاده از یک مدل طبقهبندی متن بر اساس چارچوب BERT و Transformers، دادههای رسانههای اجتماعی Weibo مربوط به جشنوارههای پکن را در سال 2019 تجزیه و تحلیل کردیم. ما برداشت ساکنان پکن از جشنوارهها و روشهای شرکت آنها در جشنوارهها را به دست آوردیم و تفاوتهای فضایی ساکنان را بررسی کردیم. شرکت در فعالیت های جشنواره
با استفاده از آمار بسامد کلمات، تجزیه و تحلیل بخشی از گفتار و تحلیل مدل موضوعی LDA، دادههای رسانههای اجتماعی Weibo مربوط به جشنوارههای پکن را در سال 2019 تجزیه و تحلیل کردیم. ما برداشت ساکنان پکن از جشنوارهها و روشهای شرکت آنها در جشنوارهها را بهدست آوردیم و بررسی کردیم. تفاوت های فضایی مشارکت ساکنان در فعالیت های جشنواره
فرهنگ سنتی تأثیر زیادی بر جشنواره ها داشت که نه تنها در انگیزه ساکنان برای شرکت در جشنواره ها، بلکه در نحوه شرکت آنها در جشنواره ها و احساسات آنها نیز منعکس می شود. جشنواره های سنتی جایگاه مرکزی درک ساکنین از جشنواره ها را به خود اختصاص دادند. این با نگرانی های فعلی که جشنواره های سنتی به شدت تحت تأثیر جشنواره های خارجی قرار گرفته اند متفاوت بود. احساسات خانواده و مادری در جشنواره های مدرن جایگاه اصلی را به خود اختصاص داد. این به وضوح در فراوانی کلمات و توزیع فضایی موضوع آشکار شد. برای جشنواره های سنتی، ساکنان احساسات خود را از طریق اشعار باستانی از فرهنگ سنتی چین بیان می کردند. به عنوان مثال، برای جشنواره های سنتی، به طور مکرر از کلماتی مانند “در مناسبت های جشن بیشتر از هر زمان دیگری به عزیزان خود فکر می کنید. (每逢佳节倍思亲)”، “تا آنجا که بتواند زندگی خواهد کرد! (但愿人长久)»، و آیات دیگر در رابطه با انواع دیگر اعیاد به کار نمی رفت. نحوه شرکت ساکنان در جشنواره ها به میزان زیرساخت ها به ویژه تعداد امکانات تفریحی مانند پذیرایی و خدمات مرتبط است. اکثر پوسترهای Weibo از مناطق درون شهری رفتارهای خاص مربوط به جشنواره را نشان میدهند که نشان میدهد آنها مستقیماً در فعالیتهای جشنواره شرکت میکنند، در حالی که پوسترهای منطقه بیرونی شهر اغلب آرزوهای تعطیلات را بیان میکنند. علاوه بر این، برخی از فعالیت های جشنواره ساکنان مربوط به اعتقادات مذهبی بود که بازتاب سنت های فرهنگی و مفاهیم پشت جشنواره در انواع مختلف جشنواره ها بود. و از آیات دیگر در رابطه با انواع دیگر اعیاد استفاده نمی شد. نحوه شرکت ساکنان در جشنواره ها به میزان زیرساخت ها به ویژه تعداد امکانات تفریحی مانند پذیرایی و خدمات مرتبط است. اکثر پوسترهای Weibo از مناطق درون شهری رفتارهای خاص مربوط به جشنواره را نشان میدهند که نشان میدهد آنها مستقیماً در فعالیتهای جشنواره شرکت میکنند، در حالی که پوسترهای منطقه بیرونی شهر اغلب آرزوهای تعطیلات را بیان میکنند. علاوه بر این، برخی از فعالیت های جشنواره ساکنان مربوط به اعتقادات مذهبی بود که بازتاب سنت های فرهنگی و مفاهیم پشت جشنواره در انواع مختلف جشنواره ها بود. و از آیات دیگر در رابطه با انواع دیگر اعیاد استفاده نمی شد. نحوه شرکت ساکنان در جشنواره ها به میزان زیرساخت ها به ویژه تعداد امکانات تفریحی مانند پذیرایی و خدمات مرتبط است. اکثر پوسترهای Weibo از مناطق درون شهری رفتارهای خاص مربوط به جشنواره را نشان میدهند که نشان میدهد آنها مستقیماً در فعالیتهای جشنواره شرکت میکنند، در حالی که پوسترهای منطقه بیرونی شهر اغلب آرزوهای تعطیلات را بیان میکنند. علاوه بر این، برخی از فعالیت های جشنواره ساکنان مربوط به اعتقادات مذهبی بود که بازتاب سنت های فرهنگی و مفاهیم پشت جشنواره در انواع مختلف جشنواره ها بود. به ویژه تعداد امکانات تفریحی مانند پذیرایی و خدمات. اکثر پوسترهای Weibo از مناطق درون شهری رفتارهای خاص مربوط به جشنواره را نشان میدهند که نشان میدهد آنها مستقیماً در فعالیتهای جشنواره شرکت میکنند، در حالی که پوسترهای منطقه بیرونی شهر اغلب آرزوهای تعطیلات را بیان میکنند. علاوه بر این، برخی از فعالیت های جشنواره ساکنان مربوط به اعتقادات مذهبی بود که بازتاب سنت های فرهنگی و مفاهیم پشت جشنواره در انواع مختلف جشنواره ها بود. به ویژه تعداد امکانات تفریحی مانند پذیرایی و خدمات. اکثر پوسترهای Weibo از مناطق درون شهری رفتارهای خاص مربوط به جشنواره را نشان میدهند که نشان میدهد آنها مستقیماً در فعالیتهای جشنواره شرکت میکنند، در حالی که پوسترهای منطقه بیرونی شهر اغلب آرزوهای تعطیلات را بیان میکنند. علاوه بر این، برخی از فعالیت های جشنواره ساکنان مربوط به اعتقادات مذهبی بود که بازتاب سنت های فرهنگی و مفاهیم پشت جشنواره در انواع مختلف جشنواره ها بود.
از طریق تجزیه و تحلیل الگوی توزیع فضایی میکروبلاگ های مرتبط با جشنواره، می توان دریافت که اطلاعات زمانی و مکانی داده های رسانه های اجتماعی می تواند به درک ویژگی های ساختار فضایی شهری کمک کند. فعالیت های جشنواره ساکنان در مراکز شهری پرجمعیت و توسعه یافته اقتصادی متمرکز شده است. تفاوت های منطقه ای بین فعالیت های جشنواره شمال و جنوب در داخل شهر نیز با ویژگی های ساختار فضایی شهری پکن مطابقت دارد. با این حال، این مطالعه نشان داد که تفاوت بین بخش شرقی و غربی شهر نیز بسیار مشهود است. این کشف چالش جدیدی را ارائه می کند. دلایل تفاوت فضاهای شرقی و غربی فعالیت ساکنان نیاز به بررسی عمیق دارد.
این مطالعه از دادههای رسانههای اجتماعی برای مطالعه درک ساکنان از جشنوارهها و ویژگیهای فضایی فعالیتها استفاده میکند. ترکیب فناوری پردازش زبان طبیعی، تجزیه و تحلیل آماری، برچسبگذاری بخشی از گفتار، تجزیه و تحلیل موضوع و تحلیل فضایی، الگوی جدیدی برای تحقیق در زمینه جشنوارهها فراهم میکند. با این حال، مدل موضوع LDA دارای کاستی های خاصی در پردازش داده های پراکنده رسانه های اجتماعی است. این امر مستلزم پیشرفت های بعدی در فناوری پردازش داده است. مشکل سوگیری نمونه در دادههای رسانههای اجتماعی وجود دارد که نمیتواند وضعیت افراد میانسال و سالخورده را که کمتر از رسانههای اجتماعی استفاده میکنند به خوبی منعکس کند. در تحقیق پیگیری می توان از روش های سنتی پیمایش پرسشنامه برای تکمیل نمونه ها با داده های چند منبعی استفاده کرد. تفاوتهای فضایی فعالیتهای جشنواره ساکنان که در این پژوهش یافت میشود، در حال حاضر تنها از منظر کیفی قابل توصیف است. در آینده امیدواریم که مطالعات بیشتر بتواند دلایل تفاوت های فضایی را از منظر کمی توضیح دهد.
مشارکت های نویسنده
مفهومسازی، روششناسی، نگهداری دادهها، نوشتن-بررسی و ویرایش، Bingqing Wang، Bin Meng و Juan Wang. تحقیق، نرم افزار، تجسم، نوشتن – آماده سازی اصلی و پیش نویس، Bingqing Wang، Siyu Chen و Jian Liu. کسب بودجه و مدیریت پروژه، بن منگ و خوان وانگ. همه نویسندگان نسخه منتشر شده نسخه خطی را خوانده و با آن موافقت کرده اند.
منابع مالی
این تحقیق توسط برنامه تحقیق و توسعه کلید ملی چین (Grant Nos. 2017YFB0503605)، بنیاد ملی علوم طبیعی چین (Grant Nos. 41671165) و پروژههای تحقیقاتی دانشگاهی دانشگاه اتحادیه پکن (Grant Nos. ZK40202001) تامین شده است.
بیانیه در دسترس بودن داده ها
داده ها در صورت درخواست معقول از نویسندگان در دسترس است.
قدردانی
مایلیم از بازبینان ناشناس برای نظرات روشنگر و کمک قابل توجه آنها در بهبود این مقاله تشکر کنیم. ما همچنین از Dongsheng Zhan برای ارائه داده های ارزشمند و پشتیبانی فنی تشکر می کنیم.
تضاد علاقه
نویسندگان هیچ تضاد منافع را اعلام نمی کنند.
منابع
- Zhang, B. ساخت جشنواره های چینی در عصر سازندگی. مردم. گل میخ. 2015 ، 1 ، 62-73. [ Google Scholar ]
- تای، XC تجزیه و تحلیل وضعیت وراثت جشنواره های سنتی چینی و تحقیق در مورد اقدامات متقابل توسعه. علم هنر تکنولوژی 2019 ، 32 ، 105-106. [ Google Scholar ]
- مایر، جی. وبر، ک. تحقیق رویداد و جشنواره: بررسی و جهت گیری های تحقیق. بین المللی جشنواره رویداد J. مدیریت 2019 ، 10 ، 209–216. [ Google Scholar ] [ CrossRef ]
- ویلسون، جی. ارشد، ن. شاو، ای. پرت، تی. گسترش دامنه تحقیقات جشنواره: دستور کار بررسی و تحقیق. بین المللی جی. مناگ. Rev. 2017 , 19 , 195-213. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- وانگ، XW وراثت و توسعه جشنواره های سنتی چینی در هنگ کنگ، ماکائو و تایوان. فرقه میراث. بیمون. 2013 ، 2 ، 23-30. [ Google Scholar ]
- گروه پژوهشی «ترویج فرهنگ جشنواره». وضعیت موجود و اقدام متقابل توسعه میراث سنتی جشنواره چینی. صد Sch. هنر 2012 ، 28 ، 1-4.
- وونگ، ک. Domroes، M. درک کاربران از پارک Kowloon، هنگ کنگ: الگوهای بازدید و جنبه های منظره. چانه. Geogr. علمی 2004 ، 14 ، 269-275. [ Google Scholar ] [ CrossRef ]
- شوانن، تی. Kwan، MP اینترنت، تلفن همراه و محدودیتهای فضا-زمان. Geoforum 2008 , 39 , 1362–1377. [ Google Scholar ] [ CrossRef ]
- باتی، م. Axhausen، KW; جیانوتی، اف. پوزدنوخوف، ا. بذانی، ع. واچوویچ، ام. اوزونیس، جی. پرتغالی، ی. شهرهای هوشمند آینده. یورو فیزیک J. Spec. بالا. یورو 2012 ، 214 ، 481-518. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- ژانگ، اف. ژو، بی. لیو، ال. لیو، ی. Fung، HH; لین، اچ. راتی، سی. اندازه گیری ادراک انسان از یک منطقه شهری در مقیاس بزرگ با استفاده از یادگیری ماشین. Landsc. طرح شهری. 2018 ، 180 ، 148-160. [ Google Scholar ] [ CrossRef ]
- لیو، ی. یوان، YH; ژانگ، اف. استخراج ادراکات شهری از داده های رسانه های اجتماعی. جی. اسپات. بین المللی علمی 2020 ، 20 ، 51-55. [ Google Scholar ]
- کویلو، سی. مدلسازی و تجسم تکامل معنایی و مکانی-زمانی موضوعات در ارتباطات بین فردی در توییتر. بین المللی جی. جئوگر. Inf. علمی 2019 ، 33 ، 805-832. [ Google Scholar ] [ CrossRef ]
- Xie، YJ; پنگ، ایکس. هوانگ، Z. ادراک تصویر. حکومت پکن داده های میکروبلاگ مبتنی بر هات اسپات. Prog. Geogr. 2017 ، 36 ، 1099-1110. [ Google Scholar ]
- Kestens، Y.; لبل، ا. دانیل، م. تریو، ام. Pampalon، R. استفاده از فضاهای فعالیت با تجربه برای اندازه گیری قرار گرفتن در معرض مواد غذایی. Health Place 2010 ، 16 ، 1094-1103. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- والی، جی. کادوت، ای. روستیت، سی. پاریزوت، آی. Chauvin، P. نقش تحرک روزانه در نابرابری های سلامت روان: تأثیر تعاملی فضای فعالیت و محله محل سکونت بر افسردگی. Soc. علمی پزشکی 2011 ، 73 ، 1133-1144. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- مارتی، پ. سرانو-استرادا، ال. Nolasco-Cirugeda، A. داده های رسانه های اجتماعی: چالش ها، فرصت ها و محدودیت ها در مطالعات شهری. محاسبه کنید. محیط زیست سیستم شهری 2019 ، 74 ، 161-174. [ Google Scholar ] [ CrossRef ]
- گارای، ال. مورالس، اس. درک ایجاد تصاویر مقصد از طریق گفتگوی توییتری جشنواره. بین المللی جشنواره رویداد J. مدیریت 2017 ، 8 ، 39-54. [ Google Scholar ] [ CrossRef ]
- ژو، جی. وانگ، جی آر. ژانگ، درک JQ و تفاوتهای منطقهای جشنوارههای سنتی چینی توسط کاربران Weibo. J. Geo-Inf. علمی 2019 ، 21 ، 77–85. [ Google Scholar ] [ CrossRef ]
- لیو، ی. لیو، ایکس. گائو، اس. گونگ، ال. کانگ، سی. ژی، ی. چی، جی. شی، ال. حس اجتماعی: رویکردی جدید برای درک محیط های اجتماعی-اقتصادی ما. ان دانشیار صبح. Geogr. 2015 ، 105 ، 512-530. [ Google Scholar ] [ CrossRef ]
- لیو، جی. منگ، بی. وانگ، جی. چن، اس. تیان، بی. ژی، جی. بررسی الگوهای فضایی-زمانی فعالیتهای روزانه ساکنان با استفاده از دادههای رسانههای اجتماعی مبتنی بر متن: مطالعه موردی پکن، چین. ISPRS Int. J. Geo-Inf. 2021 ، 10 ، 389. [ Google Scholar ] [ CrossRef ]
- Carmela, C. NexT: چارچوبی برای پیش بینی مکان بعدی در شبکه های اجتماعی مبتنی بر مکان. بدانید. سیستم مبتنی بر 2020 ، 204 ، 106205. [ Google Scholar ]
- حسن، م. Orgun، MA; Schwitter, R. نظرسنجی در مورد تشخیص رویداد در زمان واقعی از جریان داده توییتر. J. Inf. علمی 2018 ، 44 ، 443-463. [ Google Scholar ] [ CrossRef ]
- میناتل، دی. فریرا، وی. Lopes، ADA وضوح نهاد محلی برای ساخت شبکه های اجتماعی مبتنی بر مکان با استفاده از نقاط اقامت. نظریه. محاسبه کنید. علمی 2021 ، 851 ، 62-76. [ Google Scholar ] [ CrossRef ]
- حسن، س. ژان، XY; Ukkusuri، SV درک فعالیت های انسانی شهری و الگوهای تحرک با استفاده از داده های مبتنی بر مکان در مقیاس بزرگ از رسانه های اجتماعی آنلاین. در مجموعه مقالات دومین کارگاه بین المللی ACM SIGKDD در محاسبات شهری، شیکاگو، IL، ایالات متحده آمریکا، 11 اوت 2013. [ Google Scholar ]
- مایر، اس وی؛ Cukier, K. Big Data: انقلابی که نحوه زندگی، کار و تفکر ما را متحول خواهد کرد، چاپ مجدد ویرایش. ; Houghton Mifflin Harcourt: Boston, MA, USA, 2013. [ Google Scholar ]
- لیو، ی. بازاندیشی برخی مسائل اساسی جغرافیای انسانی از منظر ادراک اجتماعی. Acta Geogr. گناه 2016 ، 71 ، 564-575. [ Google Scholar ]
- سالنامه آماری پکن 2020. در دسترس آنلاین: https://nj.tjj.beijing.gov.cn/nj/main/2020-tjnj/zk/indexch.htm (در 25 مه 2021 قابل دسترسی است).
- جهان بر اساس GaWC 2018. موجود به صورت آنلاین: https://www.lboro.ac.uk/gawc/world2018t.html (دسترسی در 25 مه 2021).
- اطلاعیه هفتمین سرشماری سراسری شهرداری پکن (شماره 3). در دسترس آنلاین: https://www.beijing.gov.cn/gongkai/shuju/sjjd/202105/t20210519_2392888.html (در 28 ژوئن 2021 قابل دسترسی است).
- گزارش توسعه کاربر Weibo 2020. در دسترس آنلاین: https://weibo.com/ttarticle/p/show?id=2309404613871951282183 (در 19 مه 2021 قابل دسترسی است).
- دولین، جی. چانگ، مگاوات؛ تره فرنگی.؛ Toutanova، K. BERT: پیش آموزش ترانسفورماتورهای عمیق دو جهته برای درک زبان. در مجموعه مقالات کنفرانس 2019 بخش آمریکای شمالی انجمن زبانشناسی محاسباتی، مینیاپولیس، MN، ایالات متحده آمریکا، 2 تا 7 ژوئن 2019؛ صص 4171-4186. [ Google Scholar ]
- در دسترس آنلاین: https://github.com/ThilinaRajapakse/simpletransformers (در 5 ژوئیه 2021 قابل دسترسی است).
- ولف، تی. چاوموند، جی. اولین، ال. Sanh، V. دلانگ، سی. موی، ا. سیستاک، پی. فونتوویچ، ام. دیویسون، جی. شلیفر، اس. و همکاران Trans-formers: پیشرفته ترین پردازش زبان طبیعی. در مجموعه مقالات کنفرانس 2020 در مورد روش های تجربی در پردازش زبان طبیعی: نمایش سیستم، آنلاین، 5 تا 10 ژوئیه 2020؛ صص 38-45. [ Google Scholar ]
- لی، آر. ژانگ، WB کاربرد فناوری داده کاوی بر اساس الگوریتم TF-IDF و مدل موضوعی LDA در متن شکایت مشتری قدرت. فنی خودکار Appl. 2018 ، 37 ، 46-50. [ Google Scholar ]
- گائو، تی تی. لیو، WZ; منگ، بی. هوانگ، اس. چن، SY مطالعه ادراک مناطق فشرده منابع فرهنگی مدل بر اساس موضوع-مطالعه موردی منطقه منتوگو پکن. J. دانشگاه اتحادیه پکن. 2019 ، 33 ، 45-55. [ Google Scholar ]
- وانگ، پی. گائو، سی. چن، تحقیقات XM در مورد مدل LDA بر اساس خوشه بندی متن. Inf. علمی 2015 ، 33 ، 63-68. [ Google Scholar ]
- Blei، DM; Ng، AY؛ جردن، MI تخصیص دیریکله نهفته. جی. ماخ. فرا گرفتن. Res. 2003 ، 3 ، 993-1022. [ Google Scholar ]
- بهره دار، ع. Purves، RS شرح و توصیف ویژگیهای مکان با استفاده از مدلسازی موضوع بر روی برچسبهای جغرافیایی مرجع. ژئو اسپات. Inf. علمی 2018 ، 21 ، 173-184. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- ژای، جی. روش تحلیل فضایی جین، XC GIS در برنامه ریزی شهری. طرح شهری. 2014 ، 38 ، 130-135. [ Google Scholar ]
- نیش، ی. Yan, W. ردیابی موضوعات جغرافیایی شهری بر اساس مدل موضوع پویا. محاسبه کنید. محیط زیست سیستم شهری 2020 , 79 , 101419. [ Google Scholar ] [ CrossRef ]
- لیو، ی. هوانگ، KX; بائو، جی جی. چن، کی کیو به صداها از خانه گوش کنید: تحلیلی از احساسات گردشگران چینی در مورد مقاصد استرالیا. تور. مدیریت 2019 ، 71 ، 337-347. [ Google Scholar ] [ CrossRef ]
- سان، ز. شی، پی. تحلیل تفاوت منطقه ای توسعه شهری در پکن. شهری. توسعه دهنده گل میخ. 2012 ، 19 ، 56-59. [ Google Scholar ]

شکل 1. مکان داده های Weibo در جشنواره های پکن.

شکل 2. چارچوب تحقیق فعالیت های جشنواره ساکنان بر اساس داده های رسانه های اجتماعی.

شکل 3. نقشه فرکانس کلمه.

شکل 4. تصویر ابری کلمه از پست های Weibo مربوط به جشنواره.

شکل 5. درصد نتایج بخشی از گفتار از پستهای Weibo مربوط به جشنواره، تقسیم بر نوع جشنواره. سایه آبی-اسم; سایه نارنجی – افعال; سایه سبز – صفت.

شکل 6. آمار نتیجه بخشی از گفتار از پست های Weibo مربوط به جشنواره، تقسیم بر نوع جشنواره.

شکل 7. نقشه تراکم هسته فعالیت های جشنواره ساکنان پکن.

شکل 8. نقشه توزیع فضایی LDA جشنواره های سنتی.

شکل 9. نقشه توزیع فضایی LDA جشنواره های خارجی.

شکل 10. نقشه توزیع فضایی LDA جشنواره های مدرن.
بدون دیدگاه