چکیده

:

داده های رسانه های اجتماعی حاوی اطلاعات بیان شده در زمان واقعی، از جمله متن و موقعیت جغرافیایی است. به عنوان یک منبع داده جدید برای تحقیقات رفتار جمعی در عصر کلان داده، می تواند برخی از جنبه های رفتار ساکنان را منعکس کند. در این مطالعه، یک مدل طبقه‌بندی متن بر اساس چارچوب BERT و Transformers ساخته شد که برای طبقه‌بندی و استخراج بیش از 210000 فعالیت جشنواره ساکنان بر اساس 1.13 میلیون داده Sina Weibo (تویتر چینی) جمع‌آوری‌شده از پکن در سال استفاده شد. داده های 2019 بر این اساس، آمار بسامد کلمه، تحلیل بخشی از گفتار، مدل موضوع، تحلیل احساسات و روش‌های دیگر برای درک انواع مختلف فعالیت‌های جشنواره و تحلیل کمی تفاوت‌های فضایی انواع جشنواره‌ها مورد استفاده قرار گرفت. نتایج نشان می‌دهد که فرهنگ سنتی به طور قابل‌توجهی بر جشنواره‌های ساکنان تأثیر می‌گذارد، که نشان‌دهنده انگیزه ساکنان برای شرکت در جشنواره‌ها و نحوه شرکت ساکنان در جشنواره‌ها و ابراز احساساتشان است. تفاوت های فضایی آشکاری بین ساکنین در شرکت در فعالیت های جشنواره وجود دارد. فعالیت های اصلی جشنواره در منطقه مرکزی در جاده حلقه پنجم در پکن توزیع می شود. در مقابل، ابراز احساسات در طول جشنواره عمدتاً در خارج از جاده کمربندی پنجم در پکن توزیع می شود. این تحقیق فناوری پردازش زبان طبیعی، تحلیل مدل موضوعی، تحلیل آماری فضایی و سایر فناوری‌ها را ادغام می‌کند. همچنین می تواند زمینه کاربرد داده های رسانه های اجتماعی، به ویژه داده های متنی را گسترش دهد. که یک الگوی تحقیقاتی جدید برای مطالعه فعالیت‌های جشنواره ساکنان ارائه می‌کند و درک ساکنان از جشنواره را اضافه می‌کند. نتایج تحقیق مبنایی برای طراحی و مدیریت سیستم جشنواره چینی فراهم می کند.

 

1. مقدمه

جشنواره ها یکی از فرهنگ های معرف یک کشور، ملت یا منطقه هستند. آنها کارکردهای متعددی مانند جمع آوری اجماع اجتماعی، به ارث بردن فرهنگ سنتی و غنی سازی زندگی معنوی دارند [ 1 ]. در روند نوسازی و جهانی شدن و با رشد اقتصادی، شرایط زندگی مدنی به تدریج بهبود یافته است. در ارتباط با این موضوع، استقلال زندگی ساکنان شهر افزایش یافته است و گزینه‌ها برای فعالیت‌های جشنواره افزایش یافته است [ 1 ، 2 ]. چگونگی دسترسی کامل به فرهنگ و عملکردهای متنوع جشنواره‌های سنتی چین و احیای فرهنگ سنتی چینی و غنی‌سازی آن، موضوعاتی هستند که در حال حاضر مورد توجه عموم جامعه چین هستند.
در روند جهانی شدن و مدرن شدن، تضادها و مبادلات بین فرهنگ های مختلف به تدریج افزایش یافته است. مطالعات نسبتا کمی در مورد استفاده از کلان داده برای درک فرهنگی جشنواره وجود دارد. چارچوب‌های تحقیقاتی رایج‌تر مورد استفاده برای بررسی آداب و رسوم عامیانه و فعالیت‌های اجتماعی مبتنی بر تجزیه و تحلیل در طول وضعیت واقعی، همراه با تحلیل نظری است، و سپس برای پیشنهاد گزینه‌های مدیریتی استفاده می‌شود [ 3 ، 4 ]]. مطالعات زیادی در مورد میراث و توسعه جشنواره‌های چینی از دیدگاه‌ها انجام شده است و این موارد پیشرفت‌هایی را ارائه کرده‌اند. ژانگ پیشنهاد کرد که جشنواره‌های چینی در دوران توسعه هستند و پیشنهاداتی در مورد طراحی جشنواره‌های چینی از منظر تاریخ و فولکلور ارائه کرد [ 1 ]. وانگ به طور مختصر میراث و توسعه جشنواره های سنتی چینی در هنگ کنگ، ماکائو و تایوان را مرور کرد [ 5 ]. لی از روش هایی مانند تحقیقات میدانی، نظرسنجی پرسشنامه و مطالعات ادبیات برای تجزیه و تحلیل وضعیت جشنواره های سنتی چین و پیشنهاد پیشرفت های بیشتر استفاده کرد [ 6 ]]. اما باید توجه داشت که روش جمع آوری اطلاعات مربوطه بر اساس سفرهای میدانی، نظرسنجی پرسشنامه یا مصاحبه هزینه های زمانی و مالی بالایی دارد و تابع پرسشنامه است [ 7 ]. محدودیت در طراحی، قوانین مصاحبه و عوامل ذهنی شخصی به شدت بر صحت داده ها تأثیر گذاشته بود و از آنجایی که مقیاس زمانی و مکانی پوشش نمونه کوچک بود، خطر خاصی برای قابلیت اطمینان داده ها و نتیجه گیری وجود داشت. از آنجایی که بیشتر تحقیقات در مورد جشنواره‌ها و روش‌های پژوهشی فرهنگ مبتنی بر سفرهای میدانی، نظرسنجی پرسش‌نامه، تحقیق ادبیات و سایر روش‌ها بود [ 8 و 9 ].
با پذیرش گسترده دستگاه های تلفن همراه و خدمات مبتنی بر مکان، داده های رسانه های اجتماعی به طور فزاینده ای توجه محققان را به دلیل پایگاه کاربر بزرگ، اطلاعات مکانی و زمانی و معنایی غنی و هزینه کم دسترسی به خود جلب کرده است [ 10 ، 11 ]. در همین حال، درک اینکه چگونه گفتمان محاوره‌ای در شبکه‌های اجتماعی آنلاین از نظر معنایی و جغرافیایی در طول زمان تغییر می‌کند، به آشکار کردن تغییرات پویای روابط بین فردی و ردپای دیجیتالی رویدادهای اجتماعی کمک می‌کند [ 12 ].]. Xie و دیگران از داده‌های ورود به سیستم پلت فرم رسانه اجتماعی Sina Weibo در پکن در سال 2016 استفاده کردند. آنها از الگوریتم TF-IDF (اصطلاح فرکانس معکوس سند فرکانس) بر اساس اطلاعات موقعیت جغرافیایی و خوشه‌بندی فضایی برای مکان‌یابی نقاط داغ در پکن استفاده کردند. به منظور بررسی تفاوت های اجتماعی و فرهنگی و رفتارهای جمعیتی بین مناطق مختلف پکن [ 13 ].
مطالعه رفتار مردم برای برنامه ریزی و طراحی شهری و بهبود استانداردهای زندگی ساکنان اهمیت زیادی دارد [ 14 ، 15 ]. روش‌های سنتی جمع‌آوری داده‌های رفتار انسانی مانند نظرسنجی‌ها فقط برای پروژه‌های تحقیقاتی نمونه کوچک مناسب هستند. علاوه بر این، این روش‌ها زمان‌بر و پرهزینه هستند و به‌روزرسانی نتایج به‌دست‌آمده دشوار است. در سال‌های اخیر، مردم تمایل دارند اطلاعات شخصی مفیدی را در رسانه‌های اجتماعی فاش کنند [ 16]. چگونگی استخراج کامل داده‌های رسانه‌های اجتماعی برای به دست آوردن نظرات ساکنان در مورد جشنواره‌ها به موضوع مهم تحقیقات فعلی تبدیل شده است. گارای از رسانه های اجتماعی (به ویژه توییتر) برای تجزیه و تحلیل سهم بالقوه جشنواره ها در تولید تصویر مقصد جشنواره استفاده کرد، اما اهداف تحقیقاتی آنها بیشتر بر ارزش تجاری جشنواره ها متمرکز بود [ 17 ]. ژو داده های Sina Weibo را از سال 2012 تا 2014 مربوط به پنج جشنواره سنتی جشنواره بهار، جشنواره فانوس، جشنواره Qingming، جشنواره قایق اژدها و جشنواره نیمه پاییز انتخاب کرد. درک مردم از جشنواره‌های سنتی چین و تفاوت‌های منطقه‌ای در درک آن‌ها از جشنواره‌های سنتی با استفاده از تحلیل بسامد کلمه و تحلیل تم LDA [ 18 ] مورد بررسی قرار گرفت.
تحقیقات مرتبط موجود به نتایج مهمی در تحقیقات در مورد فعالیت های جشنواره و ادراکات انسانی دست یافته است [ 10 ، 19 ]. لیو و دیگران از داده های رسانه های اجتماعی برای مطالعه فعالیت های روزانه ساکنان استفاده کردند. بر این اساس، چارچوب پیشنهادی تجزیه و تحلیل معنایی متنی، روش آماری و تکنیک‌های فضایی را ادغام می‌کند، حوزه‌های کاربردی داده‌های رسانه‌های اجتماعی، به‌ویژه داده‌های متنی را گسترش می‌دهد و الگوی جدیدی برای تحقیق در مورد فعالیت‌های ساکنان و رفتار فضایی-زمانی ارائه می‌کند [ 20 ].]. با این حال، مطالعات نسبتا کمی در مورد تجزیه و تحلیل فعالیت های جشنواره ساکنان از دو جنبه، متن کاوی و تحلیل فضا وجود دارد. بنابراین، هنوز جای زیادی برای تحقیق در مورد فعالیت های جشنواره بر اساس داده های رسانه های اجتماعی وجود دارد. ما داده‌های غیرقابل پیش‌بینی، پراکنده و نامنظم را که در شبکه‌های اجتماعی مبتنی بر مکان ظاهر می‌شوند، پردازش می‌کنیم و این داده‌های نامشخص و پر سر و صدا با برچسب‌گذاری جغرافیایی را به اطلاعات مفید و با ساختار خوب در سطح بالا تبدیل می‌کنیم [ 21 ، 22 ] (به عنوان مثال، فضا برای رویدادهای جشنواره توزیع می شود). Minatel پیشنهاد کرد که هنگام استفاده از نقاط ماندن برای ساخت LBSN، اطلاعات بسیار بیشتری را ارائه می دهد زیرا سیاهههای GPS اطلاعات تحرک بیشتری را به کاربران منتقل می کنند [ 23 ]]. توضیح آسان این موضوع، تصمیم گیری بهتر برای ساخت جشنواره بیشتر، کار بسیار چالش برانگیزی است. تحقیقات نسبتا کمی با استفاده از داده های بزرگ از این منظر وجود داشت. بنابراین، هنوز جای زیادی برای تحقیق در مورد فعالیت های جشنواره بر اساس داده های رسانه های اجتماعی وجود دارد.
در مقیاس کوچک، مانند منطقه یا شهر، مقایسه برداشت ساکنان از جشنواره های مختلف نیاز به تحقیقات بیشتری دارد. با پذیرش گسترده دستگاه های تلفن همراه و خدمات مبتنی بر مکان، داده های رسانه های اجتماعی به طور فزاینده ای توجه محققان را به دلیل پایگاه کاربر بزرگ، اطلاعات مکانی و زمانی و معنایی غنی و هزینه کم دسترسی به خود جلب کرده است [ 10 ، 11 ]. در همین حال، درک اینکه چگونه گفتمان محاوره‌ای در شبکه‌های اجتماعی آنلاین از نظر معنایی و جغرافیایی در طول زمان تغییر می‌کند، به آشکار کردن تغییرات پویای روابط بین فردی و ردپای دیجیتالی رویدادهای اجتماعی کمک می‌کند [ 12 ].]. Xie و دیگران از داده‌های ورود به سیستم برای پلت فرم رسانه اجتماعی Sina Weibo در پکن در سال 2016 استفاده کردند. آنها از الگوریتم TF-IDF (اصطلاح فرکانس معکوس سند فرکانس) بر اساس اطلاعات موقعیت جغرافیایی و خوشه‌بندی فضایی برای مکان‌یابی نقاط داغ در پکن استفاده کردند. به منظور بررسی تفاوت های اجتماعی و فرهنگی و رفتارهای جمعیتی بین مناطق مختلف پکن [ 13 ].
با استفاده از تجزیه و تحلیل داده های بزرگ و روش های تحقیق متن کاوی، می توان نگرش ها، فعالیت ها و ترجیحات افراد در مناطق مختلف یک شهر را بررسی کرد و ویژگی های اجتماعی، فرهنگی و عملکردی نقاط داغ را آشکار کرد [ 24 ، 25 ]. چنین روش‌های تحقیقی همچنین می‌تواند برای تقویت ادراک فرهنگی، کشف مفاهیم فرهنگی جشنواره‌های سنتی چینی به منظور احیای جشنواره‌های سنتی چینی، و ارائه پیشنهادات و راه‌حل‌هایی برای برآورده کردن الزامات عصر حاضر مورد استفاده قرار گیرد [ 26 ].
با استفاده از داده‌های رسانه‌های اجتماعی از پلتفرم Sina Weibo، بر اساس متن و اطلاعات زمانی مکانی، فعالیت‌های جشنواره ساکنان از دو جنبه بررسی می‌شود: متن کاوی و تحلیل فضایی. از طریق ادغام فناوری پردازش زبان طبیعی، تجزیه و تحلیل فضایی، تجزیه و تحلیل آماری و سایر ابزارهای فنی، یک الگوی تحقیقاتی جدید برای تحقیقات فرهنگ جشنواره ارائه می کند. این تحقیق بر ویژگی های رفتاری فعالیت های جشنواره ساکنان پکن و درک آنها از انواع جشنواره ها متمرکز است. ابتدا رفتارهای فعالیت های جشنواره با استخراج کلمات کلیدی و سایر اطلاعات از متن Weibo طبقه بندی می شود. سپس الگوهای فضایی اقدامات مختلف نقشه برداری می شوند. این پژوهش به بررسی ویژگی‌های حسی و فضایی فعالیت‌های جشنواره ساکنان می‌پردازد.
بقیه این مقاله به شرح زیر است. در بخش 2 ، جمع آوری داده ها و روش های تحقیق معرفی شده است. در بخش 3 ، نتایج مرتب‌سازی و طبقه‌بندی اطلاعات فعالیت‌های جشنواره ساکنان تشریح شده و ویژگی‌های معنایی، محتوای درک شده و الگوهای زمانی و مکانی فعالیت‌های جشنواره ساکنان مورد تجزیه و تحلیل قرار می‌گیرد. در بخش 4 ، مزایا و معایب روش های تحقیق مورد استفاده در این مقاله مورد بحث قرار گرفته است. در نهایت، در بخش 5 ، مطالعه خود را خلاصه می‌کنیم، نتیجه‌گیری می‌کنیم و مسیرهای تحقیقاتی آینده را پیشنهاد می‌کنیم.

2. داده ها و روش ها

2.1. منطقه مطالعه

پکن پایتخت جمهوری خلق چین، یک شهر مرکزی ملی و یک شهر بزرگ است. مرکز سیاسی چین، مرکز فرهنگی، مرکز تبادل بین المللی و مرکز نوآوری علم و فناوری که توسط شورای دولتی تایید شده است. تا سال 2018، این شهر دارای 16 منطقه با مساحت 16410 کیلومتر مربع بود. در پایان سال 2019، جمعیت دائمی 21.536 میلیون نفر و جمعیت شهری 18.65 میلیون نفر بوده است. نرخ شهرنشینی 86.6 درصد بود. تولید ناخالص داخلی منطقه پکن 3537.13 میلیارد یوان بود. ارزش افزوده صنعت ثالث 83.5 درصد از تولید ناخالص داخلی منطقه را تشکیل می دهد [ 27 ]. پکن توسط شبکه تحقیقاتی جهانی سازی و شهرهای جهان (GaWC) به عنوان شهر درجه اول جهان رتبه بندی شد [ 28 ]]. طبق داده‌های هفتمین سرشماری ملی چین، از مجموع 21.893 میلیون ساکن دائمی پکن، جمعیت 0 تا 14 ساله 11.9٪ است. جمعیت 15 تا 59 ساله 68.5٪ است. و جمعیت 60 ساله و بالاتر 19.6 درصد است [ 29 ]. پکن پایتختی باستانی با بیش از 3000 سال سابقه و دارای میراث تاریخی و فرهنگی غنی است. این شهر همچنین نماد و تصویر چین و دریچه اصلی برای نشان دادن چین به جهان است. همیشه در داخل و خارج از کشور توجه زیادی را به خود جلب کرده است.

2.2. داده ها

Sina Weibo یک پلتفرم رسانه اجتماعی با حجم زیادی از داده های رسانه های اجتماعی است. بر اساس گزارش توسعه کاربر Sina Weibo در سال 2020 [ 30 ]، تعداد کاربران فعال ماهانه این نرم افزار به 511 میلیون نفر رسید. آمار مرکز داده Weibo در دسامبر 2020 نشان می دهد که سینا ویبو در شهرهای درجه یک مانند پکن، شانگهای، گوانگژو و شنژن دارای نرخ پوشش بسیار بالایی از جمعیت شهر است [ 30 ].]. داده های سینا ویبو حاوی مقدار قابل توجهی از اطلاعات جغرافیایی مختلف است. از طریق نرم افزار Sina Weibo و ابزار خزنده وب، داده های Sina Weibo را برای سال 2019 از پکن به دست آوردیم و محتوای پست های Weibo را به صورت هدفمند ضبط کردیم. این داده ها شامل شناسه Weibo، طول و عرض جغرافیایی، زمان، پایانه تلفن همراه، منطقه، محتوای متنی و اطلاعات دیگر بود. در مجموع، بیش از 1.13 میلیون تکه داده به عنوان منبع داده برای این مطالعه به دست آمد ( شکل 1 ).

2.3. مواد و روش ها

چارچوب تحقیق فعالیت های جشنواره ساکنان به شرح زیر است ( شکل 2 ).

2.3.1. طبقه بندی و استخراج Weibo مبتنی بر معنایی

در این تحقیق یک مدل طبقه بندی متن بر اساس چارچوب BERT و Transformers ساخته شد. مدل BERT نوعی رمزگذار زبان بود که توسط گوگل در سال 2018 منتشر شد و قادر بود جملات یا پاراگراف های ورودی را به ویژگی های معنایی متناظر ترجمه کند، که به طرز شگفت انگیزی عملکرد خوبی داشته و به یک پیشرفت مهم اخیر در NLP تبدیل شده است [ 31 ]. در این تحقیق، ما از کتابخانه Transformers ساده [ 32 ] که بر اساس کتابخانه Transformers توسط HuggingFace [ 33 ] است، برای ساخت مدل خود استفاده کردیم. مدل را می توان به سرعت آموزش و ارزیابی کرد.
ابتدا، بر اساس پاکسازی ۱٬۱۳۶٬۱۲۵ پست Weibo (حذف برچسب‌ها، پیوست کردن ایمیل‌ها، ارسال لینک‌ها، عبارات، ویدیوها، اشتراک‌گذاری تصاویر و سایر اطلاعات غیرمرتبط با محتوای متن)، مدل از پیش آموزش‌دیده شده BERT-base-Chinese برای انجام طبقه بندی باینری راه اندازی شد. در مرحله دوم، 7000 پست به صورت تصادفی انتخاب شده به عنوان نمونه آموزشی برای آموزش مدل استفاده شد. برای هر پست، اگر مربوط به فعالیت‌های جشنواره ساکنان بود، به عنوان 1 علامت‌گذاری می‌شد، در غیر این صورت 0 علامت‌گذاری می‌شد. سپس یادگیری ماشینی و مدل BERT اصلی برای تأیید صحت طبقه‌بندی استفاده شد. با تنظیم پارامترهای مربوطه و تعداد تکرارهای چند بار تحت آزمایش، یک مدل چند طبقه‌بندی متن آموزش‌دیده به دست آمد (دقت مدل به 97 درصد رسید). سوم، بر اساس طبقه بندی کننده مشتق شده، تمام ورودی‌های Weibo برای طبقه‌بندی Weibo با ساکنان به BERT وارد شدند. پس از طبقه بندی و استخراج، 213649 پست در شبکه های اجتماعی مربوط به جشنواره بود.

2.3.2. آمار فراوانی کلمه

آمار فراوانی کلمه بر اساس الگوریتم TF-IDF برای ارزیابی اهمیت یک کلمه برای یک متن است. اگر یک کلمه یا عبارت خاص به طور مکرر در یک مقاله ظاهر می شود، و در مجموعه اسناد در پایین ظاهر می شود، این کلمه یا عبارت دارای توانایی خوبی برای تشخیص دسته ها در نظر گرفته می شود [ 34 ].
به طور خاص، ابتدا داده های Weibo بر اساس Jieba تقسیم بندی شدند. هدف این است که کلمات را در متن تقسیم کرده و متن را به ترتیب به چند کلمه تبدیل کنید. تقسیم بندی کلمات معادل استخراج ویژگی بود و کلمات استخراج شده را کلمات ویژگی می نامیدند. پس از به دست آوردن کلمات مشخصه، این تحقیق سپس از فرهنگ لغت سفارشی و پایگاه داده کلمات توقف استفاده کرد تا برخی از حروف اضافه و نمادها را فیلتر کند زیرا متن پیچیده تر و محتوای کلمه بزرگ بود. در نهایت واژه‌های مشخصه‌ای که نقش عمده‌ای در طبقه‌بندی متن و تحلیل موضوع داشتند انتخاب شدند و به ترتیب اهمیت رتبه‌بندی شدند.

2.3.3. مدل موضوع LDA

تخصیص دیریکله نهفته (LDA) یکی از مدل های معمولی “کیسه کلمات” [ 34 ] است و دارای طیف گسترده ای از کاربردها است [ 35 ]. این یک مدل موضوع استاندارد است که می تواند با داده های رسانه های اجتماعی در جایی که مشکل متن کوتاه و پراکندگی زیاد وجود دارد کار کند [ 36 ]. ایده اصلی آن این است که متن به طور تصادفی مخلوط شده و از موضوعات ضمنی تولید می شود و هر موضوع مربوط به توزیع کلمه خاصی است [ 37 ].
این مطالعه یک ساختار بیزی سه لایه از “متن-موضوع-کلمه” را بر اساس داده های رسانه های اجتماعی ساخت. موضوع هر متن در مجموعه متن به صورت توزیع احتمال داده شده است تا موضوعات را بر اساس توزیع موضوع طبقه بندی کنیم. این تحقیق سعی در ایجاد فهرستی از موضوعات از طریق نتایج برای بررسی ویژگی‌های فضایی فعالیت‌های جشنواره ساکنان پکن و تجسم نتایج داشت [ 38 ].

2.3.4. تحلیل فضایی

تحلیل فضایی یک روش تحلیلی پرکاربرد در جغرافیا است [ 39 ]. در این تحقیق تمرکز اصلی بر توزیع مکانی داده ها است. روش‌های مرتبط شامل تحلیل چگالی، تحلیل درون‌یابی فضایی، تجسم فضایی و اندازه‌گیری توزیع جغرافیایی [ 40 ] است. محتوای Weibo مربوط به جشنواره از طریق خوشه بندی موضوعی در فضا نمایش داده شد و تجزیه و تحلیل چگالی هسته برای مشاهده نقاط داغ در فضا انجام شد.

3. نتایج

3.1. آمار فراوانی کلمه رویداد جشن

جشنواره هایی با بیش از 10000 پست Weibo عبارت بودند از روز ملی، جشنواره نیمه پاییز، روز سال نو، روز کریسمس، جشنواره فانوس و شب کریسمس ( جدول 1 ). از آنجایی که سال 2019 هفتادمین سالگرد تأسیس جمهوری خلق چین بود، بیشتر پست‌های Weibo مربوط به روز ملی بود. جایگاه خانواده در مفهوم مردم چین از جشنواره از نظر فرهنگی مهم است و از این رو جشنواره نیمه پاییز با موضوع دیدار مجدد خانوادگی دومین محتوای بزرگ مرتبط با جشنواره Weibo در سال 2019 بود.
همه 213649 پست Weibo مربوط به جشنواره از پکن در سال 2019 بر اساس آمار فراوانی کلمه مرتب شده اند ( شکل 3 ). از آنجایی که سال 2019 هفتادمین سالگرد تأسیس جمهوری خلق چین بود، فراوانی کلمات مربوط به روز ملی مانند «میهن»، «تولدت مبارک»، «70» زیاد بود. تعداد ورودی های مربوط به جشنواره نیمه پاییز نیز زیاد بود. در فعالیت‌های جشنواره‌های چینی، خوردن غذا به وضوح یک رفتار ضروری و راه اصلی شرکت مردم در جشنواره‌ها بود.
بر اساس تمام محتوای Weibo مربوط به جشنواره در سال 2019، محتوای اصلی درک ساکنان از جشنواره‌ها و روش‌های اصلی شرکت در جشنواره‌ها در نمودارهای ابری word منعکس شد ( شکل 4 ). کلمات با فرکانس بالا با جشنواره‌هایی با تعداد زیادی پست Weibo در سال 2019 مطابقت دارد. برای مثال، کلماتی مانند “سرزمین مادری”، “چین” و “تولدت مبارک” نیز در نقشه‌های ابری کلمه برای روز ملی، اواسط پاییز منعکس شده است. جشنواره، سال نو، و سایر کلمات مرتبط. کلماتی مانند “خوردن” و “خوشمزه” نشان دهنده راه های اصلی شرکت ساکنان در جشنواره ها بود.
جشنواره ها به سه دسته جشنواره های سنتی، جشنواره های خارجی و جشنواره های مدرن تقسیم شدند که بر اساس تعداد پست های مرتبط از بیشترین به کمترین مرتب شدند و نسبت تعداد پست های انواع جشنواره در کل داده ها محاسبه شد. . نتایج در جدول 2 نشان داده شده است.
ساکنان پکن بیشترین تعداد پست های Weibo مربوط به جشنواره های سنتی را با 40.46 درصد ارسال کردند. در میان جشن‌های سنتی، جشن نیمه پاییز با مضمون گردهمایی خانوادگی بیشتر مورد اشاره قرار گرفت. با این حال، تعداد پست های Weibo مربوط به جشنواره بهار نسبتا کم بود. این به این دلیل بود که بازه زمانی جشنواره بهار طولانی بود. فقط داده‌های Weibo در روز تعطیل در اینجا استخراج شد، بنابراین انحراف در تعداد پست‌های Weibo وجود داشت. علاوه بر این، کاربران Weibo معمولا جوان هستند و از این رو داده های پست Weibo ممکن است احساسات افراد میانسال و مسن را منعکس نکند.
جشنواره های سنتی ارتباط نزدیکی با تاریخ و فرهنگ چین دارند. به منظور بررسی میزان توجه به فرهنگ سنتی در Weibo، لازم است برخی از کلمات نسبتاً کم بسامد در کلمات مشخصه مورد تجزیه و تحلیل قرار گیرند ( جدول 3 ). فعالیت های جشنواره ساکنان به شدت تحت تأثیر فرهنگ سنتی است. این نه تنها در لباس‌ها و مکان‌هایی مانند «هنفو» و «معبد کنفوسیوس» منعکس می‌شود. در جشنواره های سنتی تأثیر فرهنگ سنتی بیشتر نمایان است. “تا زمانی که بتواند زندگی کند!”، “از دور این لحظه را با من تقسیم می کنی.” و عبارات دیگر مربوط به جشنواره نیمه پاییز بیشتر ظاهر می شوند.
جشنواره‌های خارجی 20.40 درصد از داده‌های Weibo در روز جشنواره را تشکیل می‌دهند، که نشان می‌دهد جشنواره‌های سنتی همچنان بر درک ساکنان از جشنواره‌ها غالب هستند. علاوه بر اینکه کریسمس و شب کریسمس نکات کلیدی احساس ساکنان از جشنواره های خارجی است، جشنواره های خارجی جایگاه مرکزی احساس ساکنان از جشنواره ها را اشغال نمی کنند. برای جشنواره های مدرن، تعداد پست های مربوط به روز ملی، که در آن ساکنان احساسات میهن پرستانه خود را بیان می کردند، حدود یک سوم از تعداد کل پست ها را تشکیل می داد.
همچنین دریافتیم که برخی از فعالیت های جشنواره، به ویژه برخی از جشنواره های خارجی، ارتباط خاصی با دین دارند ( جدول 4 ). در اطلاعات متنی منتشر شده نه تنها نام اعتقادات مذهبی به وضوح ذکر شده است، بلکه نام اماکن مذهبی در روز جشن به طور نسبی به چشم می خورد.

3.2. حس معنایی فعالیت های جشنواره

شکل 5 نسبت های داخلی انواع مختلف انواع مختلف داده های جشنواره و یک مقایسه طولی از همان نوع داده را نشان می دهد. می‌توانید نوع یکسانی از داده‌های جشنواره، نسبت بخش‌های مختلف گفتار و انواع مختلف را بیابید. به خصوص در جشنواره های سنتی، افعال بیشترین نسبت کلمات را تشکیل می دهند که تفاوت قابل توجهی با سایر انواع جشنواره ها دارد. شکل 6 مقایسه افقی انواع مختلف داده های جشنواره مربوط به بخش های سخنرانی مشابه است. فستیوال‌های مدرن بیشترین ویژگی‌های تعطیلات را در اسم‌ها دارند و جشنواره‌های سنتی «خوردن» را به عنوان رایج‌ترین فعل دارند.
اسامی منعکس کننده درک ساکنان از جشنواره ها، به ویژه نمادها و عناصر نماینده جشنواره ها بودند، به عنوان مثال، اسم های “کیک ماه”، “زونگزی” و “تانگیوان”، زیرا این غذاهای سنتی چینی در رابطه با جشنواره های سنتی استفاده می شد. به عنوان مثال، جشنواره نیمه پاییز، جشنواره قایق اژدها، و جشنواره فانوس، به ترتیب. واژه‌هایی مانند بابا نوئل، هدیه کریسمس و سیب مربوط به جشن‌های خارجی، یعنی کریسمس و شب کریسمس استفاده می‌شد. برای جشنواره های مدرن، کلماتی مانند “کشور مادر” و “چین” که مربوط به روز ملی است، اغلب استفاده می شد.
صرف نظر از نوع جشنواره، کلمه “شهر ممنوعه” اغلب ظاهر می شود. این نشان می‌دهد که جاذبه‌های محلی شهر ممنوعه به بخشی ضروری از جشنواره‌ها در نگرش ساکنان پکن تبدیل شده است و یک حمایت عاطفی و نماد فرهنگی ارائه می‌کند. در نهایت، نسبت اصطلاحات Weibo در هر نوع جشنواره نشان داد که نسبت جشنواره‌های سنتی بزرگ‌ترین، تا 59 درصد است که نشان می‌دهد ساکنان بیشترین درک را از جشنواره‌های سنتی دارند.
كليه كلمات با بسامد بالا بر حسب بخشي از گفتار و محتواي معنايي به چهار دسته تقسيم شدند. به عنوان مثال، مانند “خوردن”، “نوشیدن” و غیره در فعل گروهی. به منظور جمع بندی بهتر این گونه فعالیت ها، نام این واژه ها را «خوردن» گذاشتیم. به فعالیت هایی که در زندگی روزمره نیز می توان انجام داد، مانند «چک این» و «پیاده روی»، «فعالیت های اوقات فراغت» می گویند. به دلیل فضای محدود طبقه بندی های دیگر واژه ها، توضیح زیادی وجود ندارد. افعال منعکس کننده رفتارهای اصلی ساکنان شرکت کننده در جشنواره ها هستند. از فراوانی کلمات، رفتار ساکنان پکن که در جشنواره‌ها شرکت می‌کنند در بین انواع جشنواره‌ها نسبتاً یکنواخت به نظر می‌رسد ( شکل 6).). به عنوان مثال، کلماتی مانند “خوردن” و “چک این” نشان می دهد که رفتارهای اصلی ساکنان شرکت کننده در جشنواره ها با غذا خوردن مرتبط است. به نظر می رسد که «اعلام حضور» در فروشگاه های سلبریتی آنلاین به روشی مهم برای ساکنان پکن برای شرکت در جشنواره ها تبدیل شده است.
صفت ها عمدتاً بیان عاطفی ساکنان نسبت به جشنواره ها را نشان می دهند و انواع مختلف جشنواره ها با عبارات احساسی متفاوت مطابقت دارند. “چینگ مینگ” در جشنواره های سنتی با جشنواره چینگ مینگ مطابقت دارد. واژه‌هایی مانند «آرامش‌آمیز»، «هموار» و «کامل» جلوه‌های فرهنگی جشنواره‌های سنتی بودند. کلمه “صلح آمیز” در جشنواره های خارجی بیشتر ظاهر می شود که با آرزوی مردم برای صلح در شب کریسمس مطابقت دارد. صفت‌های پرمصرف که برای جشنواره‌های مدرن استفاده می‌شود، تمرکز ساکنان را در روز ملی منعکس می‌کند، به میهن ابراز غرور می‌کند و نظرات مثبتی را در مورد وضعیت موجود سرزمین مادری با صفاتی مانند “ایمن”، “قوی” و “کامیابی” نشان می‌دهد. “.

3.3. ویژگی های توزیع فضایی فعالیت های جشنواره

شکل 7 نقشه توزیع چگالی هسته پست های Weibo ساکنان پکن مربوط به جشنواره ها در سال 2019 را به طور کلی و بر اساس نوع جشنواره نشان می دهد. توزیع تراکم جشنواره‌های سنتی تفاوت چندانی با جشنواره‌های مدرن نداشت، اگرچه تراکم مرکزی پست‌های ساکنان مربوط به جشنواره‌های سنتی متراکم‌تر از جشنواره‌های مدرن بود. تراکم جشنواره‌های خارجی بسیار کمتر از جشنواره‌های سنتی یا مدرن به نظر می‌رسد، اما به نظر می‌رسد مناطق زیادی بدون پست وجود دارد، که نشان می‌دهد جشنواره‌های سنتی هنوز جایگاه اصلی رفتار و فرهنگ تعطیلات ساکنان چین را اشغال می‌کنند. این در تضاد با این تصور است که جشنواره های سنتی به طور قابل توجهی تحت تأثیر جشنواره های خارجی قرار گرفته اند.

3.4. حس موضوعی فعالیت های جشنواره

در بین 29 جشنواره در سال 2019، مدل تم LDA پست های مربوط به جشنواره را به سه نوع تقسیم کرد: بیان احساسی پست ها؛ رفتار خاص ساکنان؛ و فرهنگ نماینده جشنواره مربوطه. فعالیت‌های جشنواره ساکنان تقریباً به دو دسته تقسیم می‌شد: غذا خوردن با اقوام و دوستان و رفتن به رستوران‌های مختلف برای چک‌این. رفتن به جاذبه های گردشگری متعدد و فعالیت های جشنواره. تحلیل مدل LDA برای سه نوع جشنواره اعمال شد. مدرن، سنتی، و خارجی، و نتایج به ArcGIS برای تجزیه و تحلیل فضایی موضوعی وارد شدند.
در 5 موضوع، هر موضوع به طور مساوی در فضا توزیع شد، اما مبحث 2 بیشترین توزیع را در فضا داشت ( شکل 8 ). با مقایسه جدول 5 ، کلمات پر بسامد مبحث 2 عمدتاً با جشنواره نیمه پاییز و جشنواره بهار مطابقت دارند، مانند «کیک ماه»، «تجمع مجدد»، «سال خوک» و «موفق باشید».
توزیع فضای موضوعی جشنواره های خارجی به اندازه جشنواره های سنتی گسترده نبود، اما تفاوت های فضایی آشکاری در توزیع فضای موضوعی وجود دارد ( شکل 9 ). موضوع 1 عمدتاً در منطقه خارج از جاده کمربندی پنجم در پکن توزیع شده است و موضوع 4 عمدتاً در منطقه داخل جاده حلقه پنجم توزیع شده است. با توجه به موضوع کلمات با بسامد بالا در جدول 6موضوع 1 عمدتاً با ادراک عاطفی ساکنین و بیان آن از جشنواره با کلماتی مانند “شادی”، “امید” و “آرامش” مرتبط بود. موضوع 4 عمدتاً مربوط به رفتارهای خاص ساکنان شرکت کننده در جشنواره ها بود، مانند “هدایای کریسمس” و “سیب”، به این معنی که ساکنان شرکت کننده در کریسمس عمدتا هدایایی و سیب می دهند تا توجه خود را به اقوام و دوستان ابراز کنند.
تم 2 و موضوع 3 برای جشنواره های مدرن نیز تفاوت های فضایی قابل توجهی را نشان دادند ( شکل 10 ). ترکیب با کلمات با بسامد بالا در جدول 7 ، کلمات با بسامد بالا در موضوع 2 شامل «سال نو مبارک»، «رژه نظامی»، «امید»، «آتش بازی»، «میدان تیان‌آن‌من» و کلمات دیگر، که برخی از آنها بهترین آرزوها را برای اهالی در طول جشنواره بیان کرد. بخش دیگر عمدتاً به تشریح نمادهای نماینده و عناصر تشکیل دهنده جشنواره ها به ویژه روز ملی پرداخت. واژه‌های با بسامد موضوع 3، مانند «خوشمزه»، «چک این» و «طعم» با غذا و خوردن مرتبط بودند.
با تلفیق تفاوت‌های توزیع فضایی موضوع جشنواره‌های خارجی، می‌توان نتیجه گرفت که نحوه اصلی شرکت ساکنان در جشنواره‌ها با کمال زیرساخت‌ها ارتباط دارد. در رفتارهای خاص جشنواره، ساکنان شهر مرکزی پکن می توانند در فعالیت های مختلف جشنواره شرکت کنند، بنابراین بیشتر محتوای موجود در Weibo رفتارهای خاص جشنواره را منعکس می کند. ساکنانی که در حومه پکن زندگی می کنند ممکن است به دلیل دسترسی به چنین زیرساخت هایی محدود شده باشند. بنابراین، مردم با توجه به جشنواره یا مفهوم فرهنگی خود جشنواره، خواسته های بیشتری را در مورد محتوای Weibo ابراز کردند.

4. بحث

بیشتر تحقیقات جاری در مورد جشنواره ها و فرهنگ از طریق نظرسنجی و سفرهای میدانی انجام می شود و به ندرت از داده های بزرگ برای تجزیه و تحلیل موضوعات مرتبط استفاده می شود. بنابراین، بسیاری از محققان به ضرورت استفاده از داده های رسانه های اجتماعی برای انجام تحقیقات در مورد فعالیت های جشنواره پی برده اند [ 4 ]. برای مثال، تحقیقات ژو عمدتاً از آمار فراوانی کلمات و مدل‌های تم LDA برای شناسایی درک ساکنان از جشنواره‌های سنتی و تفاوت‌های منطقه‌ای استفاده می‌کند [ 18 ]. طبق نتایج تحقیقات آنها، طبقه بندی موضوع LDA بدیهی است که روشی قدرتمند برای تجزیه و تحلیل داده های رسانه های اجتماعی، متن کاوی و آشکارسازی ویژگی های مکانی-زمانی فعالیت های مرتبط است. مطالعه ای توسط لیو [ 41] ویژگی های عاطفی گردشگران چینی به استرالیا را بر اساس تجزیه و تحلیل متن کلان داده و برچسب گذاری بخشی از گفتار مورد مطالعه قرار داد. این روش ها همگی تحلیل متنی فعالیت های جشنواره را گسترش می دهند. با این حال، تحقیق فوق فاقد کاوی جامع از اطلاعات معنایی غنی و اطلاعات مکانی-زمانی در داده های رسانه های اجتماعی است. بنابراین، این تحقیق از فناوری NLP برای شناسایی پست‌های Weibo مرتبط با جشنواره استفاده می‌کند و آمار فراوانی کلمات، برچسب‌گذاری متن، مدل‌های موضوع LDA و روش‌های تحلیل فضایی GIS را برای تجزیه و تحلیل ویژگی‌های درک ساکنان از جشنواره‌ها و فعالیت‌ها ترکیب می‌کند.
جودیت مایر و کارین وبر [ 3] خاطرنشان کرد: بسیاری از مطالعات در زمینه تحلیل جشنواره رویکرد مطالعه موردی را اتخاذ کرده اند. بنابراین تحقیق در مورد جشنواره های ویژه نسبتاً کافی است، اما مطالعه تطبیقی ​​جامع بسیاری از جشنواره ها وجود ندارد. می توان گفت که این امر دامنه و مقیاس درک ما از جشنواره را محدود می کند. بنابراین، امیدواریم با گسترش دامنه تحقیقات در مورد انواع جشنواره ها، درک ساکنین از جشنواره های مختلف را بهبود بخشیم. از طریق مقایسه انواع مختلف جشنواره ها، این تحقیق نشان داد که متون Weibo نشان دهنده توجه بیشتر ساکنان به جشنواره های مختلف است. جشنواره‌های سنتی همچنان مورد توجه گسترده‌تری قرار می‌گیرند. از تحلیل موضوعی می توان دریافت که ویژگی های مشترکی بین انواع مختلف جشنواره ها وجود دارد. مثلا، توجه به فعالیت های اوقات فراغت و غذا بسیار برجسته است. همچنین ابراز تبریک به خانواده و دوستان از طریق جشنواره ها جهانی است. با این حال، همچنین می توان دریافت که در بین انواع مختلف جشنواره ها، جشنواره های سنتی بیشتر با تاریخ و فرهنگ مرتبط هستند، در حالی که جشنواره های مدرن بیشتر با اوقات فراغت و مصرف مرتبط هستند. جشنواره های غربی بیشتر با مصرف و سرگرمی مرتبط بوده اند و در عین حال برخی آثار مذهبی را حفظ کرده اند. چنین مطالعه جامعی برای درک عمیق مفاهیم جشنواره ها و توسعه اجتماعی و اقتصادی اهمیت زیادی دارد. جشنواره های سنتی بیشتر با تاریخ و فرهنگ مرتبط هستند، در حالی که جشنواره های مدرن بیشتر با اوقات فراغت و مصرف مرتبط هستند. جشنواره های غربی بیشتر با مصرف و سرگرمی مرتبط بوده اند و در عین حال برخی آثار مذهبی را حفظ کرده اند. چنین مطالعه جامعی برای درک عمیق مفاهیم جشنواره ها و توسعه اجتماعی و اقتصادی اهمیت زیادی دارد. جشنواره های سنتی بیشتر با تاریخ و فرهنگ مرتبط هستند، در حالی که جشنواره های مدرن بیشتر با اوقات فراغت و مصرف مرتبط هستند. جشنواره های غربی بیشتر با مصرف و سرگرمی مرتبط بوده اند و در عین حال برخی آثار مذهبی را حفظ کرده اند. چنین مطالعه جامعی برای درک عمیق مفاهیم جشنواره ها و توسعه اجتماعی و اقتصادی اهمیت زیادی دارد.
در مقیاس فضایی، این مطالعه پدیده جالبی را در الگوی فضایی فعالیت های جشنواره ساکنان در یک شهر غول پیکر یافت. اگرچه مناطق تجمع برای انواع مختلف جشنواره ها در مراکز شهری پرجمعیت متمرکز شده است، فعالیت های جشنواره های سنتی و دامنه توزیع جشنواره های مدرن به طور قابل توجهی بیشتر از جشنواره های خارجی در غرب است. ما معتقدیم نحوه شرکت ساکنان در جشنواره ها به میزان زیرساخت ها به ویژه تعداد امکانات تفریحی مانند پذیرایی و خدمات مرتبط است. در عین حال، تفاوت منطقه ای فعالیت های جشنواره در داخل شهر نیز عدم تعادل در ساختار شهری پکن را ثابت می کند، یعنی قسمت شمالی شهر پراکنده تر از ناحیه جنوبی است.شکل 7 ) [ 42 ]. همانطور که ویلسون [ 4 ] بر نقش مهم جشنواره ها برای جوامع محلی تاکید کرد. با افزایش امکانات مرتبط با جشنواره در مناطق توسعه نیافته شهری، می توان توسعه متوازن شهر را نیز ارتقا داد. اما این تحقیق چالش جدیدی را نیز مطرح می کند، یعنی تفاوت شرق و غرب شهر نیز آشکارتر است. این بخش از دلیل نیاز به بررسی عمیق دارد.
نتایج این تحقیق نشان می‌دهد که می‌توان با استفاده از داده‌های بزرگ رسانه‌های اجتماعی، برداشت ساکنان از جشنواره‌ها را درک کرد. با این حال، طبق گزارش توسعه کاربران Weibo 2020، کاربران Weibo عمدتاً افراد 20 تا 30 ساله هستند و نزدیک به 80٪ از کاربران را تشکیل می دهند [ 23 ]. بنابراین، داده‌های رسانه‌های اجتماعی بیشتر یک گروه نسبتاً جوان هستند و داده‌ها با سوگیری نمونه و نمایندگی مشکل دارند. برای حل این مشکل، در تحقیقات بعدی می توان از پرسشنامه های سنتی و روش های دیگر برای تکمیل نمونه های پژوهش با ترکیب منابع متعدد داده ها برای جبران مشکل انحراف نمونه داده های رسانه های اجتماعی استفاده کرد.

5. نتیجه گیری ها

این مطالعه از داده‌های رسانه‌های اجتماعی برای مطالعه درک ساکنان از جشنواره‌ها و ویژگی‌های فضایی فعالیت‌ها استفاده می‌کند. با استفاده از یک مدل طبقه‌بندی متن بر اساس چارچوب BERT و Transformers، داده‌های رسانه‌های اجتماعی Weibo مربوط به جشنواره‌های پکن را در سال 2019 تجزیه و تحلیل کردیم. ما برداشت ساکنان پکن از جشنواره‌ها و روش‌های شرکت آنها در جشنواره‌ها را به دست آوردیم و تفاوت‌های فضایی ساکنان را بررسی کردیم. شرکت در فعالیت های جشنواره
با استفاده از آمار بسامد کلمات، تجزیه و تحلیل بخشی از گفتار و تحلیل مدل موضوعی LDA، داده‌های رسانه‌های اجتماعی Weibo مربوط به جشنواره‌های پکن را در سال 2019 تجزیه و تحلیل کردیم. ما برداشت ساکنان پکن از جشنواره‌ها و روش‌های شرکت آنها در جشنواره‌ها را به‌دست آوردیم و بررسی کردیم. تفاوت های فضایی مشارکت ساکنان در فعالیت های جشنواره
فرهنگ سنتی تأثیر زیادی بر جشنواره ها داشت که نه تنها در انگیزه ساکنان برای شرکت در جشنواره ها، بلکه در نحوه شرکت آنها در جشنواره ها و احساسات آنها نیز منعکس می شود. جشنواره های سنتی جایگاه مرکزی درک ساکنین از جشنواره ها را به خود اختصاص دادند. این با نگرانی های فعلی که جشنواره های سنتی به شدت تحت تأثیر جشنواره های خارجی قرار گرفته اند متفاوت بود. احساسات خانواده و مادری در جشنواره های مدرن جایگاه اصلی را به خود اختصاص داد. این به وضوح در فراوانی کلمات و توزیع فضایی موضوع آشکار شد. برای جشنواره های سنتی، ساکنان احساسات خود را از طریق اشعار باستانی از فرهنگ سنتی چین بیان می کردند. به عنوان مثال، برای جشنواره های سنتی، به طور مکرر از کلماتی مانند “در مناسبت های جشن بیشتر از هر زمان دیگری به عزیزان خود فکر می کنید. (每逢佳节倍思亲)”، “تا آنجا که بتواند زندگی خواهد کرد! (但愿人长久)»، و آیات دیگر در رابطه با انواع دیگر اعیاد به کار نمی رفت. نحوه شرکت ساکنان در جشنواره ها به میزان زیرساخت ها به ویژه تعداد امکانات تفریحی مانند پذیرایی و خدمات مرتبط است. اکثر پوسترهای Weibo از مناطق درون شهری رفتارهای خاص مربوط به جشنواره را نشان می‌دهند که نشان می‌دهد آنها مستقیماً در فعالیت‌های جشنواره شرکت می‌کنند، در حالی که پوسترهای منطقه بیرونی شهر اغلب آرزوهای تعطیلات را بیان می‌کنند. علاوه بر این، برخی از فعالیت های جشنواره ساکنان مربوط به اعتقادات مذهبی بود که بازتاب سنت های فرهنگی و مفاهیم پشت جشنواره در انواع مختلف جشنواره ها بود. و از آیات دیگر در رابطه با انواع دیگر اعیاد استفاده نمی شد. نحوه شرکت ساکنان در جشنواره ها به میزان زیرساخت ها به ویژه تعداد امکانات تفریحی مانند پذیرایی و خدمات مرتبط است. اکثر پوسترهای Weibo از مناطق درون شهری رفتارهای خاص مربوط به جشنواره را نشان می‌دهند که نشان می‌دهد آنها مستقیماً در فعالیت‌های جشنواره شرکت می‌کنند، در حالی که پوسترهای منطقه بیرونی شهر اغلب آرزوهای تعطیلات را بیان می‌کنند. علاوه بر این، برخی از فعالیت های جشنواره ساکنان مربوط به اعتقادات مذهبی بود که بازتاب سنت های فرهنگی و مفاهیم پشت جشنواره در انواع مختلف جشنواره ها بود. و از آیات دیگر در رابطه با انواع دیگر اعیاد استفاده نمی شد. نحوه شرکت ساکنان در جشنواره ها به میزان زیرساخت ها به ویژه تعداد امکانات تفریحی مانند پذیرایی و خدمات مرتبط است. اکثر پوسترهای Weibo از مناطق درون شهری رفتارهای خاص مربوط به جشنواره را نشان می‌دهند که نشان می‌دهد آنها مستقیماً در فعالیت‌های جشنواره شرکت می‌کنند، در حالی که پوسترهای منطقه بیرونی شهر اغلب آرزوهای تعطیلات را بیان می‌کنند. علاوه بر این، برخی از فعالیت های جشنواره ساکنان مربوط به اعتقادات مذهبی بود که بازتاب سنت های فرهنگی و مفاهیم پشت جشنواره در انواع مختلف جشنواره ها بود. به ویژه تعداد امکانات تفریحی مانند پذیرایی و خدمات. اکثر پوسترهای Weibo از مناطق درون شهری رفتارهای خاص مربوط به جشنواره را نشان می‌دهند که نشان می‌دهد آنها مستقیماً در فعالیت‌های جشنواره شرکت می‌کنند، در حالی که پوسترهای منطقه بیرونی شهر اغلب آرزوهای تعطیلات را بیان می‌کنند. علاوه بر این، برخی از فعالیت های جشنواره ساکنان مربوط به اعتقادات مذهبی بود که بازتاب سنت های فرهنگی و مفاهیم پشت جشنواره در انواع مختلف جشنواره ها بود. به ویژه تعداد امکانات تفریحی مانند پذیرایی و خدمات. اکثر پوسترهای Weibo از مناطق درون شهری رفتارهای خاص مربوط به جشنواره را نشان می‌دهند که نشان می‌دهد آنها مستقیماً در فعالیت‌های جشنواره شرکت می‌کنند، در حالی که پوسترهای منطقه بیرونی شهر اغلب آرزوهای تعطیلات را بیان می‌کنند. علاوه بر این، برخی از فعالیت های جشنواره ساکنان مربوط به اعتقادات مذهبی بود که بازتاب سنت های فرهنگی و مفاهیم پشت جشنواره در انواع مختلف جشنواره ها بود.
از طریق تجزیه و تحلیل الگوی توزیع فضایی میکروبلاگ های مرتبط با جشنواره، می توان دریافت که اطلاعات زمانی و مکانی داده های رسانه های اجتماعی می تواند به درک ویژگی های ساختار فضایی شهری کمک کند. فعالیت های جشنواره ساکنان در مراکز شهری پرجمعیت و توسعه یافته اقتصادی متمرکز شده است. تفاوت های منطقه ای بین فعالیت های جشنواره شمال و جنوب در داخل شهر نیز با ویژگی های ساختار فضایی شهری پکن مطابقت دارد. با این حال، این مطالعه نشان داد که تفاوت بین بخش شرقی و غربی شهر نیز بسیار مشهود است. این کشف چالش جدیدی را ارائه می کند. دلایل تفاوت فضاهای شرقی و غربی فعالیت ساکنان نیاز به بررسی عمیق دارد.
این مطالعه از داده‌های رسانه‌های اجتماعی برای مطالعه درک ساکنان از جشنواره‌ها و ویژگی‌های فضایی فعالیت‌ها استفاده می‌کند. ترکیب فناوری پردازش زبان طبیعی، تجزیه و تحلیل آماری، برچسب‌گذاری بخشی از گفتار، تجزیه و تحلیل موضوع و تحلیل فضایی، الگوی جدیدی برای تحقیق در زمینه جشنواره‌ها فراهم می‌کند. با این حال، مدل موضوع LDA دارای کاستی های خاصی در پردازش داده های پراکنده رسانه های اجتماعی است. این امر مستلزم پیشرفت های بعدی در فناوری پردازش داده است. مشکل سوگیری نمونه در داده‌های رسانه‌های اجتماعی وجود دارد که نمی‌تواند وضعیت افراد میانسال و سالخورده را که کمتر از رسانه‌های اجتماعی استفاده می‌کنند به خوبی منعکس کند. در تحقیق پیگیری می توان از روش های سنتی پیمایش پرسشنامه برای تکمیل نمونه ها با داده های چند منبعی استفاده کرد. تفاوت‌های فضایی فعالیت‌های جشنواره ساکنان که در این پژوهش یافت می‌شود، در حال حاضر تنها از منظر کیفی قابل توصیف است. در آینده امیدواریم که مطالعات بیشتر بتواند دلایل تفاوت های فضایی را از منظر کمی توضیح دهد.

مشارکت های نویسنده

مفهوم‌سازی، روش‌شناسی، نگهداری داده‌ها، نوشتن-بررسی و ویرایش، Bingqing Wang، Bin Meng و Juan Wang. تحقیق، نرم افزار، تجسم، نوشتن – آماده سازی اصلی و پیش نویس، Bingqing Wang، Siyu Chen و Jian Liu. کسب بودجه و مدیریت پروژه، بن منگ و خوان وانگ. همه نویسندگان نسخه منتشر شده نسخه خطی را خوانده و با آن موافقت کرده اند.

منابع مالی

این تحقیق توسط برنامه تحقیق و توسعه کلید ملی چین (Grant Nos. 2017YFB0503605)، بنیاد ملی علوم طبیعی چین (Grant Nos. 41671165) و پروژه‌های تحقیقاتی دانشگاهی دانشگاه اتحادیه پکن (Grant Nos. ZK40202001) تامین شده است.

بیانیه در دسترس بودن داده ها

داده ها در صورت درخواست معقول از نویسندگان در دسترس است.

قدردانی

مایلیم از بازبینان ناشناس برای نظرات روشنگر و کمک قابل توجه آنها در بهبود این مقاله تشکر کنیم. ما همچنین از Dongsheng Zhan برای ارائه داده های ارزشمند و پشتیبانی فنی تشکر می کنیم.

تضاد علاقه

نویسندگان هیچ تضاد منافع را اعلام نمی کنند.

منابع

  1. Zhang, B. ساخت جشنواره های چینی در عصر سازندگی. مردم. گل میخ. 2015 ، 1 ، 62-73. [ Google Scholar ]
  2. تای، XC تجزیه و تحلیل وضعیت وراثت جشنواره های سنتی چینی و تحقیق در مورد اقدامات متقابل توسعه. علم هنر تکنولوژی 2019 ، 32 ، 105-106. [ Google Scholar ]
  3. مایر، جی. وبر، ک. تحقیق رویداد و جشنواره: بررسی و جهت گیری های تحقیق. بین المللی جشنواره رویداد J. مدیریت 2019 ، 10 ، 209–216. [ Google Scholar ] [ CrossRef ]
  4. ویلسون، جی. ارشد، ن. شاو، ای. پرت، تی. گسترش دامنه تحقیقات جشنواره: دستور کار بررسی و تحقیق. بین المللی جی. مناگ. Rev. 2017 , 19 , 195-213. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  5. وانگ، XW وراثت و توسعه جشنواره های سنتی چینی در هنگ کنگ، ماکائو و تایوان. فرقه میراث. بیمون. 2013 ، 2 ، 23-30. [ Google Scholar ]
  6. گروه پژوهشی «ترویج فرهنگ جشنواره». وضعیت موجود و اقدام متقابل توسعه میراث سنتی جشنواره چینی. صد Sch. هنر 2012 ، 28 ، 1-4.
  7. وونگ، ک. Domroes، M. درک کاربران از پارک Kowloon، هنگ کنگ: الگوهای بازدید و جنبه های منظره. چانه. Geogr. علمی 2004 ، 14 ، 269-275. [ Google Scholar ] [ CrossRef ]
  8. شوانن، تی. Kwan، MP اینترنت، تلفن همراه و محدودیت‌های فضا-زمان. Geoforum 2008 , 39 , 1362–1377. [ Google Scholar ] [ CrossRef ]
  9. باتی، م. Axhausen، KW; جیانوتی، اف. پوزدنوخوف، ا. بذانی، ع. واچوویچ، ام. اوزونیس، جی. پرتغالی، ی. شهرهای هوشمند آینده. یورو فیزیک J. Spec. بالا. یورو 2012 ، 214 ، 481-518. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  10. ژانگ، اف. ژو، بی. لیو، ال. لیو، ی. Fung، HH; لین، اچ. راتی، سی. اندازه گیری ادراک انسان از یک منطقه شهری در مقیاس بزرگ با استفاده از یادگیری ماشین. Landsc. طرح شهری. 2018 ، 180 ، 148-160. [ Google Scholar ] [ CrossRef ]
  11. لیو، ی. یوان، YH; ژانگ، اف. استخراج ادراکات شهری از داده های رسانه های اجتماعی. جی. اسپات. بین المللی علمی 2020 ، 20 ، 51-55. [ Google Scholar ]
  12. کویلو، سی. مدلسازی و تجسم تکامل معنایی و مکانی-زمانی موضوعات در ارتباطات بین فردی در توییتر. بین المللی جی. جئوگر. Inf. علمی 2019 ، 33 ، 805-832. [ Google Scholar ] [ CrossRef ]
  13. Xie، YJ; پنگ، ایکس. هوانگ، Z. ادراک تصویر. حکومت پکن داده های میکروبلاگ مبتنی بر هات اسپات. Prog. Geogr. 2017 ، 36 ، 1099-1110. [ Google Scholar ]
  14. Kestens، Y.; لبل، ا. دانیل، م. تریو، ام. Pampalon، R. استفاده از فضاهای فعالیت با تجربه برای اندازه گیری قرار گرفتن در معرض مواد غذایی. Health Place 2010 ، 16 ، 1094-1103. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  15. والی، جی. کادوت، ای. روستیت، سی. پاریزوت، آی. Chauvin، P. نقش تحرک روزانه در نابرابری های سلامت روان: تأثیر تعاملی فضای فعالیت و محله محل سکونت بر افسردگی. Soc. علمی پزشکی 2011 ، 73 ، 1133-1144. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  16. مارتی، پ. سرانو-استرادا، ال. Nolasco-Cirugeda، A. داده های رسانه های اجتماعی: چالش ها، فرصت ها و محدودیت ها در مطالعات شهری. محاسبه کنید. محیط زیست سیستم شهری 2019 ، 74 ، 161-174. [ Google Scholar ] [ CrossRef ]
  17. گارای، ال. مورالس، اس. درک ایجاد تصاویر مقصد از طریق گفتگوی توییتری جشنواره. بین المللی جشنواره رویداد J. مدیریت 2017 ، 8 ، 39-54. [ Google Scholar ] [ CrossRef ]
  18. ژو، جی. وانگ، جی آر. ژانگ، درک JQ و تفاوت‌های منطقه‌ای جشنواره‌های سنتی چینی توسط کاربران Weibo. J. Geo-Inf. علمی 2019 ، 21 ، 77–85. [ Google Scholar ] [ CrossRef ]
  19. لیو، ی. لیو، ایکس. گائو، اس. گونگ، ال. کانگ، سی. ژی، ی. چی، جی. شی، ال. حس اجتماعی: رویکردی جدید برای درک محیط های اجتماعی-اقتصادی ما. ان دانشیار صبح. Geogr. 2015 ، 105 ، 512-530. [ Google Scholar ] [ CrossRef ]
  20. لیو، جی. منگ، بی. وانگ، جی. چن، اس. تیان، بی. ژی، جی. بررسی الگوهای فضایی-زمانی فعالیت‌های روزانه ساکنان با استفاده از داده‌های رسانه‌های اجتماعی مبتنی بر متن: مطالعه موردی پکن، چین. ISPRS Int. J. Geo-Inf. 2021 ، 10 ، 389. [ Google Scholar ] [ CrossRef ]
  21. Carmela, C. NexT: چارچوبی برای پیش بینی مکان بعدی در شبکه های اجتماعی مبتنی بر مکان. بدانید. سیستم مبتنی بر 2020 ، 204 ، 106205. [ Google Scholar ]
  22. حسن، م. Orgun، MA; Schwitter, R. نظرسنجی در مورد تشخیص رویداد در زمان واقعی از جریان داده توییتر. J. Inf. علمی 2018 ، 44 ، 443-463. [ Google Scholar ] [ CrossRef ]
  23. میناتل، دی. فریرا، وی. Lopes، ADA وضوح نهاد محلی برای ساخت شبکه های اجتماعی مبتنی بر مکان با استفاده از نقاط اقامت. نظریه. محاسبه کنید. علمی 2021 ، 851 ، 62-76. [ Google Scholar ] [ CrossRef ]
  24. حسن، س. ژان، XY; Ukkusuri، SV درک فعالیت های انسانی شهری و الگوهای تحرک با استفاده از داده های مبتنی بر مکان در مقیاس بزرگ از رسانه های اجتماعی آنلاین. در مجموعه مقالات دومین کارگاه بین المللی ACM SIGKDD در محاسبات شهری، شیکاگو، IL، ایالات متحده آمریکا، 11 اوت 2013. [ Google Scholar ]
  25. مایر، اس وی؛ Cukier, K. Big Data: انقلابی که نحوه زندگی، کار و تفکر ما را متحول خواهد کرد، چاپ مجدد ویرایش. ; Houghton Mifflin Harcourt: Boston, MA, USA, 2013. [ Google Scholar ]
  26. لیو، ی. بازاندیشی برخی مسائل اساسی جغرافیای انسانی از منظر ادراک اجتماعی. Acta Geogr. گناه 2016 ، 71 ، 564-575. [ Google Scholar ]
  27. سالنامه آماری پکن 2020. در دسترس آنلاین: https://nj.tjj.beijing.gov.cn/nj/main/2020-tjnj/zk/indexch.htm (در 25 مه 2021 قابل دسترسی است).
  28. جهان بر اساس GaWC 2018. موجود به صورت آنلاین: https://www.lboro.ac.uk/gawc/world2018t.html (دسترسی در 25 مه 2021).
  29. اطلاعیه هفتمین سرشماری سراسری شهرداری پکن (شماره 3). در دسترس آنلاین: https://www.beijing.gov.cn/gongkai/shuju/sjjd/202105/t20210519_2392888.html (در 28 ژوئن 2021 قابل دسترسی است).
  30. گزارش توسعه کاربر Weibo 2020. در دسترس آنلاین: https://weibo.com/ttarticle/p/show?id=2309404613871951282183 (در 19 مه 2021 قابل دسترسی است).
  31. دولین، جی. چانگ، مگاوات؛ تره فرنگی.؛ Toutanova، K. BERT: پیش آموزش ترانسفورماتورهای عمیق دو جهته برای درک زبان. در مجموعه مقالات کنفرانس 2019 بخش آمریکای شمالی انجمن زبانشناسی محاسباتی، مینیاپولیس، MN، ایالات متحده آمریکا، 2 تا 7 ژوئن 2019؛ صص 4171-4186. [ Google Scholar ]
  32. در دسترس آنلاین: https://github.com/ThilinaRajapakse/simpletransformers (در 5 ژوئیه 2021 قابل دسترسی است).
  33. ولف، تی. چاوموند، جی. اولین، ال. Sanh، V. دلانگ، سی. موی، ا. سیستاک، پی. فونتوویچ، ام. دیویسون، جی. شلیفر، اس. و همکاران Trans-formers: پیشرفته ترین پردازش زبان طبیعی. در مجموعه مقالات کنفرانس 2020 در مورد روش های تجربی در پردازش زبان طبیعی: نمایش سیستم، آنلاین، 5 تا 10 ژوئیه 2020؛ صص 38-45. [ Google Scholar ]
  34. لی، آر. ژانگ، WB کاربرد فناوری داده کاوی بر اساس الگوریتم TF-IDF و مدل موضوعی LDA در متن شکایت مشتری قدرت. فنی خودکار Appl. 2018 ، 37 ، 46-50. [ Google Scholar ]
  35. گائو، تی تی. لیو، WZ; منگ، بی. هوانگ، اس. چن، SY مطالعه ادراک مناطق فشرده منابع فرهنگی مدل بر اساس موضوع-مطالعه موردی منطقه منتوگو پکن. J. دانشگاه اتحادیه پکن. 2019 ، 33 ، 45-55. [ Google Scholar ]
  36. وانگ، پی. گائو، سی. چن، تحقیقات XM در مورد مدل LDA بر اساس خوشه بندی متن. Inf. علمی 2015 ، 33 ، 63-68. [ Google Scholar ]
  37. Blei، DM; Ng، AY؛ جردن، MI تخصیص دیریکله نهفته. جی. ماخ. فرا گرفتن. Res. 2003 ، 3 ، 993-1022. [ Google Scholar ]
  38. بهره دار، ع. Purves، RS شرح و توصیف ویژگی‌های مکان با استفاده از مدل‌سازی موضوع بر روی برچسب‌های جغرافیایی مرجع. ژئو اسپات. Inf. علمی 2018 ، 21 ، 173-184. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  39. ژای، جی. روش تحلیل فضایی جین، XC GIS در برنامه ریزی شهری. طرح شهری. 2014 ، 38 ، 130-135. [ Google Scholar ]
  40. نیش، ی. Yan, W. ردیابی موضوعات جغرافیایی شهری بر اساس مدل موضوع پویا. محاسبه کنید. محیط زیست سیستم شهری 2020 , 79 , 101419. [ Google Scholar ] [ CrossRef ]
  41. لیو، ی. هوانگ، KX; بائو، جی جی. چن، کی کیو به صداها از خانه گوش کنید: تحلیلی از احساسات گردشگران چینی در مورد مقاصد استرالیا. تور. مدیریت 2019 ، 71 ، 337-347. [ Google Scholar ] [ CrossRef ]
  42. سان، ز. شی، پی. تحلیل تفاوت منطقه ای توسعه شهری در پکن. شهری. توسعه دهنده گل میخ. 2012 ، 19 ، 56-59. [ Google Scholar ]
شکل 1. مکان داده های Weibo در جشنواره های پکن.
شکل 2. چارچوب تحقیق فعالیت های جشنواره ساکنان بر اساس داده های رسانه های اجتماعی.
شکل 3. نقشه فرکانس کلمه.
شکل 4. تصویر ابری کلمه از پست های Weibo مربوط به جشنواره.
شکل 5. درصد نتایج بخشی از گفتار از پست‌های Weibo مربوط به جشنواره، تقسیم بر نوع جشنواره. سایه آبی-اسم; سایه نارنجی – افعال; سایه سبز – صفت.
شکل 6. آمار نتیجه بخشی از گفتار از پست های Weibo مربوط به جشنواره، تقسیم بر نوع جشنواره.
شکل 7. نقشه تراکم هسته فعالیت های جشنواره ساکنان پکن.
شکل 8. نقشه توزیع فضایی LDA جشنواره های سنتی.
شکل 9. نقشه توزیع فضایی LDA جشنواره های خارجی.
شکل 10. نقشه توزیع فضایی LDA جشنواره های مدرن.

بدون دیدگاه

دیدگاهتان را بنویسید