خلاصه
یکی از اجزای مهم تحقیق در جغرافیای فرهنگی شامل کاوش و تحلیل قوانین تفاوت های فرهنگی منطقه ای است. این موضوع در کشف فرهنگ های متمایز، حفاظت از فرهنگ های منطقه ای و درک عمیق تفاوت های فرهنگی اهمیت قابل توجهی دارد. در سالهای اخیر، با چرخش فضایی جامعهشناسی، محققان توجه فزایندهای را به اطلاعات فضایی ضمنی در دادههای رسانههای اجتماعی و همچنین پدیدههای اجتماعی و قوانینی که منعکس میکنند، معطوف کردهاند. درک پدیده های اجتماعی-فرهنگی و ویژگی های توزیع فضایی آنها از طریق متون جنبه مهمی است. با استفاده از روشهای یادگیری ماشینی، مانند رویکرد محبوب پردازش زبان طبیعی (NLP)، این مطالعه عناصر فرهنگی کانونی را از دادههای متنی استخراج میکند و الگوهای تعامل فضایی فرهنگهای خاص و همچنین ویژگیهای احساسات نسبت به فرهنگهای غیربومی را به دقت تشخیص میدهد. از طریق NLP، این مطالعه با تجزیه و تحلیل 6128 پاسخ به این سؤال، تفاوتهای بین جنوب و شمال چین که تاکنون میدانید، تفاوتهای فرهنگی میان مردم چین جنوبی و شمالی را بررسی میکند. در پلتفرم پرسش و پاسخ Zhihu ارسال شده است. علاوه بر این، این مطالعه احساسات افراد و شناخت تفاوتهای فرهنگی بین جنوب و شمال چین را در سه جنبه، یعنی الگوهای تعامل فضایی عناصر فرهنگی کانون، مؤلفههای فرهنگهای کانونی و ویژگیهای عاطفی تحت تأثیر تفاوتهای فرهنگی بین دو منطقه بررسی میکند. . نتایج نشان می دهد که: (1) مردم شمال و جنوب چین تفاوت های قابل توجهی در شناخت فرهنگ یکدیگر از خود نشان می دهند. (2) در میان تفاوت های فرهنگی متعدد، فرهنگ غذایی محبوب ترین است. و (3) مردم تمایل دارند نگرش منفی نسبت به فرهنگ غذایی متفاوت با فرهنگ خود داشته باشند. این عوامل می توانند تفاوت های فرهنگی منطقه ای را روشن کنند و به حل تعارضات فرهنگی کمک کنند. علاوه بر این، این مطالعه راهحلهای مؤثری را از منظر کلان ارائه میکند که برای جغرافیای فرهنگی جدید چالش برانگیز بوده است. این عوامل می توانند تفاوت های فرهنگی منطقه ای را روشن کنند و به حل تعارضات فرهنگی کمک کنند. علاوه بر این، این مطالعه راهحلهای مؤثری را از منظر کلان ارائه میکند که برای جغرافیای فرهنگی جدید چالش برانگیز بوده است. این عوامل می توانند تفاوت های فرهنگی منطقه ای را روشن کنند و به حل تعارضات فرهنگی کمک کنند. علاوه بر این، این مطالعه راهحلهای مؤثری را از منظر کلان ارائه میکند که برای جغرافیای فرهنگی جدید چالش برانگیز بوده است.
کلید واژه ها:
تفاوت های فرهنگی ؛ جغرافیای فرهنگی ; تحلیل احساسات ؛ الگوهای تعامل فضایی داده های موضوع Zhihu
1. معرفی
همزمان با تحولات و تحولات جامعه، پدیده های بدیع فرهنگی متعددی پدید آمده است. مطالعه فرهنگ اجتماعی از منظر جغرافیایی توجه روزافزونی از سوی جغرافیدانان را به خود جلب کرده است. علاوه بر این، جغرافیای فرهنگی به عنوان یکی از شاخه های مهم جغرافیای انسانی، روند توسعه تدریجی را طی کرده است. با نگاهی به توسعه آن، چندین محقق بر این باورند که از جغرافیای فرهنگی متعارف به جغرافیای فرهنگی جدید تبدیل شده است، که به جریان اصلی در مطالعات جغرافیای فرهنگی تبدیل شده است [ 1 ، 2 ]. برخی دیگر معتقدند که «جدید» و «قدیمی» دو ایده تحقیقاتی متفاوت هستند [ 3]. دیدگاه اخیر حاکی از مطالعه حاضر است. در این میان، ما معتقدیم که نگاه فرهنگی از پایین به بالا و معنای فرهنگی زندگی روزمره و رویههای اجتماعی که در جغرافیای فرهنگی جدید مورد تأکید قرار گرفته است، از اهمیت زیادی برای این حوزه برخوردار است [ 4 ، 5 ]. مطالعات قبلی از منظر جغرافیای فرهنگی جدید بیشتر بر تحلیل پدیده های فرهنگی در سطح خرد متمرکز بوده است. علاوه بر این، جغرافیای فرهنگی جدید در تحلیل پدیده های کلان فرهنگی بی اثر به نظر می رسد. علاوه بر این، چندین محقق معتقدند که بررسی پدیدههای کلان فرهنگی از منظر جغرافیا به چارچوب پژوهشی سنتی جغرافیای فرهنگی بازگشته است [ 2 ، 6 ، 7 ].]. دلیل اصلی این باور این است که با توجه به پدیده های کلان فرهنگی، به دست آوردن داده ها برای بیان معانی، ارزش ها و گفتمان در یک زمینه اجتماعی خاص در مقیاس بزرگ برای فناوری های گذشته دشوار است. با این حال، چنین نگرانی هایی کانون اصلی جغرافیای فرهنگی جدید هستند [ 8 ، 9 ]. در سالهای اخیر، با ظهور فناوری دادههای بزرگ، تعداد زیادی از رویکردهای اکتساب و تحلیل جدید برای تولید دادههای اجتماعی، جمعآوری و تحلیل دادههای اجتماعی و فرهنگی پدید آمده است. چنین روش هایی می توانند امکانات و فرصت های بی نهایتی را برای مطالعه جغرافیای فرهنگی جدید از سطح کلان فراهم کنند [ 7 ، 10 ].]. منابع دادههای اجتماعی و فرهنگی معمولی شامل دادههای رسانههای اجتماعی از توییتر، Weibo و Zhihu است. نظرات کاربران در مورد یک پدیده اجتماعی خاص را می توان از حجم زیادی از داده های رسانه های اجتماعی استخراج کرد و نگرش گروه های خاص نسبت به زندگی روزمره را می توان تحلیل کرد [ 11 ، 12 ]. ظهور هوش مصنوعی و فنآوریهای یادگیری ماشینی به طور فزاینده بالغ، مانند پردازش زبان طبیعی (NLP)، رویکردهای علمی بیشتری را برای تجزیه و تحلیل کلمات، استخراج عقاید و تحلیل عاطفی بر اساس دادههای بزرگ متون اجتماعی ارائه کرده است [ 13 ، 14 ، 15 ].]. چنین پیشرفتهایی برای تحقیقات پدیدههای فرهنگی کلان که در چارچوب جغرافیای فرهنگی جدید راهاندازی شدهاند سودمند است.
جغرافیای فرهنگی جدید تاکید میکند که فرهنگ محصول ساخت فعال گروههای اجتماعی مختلف است، نه تبلور تمدن بشری که توسط چند متخصص یا نخبگان شناسایی شده است [ 6 ، 7 ، 10 ].]. یک مثال جالب بیان میکند که از منظر جغرافیای فرهنگی، تفاوتهای محلی و بین منطقهای بین جنوب و شمال چین در درجه اول در تفاوتهای فرهنگی بین آنها منعکس میشود. از منظر جغرافیای فرهنگی جدید، این گونه تفاوتهای فرهنگی ناشی از تغییرات در زندگی روزمره و اعمال است که معانی و ارزشهای خاصی دارد. مطالعه چگونگی ساختن زندگی روزمره تجربه فرد از فضا و مکان، جنبه های مختلفی از جمله غذا، زبان، آداب و رسوم و غیره را در بر می گیرد [ 16 ، 17 ].]. ویژگی های رژیم غذایی و آداب و رسوم جنوب و شمال چین حامل دقیق فرهنگ های اصیل محلی این مناطق است. در عبور از مناطق مختلف، مانند زمانی که مردم شمال به جنوب می روند یا برعکس، فرهنگ ها و گویش های غذایی کاملاً برجسته می شوند. در چارچوب جغرافیای فرهنگی جدید، تضادهایی بین فرهنگهای محلی و خارجی رخ میدهد و در نتیجه مجموعهای از تجربیات محلی را به وجود میآورد و برخی مکانها را با عناصر فرهنگی خاص برچسبگذاری میکند [ 18 ]. بنابراین، این سؤال پیش میآید: چگونه میتوان این عناصر فرهنگی را در زندگی روزمره از پایین به بالا حس کرد؟
در گذشته، جغرافی دانان فرهنگی به طور موثر برداشت مردم از مکان ها را از طریق پرسشنامه و مصاحبه تحلیل می کردند [ 19 ، 20 ]. تا حدی، ادراک از ویژگی های عنصر فرهنگی عمدتاً از طریق مصاحبه یا داده های پرسشنامه به دست آمده است. در همان زمان، نظریه تصویر فرهنگی به تحقیقات جغرافیای فرهنگی معرفی شد [ 21 ]. تصویر به عنوان یک مفهوم روانشناختی اولین بار توسط محقق آمریکایی بولدینگ، KE در سال 1956 [ 22 ] ارائه شد. در سال 1965، این مفهوم توسط رینولدز به تحقیقات گردشگری معرفی شد [ 23 ]. تقریباً در همان زمان، کوین لینچ یک روش تحقیق برای تصویر شهر پیشنهاد کرد [ 24 ، 25 ]]، که شامل احساسات مردم در مورد یک شهر می شود [ 26 ]. در توسعه تدریجی خود، تصویر شهر از محیط فیزیکی یک شهر به تصاویر فرهنگی حاوی عناصر غیر مادی مانند فرهنگ شهر گسترش یافت [ 27 ]. دو تصویر بالا متعلق به یک مفهوم است که ارتباط تنگاتنگی با تفکر انسان دارد. علاوه بر این، آنها ایده ها و سناریوهایی از اشیاء درک شده در ذهن ما هستند. از منظر فرهنگ، یک تصویر فرهنگی را می توان به عنوان یک نماد فرهنگی در نظر گرفت که نشان دهنده نحوه درک مردم از فرهنگ اشیا است. محققان با استفاده از داده های نظرسنجی و مصاحبه به عنوان مواد اصلی، مفهوم فرهنگ گردشگری را از منظر تصویر فرهنگی مورد بررسی قرار داده اند [ 28 ، 29 ]]. چندین محقق نیز تلاش کرده اند تا هویت اصیل فرهنگ های قومی را بر اساس تصویر فرهنگی مطالعه کنند [ 30 ]. به طور خلاصه، نظریه تصویر فرهنگی با موفقیت وارد مطالعه جغرافیای فرهنگی شده است، به ویژه در جغرافیای شهری و جغرافیای گردشگری، که بر ویژگی های فرهنگی تأکید دارد.
ظهور کلان داده فرصت های جدیدی را برای تحقیقات مرتبط با تصویر فرهنگی به ارمغان آورده است. در سالهای اخیر، بر اساس دادههای مختلف رسانههای اجتماعی، محققان داخلی و بینالمللی مطالعات متعددی را در مورد تصاویر فرهنگی شهرها و مقاصد گردشگری انجام دادهاند [ 31 ، 32]. دادههای رسانههای اجتماعی دارای نمونههای کاربر بزرگ و فرکانسهای بهروزرسانی سریع هستند و حاوی احساسات مردم هستند. بیشتر مطالب از احساسات و نظرات واقعی مردم از زندگی و اعمال روزمره آنها سرچشمه می گیرد. مهمتر از همه، این داده ها حاوی اطلاعات مکان هستند. به عبارت دیگر، کلمات موضوعی را می توان از داده های عظیم رسانه های اجتماعی برای تجزیه و تحلیل احساسات استخراج کرد. علاوه بر این، کلمات موضوعی را میتوان برای درک ساخت کمی، خودکار و فضایی نقشههای معنا و درک جامع بازخورد در جنبههای مختلف زندگی روزمره از مردم مناطق مختلف، قرار داد و بهصورت مکانی خوشهبندی کرد. علاوه بر این، NLP پیشرفت قابل توجهی در استخراج دیدگاه مبتنی بر متن، استخراج کلمات موضوعی، و در تحلیل معنایی احساسات داشته است [ 33 ، 34 ،35 ]. نمونههای فراوانی برای استخراج نام مکان و تشخیص نوع موجود است، که میتواند دادهها و مبنایی برای روشهای تجزیه و تحلیل در این مطالعه فراهم کند و امکانسنجی تحلیل را به طور قابلتوجهی ارتقا دهد.
ادراک و تحلیل تصویر فرهنگی بر اساس اطلاعات، مانند داده های رسانه های اجتماعی، با روش تحقیق جغرافیای فرهنگی جدید مطابقت دارد. این روش پژوهشی بر معانی فرهنگی و نظامهای ارزشی از زندگی روزمره و عملکرد مردم تأکید میکند. این مطالعه دادههای پرسش و پاسخ مرتبط با جغرافیا را از Zhihu، که بزرگترین پلتفرم پرسش و پاسخ در چین است، به عنوان منبع داده اصلی آن اتخاذ میکند. علاوه بر این، تلاش میکند تا شناخت تفاوتهای فرهنگی بین چین جنوبی و شمالی را از طریق تجزیه و تحلیل متن، برچسبگذاری قسمتی از گفتار (POS)، استخراج اسم مناسب و خوشهبندی کلمات موضوعی با استفاده از NLP ایجاد کند. در نهایت، آن را تحت تأثیر تفاوت های فرهنگی بین جنوب و شمال چین تجزیه و تحلیل احساسات انجام می دهد [ 36 ، 37 ، 38].
2. منطقه مطالعه و توصیف داده ها
این مطالعه کل قلمرو چین را به عنوان منطقه مورد مطالعه خود در نظر می گیرد، همانطور که در شکل 1 نشان داده شده است. موضوع اصلی این مطالعه شامل تعامل و تفاوت در فرهنگ غذایی بین جنوب و شمال چین است. بنابراین، تمایز شمال از جنوب از دیدگاههای جغرافیایی خاص برای جلوگیری از ابهام در مورد مفهوم مناطق شمالی و جنوبی، که ممکن است نتایج تحلیل را تحت تأثیر قرار دهد، ضروری است. در چین، خط تقسیم شمال-جنوب به طور گسترده ای وجود دارد که از کل شرق و غرب چین می گذرد [ 39 ، 40 ]، همانطور که با خط قرمز در شکل 1 نشان داده شده است.. علاوه بر این، خط تقسیم شمال-جنوب به رسمیت شناخته شده عمومی نه تنها توسط جغرافیدانان به طور عینی اثبات شده و به رسمیت شناخته شده است، بلکه به طور گسترده توسط مردم پذیرفته شده است [ 41 ، 42 ].
داده های تحقیقاتی این مطالعه از 7212 پاسخ به یک سوال رایج در مورد ژیهو که می پرسد، “تفاوت های بین جنوب و شمال چین که تا به حال می دانید چیست؟” Zhihu در حال حاضر بزرگترین انجمن پرسش و پاسخ مبتنی بر دانش در چین است. طبق آمار رسمی تا سپتامبر 2017، Zhihu بیش از 100 میلیون کاربر ثبت نام شده و 26 میلیون کاربر فعال روزانه داشته است. جمع آوری داده ها در فوریه 2018 انجام شد. چندین پاسخ به دلیل نقض مفاد مربوطه در سایت پنهان شده بود. بنابراین تعداد واقعی پاسخ های استفاده شده در این تحقیق 6128 پاسخ است که 93.23 درصد از کل نظرات را به خود اختصاص داده است.
3. روش شناسی
این مقاله شامل سه بخش اصلی، یعنی تجزیه و تحلیل دادههای موضوعی و آمار، تحلیل مدلسازی فضایی دادههای موضوع فرهنگی و سازماندهی روش نقشه اطلاعات علوم زمین و بیان تصویری آن است. تجزیه و تحلیل دادههای موضوعی و آمار عمدتاً تقسیمبندی کلمات بدون نظارت، آمار کلمات، آموزش پیکربندی، طبقهبندی کلمات و آمار و غیره را پوشش میدهد. مدلسازی فضایی و تجزیه و تحلیل دادههای موضوعی فرهنگی عمدتاً شامل تجزیه و تحلیل دادههای آماری از طریق تحلیل و مدلسازی فضایی برای کشف ویژگیها و قوانین توزیع فضایی است. در نهایت، کانونهای شناختی فرهنگهای جنوبی و شمالی، و همچنین عناصر فرهنگی کانون با استفاده از نقشه اطلاعات زمینشناسی تجسم میشوند. علاوه بر این، تحلیل عاطفی بر روی کلمات با استفاده از NLP انجام شد.شکل 2 .
3.1. پیش پردازش متن
از نظر پیش پردازش، این مطالعه عمدتاً منطقهسازی را از دو جنبه معرفی میکند، یعنی تکنیکهای تقسیمبندی کلمات چینی و حذف کلمات توقف. بیشتر پاسخ ها و نظرات در ژیهو به زبان چینی است. کلمات کوچکترین واحدهای معنادار گفتار هستند. برخلاف زبان انگلیسی که از فضا به عنوان جداکننده طبیعی استفاده میکند، چینی کاراکترها را بهعنوان واحدهای اصلی بدون تمایز بین کلمات استفاده میکند. بنابراین، تقسیم بندی کلمات در زبان چینی برای تجزیه و تحلیل احساسات اساسی و ضروری است. سیستمهای تقسیمبندی کلمات چینی بالغ شامل مؤسسه فناوری محاسباتی، سیستم تحلیل واژگانی چینی (ICTCLAS) توسط آکادمی علوم چین، سیستم تحلیل واژگانی آزمایشگاهی بازیابی اطلاعات (IRLAS) است که توسط مؤسسه فناوری هاربین توسعه داده شده است. و تقسیم بندی کلمات چینی ساده (SCWS) که بر اساس زبان C توسعه یافته است. این مطالعه از ICTCLA استفاده می کند که توسط آکادمی علوم چین توسعه یافته است [43 ]. این سیستم شامل چهار ویژگی زیر است: (1) با استفاده از مدل آبشاری Hidden Markov (HMM)، ICTCLAS تجزیه و تحلیل واژگانی چینی را در یک چارچوب یکپارچه قرار می دهد، که می تواند دقت تقسیم بندی کلمات را بهبود بخشد. (2) از تماس های چند رشته ای پشتیبانی می کند که می تواند سرعت بخش بندی کلمات را بهبود بخشد. (3) سیستم نه تنها می تواند کلمات و نمادهای ساده و سنتی چینی بلکه انگلیسی را نیز تشخیص دهد. و (4) به کاربران این امکان را می دهد که فرهنگ لغت سفارشی احساسات را به فرهنگ لغت تقسیم بندی کلمه اضافه کنند تا ثبات عملکرد را افزایش دهند.
کلمات توقف، همچنین به عنوان کلمات تابعی شناخته می شوند، دسته ای از کلمات هستند که معنای واقعی ندارند. در این پژوهش، در تحلیل معنایی متون نظرات ژیهو، کلمات توقف به کلمات شکلی، حروف اضافه، ضمایر و سایر کاراکترهای بی ربط با ظاهر کم یا زیاد در متن اطلاق می شود. کلمات متداول مانند “#”، “@” و “https://” در متن Zhihu را به عنوان مثال در نظر بگیرید. چنین کلماتی معنای عملی ندارند و به تحلیل احساسات بی ربط هستند. بنابراین، فیلتر کردن کلمات توقف قبل از تجزیه و تحلیل متن ضروری است.
3.2. الگوهای تعامل فضایی در میان فرهنگ های مختلف
3.2.1. استنتاج رابطه نام مکان
در داده های متنی، چندین کاربر از نام شهرهای سطح استان برای نشان دادن مکان استفاده می کنند، در حالی که دیگران از نام استان و منطقه (مانند شمال شرقی، شمال غربی و غیره) استفاده می کنند که اجتناب ناپذیر است. برای حل این مشکل، این مقاله از شهرهای سطح استان به عنوان واحد تحلیل اساسی در طراحی قوانین برای NLP استفاده میکند. با این حال، هنگامی که نام مکان ها به عنوان استان ظاهر می شود، از شهرهای مرکز استان برای نشان دادن استان هایی که شهرهای سطح استان در آن قرار دارند استفاده می کنیم. هنگامی که نام مکان ها ظاهر می شوند، از مرکز (مرکز ثقل) یک ناحیه برای نشان دادن آنها استفاده می کنیم. هنگامی که چندین نام مکان با روابط فراگیر به طور همزمان ظاهر می شوند، ما پایین ترین سطح را برای نشان دادن آنها انتخاب می کنیم. نام مکان ها در چین به سه سطح تقسیم می شود. سطح 1 مناطق را نشان می دهد (به عنوان مثال، مناطق شمال غربی و جنوب شرقی یا جیانگ سو، ژجیانگ، و مناطق شانگهای)؛ سطح 2 به استان ها (به عنوان مثال، جیانگ سو و آنهویی) اشاره می کند. و سطح 3 نشان دهنده شهرها (به عنوان مثال، نانجینگ، چونگ کینگ، و گویلین) است. این سطوح به عنوان استخر نام مکان ما استفاده می شود. با این حال، هنگام بحث درباره تفاوتهای جنوب و شمال، متن ممکن است شامل تعداد زیادی نام مکان باشد و روابط بین نام مکانها پیچیده است. روابط پیچیده بین نام مکان های متعدد، استدلال را بسیار چالش برانگیز می کند. با تجزیه و تحلیل مقدار زیادی از متن ژیهو، ما دو رابطه اصلی را بین نام مکان ها مشاهده کردیم، یعنی شمول و روابط موازی. در مرحله بعد، با در نظر گرفتن محتوای واقعی متن ژیهو به عنوان مثال، این مطالعه به طور خلاصه رابطه بین نام مکان ها را توضیح می دهد. به عنوان مثال، Heilongjiang، شمال شرقی، و شمال در و سطح 3 نشان دهنده شهرها (به عنوان مثال، نانجینگ، چونگ کینگ، و گویلین) است. این سطوح به عنوان استخر نام مکان ما استفاده می شود. با این حال، هنگام بحث درباره تفاوتهای جنوب و شمال، متن ممکن است شامل تعداد زیادی نام مکان باشد و روابط بین نام مکانها پیچیده است. روابط پیچیده بین نام مکان های متعدد، استدلال را بسیار چالش برانگیز می کند. با تجزیه و تحلیل مقدار زیادی از متن ژیهو، ما دو رابطه اصلی را بین نام مکان ها مشاهده کردیم، یعنی شمول و روابط موازی. در مرحله بعد، با در نظر گرفتن محتوای واقعی متن ژیهو به عنوان مثال، این مطالعه به طور خلاصه رابطه بین نام مکان ها را توضیح می دهد. به عنوان مثال، Heilongjiang، شمال شرقی، و شمال در و سطح 3 نشان دهنده شهرها (به عنوان مثال، نانجینگ، چونگ کینگ، و گویلین) است. این سطوح به عنوان استخر نام مکان ما استفاده می شود. با این حال، هنگام بحث درباره تفاوتهای جنوب و شمال، متن ممکن است شامل تعداد زیادی نام مکان باشد و روابط بین نام مکانها پیچیده است. روابط پیچیده بین نام مکان های متعدد، استدلال را بسیار چالش برانگیز می کند. با تجزیه و تحلیل مقدار زیادی از متن ژیهو، ما دو رابطه اصلی را بین نام مکان ها مشاهده کردیم، یعنی شمول و روابط موازی. در مرحله بعد، با در نظر گرفتن محتوای واقعی متن ژیهو به عنوان مثال، این مطالعه به طور خلاصه رابطه بین نام مکان ها را توضیح می دهد. به عنوان مثال، Heilongjiang، شمال شرقی، و شمال در متن ممکن است شامل تعداد زیادی نام مکان باشد و روابط بین نام مکان ها پیچیده است. روابط پیچیده بین نام مکان های متعدد، استدلال را بسیار چالش برانگیز می کند. با تجزیه و تحلیل مقدار زیادی از متن ژیهو، ما دو رابطه اصلی را بین نام مکان ها مشاهده کردیم، یعنی شمول و روابط موازی. در مرحله بعد، با در نظر گرفتن محتوای واقعی متن ژیهو به عنوان مثال، این مطالعه به طور خلاصه رابطه بین نام مکان ها را توضیح می دهد. به عنوان مثال، Heilongjiang، شمال شرقی، و شمال در متن ممکن است شامل تعداد زیادی نام مکان باشد و روابط بین نام مکان ها پیچیده است. روابط پیچیده بین نام مکان های متعدد، استدلال را بسیار چالش برانگیز می کند. با تجزیه و تحلیل مقدار زیادی از متن ژیهو، ما دو رابطه اصلی را بین نام مکان ها مشاهده کردیم، یعنی شمول و روابط موازی. در مرحله بعد، با در نظر گرفتن محتوای واقعی متن ژیهو به عنوان مثال، این مطالعه به طور خلاصه رابطه بین نام مکان ها را توضیح می دهد. به عنوان مثال، Heilongjiang، شمال شرقی، و شمال در با در نظر گرفتن محتوای واقعی متن ژیهو به عنوان مثال، این مطالعه به طور خلاصه رابطه بین نام مکان ها را توضیح می دهد. به عنوان مثال، Heilongjiang، شمال شرقی، و شمال در با در نظر گرفتن محتوای واقعی متن ژیهو به عنوان مثال، این مطالعه به طور خلاصه رابطه بین نام مکان ها را توضیح می دهد. به عنوان مثال، Heilongjiang، شمال شرقی، و شمال درجدول 1 روابط شمول است، در حالی که پکن، شیان، سوژو، نانجینگ و شیامن در جدول 2 به روابط موازی تعلق دارند.
3.2.2. طبقه بندی موضوعات داغ فرهنگی
طبقه بندی موضوع می تواند به طور موثر اطلاعات پنهان در پشت متون عظیم را شناسایی کند و اهمیت قابل توجهی برای تشخیص اطلاعات متنی مانند تشخیص موضوع و طبقه بندی متن دارد. تخصیص دیریکله پنهان (LDA) یک مدل موضوع سند است که شامل سه سطح به نام های سند، موضوع و کلمه است. این مدل میتواند اطلاعات موضوع نهفته را در مجموعههای اسناد بزرگ یا مجموعهای با استفاده از تکنیکهای یادگیری ماشین بدون نظارت [ 44 ، 45 ] شناسایی کند. ایده اصلی شامل برخورد با هر سند به عنوان توزیع ترکیبی از موضوعات و هر موضوع به عنوان توزیع احتمال کلمات است. فرآیند تولید یک متن با استفاده از مدل LDA به شرح زیر است:
- (1)
-
نمونه برداری بر روی توزیع دیریکله، که فراپارامتر آن α است ، برای تولید توزیع موضوع انجام می شودθمن�مناز سند دمندمن.
- (2)
-
سه عملیات زیر برای هر کلمه در انجام می شود دمندمن. ابتدا نمونه برداری بر روی توزیع چندجمله ای انجام می شود θمن�من، نشان دهنده موضوعات، برای تولید موضوع مربوطه خود است زمن جزمن�. دوم، نمونه برداری بر روی توزیع دیریکله انجام می شود که فراپارامتر آن است β�، برای تولید موضوع زمن جزمن�‘s مربوط به توزیع کلمه است Ψزمن ج�زمن�. سوم، نمونه برداری بر روی توزیع چند جمله ای انجام می شود Ψزمن ج�زمن�، نشان دهنده کلمات، برای تولید کلمه دبلیومن جدبلیومن�.
این مطالعه از یک کلاس موضوعی شناسایی شده توسط LDA به عنوان ورودی تحلیل احساسات کاربران Zhihu استفاده می کند و از یک شاخص انسجام موضوعی برای ارزیابی کیفیت موضوع مدل سازی LDA استفاده می کند [ 46 ]. انسجام موضوع با محاسبه شباهت های معنایی بین کلمات دارای امتیاز بالا در یک موضوع، به طور خاص، امتیاز موضوع را به دست می آورد، c o h e r e n c e ( V) =∑(vمن،vj) ∈ Vs c o r e (vمن،vj، ϵ )ج�ساعته�ه�جه(�)=∑(�من،��)∈�سج��ه(�من،��،�)، که در آن V مجموعه ای از کلمات است که یک موضوع را توصیف می کند و ϵ�یک عامل هموارسازی برای اطمینان از اینکه نمره برگشتی یک عدد واقعی است. علاوه بر این، این مطالعه از روش ارزیابی انسجام UMasstopic پیشنهاد شده توسط Mimno و همکاران استفاده میکند. برای ارزیابی کیفیت موضوع [ 47 ]. معادله امتیاز UMass است s c o r e (vمن،vj, ϵ ) =logد (vمن،vj) + εد (vj)سج��ه(�من،��،�)=ل���(�من،��)+��(��)(2)، کجا د (vمن،vj)�(�من،��)تعداد کل متون Weibo حاوی کلمات vi و vj و D ( vj ) تعداد کل متون Weibo حاوی کلمه است. vj��. این مطالعه از نمره انسجام موضوع برای تعیین مناسب ترین تعداد موضوعات استفاده می کند [ 46 ].
پس از پردازش و تجزیه و تحلیل با استفاده از مدل LDA، متوجه میشویم که تفاوتهای بین شمال و جنوب عمدتاً شامل غذاهای اصلی، تنقلات، سلامها، سلیقهها، لباسها، لهجهها، آب و هوا، جشنوارهها و غیره است. علاوه بر این، چندین موضوع، مانند غذاهای اصلی، می توانند ادغام شوند. در این میان تنقلات، مزه ها و … را می توان به عنوان رژیم غذایی و … ترکیب کرد. این مطالعه موضوعات مرتبط را به 15 دسته تقسیم می کند، مانند مکان، شیء جغرافیایی، نام مکان، حیوان، گویش، لباس، آب و هوا، احساسات، اعضای بدن، ویژگی های بدن، عادت زندگی، زمان، رژیم غذایی و گیاهان، همانطور که در جدول 3 نشان داده شده است. .
3.2.3. تحلیل احساسات
پس از ایجاد موضوع در Zhihu توسط مدیر انجمن، فقط کاربران اینترنتی علاقه مند به موضوع پاسخ می دهند یا نظر می نویسند. از این رو، بیشتر پاسخ ها و نظرات مربوط به موضوع است. استخراج صحیح کلمات احساسی در ارزیابی، کلید تحلیل احساسات است. روش دیکشنری یکی از مهم ترین تکنیک های تحلیل احساسات است. ایده اصلی شامل استفاده از جملات به عنوان واحدهای تحقیقاتی، انجام تجزیه و تحلیل احساسات به طور جداگانه در هر جمله از مقاله، سپس خلاصه کردن و تجزیه و تحلیل تمام کلمات احساسی برای تعیین اینکه آیا احساسات در مقاله مثبت است یا خیر. اگر احساسات مثبت بیشتر از احساسات منفی باشد، نظر به عنوان مثبت طبقه بندی می شود. در غیر این صورت منفی است. برای افزایش دقت نتایج، کلمات را در فرهنگ لغت نمره می دهیم. نمرات احساسات مثبت، مانند، مانند، خوب، مایل به تلاش، موافقت با و غیره، به عنوان ارزش های مثبت تعیین می شود. نمرات احساسات منفی مانند دوست نداشتن، مزه های افتضاح، درک سخت، وحشت زده، مخالفت و غیره به عنوان مقادیر منفی تعیین می شود. ارزش کلماتی که نگرش خنثی را نشان می دهند، مانند خنثی، اهمیت نمی دهد، علاقه مند نیست و غیره، صفر است. علاوه بر این، کلمات مختلف شدت احساسات متفاوتی را نشان میدهند و هر چه این احساس قویتر باشد، قدر مطلق بیشتر است. علاقهمند نیست و غیره روی صفر تنظیم شده است. علاوه بر این، کلمات مختلف شدت احساسات متفاوتی را نشان میدهند و هر چه این احساس قویتر باشد، قدر مطلق بیشتر است. علاقهمند نیست و غیره روی صفر تنظیم شده است. علاوه بر این، کلمات مختلف شدت احساسات متفاوتی را نشان میدهند و هر چه این احساس قویتر باشد، قدر مطلق بیشتر است.
در روش فرهنگ لغت، انتخاب واژههای احساسی و شناسایی واژههای جدید از مهمترین عوامل است. برای بهبود دقت تجزیه و تحلیل، این مطالعه امتیاز BosonNLP_sentiment_score را اتخاذ می کند که در آن هر ورودی از یک کلمه و یک امتیاز تشکیل شده است [ 48 ]]. کلمات و امتیازات از میلیونها داده مشروح احساسات از منابع داده مانند Weibo، اخبار، انجمنها و غیره مشتق شدهاند و طیف گستردهای از اصطلاحات غیر استاندارد مانند کلمات آنلاین جدید ثبت شدهاند. کلمات منفی و قیدهای درجه برای تجزیه و تحلیل معنایی احساسات و امتیازدهی جامع ترکیب می شوند. نمره مثبت نشان دهنده احساسات مثبت است، در حالی که نمره منفی نشان دهنده احساسات منفی است. نمره 0 نشان دهنده احساسات خنثی است. پس از به دست آوردن امتیازات احساسی در مورد ژیهو در مورد نظرات مربوط به غذا و تفاوتهای فرهنگی بین شمال و جنوب چین، میتوانیم یک چهارقلو متشکل از مبدا، مقصد، غذا و امتیاز بدست آوریم. مبدأ نشان دهنده زادگاه شخص است، در حالی که مقصد نشان دهنده مکانی است که شخص در مورد آن اظهار نظر می کند. غذا موضوع ارزیابی است،
4. نتایج
نتایج تجزیه و تحلیل شامل سه بخش اصلی، یعنی الگوهای توزیع فضایی تعاملات فرهنگی بین شمال و جنوب، موضوعات داغ فرهنگی، و تحلیل ویژگیهای احساسی تفاوتهای غذایی فرهنگی بین شمال و جنوب است. بخش اول عمدتاً به تجزیه و تحلیل زمینه های مورد توجه مردم می پردازد. بخش دوم کلمات موضوعی را با استفاده از NLP استخراج می کند، موضوعات را بر اساس کلمات موضوعی با بسامد بالا تعیین می کند و عناصر مرتبط با فرهنگ را به عنوان ویژگی های فرهنگی داغ انتخاب می کند. تجزیه و تحلیل ویژگی های عاطفی شامل طبقه بندی و تجزیه و تحلیل کلمات موضوعی مربوط به احساسات است. در نهایت، مقوله قطبیت هیجانی هر کلمه برای بررسی کمی میزان تأثیر (مثبت و منفی) تفاوتهای فرهنگی شمال-جنوب بر مردم تجزیه و تحلیل میشود.
4.1. الگوهای توزیع فضایی تعاملات فرهنگی بین شمال و جنوب
تجزیه و تحلیل نشان می دهد که مفهوم فرهنگی خط تقسیم جنوب-شمال ثابت نیست. این خط می تواند یک خط تقسیم عینی شمال-جنوب باشد که توسط جغرافیدانان چینی پیشنهاد شده بود و به طور گسترده توسط مردم پذیرفته شده بود و یک خط تقسیم ذهنی. به عنوان مثال، گوانگدونگ و جیانگ سو متعلق به جنوب چین هستند. با این حال، تعداد کمی از کانتونی ها معتقدند که آنها جنوبی های واقعی هستند و بنابراین جیانگ سو را متعلق به شمال چین می دانند. مثال دیگر شامل افرادی از شمال غربی است که معتقدند شاندونگ، که در شمال چین قرار دارد، متعلق به جنوب چین است. بنابراین، از نظر تعاملات فرهنگی بین جنوب و شمال و الگوهای جریان کانونی آنها، این پژوهش از جنبههای عینی و ذهنی تحلیل میکند. به طور عینی،شکل 3 الف. از نظر ذهنی، تجزیه و تحلیل بر روی الگوهای جریان کانون داخلی در دو طرف خط تقسیم متمرکز است، همانطور که در شکل 3 b,c نشان داده شده است.
شکل 3a پنج منطقه تعامل فرهنگی داغ در شمال، یعنی پکن در سطح شهر، هنان در سطح استان و شمال، شمال غرب و شمال شرق چین را در سطح منطقه نشان می دهد. علاوه بر این، شکل چهار منطقه گرم در جنوب، یعنی جیانگ سو، سیچوان، و گوانگدونگ در سطح استان و جنوب چین در سطح منطقه را نشان می دهد. یک یافته جالب درجه بندی و تشخیص نقاط داغ این است که بیشتر مناطق هات اسپات در شمال در سطح منطقه ای هستند در حالی که مناطق جنوب بیشتر در سطح استان هستند. تحقیقات بیشتر در مورد الگوهای بین مناطق هات اسپات در شمال و جنوب چندین قانون جالب را نشان می دهد. دو الگوی تعامل اولیه یافت میشود، یعنی، جریان تعامل گسسته و الگوهای جریان تعامل انبوه. چند نفر با استفاده مستقیم از اصطلاحات عمومی جنوبی و شمالی برای توصیف تفاوتهای بین دو منطقه به این سؤال پاسخ دادند. با این حال، الگوهای جریان آنها متفاوت است. به عنوان مثال، همانطور که در نشان داده شده استشکل 3 a، هات اسپات نارنجی، که شمال را نشان می دهد، یک الگوی جریان تعامل کانون گرم نسبتاً گسسته با جنوب را تشکیل می دهد. با این حال، کانون بنفش، که نمایانگر جنوب است، یک الگوی جریان انبوه را با شمال تشکیل می دهد. نقاط داغ دیگر شامل جنوب شرقی در شمال است که الگوهای جریان انبوه را با گوانگدونگ در جنوب تشکیل می دهد، در حالی که گوانگدونگ چندین الگو را با نقاط دیگر در شمال تشکیل می دهد.
در مقایسه با شکل 3 a، که تفاوت های عینی جنوب-شمال و الگوهای جریان کانونی تعامل فرهنگی آنها را نشان می دهد، شکل 3 b,c تفاوت های ذهنی و الگوهای جریان کانون تعامل فرهنگی را نشان می دهد. شکل 3 b الگوهای جریان متقابل بین مناطق شمال خط تقسیم را نشان می دهد. شکل 3 ج الگوهای جریان متقابل بین مناطق جنوب خط تقسیم را نشان می دهد. در همین حال، شکل 3 ب نشان می دهد که شمال شرقی، که متعلق به شمال است، یک الگوی جریان تعامل قوی با الگوی جریان تعامل شمال چین را تشکیل می دهد. علاوه بر این، شمال غربی یک الگوی تعامل قوی با شمال چین و هنان تشکیل می دهد. در مقایسه با شکل 3ب، مناطق هات اسپات بیشتری در شکل 3 ج تشکیل شده است. علاوه بر این، در میان الگوهای جریان تعامل کانون قوی، گوانگدونگ یک الگوی جریان کانونی قوی با تقریباً تمام مناطق کانونی دیگر تشکیل داده است که با دیدگاه کانتون مطابقت دارد که به جز گوانگدونگ، همه مناطق به شمال تعلق دارند.
4.2. موضوعات فرهنگی داغ
در مجموع 16 دسته موضوعی با استفاده از NLP برای استخراج کلمه موضوعی به دست می آید. شماره نوع، دسته موضوع، مثال کلمه، و نسبت تعداد کلمات موضوع به تعداد کل کلمات موضوع در هر مبحث در جدول 3 نشان داده شده است. چندین دسته از موضوعات به شدت با فرهنگ مرتبط هستند، مانند رژیم غذایی، گویش و غیره. با این حال، تعداد کمی با فرهنگ کمتر مرتبط هستند، مانند آب و هوا، گیاهان و غیره. در مرحله بعد، این مطالعه به طور خلاصه موضوعات خاصی را با فرکانس های بالا مورد بحث قرار می دهد. جدول 3نشان می دهد که موضوعات مرتبط با رژیم غذایی که به شدت با فرهنگ مرتبط است 37٪ از کل کلمات موضوع را تشکیل می دهد. ظاهراً مردم بیشتر نگران تفاوتهای فرهنگ غذایی بین جنوب و شمال هستند که عمیقاً در زندگی روزمره تجربه میکنند. موضوعی که دومین واژه موضوعی را دارد، نام مکان ها است، که تا حدی نشان می دهد که مکالمات در مورد رژیم غذایی با جغرافیا مرتبط است. فرکانس بالای کلمات احساسی نشان می دهد که افراد تمایل دارند نگرش خود را هنگام صحبت در مورد تفاوت بین جنوب و شمال بیان کنند. علاوه بر این، موضوعات متعدد در مورد سبک زندگی، آب و هوا و محیط زیست به این معنی است که مردم نگران تفاوت در چنین موضوعاتی در جنوب و شمال هستند. فراوانی موضوعات مرتبط با حیوانات بیشتر از موضوعات مربوط به گیاهان است، که ممکن است به این دلیل باشد که مردم بیشتر با حیوانات ارتباط برقرار می کنند.
4.3. تجزیه و تحلیل ویژگی های عاطفی بر اساس تفاوت های غذایی فرهنگی بین شمال و جنوب
ما بررسی می کنیم که آیا نگرش مردم جنوب به فرهنگ غذایی شمال، یا برعکس، یا نگرش مردم شمال و جنوب نسبت به فرهنگ غذایی خود احساسات مثبت، منفی یا خنثی را نشان می دهد. با توجه به تجزیه و تحلیل در بخش قبل، تفاوت های غذایی فرهنگی بین شمال و جنوب محبوب ترین موضوعات هستند. بنابراین، ما عمدتاً ویژگیهای عاطفی را تحت تأثیر تفاوتهای غذایی فرهنگی بین جنوب و شمال تجزیه و تحلیل کردیم و نتایج در شکل 4 نشان داده شده است. جنوب، و نگرش مردم از جنوب و شمال نسبت به فرهنگ غذایی خود (که با عنوان “دیگران” درشکل 4 ). درصدها در شکل 4 ب نشان داده شده است، که نشان می دهد مردم شمال و جنوب بحث های محدودی در مورد فرهنگ غذایی خود دارند و در نتیجه تنها 8 درصد از کل نتایج را تشکیل می دهند. نتایج استخراج دو نوع دیگر در اینجا تحلیل می شود. شکل 4 a,c نمودارهای نسبت احساسات جنوب به فرهنگ غذایی شمال و احساسات شمالی به فرهنگ غذایی جنوب است . شکل 4a نشان می دهد که اکثر جنوبی ها احساسات منفی نسبت به فرهنگ غذایی شمال نشان می دهند، در نتیجه تقریباً 67٪ را تشکیل می دهند. عواطف مثبت و خنثی درصدهای مشابهی را به خود اختصاص می دهند که به ترتیب 17 و 16 درصد است. درصد احساسات سه گانه شمالی ها نسبت به فرهنگ غذایی جنوب، همانطور که در شکل 4 ج نشان داده شده است، مشابه آنهایی است که در شکل 4 a نشان داده شده است، بنابراین نشان می دهد که مردم در مواجهه با فرهنگ غذایی متفاوت از فرهنگ خود، تمایل نشان می دهند که مقاومت نشان دهند. .
تحلیل فوق تنها ویژگی های عاطفی را تحت تأثیر تفاوت های غذایی فرهنگی نشان می دهد، اما نمی تواند الگوهای توزیع فضایی و روابط احساسات مختلف را تشخیص دهد. بنابراین، ما سعی کردیم یک نقشه جریان هیجان بسازیم تا توزیع فضایی و الگوهای تعامل فضایی انواع مختلف احساسات را از طریق تجسم فضایی نشان دهد. شکل 5 و شکل 6توزیع فضایی و الگوهای تعاملی سه عواطف جنوبی ها نسبت به فرهنگ غذایی شمال و احساسات شمالی ها نسبت به فرهنگ غذایی جنوب را نشان می دهد. هر نقشه جریان هیجانی از چندین جریان هیجانی تشکیل شده است که به نوبه خود از سه عنصر شامل گره منطقه مبدا جریان، گره منطقه مقصد جریان و خط اتصال بین جریان ها تشکیل شده است. رنگ خط نشان دهنده قدرت جریان احساسات است. هنگام اشاره به جنوب و شمال، عده ای نام شهرها و برخی دیگر نام استان ها را به کار می بردند. با این حال، افراد بیشتری مستقیماً به نامهای منطقهای جنوب و شمال اشاره کردند. در شکل 5زرد نشان دهنده یک استان یا شهر در شمال است، در حالی که آبی نشان دهنده یک استان یا شهر در جنوب است. نارنجی اصطلاح کلی کل منطقه است که در مرکز شمال قرار دارد، در حالی که بنفش اصطلاح عمومی جنوب است که به همین ترتیب در مرکز کل منطقه قرار دارد. افراد زیادی هنگام اشاره به مناطق در هر نقشه جریان احساسات از “شمال” و “جنوب” استفاده کردند و الگوهای جریان بین شمال و جنوب قوی بود.
شکل 5 الف نشان می دهد که مردم شانشی احساسات مثبت قوی نسبت به غذای گوانگدونگ نشان می دهند و سایر احساسات مثبت قوی شامل احساسات شانشی نسبت به جیانگ سو، احساسات شیان نسبت به جیانگ سو و غیره است. شکل 5 ب نشان می دهد که در مقایسه با احساسات مثبت در شکل 5 الف، پوشش آن گسترده تر است. علاوه بر این، در مقایسه با بقیه شمال، شمال شرقی احساسات منفی بیشتری نسبت به غذاهای جنوب نشان می دهد، و بسیاری از مناطق شمالی احساسات منفی نسبت به غذاهای گوانگدونگ و شانگهای نشان می دهند. همانطور که در شکل 5 نشان داده شده است، در مقایسه با شکل 5 a,b، تعداد کمی از مردم شمالی نگرش خنثی نسبت به فرهنگ غذایی جنوب دارند.ج. به طور کلی، صرف نظر از اینکه احساسات مثبت یا منفی در آن دخیل هستند، از نظر فرهنگ غذایی، گوانگدونگ برجسته ترین استان است که نه تنها دارای الگوهای جریان قوی است، بلکه تأثیر گسترده ای در شمال دارد.
جدای از جریانهای هیجانی مثبت قوی بین مناطق عمومی جنوبی و شمالی، شکل 6 الف سایر احساسات مثبت بارز را نشان میدهد که توسط مناطق داخلی جنوب، یعنی مناطق مرکزی جنوبی، مانند هونان و هوبی، نسبت به فرهنگ غذایی شمال نشان داده شده است. . در مقابل، فقط چند بحث در مورد نگرش مثبت جنوبی ها نسبت به فرهنگ غذایی شمال غرب وجود دارد. بحث در شمال شرق نیز عمدتاً بر دلتای رودخانه یانگ تسه که در نزدیکی منطقه است متمرکز بود. در مقایسه با شکل 6 الف، مناطق جنوبی که احساسات منفی نسبت به فرهنگ غذایی شمال نشان می دهند، عمدتاً مناطق ساحلی هستند، مانند شانگهای، ژجیانگ، گوانگدونگ و هاینان. مقایسه بین شکل 6الف، ب نشان می دهد که صرف نظر از نگرش مثبت یا منفی، بحث ها عمدتاً در مورد شمال شرق، منطقه خودمختار مغولستان داخلی و پکن بوده است. دلیل اصلی چنین الگوی در پکن و شمال شرق، تعداد زیاد کالج ها و دانشگاه ها و اقتصاد توسعه یافته آنها است [ 49 ، 50 ]. در مقابل، مغولستان داخلی از نظر کالجها و دانشگاهها و اقتصاد عقبتر است. با این حال، از آنجایی که مغولستان داخلی یک مقصد گردشگری با ویژگی های قومی متمایز و مناظر علفزار شگفت انگیز است، چنین الگویی شکل گرفته است. شکل 6c نشان می دهد که به جز الگوهای جریان عاطفی بین مناطقی که عموماً به آنها جنوب و شمال گفته می شود، جریان نگرش خنثی گوانگدونگ نسبت به شمال شرقی قوی است.
5. بحث و نتیجه گیری
5.1. بحث
5.1.1. مبهم بودن نمادهای نام مکان
اگرچه این مطالعه میتواند اسامی مکانها را به راحتی از دادههای متن استخراج کند، اما تنوع و نادرستی عبارات استفادهشده توسط کاربران ممکن است منجر به انحرافات متعددی از نظر مقیاس نام مکانهای استخراجشده شود. به عنوان مثال، گوانگژو را می توان استان گوانگدونگ، چین جنوبی، کانتونی و غیره نامید. علاوه بر این، استخراج نام مکان ها به اشکال مختلف به طور کامل و صحیح برای NLP فعلی دشوار است. این دو عامل منجر به مبهم بودن نمادهای نام مکان استخراج شده در این مطالعه می شود. به عنوان مثال، در توصیف تفاوتهای بین جنوب و شمال، یک کاربر از شنیانگ (شهر) ممکن است از عبارات مختلفی برای اشاره به محل سکونت خود استفاده کند، مانند شن یانگ (شهر)، لیائونینگ (استان)، شمال شرقی چین یا حتی شمال. . این تغییرات ممکن است به موضوع چندمقیاسی چندمعنی برای نام مکانهای مشابه منجر شود. در این مطالعه، از نامهای مکان خاصی استفاده شد تا با خاصترین نماد نام مکان مورد استفاده پاسخدهندگان مطابقت داشته باشد. به طور خاص، استراتژی پردازش ارائه شده دربخش 3.2 برای حل این مشکل طراحی شده است. علاوه بر این، چندین اسم که نام مکان نیستند نیز ممکن است برای اشاره به یک منطقه خاص استفاده شوند. به عنوان مثال، کانتون به گوانگدونگ اشاره می کند. این کلمات همچنین به عنوان ضمیر نام مکان در داده های متن ظاهر می شوند. اگر این کلمات به عنوان نام مکان در پیکره وجود نداشته باشند، حذف می شوند و از قلم می افتند و در نتیجه دقت نتایج تجزیه و تحلیل کاهش می یابد.
5.1.2. دقت در تجزیه معنایی
برخی متون گهگاه مکانی را از جنوب با چندین مکان شمالی مقایسه میکنند که تفاوتهای فرهنگی بین دو منطقه را بیان میکند، یا برعکس. علاوه بر این، چنین متون حتی ممکن است چندین مکان شمالی را با چندین مکان جنوبی مقایسه کنند. دو موقعیت اول را می توان با استفاده از راه حلی که در بخش 3.1 توضیح داده شده است ، که توضیحات و مثال های خاصی را ارائه می دهد، به خوبی پرداخته می شود. در مورد وضعیت سوم، رویکردی تعمیم یافته در پیش گرفته ایم. به طور خاص، اگر چندین مکان متعلق به یک منطقه اداری در سطح بالا باشد، به جای آن از این منطقه اداری در سطح بالا استفاده می شود. اگرچه چنین برخوردی تا حدودی به این موضوع پرداخته است، اما اشکال اصلی آن کاهش دقت مکان نام مکان ها است.
5.1.3. تأثیر ویژگی های شخصی داده های نمونه بر نتایج تجزیه و تحلیل
عمل فضایی-اجتماعی فرهنگ و تولید فضای فرهنگی حاصل ساخت جمعی چند گروه اجتماعی است. بنابراین، نمونههای دادهای که برای تجزیه و تحلیل استفاده میشوند، باید به طور کلی نماینده باشند. علاوه بر این که داده های نمونه یک منطقه کامل در فضا را پوشش می دهد، ویژگی های پاسخ دهندگان داده های نمونه نیز باید متنوع باشد. به عنوان مثال، داده ها باید شامل نمونه نسبتاً متعادلی از مردان و زنان و همچنین گروه های پردرآمد و کم درآمد و کاربران شهری و روستایی باشد. داده های Zhihu مورد استفاده در این مقاله در سال 2017 جمع آوری شد. طبق آمار رسمی، تعداد کاربران Zhihu در سال 2017 به حدود 100 میلیون رسید. Zhihu یک انجمن پرسش و پاسخ با بیشترین تعداد کاربر و فعال ترین فعالیت های روزانه در چین است. تا کنون، سوال مورد استفاده در این تحقیق 93,315,823 بار مشاهده شده است که نشان می دهد موضوعی جالب و پرطرفدار است. پاسخ دهندگان بر اساس جنسیت، درآمد و سایر جنبه ها به طور تصادفی انتخاب شدند. علاوه بر این، آنها از مناطق مختلف آمده اند، که نماینده بودن داده ها را تا حدی تضمین می کند. تعداد کاربران با پایگاه بزرگ کافی بود تا نشان دهد که Zhihu به طور گسترده توسط مردم شناخته شده است. از این رو، تا حدودی، این عوامل تصادفی بودن و گستردگی گروه کاربری که توسط نمونه دادهها نشان داده شده است را تضمین میکند. تعداد کاربران با پایگاه بزرگ کافی بود تا نشان دهد که Zhihu به طور گسترده توسط مردم شناخته شده است. از این رو، تا حدودی، این عوامل تصادفی بودن و گستردگی گروه کاربری که توسط نمونه دادهها نشان داده شده است را تضمین میکند. تعداد کاربران با پایگاه بزرگ کافی بود تا نشان دهد که Zhihu به طور گسترده توسط مردم شناخته شده است. از این رو، تا حدودی، این عوامل تصادفی بودن و گستردگی گروه کاربری که توسط نمونه دادهها نشان داده شده است را تضمین میکند.
5.2. نتیجه گیری و جهت گیری آینده
این مطالعه تفاوتهای فرهنگی بین جنوب و شمال چین را به عنوان یک هدف درک و 6128 پاسخ به این سؤال در نظر گرفت که “تفاوتهای بین چین جنوبی و شمالی که تا به حال میدانید چیست؟” در Zhihu که بزرگترین پلتفرم پرسش و پاسخ دانش در چین بهعنوان منبع اصلی داده است، همچنین با استفاده از NLP، با تمرکز بر نام مکانها، واژههای مرتبط با فرهنگ و واژههای احساسی، کلمات را از متون تجزیه و تحلیل و استخراج کرده است. با استفاده از خوشهبندی، آمارها را جمعآوری کرد و الگوهای جریان تعامل نقطه کانونی، عناصر فرهنگی کانون داغ، و احساسات اصلی در مورد تفاوتهای شمال و جنوب را با استفاده از خوشهبندی تحلیل کرد.
(1) اول، جنوبی ها تمایل دارند از نام مکان های مبهم و بزرگتر برای اشاره به ویژگی های فرهنگی رایج در شمال استفاده کنند. در مقابل، مردم شمال تمایل دارند از مناطق خاص با دامنه های کوچک برای تعریف ویژگی های فرهنگی جنوب استفاده کنند، که نشان دهنده تفاوت در شناخت سایر فرهنگ ها بین مردم جنوب و شمال است.
(2) دوم، تجزیه و تحلیل انواع بسیاری از موضوعات کانونی مرتبط با تفاوتهای بین جنوب و شمال نشان داد که تفاوتها در فرهنگ غذایی مرتبطترین موضوعات هستند، بنابراین نشان میدهد که فرهنگ غذایی نقش اساسی در زندگی روزمره مردم و همچنین فرهنگ دارد. تولید.
(3) در نهایت، تجزیه و تحلیل ویژگیهای عاطفی جنوبیها و شمالیها نسبت به فرهنگ غذایی یکدیگر نشان میدهد که آنها تمایل به نشان دادن احساسات منفی نسبت به فرهنگ غذایی یکدیگر دارند. این نشان میدهد که وقتی فرهنگهای مختلف با هم تعامل دارند، اغلب به جای قدردانی از فرهنگ یکدیگر طرد میشوند. ساموئل هانتینگتون که استاد روابط بینالملل در دانشگاه هاروارد است، در کتابهای Clash of Civilizations and Remaking of World Order [ 51 ]، اظهار داشت که دلیل درگیریها بین کشورها و مناطق در جهان کنونی به دلیل ادیان یا مذهب نیست. اقتصاد اما به دلیل تعارضات بین فرهنگ های مختلف.
با این حال، فرهنگ ها به جای اینکه به طور طبیعی به وجود بیایند، تحت تأثیر محیط های اجتماعی ایجاد می شوند. به عبارت دیگر، تا زمانی که مردم فرهنگهای خاصی را درک کنند، ناگزیر با چنین فرهنگهایی سازگار میشوند یا حتی آنها را میپذیرند. هنگامی که مردم در مناطق مختلف به دلیل تفاوت در آداب و رسوم، عادات غذایی و غیره با هم درگیر می شوند، باید تا حد امکان فرهنگ یکدیگر را بیاموزند تا تفاوت های فرهنگی را درک کنند و هویت را ارتقا دهند. علاوه بر این، تعامل و تلاقی فرهنگ ها، گسترش و ادغام فرهنگ ها را تسهیل می کند.
این پژوهش تلاش کرده است تا دادههای نوین شناخت فرهنگی و روشهای تحلیل کمی را به کار گیرد. با این حال، کاستیهایی وجود دارد، و بنابراین انجام تحقیقات در مورد اهمیت فرهنگی، قضاوت ارزشی، و دلبستگی عاطفی، و همچنین هویت عناصر فرهنگی مرتبط از منظر جغرافیای فرهنگی جدید، بسیار مهم است. به عنوان مثال، تجزیه و تحلیل بیشتر می تواند به طور خاص مشخص کند که کدام ویژگی به نمادهای فرهنگی شمالی و کدام به نمادهای فرهنگی جنوبی تعلق دارد و هر کلمه احساسی تولید شده در یک فرآیند بین منطقه ای را شناسایی کند. بنابراین، چنین موضوعاتی نیاز به بررسی بیشتر دارد. نتایج تحقیق در این مقاله به طور عینی نشان می دهد که تضاد فرهنگ غذایی بین جنوبی ها و شمالی ها در چین وجود دارد.
منابع
- لوپز، جی جی آر قلمرو اختصاص یافته نمادین، یک سنت به روز شده در جغرافیای فرهنگی جدید. کشیش جئوگر. ونیز. 2018 ، 59 ، 434-447. [ Google Scholar ]
- کرسول، تی. جغرافیای فرهنگی جدید – پروژه ای ناتمام؟ فرقه Geogr. 2010 ، 17 ، 169-174. [ Google Scholar ] [ CrossRef ]
- جکسون، پی. جهتهای جدید در جغرافیای فرهنگی بازبینی شد. Area 2016 , 48 , 367–370. [ Google Scholar ] [ CrossRef ]
- کرسول، تی. میچل، دی. جغرافیای فرهنگی: مقدمه ای انتقادی. اقتصاد Geogr. 2002 ، 34 ، 334-339. [ Google Scholar ] [ CrossRef ]
- گوهین، PG جغرافیای فرهنگی: یک مقدمه انتقادی. ان دانشیار صبح. Geogr. 2001 ، 91 ، 572-573. [ Google Scholar ]
- برازو، آر. جغرافیای فرهنگی انقلاب. Ir. گل میخ. Rev. 2019 , 27 , 442-446. [ Google Scholar ] [ CrossRef ]
- هلو، ج. جغرافیای اجتماعی: ادیان و بومهای قومی جدید – در تضاد با جغرافیای فرهنگی. Prog. هوم جئوگ. 2002 ، 26 ، 252-260. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- Cook, I. واژگان جدید برای جغرافیای فرهنگی-اقتصادی؟ دیالوگ هام Geogr. 2019 ، 9 ، 83-87. [ Google Scholar ] [ CrossRef ]
- زیمرر، KS اکولوژی فرهنگی: در رابط با بوم شناسی سیاسی – جغرافیاهای جدید حفاظت از محیط زیست و جهانی شدن. Prog. هوم جئوگ. 2006 ، 30 ، 63-78. [ Google Scholar ] [ CrossRef ]
- استاینبرینک، ام. Aufenvenne, P. در مورد دیگر و جریان سازی جغرافیای فرهنگی جدید. برخی از مشاهدات علم سنجی میت اوسترر. Geogr. G 2017 ، 159 ، 83-104. [ Google Scholar ]
- توران، ی. Cekic، A. مقابله با تنهایی: تنهایی، مقابله مذهبی، دینداری، رضایت از زندگی و استفاده از رسانه های اجتماعی. Cumhur. اله Derg. 2018 ، 22 ، 1711-1745. [ Google Scholar ]
- اوربن، ا. داینلین، تی. Przybylski، AK تأثیر پایدار رسانه های اجتماعی بر رضایت از زندگی نوجوانان. Proc. Natl. آکادمی علمی ایالات متحده آمریکا 2019 ، 116 ، 10226–10228. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
- Andrade، CS; سانتوس، تجزیه و تحلیل احساسات من با متن کاوی در زمینه داده های بزرگ. بین المللی جی. تکنول. هوم تعامل داشتن. 2017 ، 13 ، 47-67. [ Google Scholar ] [ CrossRef ]
- ناجی، م. داودی، ن. Ajhoun, R. زمینه مکانی-زمانی برای بهبود دقت تحلیل احساسات. در مجموعه مقالات ششمین کنفرانس بین المللی 2018 در محاسبات و سیستم های چند رسانه ای (ICMCS)، رباط، مراکش، 10 تا 12 مه 2018؛ صص 390-395. [ Google Scholar ]
- ماجومدر، ن. هزاریکا، دی. گلبخ، ا. کامبریا، ای. پوریا، اس. تحلیل احساسات چندوجهی با استفاده از ادغام سلسله مراتبی با مدلسازی زمینه. بدانید. سیستم مبتنی بر 2018 ، 161 ، 124-133. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- چرا، م. فرهنگ غذایی: انسان شناسی، زبان شناسی، و مطالعات مواد غذایی. Soc. آنتروپل 2018 ، 26 ، 579-581. [ Google Scholar ] [ CrossRef ]
- تولیا-کلی، DP. Prog. هوم Geogr. 2013 ، 37 ، 153-160. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- ادواردسون، بی. انکویست، بی. جانستون، آر. ایجاد ارزش مشتری از طریق فراواقعیت در تجربه خدمات پیش خرید. J. Serv. Res. 2005 ، 8 ، 149-161. [ Google Scholar ] [ CrossRef ]
- کندرا، اس. Ghosh, M. Environmental Perception: تحلیل مبتنی بر تصویر از برداشت افراد از مکان ها. بین المللی J. Appl. محیط زیست علمی 2017 ، 12 ، 1223-1239. [ Google Scholar ]
- میرنیگ، ن. استراسر، ای. ویس، ا. Tscheligi, M. مطالعات در مکان های عمومی به عنوان ابزاری برای تأثیر مثبت بر نگرش مردم نسبت به ربات ها . کنفرانس بین المللی رباتیک اجتماعی Springer: هایدلبرگ، آلمان، 2012; ص 209-218. [ Google Scholar ]
- پرتغالی، ج. در مورد روابط بین نقشه های شناختی و تصاویر شهرها. شناخت. روند. 2018 ، 19 ، S6. [ Google Scholar ]
- بولدینگ، KE تصویر: دانش در زندگی و جامعه. ج. اقتصاد سیاسی. 1957 ، 54 ، 112-113. [ Google Scholar ]
- رینولدز، WH نقش مصرف کننده در ساخت تصویر. کالیفرنیا مناگ. Rev. 1965 , 7 , 69-76. [ Google Scholar ] [ CrossRef ]
- فیلومنا، جی. Verstegen، JA; مانلی، ای. رویکرد محاسباتی به تصویر شهر. شهرها 2019 ، 89 ، 14-25. [ Google Scholar ] [ CrossRef ]
- چپمن، ای اچ. لینچ، کی. تصویر شهر. J. Aesthet. منتقد هنر. 1962 ، 11 ، 46-68. [ Google Scholar ]
- Guo, CC رابطه مهم بین طراحی محیط و تصویر شهر. در مجموعه مقالات هفتمین کنفرانس بین المللی 2018 علوم اجتماعی، آموزش و تحقیقات علوم انسانی، سانیا، چین، 25 تا 27 نوامبر 2018؛ صص 31-34. [ Google Scholar ]
- اوشیمی، د. هارادا، ام. نقش ساکنان میزبان در رویدادهای ورزشی: چشم انداز تصویر شهر. مدیریت ورزشی. Rev. 2019 , 22 , 263-275. [ Google Scholar ] [ CrossRef ]
- لی، جی جی. Lu، Y. فرهنگ چینی در تحقیقات توریستی: بررسی و مقایسه مطالعات چینی و انگلیسی در 1993-2012. تور. Rev. 2016 , 71 , 118-134. [ Google Scholar ] [ CrossRef ]
- وانگ، IA; مک کرچر، بی. Li، XP East با غرب ملاقات می کند: علاقه گردشگران به فرهنگ ترکیبی در مقاصد پسااستعماری. J. Travel Res. 2016 ، 55 ، 628-642. [ Google Scholar ] [ CrossRef ]
- بریو، ام. لوریر، سی. گوای، JP وفاداری به فرهنگ باند: نقش هویت قومی در میان مجرمان جوان در منطقه مونترال. Criminologie 2017 ، 50 ، 287-310. [ Google Scholar ]
- اوه، زندگی اجتماعی DES در رسانه های اجتماعی. فودان جی. هوم. Soc. علمی 2018 ، 11 ، 119-122. [ Google Scholar ] [ CrossRef ]
- هاوی، NS; سماحا، م. رابطه بین اعتیاد به رسانه های اجتماعی، عزت نفس و رضایت از زندگی در دانشجویان دانشگاه. Soc. علمی محاسبه کنید. Rev. 2017 , 35 , 576-586. [ Google Scholar ] [ CrossRef ]
- لی، تی. پامر، سی. دانگ، او. برایوویچ، اس. حیدر، س. بوتسیس، تی. میلوارد، دی. زمستان، ا. لو، اس. بال، R. ارزیابی سیستم های پردازش زبان طبیعی (NLP) برای حاشیه نویسی برچسب گذاری محصولات دارویی با اصطلاحات مدرا. جی. بیومد. آگاه کردن. 2018 ، 83 ، 73-86. [ Google Scholar ] [ CrossRef ]
- مورنو، دی سی؛ Vargas-Lombardo, M. طراحی و ساخت یک روش استخراج دانش مبتنی بر NLP در حوزه پزشکی که برای اطلاعات بالینی به کار می رود. بهداشت و درمان آگاه کردن. Res. 2018 ، 24 ، 376-380. [ Google Scholar ] [ CrossRef ]
- پورکس، جی ال. هریس، م. اندرسون، KE; Shoulson، I. پردازش زبان طبیعی (NLP) پیامدهای کلمه به کلمه پیامدهای گزارش شده توسط بیمار، توانایی عملکردی را به عنوان مهم برای بیماران برجسته می کند. Neurotherapeutics 2018 ، 15 ، 1192. [ Google Scholar ]
- Xu، GX; منگ، YT; کیو، XY; یو، ژ. وو، ایکس. تحلیل احساسات متون نظر بر اساس bilstm. دسترسی IEEE 2019 ، 7 ، 51522–51532. [ Google Scholar ] [ CrossRef ]
- بصیری، من; قاسم آقایی، ن. نقش نیلچی، AR بهره برداری از تاریخچه نظرات بازبینان برای تحلیل احساسات. J. Inf. علمی 2014 ، 40 ، 313-328. [ Google Scholar ] [ CrossRef ]
- لیو، LZ; لیو، اچ. وانگ، اچ اس. آهنگ، دبلیو. Lu, JL مطالعه تحلیل احساسات در متون نظرات چینی. در مجموعه مقالات پنجمین کنفرانس بین المللی IEEE در سال 2014 در زمینه مهندسی نرم افزار و علم خدمات (Icsess)، پکن، چین، 27-29 ژوئن 2014. صص 397-401. [ Google Scholar ]
- چی، دبلیو. لیو، SH; ژائو، ام.اف. لیو، Z. الگوهای فضایی مختلف چین از رشد جمعیت بر اساس خط هو. جی. جئوگر. علمی 2016 ، 26 ، 1611-1625. [ Google Scholar ] [ CrossRef ]
- وانگ، FH; لیو، CL; Xu، YP تجزیه و تحلیل نابرابری تراکم جمعیت در چین با منطقهبندی خودکار GIS: خط hu مورد بازبینی قرار گرفت. چانه. Geogr. علمی 2019 ، 29 ، 541-552. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- چن، MX; گونگ، YH; لی، ی. لو، دی دی. ژانگ، اچ. توزیع جمعیت و شهرنشینی در دو طرف خط هو هوانیونگ: پاسخ به سوال نخست وزیر. جی. جئوگر. علمی 2016 ، 26 ، 1593-1610. [ Google Scholar ] [ CrossRef ]
- Hu، ZC; وانگ، YL; لیو، YS; بلند، HL؛ پنگ، جی. الگوهای فضایی-زمانی توسعه و تحول شهری-روستایی در شرق خط هو هوانیونگ، چین. ISPRS Int. J. Geo-Inf. 2016 ، 5 ، 24. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
- لی، XD; Zhang, C. تحقیق در مورد افزایش اثربخشی طبقه بندی خودکار متن چینی بر اساس روش تقسیم بندی ictclas. در مجموعه مقالات چهارمین کنفرانس بین المللی IEEE 2013 در زمینه مهندسی نرم افزار و علم خدمات، پکن، چین، 23 تا 25 مه 2012. ص 267-270. [ Google Scholar ]
- تاجبخش، ام اس; باقرزاده، ج. LDA دانش معنایی با بردار موضوع برای توصیه هشتگ: مورد استفاده توییتر. هوشمند داده آنال. 2019 ، 23 ، 609–622. [ Google Scholar ] [ CrossRef ]
- ژانگ، ی.ال. Eick، CF ردیابی رویدادها در توییتر با ترکیب یک رویکرد مبتنی بر LDA و یک رویکرد خوشهبندی چگالی-کانتور. بین المللی ج. سمنت. محاسبه کنید. 2019 ، 13 ، 87-110. [ Google Scholar ] [ CrossRef ]
- استیونز، ک. کگل مایر، پی. آندرژیوسکی، دی. باتلر، دی. کاوش انسجام موضوع در بسیاری از مدل ها و بسیاری از موضوعات. در مجموعه مقالات کنفرانس روشهای تجربی در پردازش زبان طبیعی، جزیره ججو، کره، 12 تا 14 ژوئیه 2012. ص 952-961. [ Google Scholar ]
- Mimno، DM; والاچ، اچ ام. Talley، EM; لیندرز، ام. مک کالوم، الف. بهینه سازی انسجام معنایی در مدل های موضوعی. در مجموعه مقالات کنفرانس روشهای تجربی در پردازش زبان طبیعی، ادینبورگ، انگلستان، 27-31 ژوئیه 2011; ص 262-272. [ Google Scholar ]
- حداقل، KR; ما، CG; ژائو، TM; Li, HY Bosonnlp: یک رویکرد گروهی برای تقسیم بندی کلمات و برچسب گذاری پست. در پردازش زبان طبیعی و محاسبات چینی . Springer: Cham, Switzerland, 2015; جلد 9362، ص 520–526. [ Google Scholar ]
- هونگ، دبلیو. Su، YS اثر مجاورت نهادی در همکاریهای دانشگاه و صنعت غیر محلی: تحلیلی بر اساس دادههای ثبت اختراع چینی. Res. سیاست 2013 ، 42 ، 454-464. [ Google Scholar ] [ CrossRef ]
- فیش، CO; بلوک، JH; سندنر، PG پتنت های دانشگاه چین: کمیت، کیفیت و نقش برنامه های یارانه. جی. تکنول. انتقال. 2016 ، 41 ، 60-84. [ Google Scholar ] [ CrossRef ]
- هانتینگتون، اس پی برخورد تمدن ها: و بازسازی نظم جهانی. مالی Dev.-Engl. اد. 1998 ، 25 ، 158-162. [ Google Scholar ]

شکل 1. منطقه مطالعه شامل خط تقسیم شمال-جنوب.

شکل 2. جریان کار پردازش و تجزیه و تحلیل داده ها.


شکل 3. الگوی جریان تعامل فرهنگ در چین.

شکل 4. نمودار دایره ای نسبت احساسات تحت تأثیر تفاوت های فرهنگی بین شمال و جنوب.


شکل 5. نقشه جریان احساسات مردم شمال و جنوب چین.


شکل 6. نقشه جریان احساسات مردم از جنوب و شمال چین.
بدون دیدگاه