1. معرفی
در سال های اخیر، به دلیل بهبود مستمر در استانداردهای زندگی، گردشگری به بخش مهمی از اوقات فراغت و سبک زندگی برای مردم در سراسر جهان تبدیل شده است. بر اساس دادههای منتشر شده توسط شورای جهانی گردشگری سفر، گردشگری سومین صنعت بزرگ جهان از نظر نرخ رشد تولید ناخالص داخلی (GDP) در سال 2019 بوده است. نرخ رشد گردشگری طبق گزارشها 3.5 درصد بوده که به طور قابل توجهی بیشتر است. از نرخ رشد اقتصادی جهانی 2.5% [ 1 ]. به طور خاص، صنعت گردشگری نزدیک به 80 میلیون شغل در چین ایجاد کرد که 10.3 درصد از کل نیروی کار این کشور را تشکیل می دهد. در همان زمان، ارزش تولید آن 10.9 تریلیون یوان برآورد شد که 11.3٪ از اقتصاد چین را تشکیل می دهد [ 1]]. توسعه سریع صنعت گردشگری جهان باعث توسعه شدید صنعت گردشگری چین شده است. صنعت گردشگری چین وارد مرحله “گردشگری انبوه” شده است، با تمایل مردم به سفر به طور مداوم در حال افزایش است [ 2 ]. انتظار میرود که بازار گردشگری داخلی حتی در دوران پس از اپیدمی نیز به رشد خود ادامه دهد [ 3 ].
با ارتقای بهبود اقتصادی کشور و منطقه، توسعه سریع گردشگری نیز مشکلات متعددی را در زمینه خدمات مدیریت روزانه در مقاصد گردشگری، بهویژه در نقاط دیدنی کوهستانی که نقشی محوری در گردشگری چین ایفا میکنند، ایجاد کرده است . ]. توپوگرافی منحصر به فرد و شکل زمین، محدوده فضایی گسترده، شرایط بد طبیعی و شرایط شدید فصلی آنها را برای پرسنل غیرقابل دسترس کرده است. به ویژه، تحویل مواد و منابع، برنامه ریزی ترتیبات حمل و نقل و غیره، چالش های خاصی را برای خدمات مدیریت در محیط های کوهستانی ایجاد می کند. 5]]. اثرات این چالش ها در درجه اول در تاخیر در جریان مسافر منعکس می شود. تمام مقاصد توریستی فصول توریستی سنگین و فصول خارج از فصل را تجربه میکنند که منجر به عدم تعادل فصلی جدی در جریان توریستی میشود [ 6 ]. در طول فصل گردشگری، نقاط اغلب بیش از حد شلوغ هستند. این امر باعث ازدحام ترافیک، افزایش بیش از حد منابع هتل، پذیرایی و پرسنل می شود، منجر به استفاده بیش از حد از منابع گردشگری و محیط زیست می شود و کیفیت خدمات را برای گردشگران کاهش می دهد و رضایت کلی گردشگران را کاهش می دهد. از سوی دیگر، اشباع بیش از حد گردشگران در نقاط خاص، امنیت شخصی آنها را نیز تهدید می کند. 6]]. به عنوان مثال، در 4 اکتبر 2014، به دلیل افزایش تعداد گردشگران در هفته طلایی، ظرفیت مسافر در نقطه دیدنی Three Gorges در Yichang، Hubei، کافی نبود و در نتیجه صدها گردشگر در ترمینال سرگردان شدند. در 2 اکتبر 2013، چندین گردشگر به دلیل ازدحام بیش از حد در ورودی دره Jiuzhaigou گیر کرده بودند. در 26 اکتبر 2014، ترافیک در منطقه Xiangshan پکن تقریبا فلج شد و باعث شد هزاران نفر در ایستگاه اتوبوس سرگردان شوند. علاوه بر این، هفته طلایی گردشگری شاهد یک سری حوادث امنیتی بوده است که منجر به تجربه سفر ضعیف برای گردشگران شده است [ 7]]. با این حال، در طول فصل خارج از فصل، تعداد گردشگران در مقاصد به طور قابل توجهی کم است و در نتیجه هتلها بیکار و منابع، مواد، پرسنل و غیره هدر میروند. این ملاحظات اهمیت پیشبینی دقیق جریان گردشگر را در صنعت گردشگری تأیید میکند.
پیش بینی جریان گردشگران را می توان به دو دسته پیش بینی بلند مدت و پیش بینی کوتاه مدت تقسیم کرد. هر دو پیامدهای مهمی دارند و تعیین یک روند دقیق میتواند به متخصصان صنعت گردشگری کمک کند [ 8 ، 9 ]، به ویژه با توجه به مشکلاتی مانند تخصیص بهینه منابع و کارکنان مدیریتی [ 10 ].
پیش بینی جریان گردشگر در مقاصد گردشگری تحت تأثیر عوامل متعددی از جمله آب و هوا [ 11 ]، آب و هوا [ 12 ] و دما [ 13 ] است. گردشگری ذاتا فصلی است [ 14 ] زیرا محدودیت های زمان و آب و هوا باعث ایجاد جریان های توریستی نامتعادل می شود [ 15 ]. هم فصول طبیعی و هم فصول مصنوعی تعریف شده توسط تعطیلات و سایر عوامل نهادی در تعیین جریان گردشگر نقش دارند. 16]]. بنابراین، هر دو عامل باید در طول تلاش های پیش بینی در نظر گرفته شوند. تا آنجا که ما می دانیم، در کارهای قبلی در مورد این موضوع توجه کمی به فصلی بودن شده است. به عنوان مثال، هوانگ و مین یک مدل میانگین خودرگرسیون فصلی همراه با یک روش تفاوت برای حذف اثرات فصلی بر پیشبینی جریان گردشگران ایجاد کردند و اثربخشی آن را به طور تجربی تأیید کردند [ 17 ]. با این حال، این مطالعات صرفاً بر حذف تأثیرات فصلی در پیشبینی جریان گردشگر با پیشنهاد تعدیلهای شاخص فصلی یا با ایجاد یک مدل فصلی متمرکز شدهاند. مطالعات اندکی تأثیر جایگزین های فصول طبیعی را در پیش بینی جریان گردشگر در نظر گرفته اند.
جریان های توریستی تغییرات غیرخطی پیچیده ای را نشان می دهند. این امر شناسایی رابطه بین جریان توریستی بعدا و متغیرهای تأثیرگذار فعلی بر اساس مدلهای ساده ریاضی را دشوار میکند. در سالهای اخیر، با توسعه یادگیری ماشین، مدلهای غیرخطی به طور گسترده در پیشبینی سریهای زمانی کوتاهمدت مورد استفاده قرار گرفتهاند. به عنوان مثال، روشهای مبتنی بر شبکه عصبی مصنوعی (ANN) و ماشینهای بردار پشتیبان (SVM) قبلاً در پیشبینی جریان توریستی استفاده شدهاند [ 18 ، 19 ]. با این حال، مدلهای مبتنی بر شبکه عصبی به دلیل انعطافپذیری، فاقد یک روش سیستماتیک برای ساخت مدل هستند. این امر نیازمند آزمایش های متعدد برای شناسایی پارامترهای بهینه مورد نیاز برای به دست آوردن یک مدل عصبی قابل اعتماد است [ 20]. در مقایسه با ANN، SVM قادر است از مشکلاتی مانند بیش از حد برازش داده ها و حداقل های محلی اجتناب کند و در عین حال ویژگی های مثبتی مانند استحکام را حفظ کند. علاوه بر این، SVM از نظر انتخاب پارامتر پیچیده تر از ANN است [ 21 ]. LSSVM یک نسخه ارتقا یافته از SVM است که برای بهبود دقت SVM استاندارد توسعه یافته است [ 22 ]. در مقایسه با SVM، میتواند از محدودیتهای برابری به جای نابرابریها استفاده کند، و آن را قادر میسازد به جای محدود کردن به برنامهریزی درجه دوم، مجموعهای از معادلات خطی را حل کند [ 23 ]. با این حال، دقت پیشبینی الگوریتم LSSVM به طور قابلتوجهی به انتخاب دو پارامتر خاص وابسته است. 24]]. برای رفع این اشکال، الگوریتمهای بهینهسازی خاصی، از جمله الگوریتم ژنتیک (GA) و الگوریتم بهینهسازی مگس میوه، برای شناسایی مقادیر بهینه پارامترهای LSSVM برای افزایش دقت پیشبینی آن استفاده میشوند [25 ، 26 ] . در میان آن الگوریتمهای بهینهسازی مبتنی بر هوش، PSO پیشنهاد شده توسط کندی و ابرهارت [ 27 ]، به دلیل سهولت اجرا و انسجام بالای آن، به طور گسترده در فرآیندهای بهینهسازی، طبقهبندی مدل، یادگیری ماشین و آموزش شبکههای عصبی مورد استفاده قرار گرفته است. و هماهنگی [ 29 ].
علاوه بر توسعه چنین الگوریتمهای بهینهسازی، برخی از مطالعات تلاش کردهاند تا اطلاعات مربوطه را با تجزیه و تحلیل نظرات در انجمنهای آنلاین جمعآوری کنند. برخی از محققان از دادههای موتور جستجو برای پیشبینی تقاضای هتل استفاده کردهاند [ 30 ، 31 ] با طراحی یک فهرست جستجوی ترکیبی برای پیشبینی جریان گردشگر [ 32 ]. علاوه بر این، Google Trends به طور گسترده ای برای بهبود عملکرد مدل های سنتی استفاده شده است [ 10 ، 33 ، 34 ]. کارهای مرتبط اشاره کرده اند که ترکیب منابع و تکنیک های مختلف داده می تواند به دقت بالاتری منجر شود [ 35 ]. حتی سطوح قیمت و ترافیک وب به عنوان متغیر در مطالعات خاصی استفاده شده است [ 36]. تعاملات کاربر در انجمن های آنلاین نیز برای پیش بینی جریان های توریستی استفاده شده است [ 37 ]. با این حال، بیشتر روشها برای پیشبینی بلندمدت مناسبتر هستند تا پیشبینی کوتاهمدت.
از آنجایی که مطالعات تحقیقاتی کمی برای بررسی روشهای پیشبینی کوتاهمدت و جایگزینهای فصول طبیعی در فرآیند پیشبینی جریانهای توریستی انجام شده است، ما یک روش مبتنی بر خوشهبندی فصلی را پیشنهاد میکنیم که میتواند فصلها را بر اساس ویژگیهای آنها طبقهبندی کند تا این کمبود برطرف شود. ما خوشهبندی مجدد فصلی و مدل PSO-LSSVM را ترکیب میکنیم و این ترکیب را برای پیشبینی کوتاهمدت جریان گردشگر روزانه اعمال میکنیم. فرضیه مهم در این تحقیق این است که خوشه بندی فصلی می تواند پیش بینی جریان گردشگر را بهبود بخشد. نتایج ما اعتبار مدل ترکیبی بهینهشده را با ترکیب خوشهبندی فصلی تأیید میکند و مفاهیم عملی مفیدی را برای مدیریت ارائه میکند.
ادامه این تحقیق به شرح زیر سازماندهی شده است. بخش 2 روشها را ارائه میکند، از جمله اصول زیربنای ماشین بردار پشتیبان حداقل مربعات (LSSVM) و الگوریتمهای بهینهسازی ازدحام ذرات (PSO)، و تصویری از روش PSO-LSSVM که خوشهبندی فصلی را در نظر میگیرد و آزمایشها. بخش 3 نتایج آنها را شرح می دهد. بخش 4 بحث است. در نهایت، بخش 5 نتیجه گیری و همچنین محدودیت ها و پیامدهای این تحقیق را ارائه می کند.
2. روش ها
2.1. ماشین بردار پشتیبانی حداقل مربعات
ویژگی اساسی LSSVM این است که برای استفاده از محدودیت های برابری و تبدیل مسائل برنامه نویسی درجه دوم به مسائل حل مستقیم معادلات درجه دوم طراحی شده است. یک مجموعه داده را در نظر بگیرید ایکسمن،yمن، ایکسمن∈آرn، y∈آر، جایی که ایکسمننشان دهنده i امین مورد ورودی در فضای n بعدی و yمنمقدار خروجی مربوط به را نشان می دهد ایکسمن، لتعداد کل نقاط داده است، من=1،2،⋅⋅⋅⋅⋅⋅لو n تعداد ابعاد متغیرهای ورودی است. به عنوان یک مدل پیش بینی غیر خطی، مدل LSSVM را می توان به صورت زیر بیان کرد:
که در آن w بردار وزن را نشان می دهد، b مقدار افست و ϕایکسیک تبدیل غیرخطی را نشان می دهد که داده های ورودی را ترسیم می کند ( ایکسمن) به یک فضای ویژگی با ابعاد بالا. با توجه به اصل کمینه سازی ساختار، تابع هدف بهینه سازی LSSVM را می توان به صورت زیر بیان کرد:
جایی که همننشان دهنده خطا و سینشان دهنده ضریب پنالتی مثبت است. یک ضریب لاگرانژ، λمن، برای حل مسئله بهینه سازی معرفی شده است. بنابراین، معادله (2) را می توان به شکل زیر تبدیل کرد:
در مرحله بعد، مشتقات جزئی مربوط به هر متغیر از رابطه (3) محاسبه می شوند:
متغیرها، wو همن، سپس حذف می شوند. این معادله خطی زیر را به دست می دهد:
جایی که Y=y1،y2،……،yل، آ=(1،1،……،1)تی، بمنj=ϕ(ایکسمن)تیϕایکسj، λ=λ1،λ2،……λل، و مننشان دهنده ماتریس واحد است. بنابراین، LSSVM را می توان به صورت زیر بیان کرد:
جایی که کایکس،ایکسمنعملکرد هسته یک فضای ویژگی را نشان می دهد.
2.2. بهینه سازی ازدحام ذرات
یک الگوریتم PSO با مقداردهی اولیه یک گروه تصادفی از ذرات شروع می شود و پس از انجام چندین جستجوی تکراری، راه حل بهینه را به دست می آورد. در طول هر تکرار، ذرات موقعیت و سرعت خود را بر اساس منفرد و کلی به روز می کنند. اجازه دهید فرض کنیم که در مجموع N ذره ای وجود دارد که در یک فضای D-بعدی مقداردهی اولیه شده و پراکنده شده اند. علاوه بر این، فرض کنید که موقعیت ذره i است ایکسمن=ایکسمن1،ایکسمن2،⋅⋅⋅⋅⋅⋅،ایکسمنDو بهترین موقعیت فعلی برای ذره i است لoجآل_ایکسمن=لoجآل_ایکسمن1،لoجآل_ایکسمن2،⋅⋅⋅⋅⋅⋅،لoجآل_ایکسمنD، در حالی که بهترین موقعیت یافت شده توسط کل گروه است gلoبآل_ایکسمن=gلoبآل_ایکسمن1،gلoبآل_ایکسمن2،⋅⋅⋅⋅⋅⋅،gلoبآل_ایکسمنD. در چنین سناریویی، موقعیت جدید یک ذره بعد از t لحظه های زمانی با افزودن بردار سرعت به دست می آید. Vمن=vمن1،vمن2،⋅⋅⋅⋅⋅⋅،vمنDبه موقعیت فعلی خود. این را می توان به صورت زیر بیان کرد:
سرعت هر ذره با استفاده از فرمول زیر به روز می شود:
جایی که ج1،ج2ضرایب شتاب را نشان دهید، wV،wپنشان دهنده ضرایب کشش با مقادیر اولیه برابر با 1، رند نشان دهنده دو عدد تصادفی با توزیع یکنواخت در محدوده [0،1]، لoجآل_ایکسمندتیبهترین موقعیتی است که توسط هر ذره منفرد شناسایی می شود و gلoبآل_ایکسمنDتیبهترین موقعیت شناسایی شده توسط ازدحام جهانی است.
2.3. رویکرد خوشه بندی فصلی
چندین الگوریتم برای تجزیه و تحلیل خوشهبندی استفاده میشود، و میتوان آنها را تقریباً به چهار دسته تقسیم کرد : (1) الگوریتمهایی که بر اساس روششناسی تشکیل خوشه، مانند تکنیکهای بهینهسازی از بالا به پایین، پایین به بالا و تحلیلی [ 39 ]. (2) آنهایی که به مدل خوشهای بهدستآمده وابسته هستند، مانند طبقهبندی، مرکزها (مثلاً K-means)، زیرفضاهای توزیع، و مدلهای مبتنی بر نمودار. (3) آنهایی که از طریق یک تابع عضویت به دست می آیند، که ممکن است بیشتر به دسته بندی سخت یا نرم تقسیم شوند [ 40 ]. و (4) آنهایی که از گروهها برای تعریف تمایز بین خوشههای همپوشانی استفاده میکنند و نسبت به نویز حساسیت کمتری دارند زیرا به طور مساوی بین آنها توزیع میشود [ 41] ].
الگوریتم خوشهبندی K-means به دلیل سادگی و کارآمدی، یک الگوریتم خوشهبندی نماینده معمولی است. به ویژه برای خوشه بندی ساده داده های بزرگ مناسب است. با توجه به اینکه ویژگی اولیه فصول طبیعی تغییر آب و هوا است [ 42 ]، ما تلاش می کنیم تا همبستگی بین عوامل مرتبط با آب و هوا و تغییرات در جریان روزانه گردشگر را تحلیل کنیم. جزئیات خوشه بندی فصلی به شرح زیر است.
مرحله 1: تجزیه و تحلیل عوامل مرتبط با خوشه بندی فصلی.
مرحله 2: ورودی متغیرها به الگوریتم K-means برای به دست آوردن نتایج خوشه بندی فصلی.
2.4. روش PSO-LSSVM با در نظر گرفتن خوشه بندی فصلی
هدف تحقیق حاضر در درجه اول اثبات این موضوع است که استفاده از خوشه بندی فصلی در طول پیش پردازش داده ها برای پیش بینی دقیق جریان روزانه گردشگر مفید است. همراه با اطلاعات توریستی تاریخی، مدل PSO-LSSVM برای نشان دادن تأثیر مثبت خوشهبندی فصلی بر پیشبینی جریان توریستی در مقاصد گردشگری پیشنهاد شدهاست. در مدل PSO-LSSVM، از الگوریتم PSO به عنوان یک الگوریتم بهینه سازی برای بهینه سازی پارامتر تنظیم استفاده می شود. γ) و پارامتر هسته ( σ) از LSSVM. ملاحظات خوشه بندی فصلی در PSO-LSSVM را می توان در مراحل زیر خلاصه کرد.
مرحله 1. فصول طبیعی خوشه بندی شده اند. فصل طبیعی جدید مقصد گردشگری همراه با دادههای گردشگری تاریخی این نقطه، مجموعه دادهای را تشکیل میدهد. مجموعه داده اصلی نرمال شده و به مجموعه داده های آموزشی و آزمایشی تقسیم می شود.
مرحله 2. پارامترهای الگوریتم PSO، از جمله اندازه جمعیت، زمان تکامل، و عوامل یادگیری، مقداردهی اولیه می شوند.
مرحله 3. ازدحام ذرات با سرعت ها و موقعیت های فردی تصادفی اولیه می شود.
مرحله 4. پارامترهای مختلف اولیه به LSSVM وارد می شوند و سپس ارزش تناسب هر ذره ارزیابی می شود. در این تحقیق، ریشه میانگین مربعات خطا (RMSE) تعریف شده در مجموعه داده آزمون به عنوان تابع برازش به شرح زیر استفاده می شود:
جایی که nتعداد نقاط داده در مجموعه داده را نشان می دهد و yمنو y^منبه ترتیب ارزش واقعی و ارزش تخمینی را نشان می دهد. سپس بهینه محلی و جهانی به دنبال تابع تناسب محاسبه می شود.
مرحله 5. سرعت و موقعیت هر ذره با استفاده از معادلات (10) و (11) به روز می شود.
مرحله 6. مراحل 4 و 5 تکرار می شوند تا زمانی که معیار خاتمه برآورده شود و مقادیر بهینه پارامترهای LSSVM به دست آید. نمودار جریان روند PSO-LSSVM در شکل 1 نشان داده شده است .
در این تحقیق برای ارزیابی دقت پیشبینی، از میانگین درصد مطلق خطا (MAPE) و RMSE به عنوان معیار ارزیابی استفاده شده است. بدیهی است که مقادیر MAPE یا RMSE با دقت پیشبینی نسبت معکوس دارند:
جایی که yمن،y^منبه ترتیب داده های واقعی و ارزیابی شده را نشان می دهد و nتعداد کل نقاط داده در مجموعه داده آزمایشی را نشان می دهد. لازم به ذکر است که شاخص RMSE تنها میانگین سالانه ردیف آخر جدول را به عنوان شاخص پشتیبان در نظر می گیرد. در نتیجه، شاخص MAPE برای پیشبینی روندهای روزانه مناسبتر است.
2.5. پیش پردازش داده ها
برای بهبود دقت پیشبینی، لازم است توالی اصلی متغیرهای ورودی عادی شود. فرمول نرمال شده زیر در این تحقیق اتخاذ شده است:
که در آن u مقدار نرمال شده با توزیع یکنواخت در محدوده [0,1] را نشان می دهد. و تومترآایکسو تومترمنnبه ترتیب حد بالا و پایین هستند. در این تحقیق فرض بر این است که تومترآایکسو تومترمنn. ایکسمننشان دهنده جریان گردشگر در روز i در سری داده های یک ساله اصلی است و ایکسمترمنnو ایکسمترآایکسبه ترتیب حداقل و حداکثر مقادیر دنباله اصلی را نشان می دهد.
2.6. جمع آوری داده ها و تحلیل همبستگی
برای تأیید امکانسنجی الگوریتم پیشنهادی، مجموعه دادههای جریان روزانه گردشگر در کوه هوانگشان در دوره 2014 تا 2017 قابل دسترسی است، دادههای جریان توریستی از پروژه همکاری ما با کمیته مدیریت هوانگشان میآیند. علاوه بر این، ما دمای تاریخی و آب و هوای این نقطه را برای این تحقیق بررسی کردیم. دما بر حسب درجه سانتیگراد و آب و هوا در دسته های مختلف آفتابی، ابری، برف سنگین، برف متوسط و … اندازه گیری می شود. مجموعه دادههای جریان توریستی هم شامل دادههای اصلی جریان گردشگر روزانه و هم دادههای اصلی جریان گردشگران در تعطیلات است. چهار نوع داده در مجموعه داده گنجانده شده است: ایکس1جریان روزانه گردشگر در یک روز خاص؛ ایکس2، حجم گردش گردشگران در همان روز در هفته قبل؛ ایکس3حجم گردش گردشگران در همان روز سال قبل؛ و Y، گردش روزانه گردشگر در روز بعد. هر نوع شامل 1461 نقطه داده است. رابطه بین جریان توریستی تاریخی که شامل ایکس1،ایکس2،ایکس3و جریان توریستی روزانه در روز بعدی در درجه اول توسط ضرایب همبستگی مربوطه تعیین می شود – ضرایب همبستگی بین جفت آیتم های داده متناسب با مناسب بودن عوامل انتخاب شده به عنوان ورودی مدل است.
جدول 1 ضرایب همبستگی بین ایکس1،ایکس2،ایکس3،و Y. همانطور که انتظار میرفت، ایکس1برتری نسبت به سایر عوامل مشاهده شده است. در نتیجه، ایکس1به عنوان متغیر ورودی در مدل پیشنهادی انتخاب شده است.
علاوه بر این، شدت آب و هوا، روزهای هفته و تعطیلات رسمی نیز به عنوان متغیرهای ساختگی به مدل اضافه شده است. ایکس4، ایکس5و ایکس6. ایکس4=10، که در آن 1 نشان دهنده آب و هوای شدید، مانند کولاک، برف سنگین، برف متوسط، باران شدید، رعد و برق و رگبار است که به طور قابل توجهی بر تمایل افراد به سفر تأثیر می گذارد و 0 نشان دهنده آب و هوای غیر شدید، مانند آفتابی، ابری و نم نم نم باران است. . ایکس5نشان دهنده ماتریسی است که نشان دهنده روز هفته است. ایکس6=10، جایی که 1 نشان دهنده تعطیلات رسمی است. 0 نشان دهنده یک روز معمولی است. استفاده از متغیرهای ساختگی یکی دیگر از تفاوت های پژوهش ما با تحقیقات قبلی است. ادغام چنین عواملی به ما این امکان را می دهد که از منظر میکروسکوپی به مسئله پیش بینی نزدیک شویم.
2.7. مقدار اولیه پارامتر و اضافه کردن عوامل فصلی
پارامترهای اولیه به صورت زیر تنظیم می شوند، اندازه ازدحام 30، حداکثر تعداد تکرارها 300 و ضرایب شتاب در نظر گرفته می شود. ج1و ج2به ترتیب 2 و 2 هستند. برای بررسی اینکه آیا فصل طبیعی محیط بر دقت پیشبینی جریان توریستی در روز بعد تأثیر میگذارد، یک رویکرد مبتنی بر متغیر مجازی باینری برای نشان دادن فصول مختلف معرفی شده است. سمن=10(1 نشان دهنده فصل اول طبیعی است من= 1، 2، 3، 4).
3. نتایج
نتایج آزمایش های فوق در این بخش نشان داده شده است.
3.1. تجزیه و تحلیل تأثیر فصل طبیعی اصلی
این تحقیق با هدف بررسی تأثیر تغییرات فصلی بر جریان گردشگر در روز بعد انجام شده است. جریان روزانه گردشگران در مقاصد دیدنی به طور چشمگیری در فصول مختلف تغییر می کند، در درجه اول به دلیل تفاوت دما. در این بخش، سال به چهار فصل تقسیم می شود: بهار (اسفند، فروردین و اردیبهشت)، تابستان (خرداد، تیر و مرداد)، پاییز (سپتامبر، مهر و آبان). و زمستان (دسامبر، ژانویه و فوریه) [ 15 ]. شکل 2 توزیع جریان روزانه گردشگر را در روز بعد در کوه هوانگشان در دوره 2014 تا 2017 نشان می دهد.
از شکل 2 مشخص است که به دلیل نوسانات روزانه در جریان گردشگر، توزیع پیچیده و غیر خطی است. علاوه بر این، مشاهده میشود که حجم روزانه گردشگران در کوه هوانگشان در دوره مارس تا نوامبر هر سال بالا باقی میماند، در حالی که در طول دسامبر تا ژانویه بهنظر میرسد به طور مداوم کم است. تجزیه و تحلیل بیشتر داده های نشان داده شده در شکل 2 در جدول 2 و جدول 3 ارائه شده است .
جدول 2 و جدول 3 نشان می دهد که جریان کل گردشگران و میانگین جریان گردشگران در طول بهار، تابستان و پاییز هر سال بالا باقی می مانند. همچنین تأیید می شود که جریان گردشگر در طول تابستان حداکثر است و در فصل بهار و پاییز دومین گردشگر است. حجم گردشگران در زمستان به طور قابل توجهی کمتر از سه فصل دیگر است. بنابراین می توان نتیجه گرفت که جریان های گردشگری در فصول مختلف به طور قابل توجهی متفاوت است.
3.2. پیشبینیهای مدلها و مقایسه آنها قبل از خوشهبندی فصلی
در این آزمایش، برای برآوردن الزامات مدل، مجموعه داده به یک مجموعه داده آموزشی (2014-2016) و یک مجموعه داده آزمایشی (2017) تقسیم میشود. برای افزایش دقت پیشبینی، تمام دادهها با استفاده از رابطه (15) با دامنه [0،1] نرمال میشوند:
جایی که yنشان دهنده داده های نرمال شده است، ایکسنشان دهنده داده های ورودی اصلی و ایکسحداکثر، x min به ترتیب حداکثر و حداقل مقادیر در مجموعه داده هستند.
به دنبال آن، بردارها ایکس1،ایکس4،ایکس5،ایکس6،اس1،اس2،اس3،اس4از جمله فصول طبیعی به عنوان متغیرهای ورودی در مدل های پیش بینی و بردارها استفاده می شود. ایکس1،ایکس4،ایکس5،ایکس6بدون در نظر گرفتن عوامل فصلی، به عنوان متغیرهای ورودی مدل های پیش بینی در یک تکرار جداگانه برای مقاصد مقایسه استفاده می شود. هر دو الگوریتم PSO-LSSVM و الگوریتم LSSVM به عنوان مدل های پیش بینی برای هر یک از دو مجموعه بردار ورودی به کار گرفته شده اند. جدول 4 نتایج این آزمایش را نشان می دهد.
(1) جدول 4 نشان می دهد که میانگین درصد خطای مطلق مربوط به هر ماه همیشه برای مدل هایی که عوامل فصلی را در نظر می گیرند بهتر از مدل هایی نیست که این عوامل را در نظر نمی گیرند. با این حال، میانگین نمرات MAPE/RMSE این دو مدل زمانی که عامل فصلی را در درون خود لحاظ میکنند، کمتر است. این واقعیت را ثابت می کند که فصل طبیعی محیط عاملی است که بر دقت پیش بینی تأثیر می گذارد.
(2) میانگین درصد مطلق خطای سالانه مدل PSO-LSSVM بهتر از مدل LSSVM مشاهده می شود، که نشان می دهد که الگوریتم PSO یک روش موثر برای حل مسئله بهینه سازی برای پارامترهای الگوریتم LSSVM است.
دقت پیشبینی PSO-LSSVM همچنین نشان میدهد که خطاهای پیشبینی مربوط به ژانویه، فوریه و مه زمانی که عوامل فصلی در نظر گرفته نمیشوند نسبتاً زیاد است و حداکثر خطای پیشبینی 42.46 درصد است. هنگامی که فصل طبیعی محیط در نظر گرفته می شود، به ویژه مشاهده می شود که میانگین درصد خطاهای مطلق تقریباً 2.5٪ کاهش می یابد، حتی اگر حداکثر خطای پیش بینی بالا در 40.09٪ باقی بماند. این ممکن است به این واقعیت نسبت داده شود که جریان روزانه گردشگر با فصول متناوب متفاوت است. به دست آوردن پیش بینی های دقیق به سادگی بر اساس عامل فصلی طبیعی محیط غیر واقعی است. از این رو، پیش درمان فاکتور تغییرات فصلی ضروری است.
بنابراین، PSO-LSSVM به عنوان یک روش موثر برای پیشبینی دقیق جریان روزانه گردشگر در مقاصد گردشگری تأیید میشود. علاوه بر این، پیشبینیها تأیید میکنند که در نظر گرفتن فصل طبیعی محیط، خطای پیشبینی را نزدیک به 2٪ کاهش میدهد. با این حال، با توجه به تفاوت در زمان و دما، نمی توان انتظار داشت که یک ترکیب ساده از عامل فصلی به طور رضایت بخشی دقت پیش بینی را افزایش دهد. از این رو، پیش درمان عامل تغییرات فصلی ضروری است.
3.3. تنظیم فصول طبیعی بر اساس K-Means
در طول کاربرد عملی مدل پیشبینی، آب و هوا با تغییر فصول از سرد به گرم یا از گرم به سرد تغییر میکند. به عبارت دیگر، تغییر دما در همان فصل ممکن است روند جریان روزانه گردشگر را در یک مقصد تغییر دهد، در حالی که جریان روزانه ممکن است در طول ماه های متوالی با وجود تغییر فصل بین آنها یکسان باشد، اگر تفاوت دما برای گردشگران قابل لمس نباشد. . بنابراین، اگر مدل پیشبینی به طور مستقیم فصول طبیعی را در نظر بگیرد، دقت پیشبینیهای آن تحت تأثیر نامطلوب قرار میگیرد. این امر منجر به ضرورت پیش درمانی عامل تغییرات فصلی می شود.
متناسب با هر فصل، جریان روزانه گردشگر با تغییر زمان و دما تغییر می کند. همانطور که از داده های روزانه توریست (از پروژه همکاری با کمیته مدیریت هوانگشان) در دوره مارس 2014 تا فوریه 2015 در کوهستان هوانگشان مشهود است، حجم گردشگر روزانه مطابق با حداکثر و حداقل دمای روزانه متغیر بوده است. شکل 3 جریان گردشگر را در فصول مختلف نشان می دهد.
همانطور که در شکل مشاهده می شود، توزیع جریان گردشگران در چهار فصل روند تقریباً یکسانی با دمای روزانه نشان می دهد، به جز تغییرات شدید در چهار تعطیلات قانونی. همچنین می توان از داده ها نتیجه گیری های بیشتری گرفت. در طول بهار، درجه حرارت در محیط های کوهستانی در اوایل ماه مارس نسبتا پایین باقی می ماند و در نتیجه جریان روزانه گردشگر در آن زمان کاهش می یابد. داده ها تأیید می کند که تعداد روزانه گردشگران در این مدت به طور متوسط 2000 نفر است. با گذشت زمان، دما به تدریج افزایش می یابد و آب و هوا راحت تر می شود. آب و هوا برای سفر مناسب تر می شود. در نتیجه جریان گردشگر روزانه در کوه افزایش می یابد. اگرچه تابستان گرم ترین دوره سال است، اما دمای هوا در کوهستان هوانگشان در 25 درجه سانتی گراد ثابت می ماند.14]. علاوه بر این، تعطیلات تابستانی بین ژوئیه و آگوست برنامه ریزی شده است، که در طی آن مردم ترجیح می دهند سفر کنند. با توجه به این عوامل، گردش روزانه گردشگر در این مدت همچنان بالاست. در پاییز، دمای کلی در مقاصد کوهستانی در ماه های سپتامبر و اکتبر بسیار راحت است و جریان گردشگران همچنان بالاست. با این حال، دما در ماه نوامبر شروع به کاهش می کند، تعداد افرادی که مایل به بازدید از کوه ها هستند کمتر می شود. به طور کلی، در زمستان، جریان روزانه گردشگران در کوه هوانگشان به دلیل دمای پایین کم است. با این حال، جریان توریستی ممکن است حتی در زمستان به دلیل افزایش موقت دما، روند افزایشی را نشان دهد، در حالی که در اکثر فصلها، جریان گردشگر روزانه همان توزیع دما و رطوبت محیط را نشان میدهد. از این رو،
بر اساس تجزیه و تحلیل، بیشترین و کمترین دماهای روزانه، جریان توریستی یک روز خاص و زمان به عنوان متغیرهای ورودی انتخاب می شوند. الگوریتم K-means برای تنظیم فصل طبیعی در مقصد کوه Huangshan اتخاذ شده است. با در نظر گرفتن داده های مربوط به سال 2014 به عنوان مثال، نتایج خوشه بندی در شکل 4 نشان داده شده است .
در شکل از عدد 1 برای نمایش خوشه 0، عدد 2 برای خوشه 1، عدد 3 برای خوشه 2 و غیره استفاده می کنیم. همانطور که مشخص است، هنگامی که سال به سه فصل تقسیم می شود، برخی از نقاط نمونه به خوشه های بسیار کمی تقسیم می شوند. وقتی به پنج کلاس تقسیم می شود، برخی از اشیا به بیش از یک دسته تعلق دارند. با این حال، وقتی به شش کلاس تقسیم می شود، تنها چند شی به هر کلاس تعلق دارد که برای تشکیل یک دسته ناکافی است. جدول 5 و جدول 6 نتایج خوشه بندی خاص را برای موارد سه و چهار کلاس ارائه می دهد.
برای سهولت ارائه نتایج خوشه بندی، شکل 5 طراحی شده است که از آن می توان نتیجه گرفت که وقتی سال به سه دسته تقسیم می شود، آوریل، مه، ژوئن، ژوئیه، آگوست، سپتامبر و اکتبر در یک دسته بندی واحد قرار می گیرند. . با این حال، در ماه های آوریل تا اکتبر، دما در ابتدا افزایش می یابد و سپس کاهش می یابد و بر این اساس بر جریان روزانه گردشگر تأثیر می گذارد. پس از آزمایشهای مکرر، نتایج تأیید میکنند که وقتی سال به چهار کلاس فصلی تقسیم میشود، به حالت پایدار میرسد. نتیجه نهایی نیز در شکل 5 ارائه شده است، که در آن ژانویه، فوریه و 1 تا 14 مارس برای تشکیل یک کلاس در نظر گرفته شده است. در طول این مدت، دما نسبتاً پایین است و جریان گردشگران روزانه تقریباً در طول دوره یکسان است. با این حال، در اواخر ماه مارس، دما به تدریج شروع به افزایش می کند و آب و هوا راحت تر می شود. بنابراین، گردش روزانه گردشگران در مقاصد کوهستانی در این مدت مشابه ماه های آوریل و اردیبهشت است. بنابراین، اوایل مارس در همان دسته ژانویه و فوریه طبقه بندی می شود، در حالی که اواخر مارس اکنون در همان دسته آوریل و می طبقه بندی می شود. به طور مشابه، در ماه های ژوئن، ژوئیه و آگوست، اگرچه دمای سطح نسبتاً بالا است، دما در نقاط کوهستانی نسبتاً پایین باقی می ماند. و بنابراین، آنها با سپتامبر و اکتبر در یک کلاس واحد گروه بندی می شوند. در همین حال،
3.4. پیشبینیهای مدلهای مختلف و مقایسه آنها پس از خوشهبندی فصلی
برای بررسی اثربخشی و امکانسنجی خوشهبندی فصلی، از بردارها استفاده میکنیم ایکس1،ایکس4،ایکس5،ایکس6،اسمنبه عنوان متغیرهای ورودی در مدل ها، جایی که سمن”=10(1 نشان دهنده فصل طبیعی i = 1، 2، 3، 4) فصول طبیعی جدید را نشان می دهد . در یک آزمایش جداگانه، ما از بردارهایی که فصول طبیعی تعریف شده اولیه را نشان میدهند برای مقاصد مقایسه استفاده میکنیم. مانند قبل، هر دو PSO-LSSVM و LSSVM با توجه به هر دو مجموعه بردار آزمایش می شوند. جدول 7 و جدول 8 نتایج پیش بینی ها را نشان می دهد.
جدول 7 نشان می دهد که وقتی سال به چهار کلاس فصلی تقسیم می شود، نمرات MAPE/RMSE هر دو مدل با هر ماه بهتر از زمانی که سال به سه کلاس فصلی تقسیم می شود، مطابقت دارد. علاوه بر این، استدلال پشت تقسیم سال به چهار دسته فصلی قبلاً ارائه شده است. علاوه بر این، زمانی که سال به چهار کلاس فصلی تقسیم میشود، دقت پیشبینی PSO-LSSVM بهتر از LSSVM مشاهده میشود که امکانسنجی مدل پیشنهادی را ایجاد میکند.
جدول 8 نتایج پیشبینیهای PSO-LSSVM و LSSVM را تحت تعاریف مختلف فصول نشان میدهد.
(1) همانطور که از جدول 8 مشخص است، اگرچه اتخاذ خوشه بندی فصلی میانگین درصد مطلق خطای ماهانه را کاهش نمی دهد، اما میانگین درصد مطلق خطای سالانه را نزدیک به 1.5٪ کاهش می دهد. علاوه بر این، شاخص RMSE نیز نتیجه گیری ما را تایید می کند. این نشان می دهد که خوشه بندی فصلی در افزایش دقت پیش بینی موثر است.
(2) امتیاز MAPE/RMSE سالانه مدل PSO-LSSVM بهتر از LSSVM به طور کلی مشاهده می شود، همانطور که از جدول 8 مشاهده می شود ، مدل PSO-LSSVM در بیشتر ماه ها عملکرد بهتری نسبت به LSSVM دارد. خطا به طور متوسط نزدیک به 1.5٪ کاهش یافت. این نتیجه گیری ما را تایید می کند که مدل PSO-LSSVM یک روش موثر برای پیش بینی جریان روزانه گردشگر در مقاصد گردشگری دیدنی است.
(3) خوشهبندی فصلی که بهترین نتایج را ایجاد میکند ژانویه، فوریه و 1-14 مارس را در یک گروه، نوامبر و دسامبر را در گروهی دیگر و آوریل و می را در گروه دیگری طبقهبندی میکند.
با مقایسه پیشبینیهای PSO-LSSVM، تأیید میکنیم که میانگین درصد خطای مطلق مربوط به مارس پس از تعدیل فصلی به طور قابلتوجهی کاهش مییابد. اگرچه نمرات MAPE مربوط به آوریل و می کمی بالاتر از امتیازات قبل از خوشه بندی است، امتیاز MAPE در نوامبر، دسامبر و مارس کمتر از قبل از خوشه بندی است، و مشاهده می شود که ارزش MAPE در طول سال کاهش می یابد. بنابراین، روش پیشنهادی در این تحقیق مؤثر است، همچنین شاخص RMSE نیز اعتبار روش پیشنهادی را تأیید میکند.
4. بحث
پیشبینی جریان روزانه گردشگر در مقاصد دیدنی برای صنعت گردشگری ضروری است و دقت پیشبینی برای توزیع بهینه منابع گردشگری بسیار مهم است [ 8 ، 37 ، 43 ]. کوه هوانگشان یک نقطه دیدنی معروف در چین است و حجم توریستی روزانه آن بهعنوان ویژگیهای پیچیده غیرخطی شناخته میشود و دادههای گردشگری تاریخی روندهای مختلفی از نوسانات را در طول فصول مختلف نشان میدهند. .]. این تحقیق دادههای جریان توریستی در کوه هوانگشان را بین سالهای 2014 و 2017 به عنوان مجموعه داده در نظر میگیرد و تغییرات حجم گردشگران روزانه را با توجه به فصول مختلف تحلیل میکند. از یک سو، بهینه سازی ازدحام ذرات برای بهینه سازی ماشین بردار پشتیبان حداقل مربعات استفاده می شود. از سوی دیگر، ما با الگوریتم خوشهبندی بر تنظیم مجدد فصول تمرکز میکنیم. در پاسخ به نتایج تحقیق ما، می توان به این نکته اشاره کرد که عملکرد پیش بینی از دو جنبه قابل بهبود است: خود پیش بینی کننده و ورودی الگوریتم. نتایج تجربی بالا صحت تحقیق ما را تأیید میکند که اثر مدل پیشبینی کلاسیک را میتوان با تعدیل فصلی بهینه کرد و دارای الهامبخش و ارزش عملی برای پیشبینی کوتاهمدت جریان توریستی روزانه است.
به طور خلاصه، در مقایسه با تحقیقات قبلی، تفاوت ها و مزایای این تحقیق به شرح زیر است:
(1) به جای پیش بینی جریان گردشگران در فواصل زمانی ماهانه یا سالانه، این تحقیق در یک بازه زمانی روزانه انجام می شود و این بهبود می تواند کارایی پیش بینی را به میزان قابل توجهی افزایش دهد.
(2) عملکرد پیشبینی مدل ترکیبی در این تحقیق به طور قابلتوجهی از طریق الگوریتم بهینهسازی پیشنهادی، که از بخش 4 قابل مشاهده است، بهبود یافته است .
(3) تعدیل و تقسیم فصلی به عنوان عوامل در تحقیق ما در مدل پیشبینی گنجانده شد و ثابت میکند که روشی مؤثر برای بهبود عملکرد پیشبینی مدل است. در همین حال، همانطور که در بخش 2 ذکر شد، کارهای تحقیقاتی قبلی به ندرت به این سؤال توجه می کردند .
نتایج این تحقیق به مدیریت گردشگری کمک می کند و مفاهیم کاربردی زیر را می توان در مدیریت ارائه کرد:
(1) با توجه به نتایج خوشه بندی فصلی، مدیران همیشه می توانند به جای استفاده از یک مدل، مدل ترکیبی متفاوتی را اتخاذ کنند. یعنی، می تواند ویژگی مدیریت واقعی را بهبود بخشد.
(2) پیشبینی دقیق جریان گردشگران کوتاهمدت روزانه میتواند به کاهش تعداد حوادث شلوغی برای بهبود کیفیت تجربه گردشگران کمک کند.
(3) از نظر مدیریت تخصیص منابع نقاط دیدنی، روش پیشبینی دقیق جریان توریستی ارائه شده در این تحقیق میتواند اتلاف منابع را کاهش دهد.
به طور کلی، این تحقیق الهامبخشی برای پیشبینی جریان گردشگر است. این شکاف پیشبینی جریان توریستی را با معرفی ایده خوشهبندی فصلی پر میکند، که ثابت کرد موثر است. نتایج این تحقیق می تواند برخی مفاهیم کاربردی را نیز ارائه دهد.
5. نتیجه گیری ها
در این تحقیق، فصل طبیعی محیط به عنوان یک عامل اساسی در پیشبینی جریان روزانه گردشگر در روز بعد در نظر گرفته شده و یک مدل ترکیبی بهینه پیشنهاد شده است. نتایج تجربی تأیید میکند که: (1) فصل عاملی است که عمیقاً بر دقت پیشبینی جریان روزانه گردشگر تأثیر میگذارد، که میتواند با شواهد جدول 4 تأیید شود . (2) تنظیمات فصلی دقت پیشبینی را تقریباً 3 درصد بهبود میبخشد. به ویژه برای ماه هایی که تغییرات دمایی قابل توجهی دارند، به عنوان مثال، مارس مناسب است. شواهد جدول 7 و 8 می تواند آن را تایید کند. (3) برتری PSO-LSSVM بر LSSVM نیز تأیید شده است و می توان آن را با شواهدی جدول 4 پشتیبانی کرد.ازجدول 7 و جدول 8 . این به نقش روش PSO در تعیین مقادیر بهینه پارامترهای LSSVM بر اساس هماهنگی انسجام عالی آن نسبت داده می شود. علاوه بر این، تنظیم موثر فصول طبیعی بر اساس الگوریتم K-means یکی دیگر از دلایل مهم برتری PSO-LSSVM است. بنابراین، بر اساس ایده تعدیل فصلی، PSO-LSSVM همراه با الگوریتم K-means به عنوان یک روش مناسب و امکانپذیر برای پیشبینی روزانه حجم گردشگران ایجاد شد. نتایج تجربی در این تحقیق این نتیجه را تایید می کند.
با این حال، روش پیشنهادی هنوز از محدودیتهای خاصی رنج میبرد که میتواند در کارهای آینده بهبود یابد. ابتدا، این تحقیق با تمرکز بر کاربرد عملی روش انجام شد و نظریه زیربنایی شایستگی تحقیقات بیشتر را دارد. دوم، عوامل خاصی مانند آب و هوا را میتوان با پیچیدگی بیشتری نسبت به آنچه در این تحقیق در نظر گرفت برای بهبود بیشتر دقت پیشبینی در نظر گرفت. علاوه بر این، روش تعدیل فصلی مستحق تحقیقات بیشتر است.
به طور کلی، این تحقیق قابلیت اطمینان بهبود اثر پیشبینی مبتنی بر تعدیل فصلی را ثابت میکند و دقت پیشبینی کوتاهمدت جریان روزانه گردشگر بهدستآمده توسط مدل ترکیبی پیشنهادی، برای متخصصان صنعت گردشگری مفید است و آنها را قادر میسازد تا به طور منطقی تخصیص منابع مناسب از قبل این تحقیق همچنین به تحقیق در مورد پیشبینی کوتاهمدت کمک میکند، که از آنجایی که اکثر مطالعات موجود بر پیشبینی ماهانه یا سالانه متمرکز شدهاند، قابل توجه است.
بدون دیدگاه