خلاصه

دانش در مورد نقاطی که فعالیت توریستی انجام می شود، از جمله اینکه کدام بخش از بازار توریستی از آنها بازدید می کنند، اطلاعات ارزشمندی برای مدیران خدمات گردشگری است. امروزه، برنامه‌های کاربردی تلفن‌های هوشمند جمع‌سپاری شده به عنوان بخشی از نظرسنجی‌های گردشگران به‌دنبال دانش درباره گردشگران در تمام مراحل سفر استفاده می‌شوند. با این حال، معرف بودن این نوع منبع، یا نحوه اعتبارسنجی نتایج، بخشی از مسائلی است که هنوز باید حل شود. در این تحقیق، روشی برای کشف نقاط داغ با استفاده از تکنیک‌های خوشه‌بندی و ارائه تفسیری مبتنی بر داده به این کانون‌ها ارائه شده است. نمایندگی مجموعه داده و اعتبار نتایج در برابر آمارهای موجود ارزیابی می شود. این روش با استفاده از 124725 سفر مورد ارزیابی قرار گرفت که توسط 1505 دستگاه جمع آوری شده است.

کلید واژه ها:

مدیریت گردشگری ; هات اسپات ; جمع سپاری ; تجزیه و تحلیل داده های بزرگ ؛ تحرک انسان ؛ خوشه بندی رفتاری ; ارزیابی خوشه بندی

1. معرفی

مقاصد در سراسر جهان حدود 1.5 میلیارد گردشگر بین المللی را در سال 2019 ثبت کردند که نسبت به سال قبل 3.8 درصد افزایش داشت [ 1 ]. بنابراین، مدیران گردشگر علاقه مند به پیش بینی رفتار حرکت گردشگران آینده بخش های مختلف از بازار گردشگری هستند [ 2 ]. بخش توریستی گروهی است که ممکن است به تجربیات جداگانه یا ترکیب خدمات بازاریابی توریستی نیاز داشته باشد [ 3 ]. استفاده از داده‌های جمع‌سپاری GNSS (سیستم ناوبری ماهواره‌ای جهانی) امکان دستیابی به بینش‌هایی را از رفتار گردشگران به منظور پاسخگویی به سؤالات پیچیده بدون توجه به اینکه محیط شهری یا روستایی است [4، 5] فراهم کرده است .]. برخی از این پرسش‌ها پیامدهای اقتصادی مستقیمی برای مناطق مقصد گردشگری دارند، مانند جستجوی نقاط مهمی که فعالیت‌های گردشگری در آن انجام می‌شود و ارتباط آن‌ها با بخش‌های بازار گردشگری.
تجزیه و تحلیل بازار گردشگری به دلیل گروه متنوعی از گردشگران فعال درگیر، یک کار پیچیده است. یک استراتژی مدیریتی مورد استفاده، بخش‌بندی بازار است، که در آن داده‌های توریستی توسط مدیران خدمات برای شناسایی بخش‌های گردشگری به‌دنبال پیش‌بینی رفتار گردشگران آینده استفاده می‌شود [ 2 ]. طبق ادبیات، تقسیم‌بندی بازار گردشگری بر اساس رویکردهایی مانند مزایای توریستی [ 6 ]، معیارهای انتخاب صنایع دستی و مشارکت خرید [ 7 ] و فصلی [ 8 ] انجام شده است. در کار قبلی [ 9 ]، تقسیم‌بندی بازار گردشگری در استان زیلند در هلند بر اساس الگوهای زمان اقامت انجام شد که سه بخش گردشگری را شناسایی می‌کرد:خارجی 24 ، گردشگرانی که کمتر از 24 ساعت را در منطقه زیلند صرف کرده اند تنها در یک موقعیت. خارجی طولانی ، کسانی که بیش از 24 ساعت را در منطقه Zeeland تنها در یک موقعیت سپری کردند. و خارجی مکرر ، کسانی که برای آنها سفرهای متعدد در داخل و خارج از منطقه Zeeland مشاهده شد.
به طور سنتی، آمار گردشگری با استفاده از نظرسنجی های کاغذی جمع آوری می شود که قادر به ثبت رفتار طولی یک گردشگر نیست. امروزه، کمپین‌های گردشگری داده‌های توریستی را با استفاده از برنامه‌های کاربردی تلفن‌های هوشمند جمع‌سپاری، مانند Bucketfood [ 10 ] و Zeeland App [ 11 ] جمع‌آوری می‌کنند، که زمانی که دانش درباره گردشگر در تمام مراحل سفر ضروری است، مزایایی دارند. استفاده از گوشی‌های هوشمند به‌عنوان حسگر به ما این امکان را می‌دهد که داده‌ها را در مناطق بزرگ جغرافیایی (روستایی)، در مناطق (حتی) کمتر بازدیدکننده و به طور مداوم در هر زمانی از روز جمع‌آوری کنیم. بنابراین، دقت داده های مکانی-زمانی بالاتر از آمار گردشگری معمولی است [ 12]. کمپین‌های گردشگری جمع‌سپاری برای به دست آوردن بینش‌های مختلف مانند جریان‌های تحرک گردشگران، استفاده از انواع مختلف حالت‌های حمل‌ونقل، تعداد بازدیدکنندگان و الگوهای تحرک آنها، درک پروفایل‌های تحرک بازدیدکنندگان، و مشوق‌های بالقوه‌ای که ممکن است برای تأثیرگذاری بر تحرک کاربران استفاده شوند، راه‌اندازی می‌شوند. رفتار – اخلاق. با این حال، تجزیه و تحلیل داده های بزرگ مکانی-زمانی برای تبدیل داده های جمع آوری شده به بینش های ارزشمند و معنادار مورد نیاز است.
در ادبیات، تجزیه و تحلیل داده‌های بزرگ مکانی-زمانی، کمک‌هایی مانند الگوریتم‌ها، روش‌ها، چارچوب‌ها، رویکردها و راه‌حل‌های جدید برای پرداختن به چالش‌های حوزه خاص [13] برای استخراج اطلاعات به منظور درک پدیده‌ها به عنوان تحرک انسان از داده‌های GNSS جمع‌سپاری شده توسعه داده است. [ 14 ، 15 ، 16 ]. در حوزه گردشگری، تحلیل مسیر [ 17 ] به نام داده کاوی مسیر در زمینه های خاصی مانند گردشگری برای کشف الگوهای حرکت گردشگری شهری یا روستایی استفاده شده است [ 4 ، 5 ، 8] .] یکی از اهداف آن برای استخراج نقاط مورد علاقه است. برای شناسایی خوشه‌ها (به عنوان مثال، نقاط مهم)، ویژگی‌های مکانی-زمانی به عنوان بخشی از داده‌های ورودی زنجیره‌های پردازشی استفاده شده‌اند که شامل فرآیندهای فرعی داده‌کاوی برای تبدیل داده‌ها به دانش است [18 ] . در [ 19 ]، یادگیری قانون تداعی برای الگوبرداری در بازدید از جاذبه‌های توریستی برای نشان دادن پتانسیل شبکه‌های سنجش موقت در اندازه‌گیری غیر مشارکتی حرکات در مقیاس کوچک اعمال می‌شود. در [ 20]، نویسندگان رویکردهای مختلف خوشه بندی را برای شناسایی افراد و نقاط داغ جمعی در نظر می گیرند. یافته‌های آنها ثابت کرد که OPTICS قوی‌ترین الگوریتم در برابر پارامترهای اولیه است، اما تنظیم پارامتر و بازنمایی داده‌ها مورد ارزیابی قرار نگرفت. با این وجود، این نتایج مبتنی بر داده باید اعتبار سنجی شوند. در ادبیات، منابع داده خارجی مانند اطلاعات جغرافیایی معنایی [ 21 ]، دسته‌بندی‌های Google [ 22 ] و OpenStreetMaps [ 20 ] برای انجام این کار استفاده شده‌اند.
در این تحقیق، روشی برای شناسایی نقاط داغ از داده‌های جمع‌سپاری شده که تفسیری مبتنی بر داده را به آنها می‌دهد پیشنهاد شده است. یک مجموعه داده جمع‌سپاری که از بیش از 1500 شرکت‌کننده، طی یک دوره پنج ماهه، در استان توریستی زیلند، هلند جمع‌آوری شده است، استفاده می‌شود. فقط سفرهایی که توسط گردشگر انجام می شود که متعلق به بخش های توریستی خارجی طولانی و دوره ای خارجی است [ 9] در نظر گرفته شده اند. مشارکت‌های پژوهشی بنیادی این کار به سؤال تحقیقاتی زیر مربوط می‌شود: (1) چگونه می‌توان داده‌های جمع‌سپاری و خوشه‌های حاصل از این نوع منبع داده را تأیید کرد؟ (ii) بینش‌های اضافه‌ای که داده‌های جمع‌سپاری می‌توانند در بالای آمارهای موجود به ارمغان بیاورند، چیست؟ (iii) آیا بین بخش های توریستی در الگوهای فعالیت آنها تفاوت وجود دارد؟
بقیه این مقاله به شرح زیر سازماندهی شده است: بخش 2 یک نمای کلی از منطقه مطالعاتی جغرافیایی و توضیحات مجموعه داده می دهد. روش دقیقی که برای کشف خوشه‌هایی که نقاط داغ را نشان می‌دهند نیز در این بخش گنجانده شده است. در بخش 3 ، نتایج به همراه برخی از بینش‌ها در مورد کانون گردشگری و کمپین جمع‌سپاری گردشگری ارائه شده است. بحث در مورد یافته ها در بخش 4 صورت می گیرد و نتایج این تحقیق را می توان در بخش 5 یافت .

2. مواد و روشها

2.1. منطقه مطالعاتی جغرافیایی

در هلند، استان زیلند ( شکل 1 ) یکی از استان های پربازدید از نظر گردشگران خارجی است، اما کم جمعیت ترین استان کشور است [ 23] .]. گردشگران برای فعالیت های قابل توسعه (جدول 3) از استان بازدید می کنند. از نظر جغرافیایی، زیلند در جنوب غربی هلند واقع شده است و حدود 2930 کیلومتر مربع مساحت دارد که از سواحل و جزایر تشکیل شده است. استان زیلند دارای 13 شهرداری است. بر اساس آمار هلند، یک موسسه دولتی هلند، که در هلندی به عنوان Centraal Bureau voor de Statistiek (CBS) شناخته می شود، این استان در سال 2017 بیش از 10 میلیون اقامت شبانه را ثبت کرده است و برای اولین بار تعداد شب اقامت گردشگران خارجی ثبت شده است. (غیر هلندی) از تعداد شب اقامت هلندی ها (غیر مقیم) بیشتر شد [ 24]. این تحقیق در این استان انجام شد که از نظر تعداد شب در هلند رتبه 6 و از نظر گردشگران خارجی رتبه 3 را دارد.

2.2. مجموعه داده

در این تحقیق از مجموعه داده های زیر استفاده شده است:
  • مجموعه داده گردشگری جمع سپاری شده داده‌ها توسط اپلیکیشن جمع‌سپاری تلفن همراه ارائه‌شده توسط آژانس رسمی اطلاعات توریستی منطقه‌ای VVV Zeeland (استان زیلند، هلند) جمع‌آوری شد. کاربران هدف گردشگرانی بودند که از ماه می تا سپتامبر 2017 از استان بازدید کردند. در این مدت، در مجموع 10597 کاربر این اپلیکیشن را دانلود کردند که از این تعداد 1505 کاربر داده های خود را ارائه کردند. کاربران فعال 124725 سفر (مسیر پیموده شده از مبدأ سفر تا محل مقصد سفر) و 151612 بخش سفر (قسمت‌هایی از سفر که با حالت حمل‌ونقل تکی انجام می‌شود) مشارکت کردند. در مجموعه داده، هر رکورد یک بخش سفر را نشان می دهد. شرح مفصلی از ویژگی های جمع آوری شده برای هر بخش سفر در جدول 1 آورده شده است .
  • مجموعه داده CBS . این مجموعه داده شامل آمار منتشر شده توسط CBS در مورد گردشگران در اقامتگاه های استان زیلند [ 24 ] است. دوره زمانی در نظر گرفته شده در مقایسه، از ژوئیه تا سپتامبر 2017 است. این منبع داده خارجی برای اندازه گیری نمایندگی داده های جمع سپاری استفاده می شود.
  • کاربری اراضی هلند این مجموعه داده شامل فایل کاربری زمین از هلند است که توسط CBS [ 25 ] منتشر شده است. این شامل هندسه دیجیتالی استفاده از زمین مانند مناطق ترافیکی، ساختمان ها و مناطق تفریحی است. این منبع داده خارجی برای تکمیل مجموعه داده استفاده می شود تا بتواند تفسیری مبتنی بر داده را به نتایج ارائه دهد. جدول 2 فیلدهای مجموعه داده را نشان می دهد.
  • مجموعه داده اعتبار سنجی NBTC-NIPO Research یک شرکت تحقیقاتی است که در تحقیقات تعطیلات، اوقات فراغت و سفرهای کاری تخصص دارد. یکی از پروژه های تحقیقاتی آنها، تحقیقات مداوم تعطیلات است که در هلندی به عنوان ContinuVakantieOnderzoek (CVO) شناخته می شود. این پروژه یک نظرسنجی در مقیاس بزرگ مصرف کنندگان در مورد رفتار تعطیلات در هلند است. در CVO 2015، که از 1 اکتبر 2014 تا 30 سپتامبر 2015 انجام شد، از افرادی که تعطیلات توریستی را در زلند گذرانده بودند، پرسیده شد که آیا در طول تعطیلات خود فعالیت های خاصی انجام داده اند یا خیر. 10 مورد برتر از فعالیت های گردشگران هلندی شبانه در زیلند در جدول 3 نشان داده شده است . در این تحقیق از این منبع داده خارجی برای اعتبار سنجی تفسیر نتایج استفاده شده است.

2.3. روش شناسی

در این بخش روش پیشنهادی توضیح داده شده است. شکل 2 زنجیره پردازش را نشان می دهد زیرا داده های جمع سپاری به عنوان ورودی ارائه می شوند تا زمانی که هات پات های معنی دار به عنوان یک نتیجه ارائه شوند. در ادامه مراحل مختلف با جزئیات بیشتر مورد بحث قرار خواهد گرفت.

2.3.1. پیش پردازش مجموعه داده

در مرحله پیش پردازش، پاکسازی داده ها انجام می شود تا بخش های سفر با داده های از دست رفته یا فیلدهای خالی حذف شوند. سفرها با استفاده از بخش های سفر معتبر به منظور استخراج ویژگی هایی مانند مکان مقصد سفر بازسازی می شوند. سفرهایی که مکان مقصد خارج از منطقه مورد مطالعه است فیلتر می شوند. سپس، تبدیل داده ها برای استخراج برخی از ویژگی ها انجام می شود. ابتدا ژئوکدینگ معکوس در مبدا و مقصد اعمال می شود تا در صورتی که نقاط مکان در داخل محدوده مورد مطالعه باشد، نام مبدا و مقصد شهرداری به دست آید، در غیر این صورت خالی خواهند بود. دوم، برای هر سفر، زمان اقامت به عنوان اختلاف زمانی بین زمان رسیدن به مقصد سفر فعلی و زمان عزیمت سفر بعدی محاسبه می‌شود. سرانجام، ویژگی مکان مقصد از درجه اعشار به سیستم مختصات Mercator عرضی جهانی (UTM) تبدیل می شود تا بتواند از متر به عنوان واحد اندازه گیری فاصله در طی مراحل روش شناسی زیر استفاده کند. علاوه بر این، با استفاده از تقسیم‌بندی بازار گردشگری انجام شده در [9 ]، بخش توریستی که کاربر به آن تعلق دارد به هر سفر اضافه می شود تا سفرهایی را که توسط بخش های توریستی طولانی مدت و خارجی انجام نشده است فیلتر کند. شکل 3 مکان های جغرافیایی مقصد سفر مجموعه داده را با نشان دادن منطقه مورد مطالعه نشان می دهد.
در این مجموعه داده، 25613 نقطه داده وجود دارد. هر کدام نشان دهنده مکان مقصد سفر است. شرح مفصلی از ویژگی های جمع آوری شده برای هر مکان مقصد سفر در جدول 4 آورده شده است .
2.3.2. نمایندگی مجموعه داده
این مطالعه بر روی تشخیص نقاط داغ برای بهبود درک رفتار بازدیدکنندگان Zeeland تمرکز دارد. هدف آن ایجاد یک مدل خوشه‌بندی مبتنی بر چگالی است. با این حال، این نوع مدل معمولاً با داده های تاریخی آموزش داده می شود، با این فرض که متغیرهای مورد استفاده مدل در آینده نزدیک همان رفتار را حفظ خواهند کرد. بنابراین، ارزیابی می‌شود که آیا مجموعه داده جمع‌سپاری یک مجموعه داده نماینده است یا خیر. از این رو، مقایسه توزیع داده‌ها بین تعداد گردشگران در اقامتگاه‌های توریستی توسط هر شهرداری استان زلاند ثبت‌شده در مجموعه داده آمار هلند، و تعداد سفرهای ورودی توسط هر شهرداری استان زیلند ثبت‌شده در مجموعه داده‌های جمع‌سپاری شده است. انجام شد.

قبل از انجام مقایسه، هر دو نمونه استاندارد شدند تا آنها را در یک مقیاس قرار دهند و میانگین را روی 0 با انحراف استاندارد 1 متمرکز کنیم. روش استانداردسازی را می توان به صورت زیر بیان کرد:

ایکسستید(من)=ایکس(من)-μایکسσایکس

جایی که μایکسو σایکسمیانگین و انحراف معیار صفت را نشان می دهد.

سپس، آزمون دو نمونه ای کولموگروف-اسمیرنوف ( آزمون K-S ) (معادله ( 2 ))، که یک آزمون ناپارامتریک برای برابری پیوسته یا ناپیوسته است، برای ارزیابی اینکه آیا هر دو نمونه از یک جمعیت با توزیع یکسان این آزمون فاصله KS را کمی می کند که به عنوان حداکثر فاصله عمودی بین توابع توزیع تجربی دو نمونه تعریف می شود. این به صورت زیر تعریف می شود:

Dn،متر=حداکثرایکس|اف(ایکس)-جی(ایکس)|

جایی که اف(ایکس)تابع توزیع تجمعی مشاهده شده اولین نمونه است که دارای اندازه n و است جی(ایکس)تابع توزیع تجمعی مشاهده شده نمونه دوم است که اندازه m است . اگر فاصله K-S کوچک یا مقدار p زیاد باشد، هر دو نمونه از جمعیتی با توزیع یکسان می آیند (فرضیه صفر).

2.3.3. تجزیه و تحلیل خوشه بندی
در این مطالعه، هدف شناسایی نقاط داغ بازدید شده توسط گردشگران زیلند با استفاده از خوشه بندی، یک تکنیک یادگیری بدون نظارت برای کشف ساختارهای داده به منظور استخراج اطلاعات معنادار است. یک الگوریتم خوشه بندی مبتنی بر چگالی از مفهوم چگالی استفاده می کند که می تواند به عنوان تعداد نقاط داده در واحد حجم فضای ویژگی تعریف شود [ 27 ]. یک نقطه داده از متغیرهای نشان داده شده در جدول 5 ساخته شده است . یک منطقه از فضای ویژگی به عنوان یک منطقه با چگالی بالا یا کم تراکم با توجه به وقوع نقاط داده ای که نزدیک به هم بسته بندی شده اند شناسایی می شود. سپس، خوشه ها با تقسیم بندی و الگوهای یادگیری از مناطق با تراکم بالا شناسایی می شوند.
در این مرحله، اولین هدف کاهش تعداد نقاط داده تولید شده توسط یک گردشگر منفرد است تا سپس به دنبال خوشه هایی با تراکم ناهمگن بگردند. به طور کلی، الگوریتم‌های خوشه‌بندی مالکیت نقاط داده را در نظر نمی‌گیرند، بنابراین یک نقطه می‌تواند به اشتباه به‌عنوان یک نقطه مهم طبقه‌بندی شود، فقط به دلیل تعداد بالای بازدیدهای ثبت‌شده توسط یک کاربر. برای رسیدگی به این مشکل، الگوریتم خوشه‌بندی فضایی مبتنی بر چگالی برنامه‌های کاربردی با نویز (DBSCAN) [ 28 ] انتخاب می‌شود زیرا مکان‌هایی را که گردشگران بازدید کرده‌اند، بدون توجه به تعداد دفعاتی که از آنها بازدید کرده‌اند، پیدا می‌کند، به عنوان مثال، خوشه‌هایی با هر شکلی بدون توجه به چگالی آن‌ها. و به دلیل توانایی DBSCAN برای پردازش مجموعه داده های بسیار بزرگ [ 29]. برای رسیدگی به مسئله چگالی خوشه ناهمگن، از الگوریتم Ordering Points To Identify the Clustering Structure (OPTICS) [ 30 ] استفاده می شود. مزیت اصلی OPTICS این است که می تواند خوشه هایی با چگالی متفاوت پیدا کند. تا جایی که می‌دانیم، الگوریتم‌های مبتنی بر چگالی که هم خوشه‌ها را با نقاط داده کاربران مختلف و هم شرایط چگالی خوشه‌ای ناهمگن را پیدا می‌کنند، وجود ندارند. برای مثال، Reverse Nearest Neighbor-DBSCAN [ 31 ] که یک الگوریتم مبتنی بر DBSCAN است، فقط جستجوی خوشه‌هایی با چگالی ناهمگن را انجام می‌دهد. Photo-DBSCAN [ 32 ] خوشه هایی را پیدا می کند که حاوی نقاط داده کاربران مختلف است، اما تضمین نمی کند که بتواند خوشه هایی با چگالی های مختلف را شناسایی کند.
DBSCAN دارای دو پارامتر است: حداقل تعداد نقاط داده برای تشکیل یک ناحیه متراکم ( minPts ) و ε ( epsilon ) که نشان دهنده حداکثر فاصله، بیان شده بر حسب واحد فضای ویژگی، بین دو نقطه داده برای یک نقطه داده است که باید در نظر گرفته شود. همسایگی دیگری با توجه به ادبیات، تعداد ابعاد ( کم ) یک مجموعه داده را می توان برای تعیین مقدار minPts هایپرپارامتر استفاده کرد . در بسیاری از موارد یک مجموعه داده دو بعدی، می توان آن را در مقدار پیش فرض minPts = 4 [ 28 ] نگه داشت، در حالی که در موارد مجموعه داده های بزرگ و با ابعاد بالا، می توان minPts = 2* dim [ 33] را تنظیم کرد.]. در برخی از مطالعات، یک مقدار مطلق منفرد مناسب نیست، بنابراین آنها آن را بر اساس درصدی از مالکیت نقطه داده [ 34 ]، با استفاده از یک رویکرد اکتشافی بر اساس اندازه مجموعه داده [ 35 ] تنظیم کرده اند یا تخمین مقدار آن را انجام می دهند. با استفاده از یک تابع هدف [ 36 ]. به طور کلی، مقادیر بیشتری از minPtsنسبت به نویز قوی تر هستند و خوشه های مهم تری تولید می کنند. با این حال، سعی بر این است که بازدیدهای متعددی را که یک کاربر از یک مکان انجام می دهد با یک نقطه داده منفرد نشان دهد در حالی که مکان هایی که فقط یک بار بازدید شده اند باید نگه داشته شوند، بنابراین نقاط غیر داده باید به عنوان نویز طبقه بندی شوند. فراپارامتر ε که حداکثر فاصله شعاع جستجو را نشان می دهد باید با کمترین مقدار ممکن تنظیم شود. این فراپارامتر همچنین در بسیاری از مطالعات با استفاده از فاصله k-NN (یعنی 25 تا 550 متر) یا با در نظر گرفتن دامنه کاربردی و دانش منطقه مورد مطالعه تنظیم شده است [33 ، 36 ، 37 ] .
الگوریتم با انتخاب یک نقطه داده تصادفی p از مجموعه داده D شروع می شود . سپس به دنبال نقاط داده در همسایگی ε p می گردد . اگر حداقل نقاط داده minPts (از جمله آن) وجود داشته باشد، p به عنوان یک نقطه اصلی نشان دهنده شروع یک خوشه علامت گذاری می شود و تمام نقاط داده در همسایگی ε آن به خوشه آن اضافه می شود. در غیر این صورت، نقطه داده p به عنوان نویز مشخص می شود. با این حال، p ممکن است بعداً بخشی از همسایگی ε نقطه اصلی دیگری باشد و از این رو بخشی از یک خوشه شود. سپس الگوریتم از هر نقطه داده خوشه جدید بازدید می کند تا همان کار را انجام دهد. اگر یک نقطه qاز ε-همسایگی p یک نقطه هسته است ، گفته می شود که این نقاط داده به طور مستقیم با چگالی متصل و قابل دسترسی از یکدیگر هستند. شبکه ساخته شده توسط این نقاط داده متصل به چگالی یک خوشه در نظر گرفته می شود. الگوریتم به صورت بازگشتی از طریق اتصالات چگالی از نقاط اصلی جستجو می کند . هنگامی که یک نقطه داده از یک نقطه اصلی قابل دسترسی باشد، متوقف می شود، اما یک نقطه اصلی نیست . این نقطه داده یک نقطه مرزی در نظر گرفته می شود . سپس، الگوریتم با انتخاب یک نقطه داده بازدید نشده برای تکرار فرآیند ادامه می‌یابد.

در DBSCAN، متریک فاصله پیش‌فرض مورد استفاده برای محاسبات همسایگی، فاصله اقلیدسی بین دو نقطه داده است (معادله ( 3 )). این به صورت زیر تعریف می شود:

دمنستی(من،j)=(ایکسمن1-ایکسj1)2+(ایکسمن2-ایکسj2)2+…+(ایکسمنپ-ایکسjn)2،

جایی که من = ( ایکسمن1، ایکسمن2، …، در ) و j = ( ایکسj1، ایکسj2, …, jn ) نشان دهنده دو نقطه داده توصیف شده توسط n ویژگی عددی است. هنگامی که DBSCAN با نقاط داده یک گردشگر ارزیابی شد، برای هر خوشه به دست آمده، مرکزی ترین نقطه داده آن استخراج می شود و ویژگی “زمان اقامت” با میانگین “زمان اقامت” از نقاط داده در خوشه به روز می شود. این ویژگی در مرحله توصیف مبتنی بر داده استفاده خواهد شد. این رویه برای هر گردشگر (غیر فیلتر شده) در مجموعه داده اعمال می شود تا مجموعه داده جدیدی ساخته شده از مرکزترین نقاط استخراج شده ایجاد شود.

سپس، Ordering Points To Identify the Clustering Structure (OPTICS) [ 30 ] برای تخصیص عضویت خوشه بر روی مجموعه داده کاهش یافته استفاده می شود. OPTICS به دلیل توانایی آن برای یافتن خوشه هایی با چگالی متفاوت انتخاب شد. این الگوریتم از پارامترهای مشابه DBSCAN استفاده می کند. با این حال، تنها فراپارامتر اجباری minPts است . شعاع جستجو (ε) در اطراف یک نقطه داده اختیاری است. ثابت نیست و افزایش می یابد در حالی که حداقل minPts وجود نداردنقاط داده ای که در آنها به OPTICS اجازه می دهد تا مناطق با چگالی متفاوت را شناسایی کند. مناطق با چگالی بالا یک ε کوچک دارند در حالی که مناطق با چگالی کم یک ε بزرگ دارند. بنابراین، ε برای محدود کردن تعداد نقاط داده در نظر گرفته شده در جستجوی همسایگی برای کاهش پیچیدگی محاسباتی استفاده می‌شود.

کوچکترین فاصله دور از یک نقطه داده که شامل minPts سایر نقاط داده است، فاصله هسته نامیده می شود (معادله ( 5 )). فاصله بین یک نقطه هسته p و یک نقطه هسته q در داخل ε آن، که نمی تواند کمتر از فاصله هسته باشد، فاصله قابل استفاده مجدد است (معادله ( 5 )). فاصله مرکزی و فاصله دسترسی در OPTICS [ 30 ] به صورت زیر تعریف شد :

جorه-دمنستیϵ،مترمنnپتیس(پ)=UنDEافمننED،اگرسیآrد(نϵ(پ))<مترمنnپتیسمترمنnپتیس-دمنستی(پ)،oتیساعتهrwمنسه
rهآجساعتآبمنلمنتیy-دمنستیϵ،مترمنnپتیس(پ،q)=UنDEافمننED،اگر|نϵ(q))|<مترمنnپتیسمترآایکس(جorه-دمنستی(q)،دمنستی(q،پ))،oتیساعتهrwمنسه

که در آن minPts-dist ( p ) فاصله تا minPts نزدیکترین همسایه p است ، سیآrد(نϵ(پ))اصلی بودن زیرمجموعه ای از مجموعه داده D موجود در همسایگی ε نقطه داده p است . نϵ(q)ε-همسایگی یک نقطه داده q است و dist ( q , p ) فاصله اقلیدسی بین p و q است .

الگوریتم شروع به بازدید از هر نقطه داده از مجموعه داده برای شناسایی و علامت گذاری نقاط اصلی می کند. برای هر نقطه، محاسباتی انجام می شود. ابتدا فاصله هسته و فاصله دسترسی محاسبه می شود. دوم، امتیاز دسترسیکه به عنوان بزرگتر فاصله هسته یا کوچکترین فاصله دسترسی آن محاسبه می شود. در نهایت، توالی نقاط داده ای که الگوریتم قرار است بعداً از آنها بازدید کند، بر اساس فاصله دسترسی تا نقطه داده فعلی به روز می شود. این بدان معنی است که نقطه مرکزی بعدی برای بازدید، نقطه ای است که کمترین فاصله دسترسی را نسبت به نقطه فعلی دارد. هنگامی که الگوریتم تمام نقاط را بازدید کرد، هم ترتیب بازدید از هر نقطه داده و هم امتیاز دسترسی هر مورد را برمی‌گرداند.
فرآیند استخراج خوشه‌بندی با استفاده از نمودار Reachability انجام می‌شود. دو روش برای انجام تشخیص خوشه بندی وجود دارد. روش اول شامل انتخاب مقداری امتیاز دسترسی برای رسم یک خط افقی در سراسر نمودار دسترسی است. هنگامی که نمودار به زیر خط افقی فرو می رود، نقطه شروع یک خوشه مشخص می شود، در حالی که، اگر نمودار به بالای خط برگردد، انتهای خوشه مشخص می شود. سپس، هر مورد بالاتر از خط افقی را می توان به عنوان نویز طبقه بندی کرد. دوم روش ξ( xi ) است که از شیب استفاده می کندمفهوم به صورت 1 – ξ تعریف شده است. در اینجا، شروع و پایان یک خوشه در نمودار Reachability زمانی اتفاق می‌افتد که دسترسی به دو نقطه داده متوالی با ضریب 1 – ξ تغییر کند. یک شیب رو به پایین با حداقل مقدار شیب انتخاب شده شروع یک خوشه را ایجاد می کند در حالی که یک شیب رو به بالا با حداقل مقدار شیب انتخاب شده پایان آن را نشان می دهد. در این تحقیق از این روش به دلیل قابلیت یافتن خوشه هایی با تراکم متفاوت و همچنین سلسله مراتبی در بین آنها استفاده شده است. با این حال، یک الگوریتم خوشه‌بندی فقط خوشه‌ها را در نقاط داده شناسایی می‌کند، اما مشخص نمی‌کند که چقدر خوب یا بد هستند.

یک الگوریتم خوشه‌بندی که با پیکربندی فراپارامترهای مختلف محاسبه می‌شود، ممکن است نتیجه خوشه‌بندی متفاوتی تولید کند. بنابراین، از یک ارزیابی متریک خوشه‌بندی استفاده می‌شود تا بتوان محاسبات الگوریتم OPTICS را با مقادیر فراپارامتر مختلف به منظور تعیین مقادیر بهینه که در آن متریک بهترین است، مقایسه کرد. در این تحقیق از ضریب Silhouette [ 38 ] به عنوان معیاری برای ارزیابی کیفیت خوشه بندی استفاده شده است. این متریک زمانی استفاده می شود که برچسب های حقیقت زمینی شناخته نشده باشند. یک نتیجه خوشه‌بندی را می‌توان با چهار معیار ارزیابی کرد: فشردگی، جداسازی، تناسب کلی، و ابعاد ذاتی [ 39]. ارزیابی فشردگی و جداسازی خوشه‌بندی با این متریک برای هر مدل تولید شده توسط ترکیب هر ابرپارامتر انجام می‌شود. ضریب silhouette به صورت زیر تعریف می شود:

اس(من)=ب(من)-آ(من)حداکثر{ب(من)،آ(من)}،

جایی که آ(من)فشردگی خوشه را نشان می دهد که به عنوان فاصله متوسط ​​بین یک نمونه محاسبه می شود ایکس(من)و تمام نقاط داده دیگر در همان خوشه، و ب(من)جداسازی خوشه ای را نشان می دهد که به عنوان میانگین فاصله بین نمونه محاسبه می شود ایکس(من)و تمام نمونه ها در نزدیکترین خوشه. ضریب Silhouette بین -1 برای خوشه‌بندی نادرست و +1 برای خوشه‌بندی بسیار متراکم محدود می‌شود. نمرات حدود صفر نشان دهنده همپوشانی خوشه ها است. آزمایش‌ها برای تنظیم فراپارامترهای OPTICS minPts و ξ در بخش 3.2 توضیح داده شده‌اند .

2.3.4. خصوصیات و اعتبارسنجی داده محور
پس از انتخاب مقادیر فراپارامتر بهینه، یعنی ترکیب مقادیری که میانگین امتیاز ضریب سیلوئت در میان خوشه‌های به‌دست‌آمده بالاترین است، OPTICS با استفاده از آن‌ها برای تولید یک مدل خوشه‌بندی با خوشه‌های متراکم‌تر و به خوبی جداشده‌تر انجام می‌شود. سپس، یک خصوصیات مبتنی بر داده از هر خوشه (هات اسپات) انجام می شود. در این مرحله، از مجموعه داده کاربری زمین و ویژگی زمان ماندن نقاط داده خوشه استفاده می شود. کاربری زمین هر نقطه داده با توجه به ویژگی مکان مقصد تعیین می شود، به عنوان مثال، یک خوشه ممکن است نقاط داده با کاربری های مختلف داشته باشد. سپس، کاربری اصلی یک خوشه با بیشترین استفاده از زمین در میان نقاط داده آنها مشخص می شود. علاوه بر این،
در مرحله آخر، با توجه به اینکه کاربری اراضی با فعالیت های انسانی توسعه یافته در یک ملک مرتبط است، تعداد نسبی کانون ها بر اساس کاربری با فعالیت گردشگران شبانه منطقه مورد مطالعه که در اعتبار سنجی شرح داده شده است، مقایسه می شود. مجموعه داده محاسبه می شود. در صورت عدم تطابق بین این منابع داده، باید دوباره با یک مقدار فراپارامتر دیگر، خوشه بندی انجام شود. در غیر این صورت، خوشه ها (نقاط داغ) به عنوان یک نتیجه از این زنجیره پردازش ارائه می شود.

3. نتایج

این بخش نتایج تجزیه و تحلیل را برای کشف نقاط داغی که گردشگران در آن زمان در منطقه مورد مطالعه سپری می کنند ارائه می کند.

3.1. تجزیه و تحلیل سفرهای ورودی برای نمایندگی

نمایندگی مجموعه داده جمع‌سپاری براساس مقایسه آن با آمار گردشگران در داده‌های اقامتگاه‌های توریستی از آمار هلند ارزیابی شد. نمودار نشان داده شده در شکل 4 توابع توزیع تجمعی مجموعه داده جمع سپاری و آمار رسمی را نشان می دهد. فاصله KS برای تعیین اینکه آیا هر دو نمونه از جمعیتی با توزیع یکسان آمده اند یا نه، D = 0.23 و p -value = 0.90 است.
فاصله K–S برای جدول مقدار بحرانی با α = 0.05، n = 12 و m = 12 ، D-crit = 0.84 است . از آنجایی که D = 0.23 < 0.84، تفاوت معنی‌داری بین توزیع‌های نمونه‌ها وجود ندارد، به این معنی که هر دو نمونه از جمعیتی با توزیع یکسان هستند که نشان می‌دهد مجموعه داده‌های جمع‌سپاری نماینده این مطالعه است.

3.2. آزمایش کنید

تجزیه و تحلیل خوشه‌بندی مبتنی بر چگالی در دو مرحله بر روی مجموعه داده‌های ساخته شده از 25613 نقطه داده انجام می‌شود. مرحله اول با هدف کاهش تعداد نقاط داده تولید شده توسط هر کاربر به منظور جلوگیری از شناسایی خوشه های ساخته شده توسط نقاط داده تنها از یک کاربر است. این روش با استخراج n زیر مجموعه نقطه داده، یکی برای هر کاربر، شروع می شود تا سپس DBSCAN برای هر زیر مجموعه اعمال شود.
در ادبیات، محدوده بافر فضایی از 20 تا 1000 متر در مطالعات مختلف برای تجزیه و تحلیل رفتار ساکن کاربر استفاده شده است [ 40 ، 41 ، 42 ]. بنابراین، مقدار فراپارامتر ε روی 50 متر ثابت شد. سپس، تلاش می‌شود بازدیدهای متعددی را که یک کاربر از یک مکان انجام می‌دهد با یک نقطه داده منفرد نشان دهد، در حالی که مکان‌هایی که فقط یک بار بازدید شده‌اند باید حفظ شوند. بر اساس این دو فرض، minPts= 1 انتخاب شده است. با این مقدار هایپرپارامتر، نقاط غیر داده به عنوان نویز توسط DBSCAN طبقه بندی می شوند. سپس، DBSCAN را روی هر زیر مجموعه اعمال می کنیم تا فشرده سازی داده ها توسط کاربر انجام شود. در مواردی که یک خوشه از بیش از یک نقطه داده تشکیل شده است، مرکز بیشترین نقطه داده برای نمایش خوشه در نظر گرفته می شود. مجموعه داده حاصل شامل 12337 نقطه داده است که 48.17 درصد از مجموعه داده اصلی است. شکل 5 مقایسه بین داده های اصلی و داده های فشرده یک کاربر را نشان می دهد.
مرحله بعدی شامل استفاده از OPTICS برای کشف خوشه‌ها در مجموعه داده‌های فشرده شده است. در آزمایش، مقدار فراپارامتر ε برای کاهش پیچیدگی محاسباتی تنظیم شده است. یک مقدار مناسب با رسم فاصله k-NN نقاط ( شکل 6 ) به منظور افزایش به دنبال یک زانو در نمودار انتخاب شد. سپس، k = 3 بر اساس تعداد ویژگی های مجموعه داده به اضافه یک استفاده می شود. فاصله ε = 300 متر به عنوان حداکثر شعاع جستجو در اطراف یک نقطه داده انتخاب شد. به عبارت دیگر، جستجوی الگوریتم در یک نقطه داده زمانی متوقف خواهد شد که فاصله هسته به 300 متر برسد.
بخش مقدار Hyperparameter را نمی توان از داده ها انجام داد. فراپارامترهای minPts و xi به دنبال ترکیب مقادیر بهینه برای اجرای الگوریتم OPTICS با مجموعه داده و برای انجام انتخاب خوشه‌بندی بر اساس چگالی‌های مختلف تنظیم شده‌اند ابتدا فضای جستجوی فراپارامتر تعریف می شود. هایپرپارامتر minPts بین 5 تا 15 برای حداقل و حداکثر تعداد نقاطی که یک نقطه داده باید در همسایگی خود داشته باشد تا خوشه باشد محدود می شود. در مراحل یک نقطه داده افزایش می یابد. xi _هایپرپارامتر در مراحل 0.01 بین 0 و 1 محدود می شود. دوم، با استفاده از رویکرد بوت استرپینگ، 10 نمونه از 70 درصد مجموعه داده، طبقه بندی شده توسط شهرداری و بخش گردشگری تولید می شود. سپس برای هر نمونه بوت استرپ، الگوریتم OPTICS محاسبه می شود مترمنnپتیسمنو با استفاده از هر کدام ایکسمنjبرای استخراج خوشه ها میانگین ضریب Silhouette (معادله ( 6 )) برای اندازه گیری خوب بودن نتیجه خوشه بندی با استفاده از مترمنnپتیسمندر ایکسمنj. در نهایت، میانگین معیار کیفیت در بین نمونه‌های بوت استرپ برای هر ترکیبی از مقادیر فراپارامترها انجام می‌شود. شکل 7 نشان می دهد که چگونه ضریب Silhouette برای هر ترکیبی از minPts و xi تغییر می کند . در اینجا، هر منحنی نشان دهنده میانگین ضریب Silhouette در بین 10 نمونه بوت استرپ است.
در نهایت، مقادیر minPts و xi در جایی انتخاب می شوند که میانگین امتیاز ضریب Silhouette بالاترین باشد. این در شکل 7 در 0.83 قابل مشاهده است. بنابراین، مدلی با خوشه های متراکم تر و به خوبی از هم جدا شده، مدلی با minPts = 5 و xi = 0.38 است. سپس، الگوریتم OPTICS بر روی مجموعه داده کامل با استفاده از minPts = 5 اعمال می شود. مقدار شیب xi = 0.38 برای استخراج خوشه هایی با چگالی های مختلف استفاده می شود. نمودار دسترسی برای این مدل خوشه بندی در شکل 8 نشان داده شده است .
مدل خوشه بندی محاسبه شده با مقادیر انتخاب شده، 288 خوشه را در مجموعه داده شناسایی می کند. محل این خوشه ها در شکل 9 الف نشان داده شده است. ضریب Silhouette برای هر یک از خوشه های به دست آمده برای بررسی کیفیت هر خوشه محاسبه شد. شکل 9 ب نشان می دهد که 11 خوشه دارای ضریب سیلوئت منفی هستند در حالی که بقیه دارای امتیاز بیشتر از 0 هستند که نشان دهنده یک نتیجه خوشه ای خوب است. میانگین ضریب Silhouette از 288 خوشه 0.79 است.

3.3. بینش های مبتنی بر داده هات های توریستی

در این کار، هیچ داده‌ای وجود ندارد که صریحاً مشخص کند که آیا خوشه‌های حاصل با آمار رفتار گردشگران مطابقت دارند یا خیر. با این حال، مجموعه داده استفاده از زمین از هلند برای ارائه یک تفسیر مبتنی بر داده برای توصیف خوشه‌ها (نقاط داغ) شناسایی شده استفاده می‌شود. کاربری زمین برای هر نقطه داده از مجموعه داده تخصیص داده می شود، بنابراین یک هات اسپات ممکن است بیش از یک کاربری داشته باشد. سپس، کاربری اصلی هر کانون بر اساس بیشترین استفاده از زمین در بین نقاط داده آنها تعیین شد. جدول 6 تعداد کانون های شناسایی شده را بر اساس کاربری اراضی نشان می دهد.
بر اساس مجموعه داده های CVO 2015، گردشگران عمدتاً برای تفریح ​​در فضای باز مانند بازدید از ساحل از این منطقه بازدید می کنند. این با نتایج بخش 3.2 مطابقت دارد . مشخص شده است که 42/35 درصد از کانون‌ها مربوط به فعالیت‌های تفریحی، 40/18 درصد آن‌ها کاربری تفریحی و 01/17 درصد مابقی در مناطق خشک طبیعی شامل سواحل هستند. نتایج نشان می‌دهد که دومین گروه اصلی از کانون‌ها (9.03%) در مناطق خرده‌فروشی و پذیرایی قرار دارند ، که با دومین فعالیت انجام شده در طول تعطیلات ثبت‌شده در CVO 2015 مطابقت دارد. در نهایت، سومین کاربری رایج زمین در مجموعه داده (7.99٪). ) محل کسب و کار است .
در این مطالعه، رفتار دو بخش توریستی بازار گردشگری از استان زیلند مورد تجزیه و تحلیل قرار گرفته است. شکل 10 نقاط حساس شناسایی شده را بر اساس بخش گردشگری نشان می دهد. نتایج نشان می‌دهد که هر دو بخش توریستی در اکثر نقاط داغ حضور دارند. با این حال، مشاهده می شود که بازدیدکنندگان مکرر مکان های دور از خط ساحلی را نیز کشف می کنند.
به منظور به دست آوردن بینشی در مورد رفتار زمان‌بندی گردشگران در هات‌اسپات، برای هر نقطه، میانگین زمان اقامت با استفاده از نقاط داده‌ای که ساخته می‌شوند محاسبه شد. شکل 11 توزیع هات اسپات را بر اساس زمان اقامت گردشگر نشان می دهد. نتایج نشان می‌دهد که 51 درصد از کانون‌ها مربوط به مکان‌هایی است که گردشگر کمتر از 4 ساعت در آن‌ها می‌ماند.
رفتار زمان‌بندی گردشگران بر اساس مکان کانون در شکل 12 نشان داده شده است . نتایج نشان می‌دهد که وقوع نقاط داغ، که در آن گردشگران بیش از 4 ساعت می‌مانند، بیشتر در سرزمین اصلی است تا در ساحل.

3.4. بینش کمپین توریستی Crowdsourced

کمپین‌های جمع‌سپاری گردشگری به ما این امکان را می‌دهند که رفتار بازدیدکنندگان را درک کنیم، بدانیم از کجا آمده‌اند و زمان‌های ترجیحی ورود آنها به منطقه مورد مطالعه را بدانیم. این بینش ها برای ایجاد سیاست هایی برای موقعیت یابی مقاصد جذاب مختلف، فعالیت های گردشگری پایدار و بهبود تجارب بازدیدکنندگان مهم هستند [ 1 ].
شکل 13 توزیع ساعات ورود گردشگران به منطقه مورد مطالعه را نشان می دهد. مشاهده می شود که بخش توریستی طولانی خارجی دارای زمان ورود در حوالی ظهر است که در روزهای هفته و آخر هفته همین الگو را ارائه می دهد. این رقم همچنین نشان می دهد که زمان ورود بخش توریستی مکرر خارجی در کل روز توزیع شده و در حدود ساعت 2 بعد از ظهر متمرکز است که با ورود به اکثر مکان های اقامتی مطابقت دارد.
به منظور دستیابی به بینش بهتری در مورد تعداد گردشگران در یک کمپین جمع‌سپاری گردشگری در برابر کیفیت خوشه‌بندی حاصل، تحلیل عمیق‌تری در مورد چگونگی تغییر میانگین ضریب Silhouette با توجه به تعداد گردشگران موجود انجام شد. الگوریتم OPTICS با استفاده از مقادیر فراپارامتر انتخاب شده بر روی زیرمجموعه هایی محاسبه شد که تعداد گردشگران را در 10٪ تغییر می دهد. شکل 14 نشان می دهد که چگونه این معیار کیفیت برای هر مورد متفاوت است. ضریب Silhouette پس از استفاده از نقاط داده تولید شده توسط 60٪ (430 کاربر) گردشگر موجود از مجموعه داده، به دلیل افزایش تراکم نقاط داده در نقاط حساس کشف شده، پایدارتر می شود.

4. بحث

استفاده از داده های جمع سپاری گردشگری برای حمایت از مدیران گردشگر مستلزم استفاده از زنجیره ای از فرآیندها برای تبدیل داده های خام به دانش به عنوان روش پیشنهادی است. قبل از انجام هر تجزیه و تحلیل، داده‌های crowdsourced باید پاک شوند تا مسائل مربوط به کیفیت داده‌ها مانند داده‌های از دست رفته، نویز، و خطاها مانند هر فرآیند کشف دانش رسیدگی شود [ 18 ]. با این حال، حل مسائل مربوط به کیفیت داده ها صحت، عینیت و نمایندگی داده های جمع سپاری را تضمین نمی کند [ 43 ، 44 ].
این مطالعه به دانش در مورد ارزیابی بازنمایی داده ها از منابع اطلاعات جغرافیایی داوطلبانه گردشگری کمک می کند تا بینشی برای مدیران گردشگری فراهم کند. روش‌های مختلفی برای ارزیابی بازنمایی داده‌ها برای اطمینان از سودمندی نتایج از دیدگاه سیاست عمومی استفاده شده است [ 45 ]. در [ 46 ]، هدف آنها استخراج محتوای تولید شده توسط کاربر و جمع‌سپاری از شرکت‌کنندگان بود، بنابراین یک نظرسنجی را برای اطمینان از اینکه شرکت‌کنندگان نماینده کل جمعیت اینترنتی ایالات متحده هستند، اعمال کردند. برای ارزیابی جنبه های مختلف نمایندگی داده های تحرک جمعی، در [ 44]، یک فرآیند اعتبارسنجی با معیارهایی مانند پوشش جغرافیایی، تطابق مبدا-مقصد، تطابق جمعیتی، توزیع فاصله-مدت، و تطابق مسیر پیشنهاد شده است. در این مطالعه، ارزیابی بازنمایی داده‌های جمع‌سپاری گردشگری از دو بخش از گردشگر علامت‌گذاری شده با استفاده از یک منبع داده خارجی مانند آمار رسمی گردشگری همانطور که در بخش 3.1 نشان داده شده است، انجام می‌شود . ثابت شد که هر دو مجموعه داده از جمعیتی با توزیع یکسان می آیند که نشان می دهد مجموعه داده جمع سپاری نماینده این مطالعه است. با این حال، تضمین نمی‌کند که مجموعه داده جمع‌سپاری به دلیل روش جمع‌آوری مغرضانه نباشد [ 47]]. این یک محدودیت روش به دلیل فقدان توصیف‌کننده‌های اجتماعی-اقتصادی و روان‌شناختی است، اما این مجموعه داده به دلیل سطح جزئیات موجود همچنان منبع اطلاعاتی ارزشمندی است.
سپس، تجزیه و تحلیل داده‌های گردشگری با ترکیب رویکردهای خوشه‌بندی مبتنی بر تراکم برای به دست آوردن نتایج مطلوب در جستجوی نقاطی که در آن فعالیت‌های گردشگری از بخش خاصی از یک بازار توریستی انجام می‌شود، انجام شد. در این مقاله از داده های جمع آوری شده از 1505 کاربر اپلیکیشن که 124725 سفر و 151612 قسمت سفر را ثبت کرده بودند استفاده شد. علاوه بر این، 12337 نقطه داده ثابت شناسایی شد. چنین داده‌هایی به‌عنوان ورودی برای تجزیه و تحلیل جغرافیایی-فضایی با استفاده از تکنیک‌های خوشه‌بندی برای شناسایی نقاط داغ که در آن فعالیت‌های گردشگری خارجی طولانی و خارجی تکراری هستند، استفاده می‌شود.بخش های گردشگری انجام می شود. همچنین 288 خوشه (هات اسپات) شناسایی شد. بر اساس تجزیه و تحلیل کاربری اصلی نقاط داغ مرتبط با هدف سفر، سه گروه بزرگ متمایز می شوند. با 35.42 درصد از کل کانون ها، بیشترین گروه مربوط به مکان های تفریحی است. این منطقه از 102 نقطه تشکیل شده است که 53 مورد از آنها دارای کاربری تفریحی و 49 مورد دارای کاربری “زمین طبیعی خشک” هستند که سواحل به آن تعلق دارند. گروه دوم 03/9 درصد، 26 درصد از کل کانون‌ها را تشکیل می‌دهد و با «خرده‌فروشی و پذیرایی» به‌عنوان کاربری اصلی مرتبط است. در نهایت، نقاط داغ مرتبط با “محل تجاری” 7.99٪ را نشان می دهد.
تجزیه و تحلیل کاربری زمین هات اسپات شباهت زیادی را بین متداول ترین هدف سفر مستند شده توسط آمار رسمی استان زلند با این نقاط داغ کشف شده جمع آوری شده سیار نشان می دهد. هدف اصلی سفر برای بازدید از منطقه، تفریح ​​است [ 48 ]. مناطقی که استفاده از زمین «تفریحی» یا «زمین طبیعی خشک» است، تنها 2.35 درصد از استان زلند را تشکیل می‌دهند. بزرگترین گروه نقاط شناسایی شده دارای کاربری زمینی است که در آن فعالیت‌های تفریحی توسعه می‌یابد که نشان می‌دهد داده‌های تلفن هوشمند پتانسیل نشان دادن موفقیت‌آمیز نقاط گردشگری در یک منطقه معین و همچنین ارائه بینش طولی بیشتری در مورد رفتار فعالیت‌های مرتبط با گردشگری را دارند.
به منظور کشف رفتار توریستی، بینش دقیقی در مورد نقاط داغ ارائه شده است. ابتدا، خوشه‌ها بر اساس بخش‌های گردشگری موجود بر روی آنها مشخص شدند. نتایج نشان می دهد که 65 خوشه فقط از گردشگران خارجی بازگشتی تشکیل شده است، در حالی که شش خوشه فقط از گردشگران خارجی طولانی تشکیل شده اند. بنابراین، هر دو بخش گردشگری در بیشتر خوشه ها حضور دارند. با این حال، مشاهده شد که بازدیدکنندگان مکرر بیشتر در نقاط دور از خط ساحلی حضور دارند. سپس، خوشه‌ها بر اساس میانگین زمان اقامت گردشگر در یک کانون مشخص شدند. نتایج نشان می دهد که یک گردشگر بین 1 تا 4 ساعت در 51 درصد از نقاط شناسایی شده باقی می ماند.
فقدان داده‌های مربوط به فعالیت حقیقت زمینی بازدیدکننده می‌تواند به عنوان یک محدودیت بالقوه در روش پیشنهادی دیده شود. این ممکن است با اجرای یک عملکرد 2 کاناله برای ارائه بازخورد در مورد فعالیت اصلی که گردشگر در هنگام تشخیص زمان ثابت انجام می دهد، حل شود. یکی دیگر از محدودیت‌های احتمالی مربوط به کیفیت داده‌های حس‌شده گوشی هوشمند است. روش پیشنهادی مشخص می‌کند که 8.33 درصد از خوشه‌ها دارای “بزرگراه” به عنوان کاربری زمین هستند. با توجه به نویز موجود در این نوع داده‌ها، وزن‌های مبتنی بر دقت موقعیت جغرافیایی و کاربری اراضی نقاط داده هنگام تخصیص کاربری اصلی یک خوشه ممکن است در نظر گرفته شود. با این حال، دقت موقعیت جغرافیایی در مجموعه داده‌های حس‌شده موبایل در دسترس نیست.
به دنبال این، خطوط آینده تحقیقات بر تعریف یک معیار ارزیابی خوشه‌بندی متمرکز خواهد شد که اطلاعات زمینه‌ای مانند کاربری زمین را در طول تحلیل ارزیابی نیز در نظر می‌گیرد.

5. نتیجه گیری ها

این تحقیق روشی را توصیف می کند که به دانش در مورد ارزیابی بازنمایی داده ها از منابع اطلاعات جغرافیایی داوطلبانه گردشگری کمک می کند. همچنین از تکنیک‌های خوشه‌بندی مبتنی بر چگالی برای کشف نقاط حساس بالقوه از داده‌های حس‌شده گوشی‌های هوشمند استفاده می‌کند. با استفاده از داده‌های جمع‌سپاری جمع‌آوری‌شده توسط یک برنامه گردشگری مانند Zeeland App، کاربردی بودن روش برای حمایت از مدیران گردشگری با بینش‌هایی که این نوع داده‌ها می‌توانند در بالای آمار موجود به ارمغان بیاورند و توصیف رفتار توریستی بخش‌هایی از بازار گردشگری است. نشان داده شده. طراحی، تنظیم پارامتر، اجرا، و نتایج اجرای روش نیز ارائه شده است. 288 خوشه (نقطه داغ) شناسایی شد. با توجه به کاربری، سه گروه اصلی شناسایی می شوند: 102 کانون (35. 42٪ با کاربری تفریحی، 26 نقطه (9.03٪) با کاربری زمین “خرده فروشی و پذیرایی”، و 23 نقطه (7.99٪) مرتبط با “محل تجاری” مرتبط بودند. نتایج به‌دست‌آمده نشان‌دهنده استفاده بالقوه از داده‌های حس‌شده گوشی‌های هوشمند به‌عنوان روشی مکمل برای نظرسنجی‌های گردشگری سنتی است، زمانی که بینش‌های رفتاری مرتبط با فعالیت از یک منطقه جغرافیایی بزرگ مورد نیاز است. با این حال، مدیران گردشگر هنوز باید مراقب مشکلات معمول مبتنی بر داده‌ها مانند نمایش صحیح جمعیت باشند. نتایج به‌دست‌آمده نشان‌دهنده استفاده بالقوه از داده‌های حس‌شده گوشی‌های هوشمند به‌عنوان روشی مکمل برای نظرسنجی‌های گردشگری سنتی است، زمانی که بینش‌های رفتاری مرتبط با فعالیت از یک منطقه جغرافیایی بزرگ مورد نیاز است. با این حال، مدیران گردشگر هنوز باید مراقب مشکلات معمول مبتنی بر داده‌ها مانند نمایش صحیح جمعیت باشند. نتایج به‌دست‌آمده نشان‌دهنده استفاده بالقوه از داده‌های حس‌شده گوشی‌های هوشمند به‌عنوان روشی مکمل برای نظرسنجی‌های گردشگری سنتی است، زمانی که بینش‌های رفتاری مرتبط با فعالیت از یک منطقه جغرافیایی بزرگ مورد نیاز است. با این حال، مدیران گردشگر هنوز باید مراقب مشکلات معمول مبتنی بر داده‌ها مانند نمایش صحیح جمعیت باشند.49 ] و نتایجی که به دقت موقعیتی/زمانی و خطاهای معرفی شده توسط پردازش بستگی دارد [ 50 ]. بنابراین، سؤالات متعددی هنوز برای تحقیقات آینده باقی مانده است و این سؤالات عمدتاً بر ادغام منابع داده و بینش های مختلف به منظور نتیجه گیری قابل اعتماد برای حمایت از سیاست ها متمرکز هستند.

منابع

  1. OECD. گرایش ها و سیاست های گردشگری OECD 2020 ؛ انتشارات OECD: پاریس، فرانسه، 2020. [ Google Scholar ] [ CrossRef ]
  2. تکاچینسکی، آ. راندل-تیله، اس آر. Beaumont، N. بخش بندی: دیدگاه ذینفعان گردشگری. تور. مدیریت 2009 ، 30 ، 169-175. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  3. بلوم، بخش بندی بازار JZ: یک برنامه شبکه عصبی. ان تور. Res. 2005 ، 32 ، 93-111. [ Google Scholar ] [ CrossRef ]
  4. هاردی، ا. هیسلوپ، اس. غرفه، ک. روباردز، بی. آریال، ج. گرتزل، یو. اکلستون، آر. ردیابی سفر گردشگران با فناوری GPS مبتنی بر تلفن هوشمند: یک بحث روش شناختی. Inf. تکنولوژی تور. 2017 ، 17 ، 255-274. [ Google Scholar ] [ CrossRef ]
  5. کلنر، ال. Egger, R. ردیابی رفتار مکانی-زمانی توریست در مکان‌های شهری، مروری بر روش‌شناختی و مطالعه موردی GPS. در فناوری اطلاعات و ارتباطات در گردشگری 2016 ; Springer: Cham, Switzerland, 2016; ص 481-494. [ Google Scholar ]
  6. Frochot، I. تقسیم بندی سود گردشگران در مناطق روستایی: دیدگاه اسکاتلندی. تور. مدیریت 2005 ، 26 ، 335-346. [ Google Scholar ] [ CrossRef ]
  7. هو، بی. Yu, H. تقسیم بندی بر اساس معیارهای انتخاب صنایع دستی و مشارکت خرید. تور. مدیریت 2007 ، 28 ، 1079-1092. [ Google Scholar ] [ CrossRef ]
  8. آحاس، ر. آسا، ا. مارک، Ü. پی، تی. Kull، A. فضاهای گردشگری فصلی در استونی: مطالعه موردی با داده های موقعیت یابی تلفن همراه. تور. مدیریت 2007 ، 28 ، 898-910. [ Google Scholar ] [ CrossRef ]
  9. رودریگز، جی. سمنجسکی، آی. گوتاما، اس. ون دی وگه، ن. اوچوا، دی. رودریگز، جی. سمنجسکی، آی. گوتاما، اس. ون دی وگه، ن. Ochoa، D. رویکرد خوشه‌بندی سلسله مراتبی بدون نظارت برای بخش‌بندی بازار گردشگری بر اساس داده‌های تلفن همراه جمع‌سپاری شده. Sensors 2018 , 18 , 2972. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  10. مایکل، ا. گاوالاس، دی. باکتفود: بستر جمع سپاری برای ترویج گردشگری غذا. در مجموعه مقالات کنفرانس بین المللی IEEE 2019 در کارگاه های آموزشی فراگیر محاسبات و ارتباطات (کارگاه های PerCom)، کیوتو، ژاپن، 11 تا 15 مارس 2019؛ صص 9-14. [ Google Scholar ]
  11. دانلود اپلیکیشن Zeeland—VVV Zeeland. در دسترس آنلاین: https://www.vvvzeeland.nl/en/service/zeeland-app/ (در 5 اکتبر 2020 قابل دسترسی است).
  12. آحاس، ر. آسا، ا. رز، ا. مارک، Ü. Silm، S. ارزیابی داده های موقعیت یابی غیرفعال تلفن همراه برای نظرسنجی های گردشگری: مطالعه موردی استونیایی. تور. مدیریت 2008 ، 29 ، 469-486. [ Google Scholar ] [ CrossRef ]
  13. یانگ، سی. کلارک، ک. شکر، س. تائو، CV تجزیه و تحلیل داده های مکانی-زمانی بزرگ: مرز تحقیق و نوآوری. بین المللی جی. جئوگر. Inf. علمی 2019 ، 34 ، 1075-1088. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  14. وو، سی. یانگ، ز. خو، ی. ژائو، ی. لیو، ی. تحرک انسانی دقت موقعیت یابی جهانی را برای محلی سازی تلفن همراه افزایش می دهد. IEEE Trans. توزیع موازی سیستم 2014 ، 26 ، 131-141. [ Google Scholar ] [ CrossRef ]
  15. Spangenberg، T. توسعه یک جعبه ابزار سیار برای حمایت از تحقیقات در مورد رفتار حرکتی انسان با استفاده از مسیرهای GPS. Inf. تکنولوژی تور. 2014 ، 14 ، 317-346. [ Google Scholar ] [ CrossRef ]
  16. سمنجسکی، آی. بلنز، آر. گوتاما، اس. Witlox، F. ادغام کلان داده در سیستم پشتیبانی برنامه ریزی سیاست تحرک پایدار 2.0. Sustainability 2016 , 8 , 1142. [ Google Scholar ] [ CrossRef ][ Green Version ]
  17. گونزالس، ام سی؛ هیدالگو، کالیفرنیا؛ Barabási، AL درک الگوهای تحرک فردی انسان. طبیعت 2008 ، 453 ، 779-782. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  18. فیاض، U. پیاتتسکی-شاپیرو، جی. اسمیت، پی. از داده کاوی تا کشف دانش در پایگاه های داده. AI Mag. 1996 ، 17 ، 37-53. [ Google Scholar ]
  19. ورسیکله، ام. دی گروت، ال. کلیس بوآرت، ام. نویتنز، تی. مورمن، آی. Van de Weghe، N. الگوی کاوی در بازدید از جاذبه های توریستی از طریق یادگیری قوانین انجمن در داده های ردیابی بلوتوث: مطالعه موردی گنت، بلژیک. تور. مدیریت 2014 ، 44 ، 67-81. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  20. سمنجسکی، آی. راماچی، م. گوتاما، اس. تشخیص نقاط مورد علاقه از داده های گردشگری جمعی. در علوم محاسباتی و کاربردهای آن – ICCSA 2019 ؛ Misra, S., Gervasi, O., Murgante, B., Stankova, E., Korkhov, V., Torre, C., Rocha, AMA, Taniar, D., Apduhan, BO, Tarantino, E., Eds. ; انتشارات بین المللی Springer: چم، سوئیس، 2019; ص 203-216. [ Google Scholar ]
  21. تانگ، ال. گائو، جی. رن، سی. ژانگ، ایکس. یانگ، ایکس. کان، زی. تشخیص و ارزیابی خوشه‌های شهری با داده‌های بزرگ فضایی و زمانی. Sensors 2019 , 19 , 461. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  22. آتینسیا، ی. کروز، ای. واکا، سی. Zambrano، L. تجزیه و تحلیل فضایی-زمانی: استفاده از پست های اینستاگرام برای مشخص کردن نقطه مورد علاقه شهری. در مجموعه مقالات هفتمین کنفرانس بین المللی 2020 درباره دولت الکترونیک دموکراسی (ICEDEG)، بوئنوس آیرس، آرژانتین، 22 تا 24 آوریل 2020؛ صص 114-119. [ Google Scholar ]
  23. Trendrapport Toerisme، Recreatie en Vrije Tijd. 2019. در دسترس آنلاین: https://www.cbs.nl/nl-nl/publicatie/2019/48/trendrapport-toerisme-recreatie-en-vrije-tijd-2019 (دسترسی در 10 سپتامبر 2020).
  24. دفتر مرکزی مرکز آمار-StatLine-خوابگاه شبانه. مهمان، کشور محل اقامت، نوع، منطقه. در دسترس آنلاین: https://opendata.cbs.nl/#/CBS/en/dataset/82059ENG/table (در 8 ژوئیه 2020 قابل دسترسی است).
  25. مجموعه داده: CBS Bestand Bodemgebruik. 2015. در دسترس آنلاین: https://www.pdok.nl/introductie/-/article/cbs-bestand-bodemgebruik (در 10 سپتامبر 2020 قابل دسترسی است).
  26. چرخه سفر مشتری در زیلند. در دسترس آنلاین: https://kwaliteit.toerismevlaanderen.be/de-customer-journey-cycle-in-zeeland (در 10 سپتامبر 2020 قابل دسترسی است).
  27. Rhys, HI Machine Learning with R, the Tidyverse, and mlr , 1st ed.; شرکت انتشارات منینگ: جزیره پناهگاه، نیویورک، ایالات متحده آمریکا، 2020؛ پ. 536. [ Google Scholar ]
  28. استر، ام. کریگل، اچ پی؛ ساندر، جی. Xu, X. یک الگوریتم مبتنی بر چگالی برای کشف خوشه ها در پایگاه داده های فضایی بزرگ با نویز. در مجموعه مقالات دومین کنفرانس بین المللی کشف دانش و داده کاوی، پورتلند، OR، ایالات متحده آمریکا، 2 تا 4 اوت 1996. ص 226-231. [ Google Scholar ]
  29. ژو، ا. ژو، اس. کائو، جی. فن، ی. Hu, Y. رویکردهایی برای مقیاس بندی الگوریتم DBSCAN به پایگاه داده های فضایی بزرگ. جی. کامپیوتر. علمی تکنولوژی 2000 ، 15 ، 509-526. [ Google Scholar ] [ CrossRef ]
  30. آنکرست، م. برونیگ، MM; کریگل، اچ پی؛ Sander, J. OPTICS: Ordering Points to Identify the Clustering Structure. SIGMOD Rec. (ACM Spec. Interest Group Manag. Data) 1999 ، 28 ، 49-60. [ Google Scholar ] [ CrossRef ]
  31. برایانت، آ. Cios، K. RNN-DBSCAN: الگوریتم خوشه‌بندی مبتنی بر چگالی با استفاده از تخمین‌های تراکم نزدیک‌ترین همسایه معکوس. IEEE Trans. بدانید. مهندسی داده 2018 ، 30 ، 1109–1121. [ Google Scholar ] [ CrossRef ]
  32. کیسیلویچ، اس. منزمن، اف. Keim, D. P-DBSCAN: الگوریتم خوشه‌بندی مبتنی بر چگالی برای اکتشاف و تجزیه و تحلیل مناطق جذاب با استفاده از مجموعه عکس‌های دارای برچسب جغرافیایی در مجموعه مقالات اولین کنفرانس بین المللی و نمایشگاه محاسبات برای تحقیقات و کاربردهای جغرافیایی، واشنگتن، دی سی، ایالات متحده آمریکا، 21 تا 23 ژوئن 2010. صص 1-4. [ Google Scholar ]
  33. شوبرت، ای. ساندر، جی. استر، ام. کریگل، اچ پی؛ Xu, X. DBSCAN Revisited, Revisited: چرا و چگونه باید (هنوز) از DBSCAN استفاده کنید. ACM Trans. سیستم پایگاه داده 2017 , 42 . [ Google Scholar ] [ CrossRef ]
  34. هو، ی. گائو، اس. یانوویچ، ک. یو، بی. لی، دبلیو. پراساد، اس. استخراج و درک مناطق شهری مورد علاقه با استفاده از عکس های دارای برچسب جغرافیایی. محاسبه کنید. محیط زیست سیستم شهری 2015 ، 54 ، 240-254. [ Google Scholar ] [ CrossRef ]
  35. بیرانت، دی. Kut، A. ST-DBSCAN: الگوریتمی برای خوشه بندی داده های مکانی-زمانی. دانستن داده ها مهندس 2007 ، 60 ، 208-221. [ Google Scholar ] [ CrossRef ]
  36. دوکوتا، بی. میازاکی، اچ. ویتایانگ کورن، آ. کیم، اس ام با استفاده از اطلاعات جغرافیایی داوطلبانه و داده های سنجش از دور نور شبانه برای شناسایی مناطق گردشگری مورد علاقه. پایداری 2019 ، 11 ، 4718. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  37. Vu، HQ; لی، جی. قانون، ر. Ye, BH در حال بررسی رفتارهای سفر گردشگران ورودی به هنگ کنگ با استفاده از عکس های دارای برچسب جغرافیایی. تور. مدیریت 2015 ، 46 ، 222-232. [ Google Scholar ] [ CrossRef ]
  38. Rousseeuw, PJ Silhouettes: کمکی گرافیکی برای تفسیر و اعتبارسنجی تحلیل خوشه‌ای. جی. کامپیوتر. Appl. ریاضی. 1987 ، 20 ، 53-65. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  39. دوبس، آر. جین، AK مطالعات اعتبار در روش‌شناسی خوشه‌بندی. تشخیص الگو 1979 ، 11 ، 235-254. [ Google Scholar ] [ CrossRef ]
  40. رودریگز اچوریا، جی. گوتاما، اس. ون دی وگه، ن. اوچوا، دی. Ortiz Jaramillo، B. استفاده کارآمد از سیستم های اطلاعات جغرافیایی برای بهبود طبقه بندی حالت حمل و نقل. در DATA ANALYTICS 2018: هفتمین کنفرانس بین المللی تجزیه و تحلیل داده ها، آتن، یونان، 18 تا 22 نوامبر 2018 ؛ Bhulai, S., Kardaras, D., Semanjski, I., Eds.; آکادمی بین المللی، انجمن تحقیقات و صنعت (IARIA): ویلمینگتون، DE، ایالات متحده آمریکا، 2018؛ صص 130-135. [ Google Scholar ]
  41. فیلیپ بیلجکی، HL; ون اوستروم، پی. تقسیم بندی و طبقه بندی مسیرهای حرکت مبتنی بر حالت حمل و نقل. بین المللی جی. جئوگر. Inf. علمی 2013 ، 27 ، 385-407. [ Google Scholar ] [ CrossRef ]
  42. گونگ، اچ. چن، سی. بیالوستوزکی، ای. Lawson، CT یک روش GPS/GIS برای تشخیص حالت سفر در شهر نیویورک. محاسبه کنید. محیط زیست سیستم شهری 2012 ، 36 ، 131-139. [ Google Scholar ] [ CrossRef ]
  43. بصیری، ع. هاکلی، م. فودی، جی. Mooney, P. کیفیت داده‌های جغرافیایی جمع‌سپاری شده: چالش‌ها و مسیرهای آینده. بین المللی جی. جئوگر. Inf. علمی 2019 ، 33 ، 1588-1593. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  44. Leao، SZ; Lieske، SN; Pettit، CJ اعتبارسنجی داده‌های تحرک دوچرخه‌سواری جمع‌سپاری شده برای حمایت از برنامه‌ریزی شهری. ترانسپ Lett. 2019 ، 11 ، 486-497. [ Google Scholar ] [ CrossRef ]
  45. بوبالو، م. ون زانتن، بی تی; Verburg، PH جمع سپاری اطلاعات جغرافیایی در مورد ادراکات و ترجیحات چشم انداز: یک بررسی. Landsc. طرح شهری. 2019 ، 184 ، 101-111. [ Google Scholar ] [ CrossRef ]
  46. گوس، ا. Ipeirotis، PG; لی، بی. طراحی سیستم های رتبه بندی هتل ها در موتورهای جستجوی سفر با استخراج محتوای تولید شده توسط کاربر و جمع سپاری. علامت گذاری. علمی 2012 ، 31 ، 493-520. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  47. یوان، ی. وی، جی. Lu, Y. ارزیابی بازنمایی جنسیتی رسانه های اجتماعی مبتنی بر مکان: مطالعه موردی Weibo. ان GIS 2018 ، 24 ، 163-176. [ Google Scholar ] [ CrossRef ]
  48. Omvang Toerisme in Zeeland 2018 — Projecten Portfolio. در دسترس آنلاین: https://www.projectenportfolio.nl/wiki/index.php/KCKT_Publication_PR_00006 (در 8 ژوئیه 2020 قابل دسترسی است).
  49. واینبرگ، جی دی. فریز، جی. McElhattan, D. مقایسه ویژگی‌های داده‌ها و نتایج یک نظرسنجی آنلاین فاکتوریل بین نمونه‌ای مبتنی بر جمعیت و یک نمونه استخدام‌شده توسط Crowdsource. اجتماعی علمی 2014 ، 1 ، 292-310. [ Google Scholar ] [ CrossRef ]
  50. ون گلووه، سی. لوپز، ای جی؛ گوتاما، اس. منابع خطا در تجزیه و تحلیل داده های ردیابی فضایی جمع سپاری شده. در مجموعه مقالات کنفرانس بین المللی IEEE 2019 در کارگاه های آموزشی فراگیر محاسبات و ارتباطات (کارگاه های PerCom)، کیوتو، ژاپن، 11 تا 15 مارس 2019؛ ص 183-188. [ Google Scholar ]
شکل 1. استان زیلند، هلند.
شکل 2. مراحل روش شناسی.
شکل 3. مکان های مقصد سفر در استان زیلند.
شکل 4. مقایسه توزیع داده های برنامه CBS در مقابل Zeeland.
شکل 5. فشرده سازی مجموعه داده برای یک کاربر: 466 نقطه داده به 178 نقطه کاهش یافته است که نشان دهنده 61.80 درصد فشرده سازی است.
شکل 6. فاصله K-NN با استفاده از k = 3.
شکل 7. تنظیم پارامترهای minPts و xi .
شکل 8. نمودار قابلیت دسترسی.
شکل 9. تجزیه و تحلیل سیلوئت برای مدل خوشه بندی OPTICS با minPts = 5 و xi = 0.38. ( الف ) تجسم 288 خوشه حاصل در منطقه مورد مطالعه. ( ب ) طرح شبح 288 خوشه.
شکل 10. نقاط کانونی بر اساس بخش توریستی.
شکل 11. تعداد خوشه ها بر اساس تعداد ساعات اقامت.
شکل 12. نقاط داغ بر اساس زمان ماندن: ( الف ) کمتر از 2 ساعت. ( ب ) بین 2 تا 4 ساعت؛ ( ج ) بین 4 و 6 ساعت؛ ( د ) بیش از 6 ساعت.
شکل 13. توزیع ورودی های ساعتی سفرهای ورودی در طول دوره مطالعه. ( الف ) بخش گردشگری طولانی خارجی؛ ( ب ) بخش توریستی مکرر خارجی.
شکل 14. میانگین ضریب سیلوئت برای مدل خوشه بندی با تعداد کاربران مختلف در منطقه مورد مطالعه.

بدون دیدگاه

دیدگاهتان را بنویسید