BITOUR: یک بستر هوش تجاری برای تجزیه و تحلیل گردشگری
خلاصه
ادغام دادههای مشترک در سیستم هوش تجاری (BI) مبتنی بر داده، فرصتی را برای تقویت فرآیند تصمیمگیری در جهت بهبود رقابت پذیری گردشگری به ارمغان میآورد. این مقاله BITOUR را ارائه میکند ، یک پلتفرم BI که چهار منبع داده مشترک ( توئیتر ، Openstreetmap ، Tripadvisor و Airbnb ) را ادغام میکند. BITOUR از یک معماری کلاسیک BI پیروی می کند و قابلیت هایی را برای تبدیل داده ها، پردازش داده ها، تجزیه و تحلیل داده ها و تجسم داده ها فراهم می کند.
در هسته پردازش داده ها، BITOUR مکانیسم هایی را برای شناسایی گردشگران در توییتر ارائه می دهد، توییت هایی را از Tripadvisor و Airbnb به جاذبه ها و سایت های اقامتی اختصاص دهید ، احساسات را در نظرات صادر شده توسط گردشگران تجزیه و تحلیل کنید، و همه اینها با استفاده از اشیاء موقعیت جغرافیایی در Openstreetmap . با تمام این مواد، BITOUR تجزیه و تحلیل داده ها و تجسم را برای پاسخ به سوالاتی مانند مکان های پر رفت و آمد گردشگران، میانگین مدت اقامت یا دید بازدیدکنندگان از یک مقصد خاص امکان پذیر می کند.
کلید واژه ها:
هوش تجاری ؛ داده های مشترک ؛ رقابت پذیری گردشگری
1. معرفی
داده های اجتماعی و مشارکتی به منبع مهمی از اطلاعات و دانش در حوزه های مختلفی از جمله انتخابات سیاسی، تشخیص احساسات، مدیریت بلایا، شهرهای هوشمند و گسترش بیماری ها تبدیل شده اند [1 ، 2 ، 3 ] . بیشتر این اهمیت به دلیل تغییر قابل توجه در وب است. کاربران اینترنت از مصرفکننده به خالق اطلاعات تبدیل شدهاند، پدیدهای به نام Web 2.0 که به کاربران آنلاین اجازه میدهد در جوامع اجتماعی شرکت کنند تا محتوای وب را ایجاد و توزیع کنند [4 ، 5 ، 6 ] . تعداد فزاینده ای از کاربران وب در چنین اشتراک گذاری محتوا و فعالیت های اجتماعی آنلاین شرکت می کنند.
کاربران به طور فزاینده ای قبل از تصمیم گیری در مورد خرید آنلاین، به نظرات ارسال شده در وب توجه می کنند. کاربران تأیید می کنند که هنگام بررسی نظرات گذاشته شده در وب سایت قبل از رفتن به هتل، رستوران یا جاذبه توریستی، اعتماد به نفس بیشتری دارند. به طور خاص، محتوای ایجاد شده توسط گردشگران به عنوان بسیار قابل اعتماد، معتبر، مرتبط، به روز و جذاب تلقی می شود [ 7 ، 8 ، 9 ].
در این مقاله، ما بر نحوه استفاده از دادههای ایجاد شده به طور مشترک در شبکههای اجتماعی برای تجزیه و تحلیل بخش گردشگری تمرکز میکنیم، صنعتی که به شدت بر عملکرد اقتصادی و استانداردهای زندگی کشورها تأثیر میگذارد. مقاصد سفر به طور مستمر به دنبال بهبود موقعیت رقابتی خود در بازار توریستی بین المللی یا ملی و جذب بیشترین جریان گردشگران با توجه به توانایی های خود هستند [ 10,11,12,13,14 .]. با در نظر گرفتن سال 2019، این بخش اقتصادی 3.5 درصد بالاتر از اقتصاد جهانی رشد کرد که رشد 2.5 درصدی داشت، 330 میلیون شغل (1 در 10) ایجاد کرد و 10.3 درصد از تولید ناخالص داخلی جهانی را تشکیل می داد. یک جنبه مهم در بهبود رقابت، درک بخش از طریق تجزیه و تحلیل داده ها است.
در نتیجه افزایش داده های موجود، اطلاعات بیشتر و بیشتری در مورد گردشگران و جاذبه ها ذخیره می شود. به لطف پیشرفت در عملکرد پردازش داده ها و بلوغ یادگیری ماشینی، ما می توانیم تمام این داده های موجود را به منظور بهبود رقابت گردشگری پردازش کنیم.
دادههای مکانی نیز منبع ارزشمندی از اطلاعات را نشان میدهد تا بتوان مکانهای جغرافیایی، مکانها، جادهها، جاذبهها و غیره را تعیین کرد. این اطلاعات برای دانستن مکانهایی که گردشگران از آنها بازدید میکنند، مدت زمانی که گردشگران در جاذبهها میگذرانند و غیره بسیار مفید است.
در این کار، ما از منابع داده های مشترک و مکانی استفاده می کنیم که دانش ارزشمندی را برای تجزیه و تحلیل بخش گردشگری ارائه می دهد. به طور خاص، ما از چهار منبع داده OpenStreetMap، Twitter، Tripadvisor و Airbnb استفاده کردیم . با اطلاعات ارائه شده توسط این منابع داده و با استفاده از هوش تجاری به عنوان پشتیبان فناوری، بستری برای کل فرآیند استخراج و ادغام داده ها از این منابع ایجاد شد. این شامل استخراج و ادغام داده ها در قالبی ثابت، پردازش و ساختاردهی داده ها برای استفاده در وظایف تجزیه و تحلیل و تجسم نتایج تجزیه و تحلیل است. پلت فرم ساخته شده BITOUR نام دارد .
هوش تجاری (BI) به عنوان مفهومی برای استخراج و تجزیه و تحلیل دادههای تجاری برای تصمیمگیری بهتر ظاهر میشود، و به این ترتیب BI نمونه خوبی است که پایههای اهرم انفجار و انتشار دادهها را ایجاد میکند. به گفته تحلیلگران گارتنر، BI یک اصطلاح جامع است که شامل برنامههای کاربردی، زیرساختها و ابزارها، و بهترین شیوههایی است که امکان دسترسی و تجزیه و تحلیل اطلاعات را برای بهبود و بهینهسازی تصمیمگیریها و عملکرد فراهم میکند [ 15 ]. BI طیف گسترده ای از فناوری ها مانند انبار داده، پردازش تحلیلی آنلاین (OLAP)، داده کاوی، معیار، متن کاوی و تجزیه و تحلیل آینده نگر را در بر می گیرد [ 16]]. عامل کلیدی موفقیت BI، از جمله جنبه های دیگر، در توانایی آن برای مدیریت منابع داخلی و خارجی متشکل از داده های ساختاریافته و بدون ساختار نهفته است. معماری های BI به عنوان راه حلی برای مدیریت و توسعه گردشگری به سرعت در حال گسترش هستند [ 17 ].
ادغام داده های مشترک در یک پلت فرم BI یک رویکرد جذاب برای تجزیه و تحلیل اطلاعات گردشگری به منظور کشف فعالیت هایی که گردشگران در یک مقصد انجام می دهند، نظرات در مورد یک مقصد خاص، جاذبه های گردشگری یا فصولی که بیشتر توسط گردشگران بر اساس ملیت تردد می کنند، نشان می دهد. در میان بسیاری از سوالات دیگر
بسترهای BI گردشگری موجود در ادبیات به دنبال ادغام منابع داده برای درک بهتر گردشگری هستند. پلتفرم های BI در گردشگری معمولاً برای موارد زیر استفاده می شوند:
-
نشان دادن شاخص های گردشگری به عنوان داده های مرتبط با کیفیت بالا [ 18 ]
-
استفاده از داده های شبکه های اجتماعی برای شناخت جنبش های توریستی [ 19 ].
-
شناخت درک گردشگران از مقاصد [ 20 ].
BITOUR به طور تعاملی یک مقصد را برای تجزیه و تحلیل تعریف می کند، داده ها را از انواع مختلف منابع مانند داده های فضایی یا نظری بارگیری می کند، روال هایی را برای مرتبط کردن نظرات به مکان ها، شناسایی کاربرانی که گردشگر هستند و همچنین تجسم داده ها در یک پلت فرم را انجام می دهد. BITOUR جداول و گرافیک های پویا ایجاد کرد که امکان دستکاری نتایج تمام عملیات انجام شده بر روی پلت فرم را ممکن می کند. به این ترتیب، روندهای توریستی را می توان برای کوتاه کردن زمان پاسخ به رویدادها، تمرکز بر کمپین های بازاریابی و غیره تجزیه و تحلیل کرد. به طور خلاصه، روش دیگری برای نزدیک شدن به گردشگران و درک آنها.
ساختار مقاله به شرح زیر است؛ بخش 4 یک نمای کلی از عملکردهای پلت فرم ارائه می دهد. بعداً، در بخش 5 نحوه سازماندهی مؤلفه های مختلف را ارائه می دهیم. بعد، بخش 6 برخی از جنبه های کلیدی پردازش داده ها مانند تخصیص توییت ها را برجسته می کند. در نهایت، بخش 7 نشان می دهد که چگونه می توان از تمام داده های گنجانده شده در پلتفرم بهره برداری کرد.
2. وضعیت هنر
استفاده از راهحلهای هوش تجاری و منابع داده مشترک در دهه گذشته هم بهصورت مجزا و هم با هم افزایش یافته است. در ادبیات آکادمیک و علمی، چندین مزیت استفاده از BI شناسایی شده است، از جمله بهینه سازی کار عملیاتی، بهبود روابط با مشتریان و تامین کنندگان، کاهش افزونگی داده ها، تسهیل انواع سوالات جدید توسط بخشی از کاربران نهایی. ، سودآوری بالاتر، پشتیبانی تصمیم گیری بهتر و ایجاد مزیت رقابتی [ 21 ، 22 ، 23 ].
یکی از بخشهایی که بیشترین استفاده را از BI میکند، بخش سلامت است که شامل انبارهای داده، سیستمهای OLAP و داشبورد برای نظارت بر سیاستهای سلامت است [ 24 ، 25 ، 26 ]. انبارهای داده های مکانی که به دنبال استفاده از اطلاعات بیمار برای تسهیل رویکرد مؤثرتر برای درمان های اپیدمیولوژیک هستند [ 27 ، 28 ، 29 ]. و استفاده از تکنیک های داده کاوی برای ایجاد نمایه سلامت بیماران و جوامع برای تسهیل درمان ها [ 26 ، 29 ، 30 ].
به طور خاص، نمونههایی از پردازش تحلیلی آنلاین (OLAP) و دادهکاوی اعمال شده در گردشگری را میتوان در موارد زیر یافت:
-
درک رفتار گردشگران، به عنوان مثال، چه مکان هایی را باید بازدید کرد، در چه زمانی و به چه ترتیبی [ 31 ، 32 ].
-
کشف نظر گردشگران از یک مقصد و جاذبه های آن با استفاده از تکنیک های تحلیل متن و احساسات [ 33 ، 34 ، 35 ].
-
ایجاد سیستم های شاخص پشتیبانی شده در انبارهای داده و تکنیک های پردازش تحلیلی آنلاین [ 36 ، 37 ].
-
استفاده از داده های مرتبط برای بازیابی داده ها از منابع مختلف و ادغام آن در انبارهای داده برای تجسم بعدی [ 38 ، 39 ].
علاوه بر این، برای برخی از نویسندگان، هوش تجاری یکی از جنبه های سیستم های پشتیبانی تصمیم (DSS) است [ 40 ، 41 ] و در ادبیات چندین نمونه از DSS وجود دارد که به دنبال ادغام منابع متنوع برای تسهیل فرآیند تصمیم گیری هستند. به عنوان مثال، سیستم اطلاعات مدیریت گردشگری ( TourMIS ) [ 42 ] یک DSS است که از نظر مالی توسط دفتر ملی گردشگری اتریش و کمیسیون سفر اروپا پشتیبانی می شود و بر اساس نیازهای خاص مدیران گردشگری توسعه یافته است. TourMIS یک نمای یکپارچه از منابع داده های مختلف را ارائه می دهد که می تواند از طریق یک رابط گرافیکی تجسم و تجزیه و تحلیل شود. TourMISدادههای رسمی از Eurostat و اداره آمار فدرال و همچنین دادههای گردشگری محلی و ملی ارائه شده توسط سازمانهای گردشگری مربوطه را در خود جای میدهد و روند نرخ اشغال، تعداد بازدیدکنندگان، مقاصد گرم و غیره را نشان میدهد.
مشابه مثال قبلی، شاخصهای گردشگری بهعنوان دادههای پیوندی با کیفیت بالا ( ETIHQ ) یک DSS گردشگری است که از TourMIS استفاده میکند و امکان تجسم و تجزیه و تحلیل شاخصهای آماری از منابع دادههای مختلف و از حوزههای مختلف (گردشگری، اقتصاد، محیطزیست) را فراهم میکند [ 18] . ]. ETIHQ از فنآوریهای معنایی و تکنیکهای نظر کاوی برای پردازش دادههای جمعآوریشده و استخراج دانش عملی از مخازن استفاده میکند. بهعلاوه، آمارهای TourMIS را بهعنوان دادههای پیوندی (LD) به نمایش میگذارد و به متخصصان گردشگری اجازه میدهد به منابع دیگر شاخصها متصل شوند و آرشیو دادههای مرتبط را بررسی کنند. ETIHQدر انجام یکپارچه سازی داده ها با مشکلاتی مواجه شده است زیرا بیشتر داده های باز تحت قالب های نحوی مختلفی ارائه می شوند که نیاز به تلاش قابل توجهی برای ادغام دارند. از دیدگاه معنایی، مشکلات ناشی از استفاده از اصطلاحات مختلف برای یک موجودیت، دانه بندی جغرافیایی مختلف یا اندازه گیری ها در فواصل زمانی مختلف است.
هم TourMIS و هم ETIHQ تا حد زیادی از داده های رسمی استفاده می کنند. تلاشی برای ادغام داده ها از منابع ناهمگن در [ 43] یافت می شود]، که در آن نویسندگان کاربرد BI را در صنعت گردشگری ارائه می دهند، به طور خاص، یک مطالعه موردی از یک جشنواره غذای محلی در تایلند. این سیستم داده های انبوه در مورد محصولات خریداری شده توسط گردشگران، خدمات با تجربه، مقاصد ارزیابی شده و همچنین داده های مربوط به محل اقامت را ادغام می کند و این داده ها را به اطلاعاتی معنادار تبدیل می کند تا سازمان دهندگان رویداد رفتار گردشگران را درک کنند تا رضایت آنها و افزایش درآمد افزایش یابد. سود این چارچوب متکی بر معماری متشکل از سیستم های مدیریت پایگاه داده، تحلیل تجاری، مدیریت عملکرد کسب و کار، تکنیک های یادگیری ماشین و تجسم داده ها برای هدایت تحلیل است.
از سوی دیگر، منابع داده مشترک برای درک رفتار کاربر استفاده شده است. منابع مشترک مختلف با توجه به ماهیت خاص داده های شما می توانند برای استخراج انواع مختلف اطلاعات استفاده شوند. مثلا:
-
توییتر به منبع ارزشمندی از اطلاعات برای انواع مختلف تحلیل تبدیل شده است که امکان استخراج دانش را فراهم می کند [ 44 ]. برخی از گستردهترین کاربردهای دادههای توییتر در کارهای تحلیلی عبارتند از: استخراج احساسات بیان شده در متن توییتها با استفاده از تکنیکهایی که از سادهترین روشها مانند کیسههای کلمه تا پیشرفتهترین الگوریتمهای یادگیری ماشین (ماشینهای پشتیبانی برداری، شبکههای عصبی) را شامل میشود. و غیره) [ 45 ]; همچنین در حوزه های خاصی مانند گردشگری برای شناخت تصویری که گردشگران از یک مقصد، شناسایی گردشگران و ساکنان و غیره دارند، استفاده شده است [ 46 ].]؛ استفاده از اطلاعات جغرافیایی قابل استخراج از توییت ها برای تعیین مسیرهای کاربران، مکان های تمرکز افراد و مدت اقامت در یک مکان [ 19 ].
-
OSM به نمونه پیشرو VGI در اینترنت تبدیل شده است. OSM فقط یک پایگاه داده مکانی نیست که به طور جمعی ایجاد شده است، بلکه تا حدی توسعه یافته است که به یک اکوسیستم گسترده از داده ها، سیستم های نرم افزاری و برنامه ها و ابزارهایی تبدیل شده است که از داده های موجود در OSM استفاده می کنند [ 4 ، 47 ، 48 ]. یکی از متداولترین کاربردهای OSM به سمت تعریف مسیرهای عبوری (دوچرخه، افراد با ویلچر و وسایل نقلیه) است، بنابراین به کاربران این خدمات اجازه میدهد تا اطلاعات به موقع و بصری را در مورد مسیرها و وضعیت ترافیک به دست آورند [ 49 , 50]؛ و خدمات نقشه برای یافتن مکان هایی مانند خانه ها، جاذبه ها، رستوران ها و غیره. این خدمات امکان پاسخگویی به سوالاتی مانند مکان X کجاست؟ فاصله بین مکان های X و Y چقدر است؟ بهترین مسیر بین دو نقطه X و Y کدام است؟ [ 51 ، 52 ، 53 ].
3. روش شناسی
هدف BITOUR ارائه بینشی از توسعه گردشگری یک کشور یا منطقه جغرافیایی با استفاده از داده های مشترک و باز است. در نهایت به دنبال جمع آوری و تحلیل نظرات و احساسات مردم هستیم تا تصویری از صنعت گردشگری یک مقصد داشته باشیم.
BITOUR از یک روش سه فازی برای طراحی و توسعه پلت فرم پیروی می کند. در ادامه این سه مرحله را توضیح می دهیم.
3.1. تجزیه و تحلیل نیازمندی ها
در این مرحله ما الزامات برای دستیابی به هدف BITOUR را شناسایی می کنیم و انتظارات برای دستیابی به چشم انداز گردشگری یک مقصد را بررسی می کنیم. تجزیه و تحلیل نیاز به نوبه خود از دو مرحله تشکیل شده است:
-
تجزیه و تحلیل نیازهای اطلاعاتی . با توجه به یک مقصد خاص، BITOUR به داده هایی از نظرات بازدیدکنندگان و امکانات ارائه شده توسط مقصد نیاز دارد. به طور خاص، (الف) داده ها باید حاوی نظر مسافران در مورد یک مقصد و نقاط مورد علاقه آن باشد، (ب) منابع داده باید عمدتاً در دسترس باشند و حاوی اطلاعات جغرافیایی ارجاع شده باشند (ج) منابع داده باید پلتفرم های اشتراک داده مشترکی باشند که ارائه دهند. دسترسی قابل مدیریت به داده هامنابع داده BITOUR طیف وسیعی از دادهها را از نقاط مورد علاقه، امکانات اقامتی، رستورانها، نظرات گردشگران در مورد مکانها و غیره جمعآوری میکنند. علاوه بر این، ما از دادههای باز در دسترس عموم استفاده میکنیم.
-
نقشه راه استراتژی اطلاعات : BITOUR باید به کاربران اجازه دهد تا منطقه جغرافیایی مورد مطالعه را انتخاب کنند تا داده های ارجاع شده به منطقه مورد نظر را بارگیری کنند. علاوه بر این، BITOUR باید امکان گنجاندن منابع داده بیشتر را در دراز مدت باز نگه دارد.
3.2. طراحی راه حل
در این مرحله بلوک های ساختمانی پلت فرم را تعریف می کنیم و طراحی سطح بالایی از بلوک ها را ارائه می دهیم.
-
محیط فنی . به منظور دستیابی به هدف خود از در دسترس قرار دادن داده ها به صورت رایگان، ما به ابزارها و محیط های رایگان مانند زبان برنامه نویسی PHP و سیستم پایگاه داده Postgres محدود می شویم. علاوه بر این، از یک محیط وب بر روی یک محیط دسکتاپ استفاده شد تا سایت در دسترس علاقهمندان قرار گیرد.
-
منابع داده . منابع داده اولیه BITOUR عبارتند از:
-
OSM : این پروژه پیشرو و کامل ترین پروژه اطلاعات جغرافیایی رایگان و مشترک در سراسر جهان است. علاوه بر این، مکانیسم های دسترسی خودکار به اطلاعات مکانی یک مکان مورد علاقه را از طریق API ها فراهم می کند.
-
توییتر : محبوب ترین و پرکاربردترین شبکه اجتماعی میکروبلاگینگ در سرتاسر جهان است، بنابراین به منبع ارزشمندی از اطلاعات در مورد نظرات شخصی تبدیل می شود. علاوه بر این، توییتهای دارای ارجاع جغرافیایی برای تحلیل گردشگری بسیار مفید هستند.
منابع داده ای که اطلاعات تکمیلی را ارائه می دهند عبارتند از:-
Tripadvisor : اطلاعاتی در مورد محل اقامت، قیمت و رتبه بندی ارائه می دهد. در میان پلتفرمهای متعدد سفر مجازی، Tripadvisor بیشترین مقدار محتوای ایجاد شده توسط کاربران را از نظر بررسی و رتبهبندی مؤسسات شامل میشود.
-
Airbnb : این پروژه پیشرو در جهان در ارائه خدمات میانجیگری بین میزبانان و مسافران برای اقامت غیررسمی، به طور کلی برای اهداف گردشگری است. داده های مربوط به موسسات مانند قیمت، ارزیابی ها و مکان را ارائه می دهد. Airbnb اطلاعات رسمی محل اقامت (هتل ها و خوابگاه ها) Tripadvisor را تکمیل می کند .
-
-
تعریف الزامات . در این مرحله، ابعاد مورد نیاز برای تعریف الزامات مورد تجزیه و تحلیل قبلی مانند زمان، جاذبههای گردشگری، نظرات مسافران و همچنین معیارهای تجزیه و تحلیل دادهها مانند تعداد توییتها به ازای هر کاربر و مدت اقامت را شناسایی میکنیم. در نهایت، تعیین سطح دانه بندی یا سطح جزئیاتی که داده ها در آن ذخیره می شوند، کلیدی است. در BITOURدادهها در سطح جزئیات یک کاربر، یک توییت، یک نقطه مورد علاقه، یک هتل واحد و غیره ذخیره میشوند. ایجاد روابط بین این دادهها برای کشف اطلاعات مفید مورد نیاز است. به این معنی که گردشگران باید در میان کاربرانی که توییتهایی را در منطقه مورد علاقه ارسال میکنند شناسایی شوند. توییت ها باید به نقاط خاص یا امکانات اقامتی مرتبط باشند تا بفهمیم کدام یک از آنها بازدید می شود و غیره.
-
معماری راه حل . ما بلوک های سازنده BITOUR را در سطح بسیار بالایی تعریف و طراحی می کنیم .
-
معماری سیستم : از معماری کلاسیک BI با چهار لایه پیروی می کند: ETL، یکپارچه سازی داده ها، پردازش و تجسم. جزئیات در مورد این معماری در بخش 5 نشان داده خواهد شد .
-
معماری ETL در این مرحله استراتژی استخراج داده ها از منابع و نحوه پردازش داده ها را تعریف می کنیم. استخراج داده ها از طریق API های ارائه شده توسط هر منبع داده و پیاده سازی های خودمان انجام می شود (به بخش 5.1 مراجعه کنید ).
-
یکپارچه سازی داده ها . داده های استخراج شده از منابع در یک انبار داده مشترک و سازگار ادغام می شوند. این اجازه می دهد تا اطلاعات را به گونه ای سازماندهی کنید که عملکرد پرس و جوها را بهینه کند. جزئیات مدل داده در بخش 5.2 آورده خواهد شد .
-
تجسم . ساختار ناوبری وب سایت نحوه مرور داده ها توسط کاربر را نشان می دهد (به بخش 7 مراجعه کنید ).
-
3.3. پیاده سازی و استقرار
این مرحله شامل اجرای واقعی پلت فرم است.
-
توسعه پایگاه داده و ETL . این مرحله شامل تعریف روالهایی برای استخراج دادهها از منابع و پردازش دادهها برای استخراج اطلاعات است که سپس پایگاه داده را پر میکند. API های ارائه شده توسط منابع داده استفاده می شود و کدی که اجازه دسترسی به آنها را می دهد ایجاد می شود ( بخش 5.1 ). علاوه بر این، روال های اختصاص توییت به مکان ها با استفاده از معیارهای مختلف اجرا می شود. روال شناسایی گردشگران و محاسبه آمار اولیه نیز کدگذاری شده است.
-
محیط وب . ما یک نمونه اولیه از یک برنامه کاربردی وب می سازیم که تمام عملکردها، بارگذاری داده ها، پردازش و تجسم داده های مشتق شده را یکپارچه می کند.
-
استقرار . نمونه اولیه توسعهیافته در یک محیط تولید (سرور) با یک آدرس IP عمومی مستقر میشود که امکان دسترسی از موجودیتهای مختلف را فراهم میکند. در این سرور تمامی ابزارها، کتابخانه ها و زبان های مورد استفاده BITOUR به درستی پیکربندی شده اند. شکل 1 نمای گرافیکی BITOUR را در حین استقرار نشان می دهد. شکل از نظر جغرافیایی مقصد مورد تجزیه و تحلیل را نشان می دهد (شهر والنسیا، اسپانیا، در شکل). این ابزار اجازه می دهد تا در ناحیه مستطیلی قرمز بزرگنمایی کنید و نمای نزدیک نقشه شهر را دریافت کنید.
4. نمای کلی سیستم
BITOUR یک پلت فرم BI است که به طور ویژه برای تجزیه و تحلیل مقاصد گردشگری با تأکید بر استفاده از محتوا و داده های ایجاد شده توسط کاربران وب 2.0 طراحی شده است. ستون فقرات ابزار از منابع داده ای مستقل از حوزه گردشگری تشکیل شده است، یعنی یکی با اطلاعات مکانی (مانند OpenStreetMap) و دیگری با اطلاعات اجتماعی (مانند توییتر). محتوایی که BITOUR مدیریت می کند، مهمتر از همه، دو نوع است:
-
فضایی: اطلاعات مربوط به موقعیت و شکل مکان های مقصد را بر اساس یک سیستم مختصات جغرافیایی نشان می دهد.
-
اجتماعی: داده های نظری را نشان می دهد که به مقصدی مانند متن ایجاد شده در میکروبلاگینگ نسبت داده می شود .
فرآیند کلی پشتیبانی شده توسط BITOUR از پنج عملکرد تشکیل شده است ( شکل 2 را ببینید ):
-
تعریف مقصد و بارگذاری داده های مقصد . همانطور که در شکل 2 مشاهده می شود ، اولین عملکردی که BITOUR ارائه می دهد، تعریف مقصد مورد نظر و تعیین عناصر مقصد برای بارگذاری در پلت فرم از هر یک از منابع است.
-
پردازش توییت ها توییتهای بهدستآمده در آپلود دادهها با رعایت معیارهای اولویت و فاصله به نزدیکترین اشیاء به مقصد اختصاص داده میشوند و یک سری آمار و دادههای مربوط به تعداد توییتهای ارسال شده، مدت اقامت و غیره برای هر کاربری که ارسال کرده است محاسبه میشود. توییت ها
-
تحلیل احساسات متن توییت ها برای تعیین اینکه آیا احساسات مثبت یا منفی را بیان می کند، تجزیه و تحلیل می شود.
-
شناسایی توریستی این تابع شامل تصمیم گیری کاربرانی است که می توانند به عنوان گردشگر در نظر گرفته شوند.
-
تجزیه و تحلیل و تجسم داده ها. در نهایت، تمام داده های دانلود شده و پردازش شده در عملکردهای شرح داده شده در بالا در دسترس تحلیلگر قرار می گیرد. تحلیلگر میتواند دادهها را ترکیب و کاوش کند، نمودارهایی از آن ایجاد کند و توزیع فضایی دادههای حاصل را بررسی کند تا اطلاعاتی را برای پشتیبانی از فرآیند تصمیمگیری بهدست آورد.
یک کاربر در BITOUR می تواند هر یک از دو نقش، مدیر یا تحلیلگر را بر عهده بگیرد. هر یک از عملکردهای ذکر شده توسط مدیر یا تحلیلگر انجام می شود:
-
administrator: این نقش همه قابلیت هایی را که پلتفرم برای پیکربندی و تعیین مقصد دارد را با هم جمع می کند. به این ترتیب، تعریف مقصد یا بارگذاری داده، در میان سایر عملکردها، تنها توسط یک کاربر تحت نقش مدیر قابل انجام است.
-
تحلیلگر: در این نقش، عملکردهایی که پلتفرم برای تجزیه و تحلیل یک مقصد دارد، پس از پیکربندی همه متغیرهای لازم برای تجزیه و تحلیل داده ها، گروه بندی می شوند.
مدیر دارای چهار عملکرد است که همه آنها با یک هدف آماده سازی داده های مقصد برای تجزیه و تحلیل بعدی هستند. از جمله این قابلیت ها، تعریف مقصد و بارگذاری داده ها و تمامی پردازش داده های بارگذاری شده (تخصیص توییت ها، تجزیه و تحلیل احساسات و شناسایی گردشگران) است.
از سوی دیگر، تحلیلگر مسئول تجزیه و تحلیل داده ها و عملکردهای تجسم است که به نوبه خود می تواند به سه وظیفه تقسیم شود که عبارتند از: (1) ایجاد نمودارها و جداول پویا. (2) فیلتر کردن داده ها بر روی نقشه. و (3) توزیع توییت ها در اطراف جاذبه های یک مقصد. این آخرین قابلیت شاید مهم ترین باشد زیرا برای تحقق هدفی است که پلت فرم برای آن ایجاد شده است. یعنی استفاده از داده های مشترک و محاسبات انجام شده از آنها برای پشتیبانی از فرآیند تصمیم گیری در حوزه گردشگری.
5. معماری
شکل 3 معماری BITOUR را نشان می دهد که از چهار لایه تشکیل شده است: لایه منبع داده و لایه ETL. لایه ادغام؛ لایه پردازش و لایه تجسم. در شکل 3 میتوانیم مشاهده کنیم که هر لایه از محصولات یا نتایج لایه قبلی استفاده میکند، به عنوان مثال، لایه Visualization با خروجی پردازش داده تغذیه میشود.
بخش های زیر به تفصیل عملیات انجام شده در هر لایه BITOUR را نشان می دهد و همچنین ابزارهای مورد استفاده برای طراحی BITOUR را نشان می دهد .
5.1. منبع داده و لایه ETL
همانطور که در شکل 3 مشاهده می شود ، ما از چهار منبع داده در BITOUR استفاده کردیم که اطلاعات مرتبط و لازم را برای تجزیه و تحلیل بخش گردشگری فراهم می کند. دو مورد از آنها منابع همه منظوره هستند: OpenStreetMap ( OSM ) داده های مکانی را ارائه می دهد و Twitter داده های اجتماعی را در قالب نظرات عمومی و نظرات در مورد نقاط مقصد ارائه می دهد:
-
OSM : موقعیت و هندسه میلیونها مکان در جهان را که آزادانه در دسترس هستند ثبت میکند. OSM امکان دسترسی به مکانهای مختلف واقع در یک مقصد مانند موزهها، رستورانها، بناهای تاریخی و غیره را میدهد. علاوه بر این، دادههای OSM را میتوان به روشهای مختلفی جستجو کرد، که در میان آنها موارد زیر برجسته هستند: (الف) بر اساس مناطق جغرافیایی (مثلاً شهر والنسیا)؛ و (ب) با برچسبهای شکل کلید/مقدار برای طبقهبندی اشیا (به عنوان مثال، اشیایی که گردشگری = موزه ).
-
توییتر: محبوب ترین شبکه میکروبلاگینگ در جهان است. این نظر، وضعیت ذهنی و موقعیت میلیون ها نفر را در مورد هر نوع رویداد در سراسر جهان ذخیره می کند. همچنین دسترسی آسان به داده های خود را از طریق یک API فراهم می کند که امکان بازیابی نظرات بیان شده در مورد یک مقصد گردشگری را فراهم می کند.
علاوه بر این، BITOUR از دو منبع داده دیگر خاص برای حوزه گردشگری، Tripadvisor و Airbnb استفاده می کند:
-
Tripadvisor: داده هایی را در مورد امکانات و خدمات خدمات گردشگری یک مقصد ارائه می دهد. در BITOUR ، از Tripadvisor برای به دست آوردن اطلاعات در مورد هتل های واقع در یک مقصد خاص استفاده می شود.
-
Airbnb: این منبع، مشابه Tripadvisor، دادههای خدمات اقامتی، عمدتاً برای مقاصد گردشگری را ارائه میدهد که نمیتوان آنها را به عنوان هتل طبقهبندی کرد و عمدتاً اقامتگاههای غیررسمی هستند.
فرآیند استخراج، تبدیل و بارگذاری (ETL) برای همه منابع داده، همانطور که در شکل 3 مشاهده می شود ، با استفاده از زبان برنامه نویسی PHP پیاده سازی شده است. این فرآیند شامل دسترسی به هر منبع داده، استخراج و پردازش اطلاعات هدف و بارگذاری آن در انبار داده است. این فرآیند ETL در بخش 6 توضیح داده شده است .
5.2. لایه یکپارچگی
همانطور که در شکل 3 نشان داده شده است، هدف این لایه یکپارچه سازی داده ها از چهار منبع مورد استفاده در یک مکان، انبار داده است. این انبار با استفاده از رویکرد پیشنهاد شده توسط بیل اینمون [ 54 ] ساخته شده است. یعنی، کل مدل داده استاندارد شده ابتدا پیکربندی میشود، و سپس بقیه ساختارهای تجزیه و تحلیل پیکربندی میشوند، خواه آنها فروشگاههای داده دپارتمان باشند یا مکعبهای OLAP.
داده ها در این لایه اساساً دو نوع هستند: غیر مکانی و فضایی. نوع اول شامل تمام اطلاعات متنی یا عددی مربوط به ویژگیهای اشیا یا موجودیتها مانند نام یک جاذبه یا قیمت یک هتل است. در نوع دوم مختصات جغرافیایی و هندسی یک مکان ذخیره می شود. همانطور که در شکل 3 نشان داده شده است ، انبار داده در یک پایگاه داده SQL (یا رابطه ای) پیاده سازی شده است. مدیریت داده های غیر مکانی با استفاده از سیستم مدیریت پایگاه داده PostgreSQL انجام شد. و برای مدیریت داده های مکانی، PostGIS، پلاگین PostgreSQL برای داده های مکانی، استفاده شد.
برخی از نهادهای مهم در انبار داده به شرح زیر است:
-
مقصد : این موجودیت تمام مقاصد ایجاد شده را در پلتفرم ذخیره می کند. برای هر مقصد، اطلاعات زیر ذخیره می شود: نام، مرکز جغرافیایی و جعبه مرزی جغرافیایی. این موجودیت عرضی به سایر موجودیت ها است، زیرا همه داده ها و عملیات در محدوده یک مقصد انجام می شود.
-
مکان های OSM : این موجودیت تمام اشیاء OSM را که برای هر مقصد دانلود شده اند ذخیره می کند. برای هر شی، نام، تگ های OSM مرتبط، هندسه و سایر موارد ذخیره می شود.
-
توییتها : این موجودیت دادههای توییتها، از جمله کاربر، مختصات توییت، زبان اختصاص داده شده توسط توییتر و غیره را ذخیره میکند. از این اطلاعات، موجودیت دیگری برای ذخیره اطلاعات مربوط به کاربران توییتر ایجاد می شود.
-
Entities Hotels و Airbnb اطلاعات مربوط به محل اقامت استخراج شده از TripAdvisor و AirBnB، به طور خاص، نام، مکان و قیمت و سایر موارد را ذخیره می کنند.
داده ها در انبار داده در صورت تقاضا به روز می شوند. به عبارت دیگر، کاربر علاقه مند به وظایف تجزیه و تحلیل می تواند داده ها را در هر زمان به روز کند. برخی از این داده ها مستقیماً از پلتفرم به روز می شوند و برخی دیگر باید آپلود شوند. این در بخش 6 توضیح داده شده است .
5.3. لایه پردازش
این لایه، همانطور که در شکل 3 نشان داده شده است، داده های یکپارچه را از انبار داده می گیرد و آن را پردازش و بازسازی می کند تا بتواند به طور موثر توسط لایه تجسم مورد بهره برداری قرار گیرد. در این لایه، دو جزء اصلی را می توان یافت:
در حال پردازش. این جزء وظیفه گرفتن داده ها را بر عهده دارد، زیرا از منابع مختلف ادغام شده است و عملیات و محاسبات را بر روی آنها انجام می دهد و اطلاعات مفیدی را برای تجزیه و تحلیل بعدی به دست می آورد. دو وظیفه اصلی این مؤلفه، انتساب توییتها است که به شما امکان میدهد توییتهای مرتبط با یک مقصد را به مکانهای خاصی در آن مقصد، مانند جاذبهها، هتلها، رستورانها، و غیره اختصاص دهید و شناسایی گردشگر، فرآیندی که تعیین میکند کدام کاربران توییتر میتوانند. به عنوان توریست طبقه بندی شود تا تجزیه و تحلیل بر روی این کاربران متمرکز شود. این جزء در بخش 6 به تفصیل توضیح داده خواهد شد .
مکعب های OLAP. مکعبهای OLAP امکان ساختار دهی دادهها را به روشی چند بعدی فراهم میکنند تا مشاوره آسانتر شود. برای این کار، یک طرح پردازش ROLAP انتخاب شده است به طوری که داده ها همیشه در فروشگاه های داده دپارتمان قرار دارند. به طور خاص، دو مکعب تعریف شده است، یکی که امکان تجزیه و تحلیل بازدیدهای گردشگران را فراهم می کند و دیگری که امکان تجزیه و تحلیل توییت های ساخته شده را فراهم می کند. این نیز در بخش 6 به تفصیل توضیح داده خواهد شد .
5.4. لایه تجسم
همانطور که در شکل 3 نشان داده شده است ، این آخرین لایه معماری است و وظیفه دارد تمام اطلاعات را در اختیار کاربران علاقه مند قرار دهد. برای تحقق این هدف، BITOUR از گروهی از فنآوریها استفاده میکند که برای امکانپذیر ساختن وظایف تحلیلی مختلف بیان شدهاند. این فناوری ها عبارتند از:
-
نمادگذاری شی جاوا اسکریپت برای تبادل داده.
-
لایه های باز برای نمایش نقشه ها.
-
HTML5 برای تعریف ساختار صفحات وب.
-
CSS3 y BootStrap برای تعریف ظاهر صفحات وب.
-
AngularJS برای رسیدگی به پویایی صفحه و درخواست های ناهمزمان به سرویس داده
-
PHP به عنوان یک زبان برنامه نویسی برای تعریف منطق خدمات داده.
شکل 4 یک تعامل معمولی برای این لایه را نشان می دهد. کاربر از مرورگر آدرس یک منبع را درخواست می کند. سرور مجموعه ای از داده ها را در JSON و یک صفحه وب (HTML5) با سبک خود (CSS3) برمی گرداند. این داده ها توسط مرورگر دریافت می شود و از طریق کد در AngularJS داده ها بر روی نقشه ایجاد شده با OpenLayers نمایش داده می شود. هر یک از فناوری های ذکر شده در زیر توضیح داده شده است.
6. پردازش داده ها
این بخش به برخی از عملکردهای BITOUR که نیاز به توضیح بیشتری دارد، یعنی فرآیند استخراج اطلاعات در لایه منبع داده، تخصیص توییت و سایر رویهها برای استخراج اطلاعات جدید در لایه پردازش، و پیکربندی مکعبهای OLAP میپردازد.
6.1. استخراج اطلاعات
جدول 1 منابع داده مورد استفاده در BITOUR ، داده های استخراج شده از هر یک از آنها و نوع دسترسی را خلاصه می کند. برخی از جنبه های مربوط به فرآیند استخراج عبارتند از:
-
دادههای توییتر از جستجوی API (رابط برنامهنویسی کاربردی) دانلود میشوند، که به شما امکان میدهد توییتهای ارسال شده در یک منطقه جغرافیایی خاص را در قالب JSON (نشانگذاری شی جاوا اسکریپت) دریافت کنید. به عنوان مثال، در مورد ما، ما حدود 570000 توییت برای شهر والنسیا در اسپانیا برای دوره بین فوریه 2015 تا فوریه 2018 و حدود 670000 توییت برای شهر برلین در آلمان برای دوره بین فوریه 2015 تا اوت 2018 جمع آوری کردیم. داده های تشکیل شده در توییت ها به اطلاعات کاربر و بقیه فیلدهای توییت (متن، هشتگ، مکان، زبان) تقسیم می شوند.
-
دادههای TripAdvisor از طریق API قابل دسترسی نیستند و به همین دلیل، دادههای مربوط به هتلها با حذف وب به دست میآیند . این بدان معناست که لازم است به کد HTML صفحه وب دسترسی داشته باشید، ساختار آن را تجزیه و تحلیل کنید و در بخش های صفحه برای استخراج اطلاعات مورد نظر حرکت کنید.
-
AirBnB دسترسی خودکار به داده ها را از طریق API نیز فراهم نمی کند. با این حال، برنامه های شخص ثالث مانند Inside Airbnb ( https://insideairbnb.com/ ) وجود دارد که داده ها را در قالب CSV (مقادیر جدا شده با کاما) در دسترس قرار می دهد.
با توجه به اینکه OSM سنگ بنای BITOUR است ، فرآیند استخراج آن را با جزئیات بیشتری توضیح خواهیم داد. داده های OSM از طریق Overpass API قابل دسترسی هستند. در این کار، رویکردی که برای بازیابی داده ها دنبال شده است، استفاده از لایه انتزاعی ارائه شده توسط پلت فرم BITOUR برای گروه بندی برچسب های OSM در دسته های کلی تر است که ممکن است برای گردشگر تحلیلی مورد علاقه باشد. به این ترتیب، به عنوان مثال، برچسبهای گردشگری = موزه و امکانات رفاهی = هنر_مرکز را میتوان در دسته موزه قرار داد . جدول 2نگاشت بین دسته گردشگری مورد استفاده در این کار و تگ های OSM را نشان می دهد. در طول فرآیند بازیابی اطلاعات OSM، که برای یک مقصد خاص انجام می شود، اشیاء مرتبط با برچسب های OSM در جدول 2 برای هر دسته بازیابی می شوند.
با استفاده از مورد خاص دسته “موزه ها” (به جدول 2 مراجعه کنید )، می بینیم که این دسته با دو تگ مرتبط است. فرآیند بازیابی اطلاعات به شرح زیر است:
-
یک پرس و جو داده با استفاده از دستور Overpass API برای هر یک از برچسب هایی که دسته را تشکیل می دهند ایجاد می شود. بنابراین، یک پرس و جو برای بازیابی اشیایی ایجاد می شود که در آن گردشگری کلید برابر با موزه است و دیگری که در آن امکانات کلیدی برابر با art_center است . الگوریتم 1 زیر پرس و جوی مورد تگ اول را نشان می دهد.
-
برای هر یک از پرس و جوهای ایجاد شده، یک درخواست HTTP به سرور داده OSM ارسال می شود که وظیفه پردازش آن و بازیابی اشیاء OSM را دارد که آن شرایط را برآورده می کنند. برای مثال موزههای والنسیا، اسپانیا، اشیایی مانند موزه فالرو بازیابی شدهاند (به الگوریتم 1 مراجعه کنید). در این قطعه کد، میتوانیم ببینیم که اطلاعاتی مانند street ( adr:street = "Plaça Montolivet" ) همراه با شی است.
-
اشیاء بازیابی شده در یک بسته واحد گروه بندی شده و به مشتری بازگردانده می شوند. دومی مسئول پردازش داده های برگشتی توسط هر یک از درخواست ها و ذخیره آنها در انبار داده است.
-
[out:csv(::id,::type,"name")];
-
منطقه[name="والنسیا"];
-
راه(منطقه)[گردشگری=موزه];
-
بیرون
الگوریتم 1: موزه فالرو در OSM نشان داده شده است. |
|
6.2. تکلیف توییت
این رویه سنگ بنای عملیات BITOUR را تشکیل می دهد، زیرا به عنوان پشتیبان برای وظایف بعدی تجسم و داده های ورودی برای سایر وظایف، مانند شناسایی گردشگران عمل می کند. هدف از این روش اختصاص دادن یک توییت به یک مکان است تا بدانیم توییت از کجا ساخته شده است. این روش بر اساس مقدمات زیر است:
-
همه مکان ها به دسته هایی دسته بندی می شوند که نشان دهنده نوع فعالیتی است که می توان در آنها انجام داد. به این ترتیب می توان برخی مکان ها را به عنوان موزه ها، بناهای تاریخی و غیره طبقه بندی کرد. جدول 3 فهرست دسته بندی هایی را که در حال حاضر در BITOUR تعریف شده است نشان می دهد . با این حال، دسته های جدید را می توان با استفاده از فرم در شکل 5 اضافه کرد، که اطلاعاتی را که باید برای ایجاد یک دسته جدید وارد شود نشان می دهد: نام، حداکثر فاصله مجاز و اشیاء مرتبط با آن.
-
اگر فاصله بین مکان توییت و مکان مکان کمتر از مقداری باشد که قبلاً برای هر دسته تعیین شده بود، یک توییت از یک مکان خاص ساخته شده است. به عنوان مثال، اگر ما تعریف کرده باشیم که حداکثر فاصله مجاز برای در نظر گرفتن اینکه یک توییت از یک هتل ساخته شده است 35 متر است (همانطور که جدول 3 نشان می دهد)، هر توییت در فاصله کمتر یا مساوی 35 متر نسبت به مکان قبلی طبقه بندی شده به عنوان هتل را می توان به مکان اختصاص داد. این فاصله زمانی ایجاد می شود که یک دسته ایجاد می شود ( شکل 5 را ببینید ).
-
هر توییت را فقط می توان به یک مکان اختصاص داد. با این حال، ممکن است اتفاق بیفتد که با توجه به یک توییت داده شده، می توان آن را به بیش از یک مکان اختصاص داد زیرا شرایط حداکثر فاصله را دارند. بنابراین، یک لیست اولویت بر اساس دسته بندی تعریف می شود به طوری که به توییت بالاترین مکان اولویت که شرایط حداکثر فاصله را دارد، اختصاص داده می شود. جدول 3 اولویت های اختصاص داده شده به دسته های تعریف شده را نشان می دهد.
تعریف فواصل و اولویت های جدول 3 بر اساس ارتباط هر دسته در بخش گردشگری ایجاد شده است. با این حال، این مقادیر را می توان در پلت فرم تغییر داد و با نیازهای تجزیه و تحلیل هر مشکل و دامنه تنظیم کرد.
بنابراین، داده های ورودی به فرآیند تخصیص توییت ها عبارتند از:
-
توییت هایی با موقعیت جغرافیایی آماده تخصیص هستند.
-
مکانهای دارای موقعیت جغرافیایی در پلتفرم آپلود شده و در دستهبندیها طبقهبندی میشوند.
-
دسته بندی با فاصله و اولویت از پیش تعیین شده.
با این اطلاعات، روش تخصیص به شرح زیر عمل می کند:
-
برای هر توییت، مکان آن گرفته میشود و فاصله بین هر توییت و مکانهای ذخیرهشده در پلتفرم محاسبه میشود و تأیید میشود که با شرط قرار گرفتن در حداکثر فاصله مجاز مطابقت دارند و فقط مکانهایی که این شرط را دارند حفظ میکنند.
-
از بین مکان هایی که معیار فاصله را برآورده می کنند، نزدیک ترین مکان به توییت برای هر دسته انتخاب می شود. پس از آن، از بین تمام مکانهای باقیمانده، مکانی که به بالاترین ردهبندی تعلق دارد، انتخاب میشود.
-
اگر پس از اجرای دو مرحله قبلی حداقل یک مکان هر دو معیار را داشته باشد، توییت به این مکان اختصاص داده می شود. در غیر این صورت، توییت اختصاص داده نشده است.
به عنوان مثال، توییت شناسه 1020 را می توان در نظر گرفت: پس از محاسبه فاصله بین مکان آن و مکان های ذخیره شده در پلت فرم، مقادیر منعکس شده در جدول 4 به دست می آیند. در این جدول می توانید ببینید که چگونه سه مکان وجود دارد که معیار فاصله را برآورده می کند، یکی از دسته یادبودها، یکی از دسته اوقات فراغت و دیگری از رده غذا. بنابراین، با رعایت معیار اولویت، توییت به مکان طبقهبندی بنای یادبود اختصاص مییابد، زیرا اولویت آن در مقایسه با اولویتهای 5 و 6 غذا و اوقات فراغت، 2 است. شکل 6 نشان می دهد که توییت (نقطه قرمز) در داخل Oceanographic (چند ضلعی آبی) قرار دارد.
به روشهای مشابه، توییتها با توجه به معیار زیر به هتلها یا سایتهای airbnb اختصاص داده میشوند:
-
در صورت امکان، برای مرتبط کردن یک توییت با هتل یا Airbnb، نزدیکی 35 متری را اعمال می کنیم.
-
هتل ها نسبت به سایت های Airbnb اولویت دارند.
-
اگر توریستی توئیت های اختصاص داده شده به هتل ها و توییت های اختصاص داده شده به Aribnb داشته باشد، اگر به همان میزان باشد، اقامت در هتل محسوب می شود، در غیر این صورت، به نوع اقامتی که گردشگر بیشترین تعداد را دارد اختصاص می یابد. از توییت ها
6.3. سایر رویه ها
یک رویه مهم که قبل از انجام هر تحلیلی اجرا میشود، شناسایی رباتها است که شامل شناسایی آن دسته از کاربرانی است که میتوانند به عنوان غیرانسان طبقهبندی شوند، یعنی ماشینهایی که بهطور خودکار توییتها را مینویسند، زیرا این «کاربران» نویز ایجاد میکنند. امروزه این تشخیص با یک روش ساده انجام می شود: فاصله بین هر جفت توییت ارسال شده توسط همان کاربران محاسبه می شود. اگر حداقل 10 توییت از فاصله کمتر از 20 متر ارسال شده باشد، این کاربر یک ربات محسوب می شود.
سپس، BITOUR یک سری محاسبات را برای استخراج اطلاعات در مورد کاربران باقی مانده انجام می دهد:
-
تعداد توییت های ارسال شده توسط هر کاربر.
-
مدت اقامت هر کاربر، از تاریخ اولین و آخرین توییت محاسبه می شود.
-
تعداد توییتها در هر دسته، که خلاصهای از تعداد توییتهای مرتبط با کاربر برای هر یک از دستههای تعریفشده در پلتفرم است.
-
زبان کاربر که به صورت زیر مشخص میشود: (1) وقتی زبان مشخص شده توسط کاربر در حساب توییترش انگلیسی نباشد، زبان مشخص شده در حساب انتخاب میشود. (2) برای آن دسته از کاربرانی که انگلیسی به حساب خود اختصاص داده اند: (الف) اگر حداقل 75٪ توییت ها به زبان انگلیسی نوشته شده باشند یا (ب) زبان غالب در متون توییت ها انتخاب شده باشد، انگلیسی اختصاص داده می شود.
در نهایت، با توجه به اینکه تمام تحلیلهایی که میتوان در BITOUR انجام داد با گردشگران و رفتار آنها در هنگام بازدید از یک مقصد مرتبط است، تشخیص اینکه کدام کاربران ساکن در مقصد هستند و کدام کاربران توریست هستند، مهم است. این فرآیند شناسایی توریست یک کار طبقه بندی یادگیری ماشینی است که بر اساس تکنیک خوشه بندی است. متغیرهای در نظر گرفته شده برای این کار ML عبارتند از: دوره ارسال، منطقه زمانی، تعداد توییت های ارسال شده، تعداد توییت های اختصاص داده شده، درصد توییت ها در هر دسته و غیره. جزئیات در مورد روش خوشه بندی را می توان در [ 46 ] یافت.
از سوی دیگر، BITOUR همچنین امکان انجام تجزیه و تحلیل احساسات روی توییت ها را ارائه می دهد تا تشخیص دهد که آیا نظر بیان شده در متن را می توان به عنوان مثبت یا منفی طبقه بندی کرد. علاوه بر این، متون نیز به عنوان مذهبی، خوراکی و غیره طبقه بندی می شوند. این تحلیل با استفاده از ابزار جستجوی زبانی و شمارش کلمات (LIWC) ( https://liwc.wpengine.com/ ) انجام می شود. این ابزار در کارهای مشابه دقتی بین 0.6 و 0.9 نشان داده است [ 55 ، 56 ].
6.4. مکعب های OLAP
همانطور که در بالا توضیح داده شد، مکعب های OLAP در این کار با استفاده از یک طرح پردازش ROLAP ساخته شده اند، به طوری که داده ها همیشه در فروشگاه های داده دپارتمان قرار می گیرند. به طور خاص، دو مکعب تعریف شده است. این دو ساختار جدید ایجاد شده، داده های لایه ادغام را در قالب بعدی سازماندهی مجدد می کنند.
-
اقامت: این ساختار به گونه ای طراحی شده است که تجزیه و تحلیل مربوط به گردشگران، یعنی تعداد گردشگران حاضر، مدت اقامت آنها و کل هزینه های انجام شده در مقصد را امکان پذیر کند. برای این تحلیل از ابعادی مانند جاذبه های بازدید شده، زمان سال و نوع جاذبه های بازدید شده استفاده می شود.
-
توییتها: این ساختار به جای کاربرانی که آن را انجام میدهند، امکان تحلیل در سطح پایینتری از تجمع، یعنی در سطح توییت را میدهد. به این ترتیب می توان تعداد توییت ها را بر اساس مثبت یا منفی بودن احساسات بیان شده در هر توییت تجزیه و تحلیل کرد. روز، ماه یا سالی که توییت ساخته شد؛ و مکان هایی که توییت ها از آنجا ارسال شده اند.
در شکل 7 ما می توانیم درک کنیم که چگونه دو موجودیت توییت ها و اقامت ها شامل معیارهایی مانند مدت زمان و هزینه هایی هستند که می توانند با استفاده از ابعادی مانند جاذبه، اقامت و تاریخ تجزیه و تحلیل شوند.
7. تجسم
هنگامی که پردازش به پایان رسید و داده ها در مدل بعدی ساختار یافتند، این داده ها را می توان با ابزارهای تجسم ارائه شده توسط BITOUR هدایت کرد . این بخش به عملکردی می پردازد که BITOUR برای کاربران در نقش تحلیلگر برای تعامل با داده ها ارائه می دهد، به طوری که به عنوان پشتیبان برای تصمیم گیری در حوزه گردشگری عمل می کند. هدف ارائه سازوکارهای لازم برای پاسخگویی به سوالاتی از قبیل: جاذبههایی که بیشترین هجوم گردشگر را دارند، کدام جاذبه (یا کدام جاذبه) بیشترین نظرات منفی را دارد و افرادی که در هتل اقامت میکنند کدام مکانها را ترجیح میدهند ارائه شود. بازدید کنید. این بخش چند نمونه از تجزیه و تحلیل را نشان می دهد که می توان با استفاده از BITOUR انجام دادابزار. به طور کلی، تحلیلگر می تواند اطلاعات را به دو طریق تجسم کند: با استفاده از نمودارها و جداول پویا و با استفاده از نقشه ها.
ابتدا روی مکعب Stays تمرکز می کنیم. از این مکعب، می توان داده های مربوط به گردشگران را به صورت جداگانه تجزیه و تحلیل کرد یا آنها را بر اساس زبان، نوع محل اقامت انتخاب شده و غیره گروه بندی کرد. به عنوان مثال، شکل 8 جدولی را نشان می دهد که امکان تجزیه و تحلیل مدت اقامت گردشگران در شهر والنسیا را با توجه به زبانی که آنها صحبت می کنند در این مورد می توان مشاهده کرد که به طور کلی گردشگران اسپانیایی زبان بیشترین تعداد را دارند و پس از آن انگلیسی زبانان و ایتالیایی زبانان. علاوه بر این، با توجه به مدت اقامت، تعداد گردشگران با افزایش تعداد روزها کاهش می یابد. از سوی دیگر، بررسی این داده ها از منظر توییت های ارسال شده توسط هر گردشگر امکان پذیر است. به عنوان مثال، شکل 9توزیع توییت ها در ماه را با توجه به زبان شناسایی شده برای گردشگر نشان می دهد.
با توجه به مکعب های توییت، بسیاری از جنبه ها و در سطح متفاوتی از دانه بندی قابل تجزیه و تحلیل هستند. ابتدا، یک چشم انداز کلی از توزیع توییت ها را می توان با استفاده از عملکرد نقشه در BITOUR مشاهده کرد . به عنوان مثال، شکل 10نشان می دهد که چگونه توییت های ساخته شده توسط گردشگران در سراسر شهر والنسیا توزیع می شود. علاوه بر این، در این مورد، تحلیلگر همچنین میتواند ده جاذبه را برای انجام تجزیه و تحلیل دقیقتر مشخص کند (جاذبهها به صورت نشانگر (نقاط قرمز) و توییتها به عنوان نقاط خاکستری کوچکتر نشان داده میشوند. این را می توان برای درک جنبه هایی مانند جاذبه هایی که بیشترین تأثیر را بر گردشگری دارند، اینکه آیا این جاذبه ها بر فعالیت هایی که در اطراف آنها انجام می شود تأثیر می گذارد و به چه شیوه ای فعالیت می کنند استفاده شود. به عنوان مثال، در این مورد، مکانهای خوراکشناسی نیز تحلیل میشوند: دادهها در گوشه سمت راست بالا نشان میدهند که چه تعداد توییت مربوط به مکانهای خوراک شناسی در اطراف جاذبههای انتخابی پست شده است.
اگر یک جاذبه خاص انتخاب شود ( شکل 11 را ببینید)، مکان این جاذبه در نقشه با یک چند ضلعی قرمز نشان داده می شود و داده های مربوط به این جاذبه در گوشه سمت راست بالا خلاصه شده و در نقشه نشان داده شده است. به طور خاص، در اینجا می بینیم که چگونه تعداد زیادی از توییت های مرتبط در این نقطه از شهر به هم می رسند و بیشتر آنها مربوط به سایت های خوراکی (نقاط آبی) و کمتر در مورد سایت های تفریحی (نقاط صورتی) هستند.
BITOUR همچنین امکان کاوش بصری توییت های روی نقشه را با توجه به سایر متغیرهای تعریف شده در مکعب طراحی شده برای تجزیه و تحلیل توییت ها فراهم می کند. به عنوان مثال، شکل 12 نشان می دهد که چگونه توییت ها را می توان با توجه به بعد محل سکونت تجزیه و تحلیل کرد، با مشخص کردن نوع مکان مورد تجزیه و تحلیل، Airbnb برای این مورد. توییت ها به صورت نقاط آبی روی نقشه نشان داده می شوند. به طور مشابه، نقشه همچنین میتواند توییتهای ارسال شده از موزهها و بناهای تاریخی در شهر را به تصویر بکشد ( شکل 13 ). به طور کلی، نقشه را می توان با استفاده از هر یک از ویژگی های ابعاد ایجاد شده و همچنین اعمال برخی فیلترها بر روی این ویژگی ها نمایش داد.
تحلیل جالب دیگر مربوط به احساسات پیش بینی شده برای هر توییت است. شکل 14 احساسات مرتبط با توییت های ارسال شده از برخی جاذبه ها را نشان می دهد. می توان مشاهده کرد که موضوعات غالب «اجتماعی»، «تفریح» و «عشق» هستند و به عنوان مثال، جاذبه ای که از آن توییت های مرتبط با «کار» ارسال می شود، Mercado Central (بازار مرکزی) است.
در نهایت، ترکیب هر دو مکعب، Stays و Tweets، امکان تحلیل عمیقتر رفتار گردشگران را میدهد. به عنوان مثال، شکل 15 توییت ها را بر اساس نوع اقامتگاه انتخاب شده توسط گردشگر و نوع نقطه مورد علاقه نشان می دهد که با توجه به مکانی که توییت از آن ارسال می شود تعیین می شود.
8. نتیجه گیری
جامعه مدرن، در میان جنبه های دیگر، با نقش برتر اطلاعات و دانش مشخص می شود. در این زمینه، داده های مشترک منبع ارزشمندی برای به دست آوردن بینش بهتر از رفتار گردشگران است. برای بخش گردشگری که رشد و موفقیت آن به شدت به تجربیات کاربران بستگی دارد، تصمیم گیری آگاهانه بر اساس ترجیحات و رفتار گردشگران دارایی ارزشمندی است. در مقابل، گردشگران می توانند زمانی که خدمات باکیفیت و مناسبی به آنها ارائه شود، از تجربه مفیدتری برخوردار شوند.
در این مقاله ما یک پلت فرم BI به نام BITOUR ارائه کرده ایم که داده ها را از چهار منبع مشترک، شبکه اجتماعی توییتر ، پلت فرم نقشه باز OpenStreetMap و دو سرویس اقامتی TripAdvisor و Airbnb ادغام می کند.. این پلتفرم به طور خودکار داده ها را از این منابع جمع آوری می کند و آنها را در یک انبار داده ادغام می کند که از آنجا تکنیک های داده کاوی قابل استفاده است. خروجی تجزیه و تحلیل داده ها از طریق وب توسط جامعه مسئول تصمیم گیری در ابتکارات گردشگری در یک منطقه جغرافیایی یا مقصد به تصویر کشیده می شود. به این ترتیب، فرآیند شناسایی گردشگران و اختصاص توییتها به مکانها، امکان تحلیل جنبههایی مانند توزیع توییتها و کاربران در اطراف یک مقصد، تأثیر جاذبهها بر فعالیتهایی که در اطراف آن نقطه انجام میشود، میانگین مدت اقامت گردشگران در آن مکان را میدهد. مقصد و غیره
از این تحقیق، طیف گسترده ای از مسائل ظاهر می شود که شایسته پرداختن است. پاراگراف های زیر برخی از خطوط کاری را که به طور بالقوه برای تحقیقات آینده جالب در نظر گرفته می شوند، شرح می دهند:
-
از نقطه نظر اجرای داخلی پلت فرم سه روال وجود دارد که می توان آنها را اصلاح کرد: الگوریتم شناسایی گردشگران، الگوریتم شناسایی ربات و الگوریتم برای تخصیص توییت. اگرچه این الگوریتمها نتایج خوبی به همراه داشتند، اما میتوان آنها را با گنجاندن اطلاعات استخراجشده از متن توییتها غنیتر کرد.
-
علاوه بر این، منابع داده دیگری نیز وجود دارد که می توانند برای تکمیل دیدگاه BITOUR ترکیب شوند . برخی از این منابع میتواند FourSquare باشد که جزئیاتی در مورد حرکات کاربران در مقاصد ارائه میکند و اینستاگرام که امکان درک بهتر فعالیتهای تفریحی را که گردشگران در مقصد انجام میدهند را فراهم میکند.
-
علیرغم مزایای مهم منابع داده مشترک که قبلاً در پلتفرم BITOUR ذکر و بررسی شده است، استفاده از آنها ممکن است اشکالاتی نیز داشته باشد که عمدتاً مربوط به کیفیت این داده ها است. با توجه به اینکه نهاد نظارتی وجود ندارد، کیفیت داده ها تضمین نمی شود زیرا کاربران ممکن است داده های نادرست معرفی کنند. با این حال، این خود جامعه است که به عنوان ناظر عمل می کند، زیرا سایر کاربران می توانند این داده های اشتباه را اصلاح کنند. قبل از استفاده از این منابع داده در BITOUR ، ما مطالعه ای را برای بررسی اطلاعات OSM انجام دادیم و به عنوان مثال، موقعیت هتل های OSM را با موقعیت آنها در TripAdvisor مقایسه کردیم.با نتایج رضایت بخش با این حال، با وجود تجزیه و تحلیل ما و این واقعیت که مطالعات مختلف نشان داده است که کیفیت این منابع نزدیک به منابع رسمی است [ 57 ، 58 ]، تجزیه و تحلیل کیفیت این منابع داده های مشترک و مقایسه محتوای آنها با داده های رسمی و باز از منابع سرزمینی، ملی و بین المللی. برخی از منابعی که می توان بررسی کرد، داده های ارائه شده توسط سازمان جهانی گردشگری در خلاصه سالانه خود در مورد آمار گردشگری کشور و گزارش رقابت پذیری گردشگری منتشر شده توسط مجمع جهانی اقتصاد است.
منابع
- ناکاهیرا، KT; آکاانه، م. فوکامی، ی. چند رسانه ای تعاملی هوشمند: سیستم ها و خدمات. نوآوری هوشمند. سیستم تکنولوژی 2012 ، 14 ، 609-617. [ Google Scholar ]
- نین، جی. Villatoro، D. Citizen در شبکه های حسگر: دومین کارگاه بین المللی، citiSens 2013 بارسلونا، اسپانیا، 19 سپتامبر 2013 مقالات منتخب را اصلاح کرد. لکت. یادداشت ها محاسبه. علمی 2014 ، 8313 ، 26-35. [ Google Scholar ]
- چوا، ا. سرویلو، ال. مارچگیانی، ای. Moere، AV Mapping Cilento: استفاده از داده های رسانه های اجتماعی دارای برچسب جغرافیایی برای توصیف جریان های توریستی در جنوب ایتالیا. تور. مدیریت 2016 ، 57 ، 295-310. [ Google Scholar ] [ CrossRef ]
- کاراگیاناکیس، ن. جیانوپولوس، جی. اسکوتاس، دی. Athanasiou، S. OSMRec Tool برای توصیه خودکار دسته بندی ها در موجودیت های فضایی در OpenStreetMap. در مجموعه مقالات نهمین کنفرانس ACM در مورد سیستم های توصیه کننده (RecSys ’15)، وین، اتریش، 16-20 سپتامبر 2015. انجمن ماشینهای محاسباتی: نیویورک، نیویورک، ایالات متحده آمریکا، 2015. صص 337-338. [ Google Scholar ] [ CrossRef ]
- برچر، م. Whelan، C. تجزیه و تحلیل شبکه های اجتماعی به عنوان ابزاری برای هوش جنایی: درک پتانسیل آن از دیدگاه تحلیلگران اطلاعاتی. اندام روندها. جنایت 2017 ، 21 ، 1-17. [ Google Scholar ] [ CrossRef ]
- اوبزا، ام. الکافی، ج. رویکردی برای پیاده سازی معنایی تجزیه و تحلیل داده های بزرگ در فرآیند هوش تجاری اجتماعی در محیط های توزیع شده (رایانش ابری). در مجموعه مقالات چهارمین کنفرانس بین المللی داده های بزرگ و اینترنت اشیا، رباط، مراکش، 23 تا 24 اکتبر 2019؛ صص 1-6. [ Google Scholar ] [ CrossRef ]
- زنگ، بی. گریتسن، آر. درباره رسانه های اجتماعی در گردشگری چه می دانیم؟ بازنگری. تور. مدیریت چشم انداز 2014 ، 10 ، 27-36. [ Google Scholar ] [ CrossRef ]
- Lalicic، L. باز کردن پلت فرم های نوآوری در گردشگری: سهامداران چگونه درگیر می شوند و به اجماع می رسند؟ بین المللی J. Contemp. بیمارستان مدیریت 2018 ، 30 ، 2517–2536. [ Google Scholar ] [ CrossRef ]
- چارایرون، جی. دا-روگنا، ج. Raimbault, T. داده های بزرگ: چالشی جدید برای گردشگری. در مجموعه مقالات کنفرانس بین المللی IEEE در سال 2014 در مورد داده های بزرگ (Big Data)، واشنگتن، دی سی، ایالات متحده آمریکا، 27-30 اکتبر 2014. صص 5-7. [ Google Scholar ]
- دوایر، ال. کیم، سی. رقابت مقصد: یک مدل و عوامل تعیین کننده. Curr. تور مسائل. 2003 ، 6 ، 369-414. [ Google Scholar ] [ CrossRef ]
- گومزلج، DO; Mihalic، T. رقابتپذیری مقصد – بهکارگیری مدلهای مختلف، مورد اسلوونی. تور. مدیریت 2008 ، 29 ، 294-307. [ Google Scholar ] [ CrossRef ]
- ژونگ، ال. دنگ، ج. Xiang، B. توسعه گردشگری و مدل چرخه زندگی منطقه گردشگری: مطالعه موردی پارک جنگلی ملی Zhangjiajie، چین. تور. مدیریت 2008 ، 29 ، 841-856. [ Google Scholar ] [ CrossRef ]
- فرناندز، JIP; ریورو، MS اندازه گیری پایداری گردشگری: پیشنهادی برای یک شاخص ترکیبی. تور. اقتصاد 2009 ، 15 ، 277-296. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- Cibinskiene، A. Snieskiene، G. ارزیابی رقابت پذیری گردشگری شهر. Procedia Soc. رفتار علمی 2015 ، 213 ، 105-110. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- گارتنر. هوش تجاری (BI) – واژه نامه. 2019. در دسترس آنلاین: https://www.gartner.com/it-glossary/business-intelligence-bi/ (در 16 سپتامبر 2020 قابل دسترسی است).
- ویلیامز، اس. استراتژی هوش تجاری و تجزیه و تحلیل داده های بزرگ ؛ مورگان کافمن: کمبریج، MA، ایالات متحده آمریکا، 2016. [ Google Scholar ]
- ماریانى، م. باجو، آر. فوکس، ام. هوپکن، دبلیو. هوش تجاری و داده های بزرگ در مهمان نوازی و گردشگری: مروری بر ادبیات نظام مند. بین المللی J. Contemp. بیمارستان مدیریت 2018 ، 30 ، 3514-3554. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- صبو، م. Brasoveanu، A. Onder، I. داده های مرتبط برای تصمیم گیری بین دامنه ای در گردشگری. سرویس اینترنت J. Appl. 2015 ، 6 ، 1-13. [ Google Scholar ]
- مائده، ت. یوشیدا، م. توریمی، اف. Ohashi, H. Decision Tree Analysis of Tourists’ Regard to Tourist Attractions with using Geotag Data from Social Media. در مجموعه مقالات دومین کنفرانس بین المللی اینترنت اشیا در فضای شهری، توکیو، ژاپن، 24 تا 25 مه 2016؛ ص 61-64. [ Google Scholar ] [ CrossRef ]
- پسر، من. معجر، ع. Nus، A.; Raiber, F. استخراج و رتبه بندی نکات سفر از نظرات تولید شده توسط کاربر. در مجموعه مقالات بیست و ششمین کنفرانس بین المللی وب جهانی (WWW ’17)، پرت، استرالیا، 3 تا 7 آوریل 2017؛ کمیته راهبری کنفرانس های بین المللی وب جهانی: ژنو، سوئیس، 2017. ص 987–996. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- پنگ، ام. Tuan، SH; لیو، FC تاسیس هوش تجاری و تجزیه و تحلیل کلان داده برای آموزش عالی. در مجموعه مقالات کنفرانس بین المللی مدیریت کسب و کار و اطلاعات، پکن، چین، 16 تا 17 ژوئیه 2017. صص 121-125. [ Google Scholar ] [ CrossRef ]
- کاستلانوس، ام. گوپتا، سی. وانگ، اس. دیال، یو. دورازو، ام. بستری برای آگاهی موقعیتی در BI عملیاتی. تصمیم می گیرد. سیستم پشتیبانی 2012 ، 52 ، 869-883. [ Google Scholar ] [ CrossRef ]
- راجش کومار، جی. راداکریشنا، وی. Aljawarneh, S. کاربرد استراتژیک مدل فرآیند نرم افزار برای بهینه سازی نتایج هوش تجاری. در مجموعه مقالات کنفرانس بین المللی مهندسی و MIS، استانبول، ترکیه، 24 تا 26 سپتامبر 2015. [ Google Scholar ]
- کوهن، L. تأثیرات هوش تجاری بر سلامت جمعیت: مروری بر ادبیات سیستماتیک. در مجموعه مقالات مؤسسه دانشمندان رایانه و فناوری اطلاعات آفریقای جنوبی، تابا نچو، آفریقای جنوبی، 26 تا 28 سپتامبر 2017؛ صفحات 1-9. [ Google Scholar ] [ CrossRef ]
- عشق، م. بویزورت، سی. اوروچروتو، ای. Ibbotson, I. Nifty with Data: آیا تجزیه و تحلیل هوش تجاری که از Open Data تهیه شده است می تواند یک تکلیف خوب را تشکیل دهد؟ در مجموعه مقالات کنفرانس ACM 2016 در مورد نوآوری و فناوری در آموزش علوم کامپیوتر، آرکیپا، پرو، 9 تا 13 ژوئیه 2016؛ صص 344-349. [ Google Scholar ] [ CrossRef ]
- برنت، دی. هونر، ا. Studnicki، J. تراکنش های ترخیص از بیمارستان: یک جزء انبار داده. در مجموعه مقالات سی و سومین کنفرانس بین المللی سالانه هاوایی در علوم سیستم، مائوئی، HI، ایالات متحده آمریکا، 4 تا 7 ژانویه 2000. جلد 1، ص. 10. [ Google Scholar ] [ CrossRef ]
- موسی، جی. چیانگ، پی اچ. سیلک، تی. باولی، آر. کیتینگ، دبلیو. لیکو، بی. تسو، HC; Hoven, C. استفاده از نقشه برداری GIS به عنوان یک ابزار بهداشت عمومی – از وبا تا سرطان. سرویس سلامت بینش 2013 ، 6 ، 111-116. [ Google Scholar ] [ CrossRef ]
- مونی، اس. وسترایش، دی. السید، الف. اپیدمیولوژی در عصر داده های بزرگ. اپیدمیولوژی 2015 ، 26 . [ Google Scholar ] [ CrossRef ]
- ریزی، س. رودسری، ع. توسعه انبار داده های گزارش دهی بهداشت عمومی: درس های آموخته شده. گل میخ. فناوری سلامت آگاه کردن. 2013 ، 192 ، 861-865. [ Google Scholar ] [ CrossRef ]
- ویسنیفسکی، م. کیشکوفسکی، پ. زاگورسکی، بی. ترفند، دبلیو. سامرز، ام. واینستین، آر. توسعه یک انبار داده بالینی برای کنترل عفونت بیمارستانی. مربا. پزشکی آگاه کردن. دانشیار 2003 ، 10 ، 454-462. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- میاه، س. وو، اچ. گامک، جی. مک گراث، ام. روش تجزیه و تحلیل کلان داده برای تحلیل رفتار گردشگران. Inf. مدیریت 2016 , 54 . [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- لی، دی. دنگ، ال. Cai, Z. تجزیه و تحلیل آماری جریان توریستی در نقاط توریستی بر اساس پلت فرم داده های بزرگ و الگوریتم های DA-HKRVM. پارس محاسبات همه جا حاضر. 2019 ، 24 . [ Google Scholar ] [ CrossRef ]
- کراوچیک، ام. Xiang، Z. نقشه برداری ادراکی از مارک های هتل با استفاده از بررسی آنلاین: یک رویکرد تجزیه و تحلیل متن. Inf. تکنولوژی تور. 2015 , 16 . [ Google Scholar ] [ CrossRef ]
- علایی، ع. بکن، اس. Stantic، B. تجزیه و تحلیل احساسات در گردشگری: سرمایه گذاری بر داده های بزرگ. J. Travel Res. 2017 , 58 , 004728751774775. [ Google Scholar ] [ CrossRef ]
- تلوال، ام. تحلیل احساسات برای گردشگری. در کلان داده ها و نوآوری در گردشگری، سفر و مهمان نوازی: رویکردها، تکنیک ها و کاربردهای مدیریتی ؛ Sigala, M., Rahimi, R., Thelwall, M., Eds. Springer: سنگاپور، 2019؛ صص 87-104. [ Google Scholar ] [ CrossRef ]
- شایق، پ. دانش پور، ن. استفاده از انبار داده برای بهبود تحلیل داده های گردشگری. در مجموعه مقالات نهمین کنفرانس بین المللی تجارت الکترونیک با تمرکز بر تجارت الکترونیک، اصفهان، ایران، 16 آوریل 2015. [ Google Scholar ]
- هاپکن، دبلیو. فوکس، ام. هول، جی. کیل، دی. Lexhagen، M. مدل سازی داده های چند بعدی برای یک انبار داده مقصد گردشگری. در فناوری اطلاعات و ارتباطات در گردشگری ; Springer: Berlin/Heidelberg, Germany, 2013. [ Google Scholar ] [ CrossRef ]
- صبو، م. اوندر، من. Brasoveanu، A. شارل، الف. به سوی تصمیم گیری بین حوزه ای در گردشگری: رویکرد مبتنی بر داده های پیوندی. الکترون SSRN. J. 2015 . [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- فرموسو، AM; متئوس، ام. بیتو، من؛ Berjón, R. داده های مرتبط و دستگاه های تلفن همراه را به عنوان ابزارهای گردشگری الکترونیکی باز کنید. رویکردی عملی برای یادگیری الکترونیکی مشارکتی محاسبه کنید. هوم رفتار 2015 ، 51 ، 618-626. [ Google Scholar ] [ CrossRef ]
- چن، سیستم پشتیبانی تصمیم KC برای توسعه گردشگری: رویکرد پویایی سیستم. جی. کامپیوتر. Inf. سیستم 2004 ، 45 ، 104-112. [ Google Scholar ]
- باجو، آر. Caporarello، L. سیستم های پشتیبانی تصمیم در یک مقصد گردشگری: بررسی ادبیات و ساخت مدل. در مجموعه مقالات دومین کنفرانس itAIS فصل ایتالیایی AIS (انجمن سیستم های اطلاعاتی)، ورونا، ایتالیا، 1 تا 2 دسامبر 2005. [ Google Scholar ]
- Wöber، KW تامین اطلاعات در مدیریت گردشگری توسط سیستم های پشتیبانی تصمیم بازاریابی. تور. مدیریت 2003 ، 24 ، 241-255. [ Google Scholar ] [ CrossRef ]
- وجیراکاچورن، تی. Chongwatpol، J. کاربرد هوش تجاری در صنعت گردشگری: مطالعه موردی یک جشنواره غذای محلی در تایلند. تور. مدیریت چشم انداز 2017 ، 23 ، 75-86. [ Google Scholar ] [ CrossRef ]
- دیاکوپولوس، ن. نعمان، م. Kivran-Swaine، F. Diamonds in the Rough: تجزیه و تحلیل تصویری رسانه های اجتماعی برای تحقیق روزنامه نگاری. در مجموعه مقالات سمپوزیوم IEEE 2010 در علم و فناوری تجزیه و تحلیل بصری، سالت لیک سیتی، UT، ایالات متحده آمریکا، 24-29 اکتبر 2010. صص 115-122. [ Google Scholar ] [ CrossRef ]
- استویانوفسکی، دی. دیمیتروفسکی، آی. Madjarov، G. TweetViz: تصویرسازی داده های توییتر. در مجموعه مقالات داده کاوی و انبارهای داده، لیوبلیانا، اسلوونی، 6 اکتبر 2014. [ Google Scholar ]
- بوستامانته، ا. سباستیا، ال. Onaindia، E. آیا جاذبه های توریستی می توانند سایر فعالیت های اطراف را تقویت کنند؟ تجزیه و تحلیل داده ها از طریق شبکه های اجتماعی Sensors 2019 , 19 , 2612. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- یاسری، ت. کواترون، جی. مشهدی، ع. تحلیل زمانی الگوهای فعالیت ویراستاران در پروژه نقشه برداری مشارکتی OpenStreetMap. در مجموعه مقالات نهمین سمپوزیوم بین المللی همکاری باز (WikiSym ’13)، هنگ کنگ، چین، 7-9 اوت 2013; انجمن ماشینهای محاسباتی: نیویورک، نیویورک، ایالات متحده آمریکا، 2013. [ Google Scholar ] [ CrossRef ]
- جیلانی، م. کورکوران، پ. برتولتو، M. نمایندگی شبکه خیابانی چند دانه ای نسبت به ارزیابی کیفیت داده های OpenStreetMap. در مجموعه مقالات ششمین کارگاه بین المللی ACM SIGSPATIAL در علوم حمل و نقل محاسباتی (IWCTS ’13)، اورلاندو، FL، ایالات متحده آمریکا، 5 تا 8 نوامبر 2013. انجمن ماشینهای محاسباتی: نیویورک، نیویورک، ایالات متحده آمریکا، 2013. صص 19-24. [ Google Scholar ] [ CrossRef ]
- جوکار ارسنجانی، ج. مونی، پی. Zipf، A.; Helbich, M. An Introduction to OpenStreetMap in GIScience: Experiences, Research, Applications ; Springer: برلین/هایدلبرگ، آلمان، 2015. [ Google Scholar ]
- لوکسن، دی. Vetter، C. مسیریابی بلادرنگ با داده های OpenStreetMap. در مجموعه مقالات نوزدهمین کنفرانس بین المللی ACM SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی (GIS ’11)، شیکاگو، IL، ایالات متحده آمریکا، 1-4 نوامبر 2011. انجمن ماشینهای محاسباتی: نیویورک، نیویورک، ایالات متحده آمریکا، 2011; صص 513-516. [ Google Scholar ] [ CrossRef ]
- باومباخ، اس. روبل، سی. احمد، س. دنگل، الف. تحلیل جغرافیایی مشتری، رقیب و تامین کننده برای انتخاب سایت سوپرمارکت ها. در مجموعه مقالات دومین کنفرانس بین المللی ژئوانفورماتیک و تجزیه و تحلیل داده ها در سال 2019 (ICGDA 2019)، پراگ، جمهوری چک، 15 تا 17 مارس 2019؛ انجمن ماشینهای محاسباتی: نیویورک، نیویورک، ایالات متحده آمریکا، 2019؛ صص 110-114. [ Google Scholar ] [ CrossRef ]
- میلوت، جی. مونرو، پی. بیدری، ای. گروندین، اف. Bourdeau, G. Lookupia: یک موتور جستجوی هوشمند املاک و مستغلات برای یافتن خانههایی که موقعیت جغرافیایی مطلوبی برای دستیابی به نقاط مورد علاقه دارند. در مجموعه مقالات بیست و پنجمین کنفرانس بین المللی همکار در وب جهانی (WWW ’16 Companion)، مونترال، QC، کانادا، 11-15 آوریل 2016؛ کمیته راهبری کنفرانس های بین المللی وب جهانی: ژنو، سوئیس، 2016; صص 651-653. [ Google Scholar ] [ CrossRef ]
- سیپلوچ، بی. مونی، پی. یعقوب، ر. Winstanley، AC با استفاده از OpenStreetMap برای ارائه اطلاعات محیطی مبتنی بر مکان در ایرلند. مشخصات SIGSPATIAL 2009 ، 1 ، 17-22. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- اینمون، دبلیو. ساخت انبار داده . John Wiley & Sons, Inc.: Hoboken, NJ, USA, 2002. [ Google Scholar ]
- دل پیلار سالاس-زاراته، م. لوپز-لوپز، ای. والنسیا-گارسیا، آر. آسناک ژیل، ن. آلملا، Á. Alor-Hernández, G. مطالعه ای در مورد دسته بندی های LIWC برای نظرکاوی در بررسی های اسپانیایی. J. Inf. علمی 2014 ، 40 ، 749-760. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- گامبینو، او. کالوو، اچ. مقایسه بین دو واژگان احساسات اسپانیایی در کار تحلیل احساسات توییتر. در مجموعه مقالات بیست و پنجمین کنفرانس بین المللی همکار در وب جهانی، مونترال، QC، کانادا، 11-15 آوریل 2016؛ جلد 10022، ص 127–138. [ Google Scholar ] [ CrossRef ]
- مونی، پی. کورکوران، پ. Winstanley، AC به سمت معیارهای کیفیت برای OpenStreetMap. در مجموعه مقالات هجدهمین کنفرانس بین المللی SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی (GIS ’10)، سن خوزه، کالیفرنیا، ایالات متحده آمریکا، 3 تا 5 نوامبر 2010. انجمن ماشینهای محاسباتی: نیویورک، نیویورک، ایالات متحده آمریکا، 2010. صص 514-517. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- El-Ashmawy، KLA آزمایش دقت موقعیتی داده های OpenStreetMap برای برنامه های نقشه برداری. Geod. کارتوگر. 2016 ، 42 ، 25-30. [ Google Scholar ] [ CrossRef ]

شکل 1. تعریف مقصد در BITOUR .

شکل 2. نمای کلی فرآیند توسط BITOUR پشتیبانی می شود .

شکل 3. معماری BITOUR .

شکل 4. نمای کلی لایه تجسم.

شکل 5. پیکربندی هر دسته.

شکل 6. تجسم جغرافیایی توییت.

شکل 7. مکعب های OLAP.

شکل 8. مدت زمان اقامت، گروه بندی گردشگران بر اساس زبان.

شکل 9. توییت ها بر اساس ملیت.

شکل 10. توزیع توییت ها در حدود ده جاذبه در والنسیا.

شکل 11. هنگامی که کلیسای جامع سانتا ماریا انتخاب شده است.

شکل 12. توییت هایی از اقامتگاه های Airbnb.

شکل 13. توییت هایی از موزه ها و بناهای تاریخی.

شکل 14. توییت ها در هر دسته جذابیت و احساسات.

شکل 15. توییت ها به ازای محل اقامت و نوع POI.
بدون دیدگاه