توسعه سریع داده‌های رسانه‌های اجتماعی، از جمله عکس‌های دارای برچسب جغرافیایی، برای تحقیقات جغرافیای گردشگری مفید واقع شده است. علاوه بر این، افزایش تقاضای گردشگران برای سفرهای شخصی، محققان بیشتری را تشویق کرده است که به مدل‌های توصیه گردشگری توجه کنند. با این حال، مطالعات کمی به طور جامع محتوا و اطلاعات زمینه‌ای را که ممکن است بر دقت توصیه‌ها تأثیر بگذارد، به‌ویژه محتوای بصری جاذبه‌های گردشگری به دلیل عکس‌های برچسب‌گذاری جغرافیایی اضافی و پر سر و صدا، در نظر گرفته‌اند. بنابراین، ما یک مدل توصیه جاذبه توریستی برای عکس‌های دارای برچسب جغرافیایی فلیکر پیشنهاد می‌کنیم که جاسازی‌های مکانی، زمانی و بصری (STVE) را ترکیب می‌کند. پس از خوشه بندی فضایی و استخراج تعبیه های بصری تصاویر معرف جاذبه های گردشگری، جاسازی‌های مکانی و زمانی با استراتژی نمونه‌گیری منفی Word2Vec مدل‌سازی شده‌اند و جاسازی‌های بصری با فاکتورسازی ماتریس و رتبه‌بندی شخصی بیزی ترکیب شده‌اند. ترکیب این دو بخش مدل STVE پیشنهادی ما را تشکیل می دهد. نتایج تجربی نشان می‌دهد که مدل STVE ما از سایر مدل‌های پایه بهتر عمل می‌کند. ما همچنین حساسیت پارامتر و عملکرد جزء را برای اثبات برتری عملکرد مدل خود تجزیه و تحلیل کردیم.

کلید واژه ها:

جاذبه های گردشگری ؛ عکس های دارای برچسب جغرافیایی ؛ فاکتورسازی ماتریسی ; Word2Vec _ محتوای بصری

1. مقدمه

با ظهور عصر “وب 3.0” [ 1 ، 2 ]، نقش کاربران اینترنت از دریافت کنندگان اطلاعات صرف به تولیدکنندگان و تعامل کنندگان اطلاعات تبدیل شده است. حجم زیادی از داده های حاوی موقعیت جغرافیایی به طور خود به خود توسط کاربران تولید شده است، از جمله داده های ورود به شبکه های اجتماعی، عکس های دارای برچسب جغرافیایی و غیره. این داده ها به تدریج نقش داده های جغرافیایی جمع آوری شده به روش های سنتی در تحقیقات جغرافیا از جمله گردشگری را افزایش داده یا جایگزین کرده اند. تحقیقات جغرافیایی بر اساس آمار شورای جهانی سفر و گردشگری و سازمان جهانی گردشگری، صنعت گردشگری بیش از ده درصد از تولید ناخالص داخلی جهانی را تشکیل می دهد .]. علاوه بر این، حجم سفر سال به سال افزایش می‌یابد و نشان می‌دهد که صنعت گردشگری نقش مهمی را در اقتصاد جهانی بازی می‌کند [ 4 ]. علاوه بر افزایش مقیاس، حالت گردشگری نیز به تدریج در حال تغییر است. سفر مستقل به حالت اصلی تبدیل شده است [ 5 ]، که تقاضای گردشگران را برای سفرهای شخصی و هوشمند ایجاد کرد.
تقاضای جدید گردشگری نیز باعث تغییر منابع داده و اهداف تحقیق در جغرافیای گردشگری شده است. به طور خاص، استفاده از عکس‌های دارای برچسب جغرافیایی برای این مطالعات نیز بازتابی از سازگاری با چنین روندی است. داده‌های عکس‌های دارای برچسب جغرافیایی دارای مزایایی هستند که حاوی مقدار زیادی اطلاعات گردشگری هستند و ترجیحات واقعی گردشگران را به طور مستقیم‌تر منعکس می‌کنند [ 6 ، 7 ]. علاوه بر این، مطالعات زیادی در مورد سیستم‌های پیشنهادی جاذبه‌های توریستی پدیدار شده‌اند که با هدف پاسخگویی به تقاضای روزافزون گردشگران برای گردشگری هوشمند و شخصی‌سازی شده و حل مشکل اضافه بار اطلاعات توریستی انجام شده است .]. روش های توصیه به طور کلی به روش های مبتنی بر محتوا و فیلتر مشارکتی (CF) تقسیم می شوند. روش مبتنی بر محتوا از ویژگی های مواردی استفاده می کند که کاربران ترجیح می دهند موارد مشابه را به کاربران توصیه کنند [ 9 ]. چنین روشی در برابر مشکل شروع سرد قوی است – مشکل شروع سرد به این معنی است که سیستم توصیه به سختی می تواند توصیه های دقیقی را هنگام مواجهه با کاربران یا موارد جدید ارائه دهد [ 10 ]. با این وجود، به شدت بر ویژگی های ساختار یافته و دقیق متکی است و دقت نتیجه توصیه نسبتاً پایین است [ 11 ]. روش مبتنی بر CF بازخورد سایر کاربران را برای فیلتر کردن یا رتبه بندی موارد توصیه شده جمع آوری می کند [ 10]. از مزایای سرعت سریع و دقت بالا برخوردار است و از این رو در سیستم های توصیه به طور گسترده مورد استفاده قرار می گیرد. با این حال، نمی تواند مشکل شروع سرد و پراکندگی داده را به خوبی حل کند. می توان نتیجه گرفت که هر دو روش توصیه دارای معایبی هستند که منجر به مشکلات عدم دقت توصیه در برخی سناریوها می شود. بنابراین، روش‌های پیشنهادی ترکیبی که مزایای هر دو روش را ترکیب می‌کنند، به تدریج به یک روند تبدیل شده‌اند [ 12 ، 13 ]]. علاوه بر این، مدل‌های تعبیه‌شده در زمینه یادگیری ماشین به تدریج در تحقیق الگوریتم‌های توصیه پدید آمده و توسعه یافته‌اند. استفاده از چنین روش ساده و کارآمدی برای ادغام محتوا و اطلاعات متنی در توصیه های جاذبه توریستی به این معنی است که آنها می توانند از یکدیگر یاد بگیرند و دقت توصیه ها را بهبود بخشند.
منابع داده‌های جدید و روش‌های جدید فرصت‌های جدیدی را برای تحقیق در مورد روش‌های پیشنهادی جاذبه‌های گردشگری به ارمغان آورده‌اند، اما چالش‌هایی نیز به همراه داشته‌اند. به عنوان مثال، نحوه انتخاب و بازنمایی اطلاعات متنی و محتوایی مناسب، سوالی است که قابل تامل است، به ویژه اطلاعات بصری جاذبه های گردشگری، که نوعی اطلاعات است که به راحتی نادیده گرفته می شود و به دلیل وجود آن، استخراج آن تا حدودی دشوار است. عکس های پر سر و صدا و اضافی در عکس های دارای برچسب جغرافیایی. بنابراین، ما یک مدل توصیه جاذبه گردشگری را پیشنهاد می‌کنیم که جاسازی‌های مکانی، زمانی و بصری (STVE) را برای عکس‌های دارای برچسب جغرافیایی ترکیب می‌کند. ما از عکس‌های دارای برچسب جغرافیایی فلیکر به عنوان مجموعه داده برای اعتبارسنجی مدل خود استفاده می‌کنیم. مدل STVE پس از چند مرحله پیش پردازش ساخته شده است و عمدتاً از دو بخش تشکیل شده است: جاسازی اطلاعات محدودیت زمانی و مکانی و جاسازی اطلاعات بصری. جاسازی اطلاعات محدودیت زمانی و مکانی توسط استراتژی نمونه گیری منفی Word2Vec به دست می آید. سپس، از فاکتورسازی ماتریس و رتبه‌بندی شخصی بیزی استفاده می‌کنیم و جاسازی‌های نتایج تصاویر نماینده بالا را ترکیب می‌کنیم تا تعامل بین کاربر و جاسازی بصری را به دست آوریم. برای آموزش و به روز رسانی پارامترها از روش صعود گرادیان استفاده می شود. مقایسه با چندین روش توصیه دیگر نشان می دهد که STVE نتایج بهتری در شاخص های کیفیت توصیه و رتبه بندی دارد. این آزمایش همچنین تجزیه و تحلیل می کند که چگونه مؤلفه ها و پارامترهای اصلی STVE بر نتایج توصیه ها تأثیر می گذارد. مشارکت های اصلی مطالعه ما در زیر خلاصه می شود: جاسازی اطلاعات محدودیت زمانی و مکانی توسط استراتژی نمونه گیری منفی Word2Vec به دست می آید. سپس، از فاکتورسازی ماتریس و رتبه‌بندی شخصی بیزی استفاده می‌کنیم و جاسازی‌های نتایج تصاویر نماینده بالا را ترکیب می‌کنیم تا تعامل بین کاربر و جاسازی بصری را به دست آوریم. برای آموزش و به روز رسانی پارامترها از روش صعود گرادیان استفاده می شود. مقایسه با چندین روش توصیه دیگر نشان می دهد که STVE نتایج بهتری در شاخص های کیفیت توصیه و رتبه بندی دارد. این آزمایش همچنین تجزیه و تحلیل می کند که چگونه مؤلفه ها و پارامترهای اصلی STVE بر نتایج توصیه ها تأثیر می گذارد. مشارکت های اصلی مطالعه ما در زیر خلاصه می شود: جاسازی اطلاعات محدودیت زمانی و مکانی توسط استراتژی نمونه گیری منفی Word2Vec به دست می آید. سپس، از فاکتورسازی ماتریس و رتبه‌بندی شخصی بیزی استفاده می‌کنیم و جاسازی‌های نتایج تصاویر نماینده بالا را ترکیب می‌کنیم تا تعامل بین کاربر و جاسازی بصری را به دست آوریم. برای آموزش و به روز رسانی پارامترها از روش صعود گرادیان استفاده می شود. مقایسه با چندین روش توصیه دیگر نشان می دهد که STVE نتایج بهتری در شاخص های کیفیت توصیه و رتبه بندی دارد. این آزمایش همچنین تجزیه و تحلیل می کند که چگونه مؤلفه ها و پارامترهای اصلی STVE بر نتایج توصیه ها تأثیر می گذارد. مشارکت های اصلی مطالعه ما در زیر خلاصه می شود: ما از فاکتورسازی ماتریس و رتبه‌بندی شخصی بیزی استفاده می‌کنیم و جاسازی‌های نتایج تصاویر نماینده بالا را برای به دست آوردن تعامل بین کاربر و جاسازی بصری ترکیب می‌کنیم. برای آموزش و به روز رسانی پارامترها از روش صعود گرادیان استفاده می شود. مقایسه با چندین روش توصیه دیگر نشان می دهد که STVE نتایج بهتری در شاخص های کیفیت توصیه و رتبه بندی دارد. این آزمایش همچنین تجزیه و تحلیل می کند که چگونه مؤلفه ها و پارامترهای اصلی STVE بر نتایج توصیه ها تأثیر می گذارد. مشارکت های اصلی مطالعه ما در زیر خلاصه می شود: ما از فاکتورسازی ماتریس و رتبه‌بندی شخصی بیزی استفاده می‌کنیم و جاسازی‌های نتایج تصاویر نماینده بالا را برای به دست آوردن تعامل بین کاربر و جاسازی بصری ترکیب می‌کنیم. برای آموزش و به روز رسانی پارامترها از روش صعود گرادیان استفاده می شود. مقایسه با چندین روش توصیه دیگر نشان می دهد که STVE نتایج بهتری در شاخص های کیفیت توصیه و رتبه بندی دارد. این آزمایش همچنین تجزیه و تحلیل می کند که چگونه مؤلفه ها و پارامترهای اصلی STVE بر نتایج توصیه ها تأثیر می گذارد. مشارکت های اصلی مطالعه ما در زیر خلاصه می شود: مقایسه با چندین روش توصیه دیگر نشان می دهد که STVE نتایج بهتری در شاخص های کیفیت توصیه و رتبه بندی دارد. این آزمایش همچنین تجزیه و تحلیل می کند که چگونه مؤلفه ها و پارامترهای اصلی STVE بر نتایج توصیه ها تأثیر می گذارد. مشارکت های اصلی مطالعه ما در زیر خلاصه می شود: مقایسه با چندین روش توصیه دیگر نشان می دهد که STVE نتایج بهتری در شاخص های کیفیت توصیه و رتبه بندی دارد. این آزمایش همچنین تجزیه و تحلیل می کند که چگونه مؤلفه ها و پارامترهای اصلی STVE بر نتایج توصیه ها تأثیر می گذارد. مشارکت های اصلی مطالعه ما در زیر خلاصه می شود:
  • با توجه به مشکلات شروع سرد مدل‌های مبتنی بر CF و مشکلات دقت پایین مدل‌های مبتنی بر محتوا، ما یک مدل توصیه ترکیبی برای جاذبه‌های توریستی پیشنهاد می‌کنیم که جاسازی‌های مکانی، زمانی و بصری (STVE) را با هم ترکیب می‌کند.
  • ما تابع هدف Skip-gram را برای مدل‌سازی عوامل متوالی در STVE تغییر می‌دهیم، که از ویژگی‌های Skip-gram استفاده می‌کند که داده‌های متوالی را به خوبی مدیریت می‌کند و بیشتر با سناریوی پیشنهادی واقعی جاذبه‌های توریستی مطابقت دارد.
  • با توجه به مشکلاتی که عکس‌های نویزدار و زائد ممکن است تأثیر بدی بر استخراج جاسازی‌های بصری داشته باشند و نتایج توصیه‌ها، چارچوبی را پیشنهاد می‌کنیم که می‌تواند به طور خودکار عکس‌های نویزدار و زائد را حذف کند و تصاویر معرف را برای استخراج جاسازی‌های بصری جاذبه‌های گردشگری انتخاب کند. برای استفاده بیشتر
ادامه مقاله به شرح زیر تدوین شده است. بخش 2 کار مرتبط در مورد توصیه های جاذبه گردشگری برای داده های رسانه های اجتماعی را بررسی می کند. بخش 3 چارچوب مقدماتی و کلی مطالعه را معرفی می کند که شامل جمع آوری داده ها، پیش پردازش داده ها و مراحل ساخت و آموزش مدل می شود. بخش 4 عملکرد را در مقایسه با روش های دیگر، تجزیه و تحلیل حساسیت پارامتر، و مطالعه مولفه ای ارائه می دهد. بخش 5 این مقاله را خلاصه می کند و مطالعه بیشتر را مورد بحث قرار می دهد.

2. کارهای مرتبط

توصیه جاذبه توریستی را می توان به عنوان یک نوع تحقیق توصیه مکان در نظر گرفت. مشابه روش های توصیه در زمینه های دیگر، روش های توصیه مکان برای داده های رسانه های اجتماعی از روش های مبتنی بر محتوا و CF تشکیل شده است. با این وجود، با توسعه تکنیک‌های سیستم توصیه، تعداد فزاینده‌ای از روش‌ها با ترکیب هر دو روش، ترکیب زمینه و محتوا در CF، یا ترکیب روش‌های پیشرفته یادگیری ماشین بهبود می‌یابند. چنین روش‌هایی را دیگر نمی‌توان به روش‌های مبتنی بر محتوا یا CF طبقه‌بندی کرد و در مجموع به عنوان روش‌های ترکیبی شناخته می‌شوند. انتخاب اطلاعات زمینه‌ای و محتوایی برای این روش‌ها به موضوعی بی‌اهمیت در تحقیقات توصیه‌های مکان تبدیل شده است.
با توجه به اطلاعات زمینه ای در روش های توصیه مکان، اطلاعات متوالی یکی از اطلاعات رایج در نظر گرفته شده است. به طور کلی بر اساس مدل مارکوف و تغییرات آن مدل‌سازی می‌شود، که احتمال را محاسبه می‌کند و با توجه به ماتریس انتقال از یک مکان به مکان دیگر، توصیه‌هایی ارائه می‌کند [ 14 ، 15 ، 16 ]. در سال‌های اخیر، بسیاری از محققان از روش‌های جاسازی برای مدل‌سازی اطلاعات متوالی به دلیل روش‌های جاسازی استفاده کردند. به عنوان مثال، زی و همکاران. انتقال از یک نقطه مورد علاقه (POI) به نقطه دیگر را با جاسازی شبکه اطلاعات بزرگ (LINE) [ 17 ] آموخت و جاسازی هر POI را برای توصیه POI بعدی ایجاد کرد [ 18 ]]. ژائو و همکاران از Skip-Gram برای مدلسازی مسیر بازدید از POI استفاده کرد [ 19 ]. سایر اطلاعات زمینه ای مهم فاصله جغرافیایی است، زیرا یکی از ویژگی های معمول توصیه مکان این است که توسط فاصله جغرافیایی محدود می شود. در مطالعات قبلی دو راه اصلی برای مدل‌سازی محدودیت‌های فاصله جغرافیایی وجود داشت. یکی ایجاد یک رابطه معکوس ساده بین ترجیح کاربر و فاصله جغرافیایی بین مکان‌ها، به عنوان مثال، تابع قانون قدرت [ 20 ، 21 ]، مدل گاوسی [ 22 ، 23 ] و دیگر توابع معکوس [ 24 ] است.]. دیگری تعیین فاصله قطع است، و آن مکان هایی که فاصله آنها از مکان بازدید فعلی بزرگتر از فاصله قطع است، فیلتر می شوند [ 15 ، 19 ]. به غیر از عوامل ترتیبی و جغرافیایی، عوامل دیگری نیز در تحقیق توصیه مکان در نظر گرفته شده است، از جمله عوامل زمانی [ 25 ، 26 ]، دسته بندی مکان ها [ 27 ] و غیره. مطالعات فوق یک یا دو عامل را در خود در نظر گرفتند. مدل‌های پیشنهادی، اما تعداد کمی از آنها عوامل مختلفی را که ممکن است بر دقت توصیه‌ها تأثیر بگذارد، به طور کامل ادغام کرده‌اند.
اطلاعات محتوا شامل ویژگی های کاربر [ 28 ، 29 ، 30 ]، برچسب ها [ 31 ، 32 ] و اطلاعات بصری است. اطلاعات بصری به دلیل دشواری استخراج اطلاعات بصری دقیق و محتوای بصری پر سر و صدا در عکس های تولید شده توسط کاربر، نسبتا کمتر مورد توجه قرار می گیرند. برخی از محققین برای استخراج اطلاعات بصری از Scale-Invariant Feature Transform (SIFT) یا هیستوگرام های رنگی استفاده کردند [ 33 ، 34]، اما این ویژگی های دست ساز دقت استخراج اطلاعات بصری را تا حد زیادی محدود می کند. ظهور شبکه عصبی Convolutional نمایش اطلاعات بصری را تا حد زیادی بهبود می بخشد و در روش های توصیه با محتوای بصری استفاده شده است [ 21 ، 35 ]. با این حال، عدم تعادل تعداد عکس‌ها در هر جاذبه گردشگری و نویز و اضافه بودن عکس‌ها همچنان بر بازنمایی اطلاعات بصری تأثیر می‌گذارد. دقت توصیه صرفاً استفاده از روش های توصیه مبتنی بر محتوای بصری نسبتاً پایین است و ترکیب با سایر اطلاعات زمینه ای هنوز مورد نیاز است.

3. روش شناسی

3.1. مقدماتی و چارچوب

قبل از اینکه مجموعه داده ها و روش های خود را معرفی کنیم، برخی از اصطلاحات باید برای درک بهتر بیان شوند:

تعریف 1 (عکس دارای برچسب جغرافیایی).

عکس دارای برچسب جغرافیایی عکسی است که اطلاعات موقعیت مکانی آن توسط کاربران گرفته شده است و به صورت نمایش داده می شود پ. هر عکس حاوی کد شناسایی است مند، زمان صرف شده تی، مختصات گرفته شده g، کاربر تو،و مجموعه تگ پیوست شده ایکس.

تعریف 2 (مجموعه عکس).

مجموعه عکس تمام عکس های دارای برچسب جغرافیایی در منطقه مورد مطالعه در یک زمان معین است که به صورت نشان داده شده است پ={پ1،پ2،…،پ|پ|}.

تعریف 3 (مکان معنایی).

مکان معنایی مکانی است با معنایی منحصر به فرد استخراج شده توسط خوشه بندی فضایی، که به صورت نمایش داده می شود ل. در مطالعه ما، مکان معنایی استخراج شده یک جاذبه گردشگری است.

تعریف 4 (بازدید).

بازدید به معنای بازدید کاربر از یک جاذبه گردشگری در یک زمان و مکان معین است که به صورت نمایش داده می شود v=(ل،تو،تی،پل،تو،تی). پل،تو،تینشان دهنده مجموعه عکسی است که کاربر دارد تودر هنگام بازدید از جاذبه گردشگری گرفته شده است لدر زمان تی.

تعریف 5 (مسیر بازدید کاربر).

مسیر بازدید کاربر مسیری است که تمام بازدیدهای کاربر را به ترتیب زمانی ثبت می کند که به صورت نمایش داده می شود. تیتومن=[vمن1،vمن2،…،vمن|تیتومن|].
شکل 1 چارچوب کلی مطالعه ما، از جمله مراحل پیش پردازش و مراحل ساخت مدل را نشان می دهد. هر مرحله به طور مفصل در بخش های بعدی توضیح داده شده است.

3.2. مجموعه داده ها و حوزه مطالعاتی

ما از یاهو فلیکر کریتیو کامانز 100 میلیون داده (YFCC100M) [ 36 ] به عنوان مجموعه داده آزمایشی استفاده می‌کنیم، زیرا می‌توان آن را به راحتی از سرویس‌های وب آمازون (AWS) دانلود کرد و می‌تواند مقدار کافی از داده‌های عکس دارای برچسب جغرافیایی را ارائه دهد. علاوه بر این، منک و همکاران. خلاصه کرد که اکثر مطالعات قبلی مرتبط با توصیه گردشگری نیز از داده های فلیکر [ 37 ] استفاده کردند که نشان دهنده کاربرد آن در تحقیقات گردشگری است. ویژگی‌های هر عکسی که ما عمدتاً استفاده می‌کنیم شامل شناسه هر عکس دارای برچسب جغرافیایی، شناسه کاربر، زمان ثبت، طول و عرض جغرافیایی، برچسب‌های کاربر و خود تصاویر است.
عکس‌های دارای برچسب جغرافیایی که مختصات آن‌ها در منطقه مورد مطالعه محدود شده و در مدت زمان مشخصی گرفته شده‌اند را انتخاب می‌کنیم و توکیو به عنوان منطقه مطالعه برای ارزیابی مدل ما انتخاب می‌شود. توکیو پایتخت ژاپن است که شهر توریستی معروفی نیز هست. در سال 2018، تعداد گردشگران ورودی به توکیو تقریباً 14.24 میلیون نفر و هزینه گردشگران ورودی در توکیو حدود 1.19 تریلیون ین بود [ 38 ]. شکل 2 توزیع فضایی عکس های فلیکر را در توکیو نشان می دهد. در آزمایش زیر از 145397 عکس محدود شده در توکیو و آپلود توسط 2750 کاربر استفاده شد.

3.3. پیش پردازش داده ها

قبل از ساخت مدل STVE، برخی مراحل پیش پردازش، از جمله خوشه بندی فضایی جاذبه های توریستی، به دست آوردن تعبیه بصری هر جاذبه گردشگری، و ساخت مسیر بازدید کاربر مورد نیاز است.

3.3.1. خوشه بندی فضایی جاذبه های گردشگری

از آنجایی که اطلاعات مکان به صورت طول و عرض جغرافیایی در مجموعه داده خام فلیکر نشان داده می شود، خوشه بندی عکس های دارای برچسب جغرافیایی و به دست آوردن جاذبه های گردشگری ضروری است. ما از روش خوشه‌بندی در مطالعه قبلی خود پیروی کردیم، یعنی روش خوشه‌بندی با در نظر گرفتن فاصله مکانی و معنایی، که ثابت کرده است برای خوشه‌بندی جاذبه‌های توریستی ریز دانه در منطقه متراکم عکس‌ها مؤثر است [ 39 ]. نود و نه جاذبه گردشگری پس از خوشه بندی در توکیو به دست آمد و بیشتر آنها در چو کو، میناتو کو و چیودا کو هستند. برخی در شکل 3 نشان داده شده اند ، از جمله برج توکیو ( شکل 3 ب)، بازار تسوکیجی ( شکل 3 i)، گینزا ( شکل 3 l)، کاخ امپراتوری (شکل 3)شکل 3 متر) و غیره
3.3.2. استخراج تعبیه بصری

پس از خوشه‌بندی، ما از یک مدل رتبه‌بندی عمیق از پیش آموزش‌دیده برای به دست آوردن بازنمایی بصری جاسازی هر جاذبه گردشگری استفاده کردیم. مدل رتبه بندی عمیق یک مدل مبتنی بر کانولوشن است که هدف آن بازیابی تصویر با شباهت بصری ریز است [ 40 ]]. هر عکس را در مدل رتبه بندی عمیق وارد کنید و یک جاسازی با ابعاد 2048 بدست خواهید آورد. لازم به ذکر است که تعداد عکس‌های هر جاذبه گردشگری یکسان نیست و برخی عکس‌ها هستند که محتوای بصری آن‌ها ارتباطی با جاذبه گردشگری ندارد (مثلاً سلفی). بنابراین، محاسبه مقادیر جاسازی همه عکس‌ها و گرفتن میانگین برای نمایش تعبیه هر جاذبه گردشگری مناسب نیست. برای به دست آوردن یک نمایش بصری دقیق تر، دو پیشرفت انجام دادیم. ابتدا، قبل از وارد شدن عکس‌ها به مدل رتبه‌بندی عمیق، دو نوع عکس پر سر و صدا را فیلتر کردیم: عکس‌هایی که محتوای آن‌ها عمدتاً توسط افراد اشغال شده است، توسط یک مدل آشکارساز چند جعبه تک‌شات (SSD) شناسایی و حذف می‌شوند [ 41 ].]، و عکس‌هایی که عمدتاً اشیاء را نشان می‌دهند، توسط پرسپترون چندلایه که توسط مجموعه داده Caltech 101 [ 42 ] و مجموعه داده Places2 از قبل آموزش داده شده است، فیلتر می‌شوند . دوم، پس از به دست آوردن تعبیه‌های عکس‌های باقی‌مانده از مدل‌های رتبه‌بندی عمیق، فاصله اقلیدسی هر تعبیه را از همه جاسازی‌های دیگر محاسبه کرده و آنها را به ترتیب صعودی مرتب می‌کنیم. اگر فاصله بین دو جاسازی کم باشد، محتوای بصری دو عکس مربوطه مشابه است. بنابراین، اگر فاصله یک جاسازی بین همه جاسازی‌های دیگر کم باشد، محتوای بصری این عکس نسبتاً معمولی و معرف است. برای هر جاذبه توریستی، میانگین بالا را محاسبه کردیم nتعبیه‌هایی با کمترین فاصله از سایر تعبیه‌ها و نتیجه به‌عنوان تعبیه بصری این جاذبه گردشگری به‌صورت زیر استفاده می‌شود. ه¯لj:

ه¯لj=∑ک=1nهلjکn

جایی که هلjکنشان دهنده ک-ام تعبیه در بالا nلیستی از j-ام جاذبه توریستی، و ما مجموعه nبه عنوان 50 در این مطالعه. تعبیه بصری هر جاذبه گردشگری در مدل توصیه ادغام شد.

3.3.3. ساخت مسیر بازدید کاربر
ساخت مسیر بازدید کاربر مورد نیاز است تا داده های آموزشی مدل STVE باشد. برخلاف Foursquare یا دیگر داده‌های اعلام حضور در رسانه‌های اجتماعی که می‌توانند سوابق ورود کاربر را به ترتیب زمانی به یکدیگر متصل کنند تا مسیر بازدید کاربر باشد، کاربر عکس‌های دارای برچسب جغرافیایی ممکن است هنگام بازدید از یک جاذبه گردشگری در مدت زمان کوتاهی بیش از یک عکس بگیرد. همانطور که در سه عکس نشان داده شده است ل2در شکل 4 ). مشکل اجتناب‌ناپذیر دیگر این است که برخی از عکس‌ها به دلیل ماهیت خوشه‌بندی مبتنی بر تراکم همراه با نویز، نمی‌توانند در هر جاذبه گردشگری دسته‌بندی شوند. بنابراین، ما یک آستانه زمانی تعیین می کنیم Δتیو یک آستانه فاصله Δدمنسبرای قضاوت در مورد اینکه آیا عکس های گرفته شده در زمان مجاور باید در همان بازدید ادغام شوند یا خیر. عکس‌های هر کاربر را به ترتیب زمانی مرتب کنید، از اولین عکس‌ها شروع کنید و آنها را مرور کنید. اگر عکس فعلی و عکس بعدی در یک جاذبه قرار گرفته باشند و فاصله زمان عکسبرداری آنها کمتر از Δتی، آنها را به عنوان همان بازدید ادغام کنید. اگر حداقل یکی از عکس های فعلی و عکس بعدی خوشه ای نیست، قضاوت کنید که آیا فاصله زمانی عکسبرداری کمتر از Δتیو فاصله دو عکس کمتر از Δدمنس. اگر هر دو درست هستند، آنها را به عنوان یک بازدید ادغام کنید. پس از ساخت مسیر بازدید کاربر، کاربرانی را که بیش از چهار جاذبه بازدید نکرده اند حذف می کنیم و تعداد نهایی مسیرها (کاربران) 1801 است. ما 80٪ قبلی هر مسیر را به عنوان داده های آموزشی و 20٪ باقی مانده را به عنوان داده های آزمون ارزیابی نهایی انتخاب می کنیم.

3.4. توصیف و بهینه سازی مدل

در بخش زیر، مدل STVE خود را شامل بخش جاسازی مکانی-زمانی، بخش تعبیه بصری و بهینه‌سازی مدل توصیف می‌کنیم. ساختار STVE و ارتباط بین مراحل پیش پردازش در شکل 5 نشان داده شده است ، و برخی از نمادهای مهم در مدل STVE در جدول 1 فهرست شده اند .

3.4.1. جاسازی مکانی – زمانی

ما ابتدا ویژگی‌های متوالی مسیرهای بازدید گردشگران را با اصل Skip-gram مدل‌سازی کردیم، زیرا Skip-gram، به عنوان نوعی روش Word2Vec، به خوبی می‌تواند داده‌های متوالی مانند جملات را مدیریت کند. تابع هدف Skip-gram به حداکثر رساندن احتمال کلمات متنی با توجه به کلمه مرکزی است که به صورت زیر نمایش داده می شود:

Γ=∏wتی|سی|∏تی-ک≤من≤تی+کپ(wمن|wتی)

جایی که سیکل مجموعه آموزشی را نشان می دهد و wمنبیانگر کلمه متنی از wتیدر اندازه پنجره ک. هر دو wتیو wمنمتعلق به بدنه سی. ما یک کاربر از مسیر را به عنوان یک جمله و هر جاذبه گردشگری در مسیر را به عنوان هر کلمه در نظر می گیریم. با تابع هدف Skip-gram، جاذبه های توریستی متنی را با توجه به جاذبه های مرکز در مسیر استنتاج می کنیم. با این حال، در سناریوی جملات زبان طبیعی، استراتژی انتخاب کلمه متنی Word2Vec بدون جهت است، در حالی که در سناریوی توصیه جاذبه توریستی، پیش بینی جاذبه بعدی با توجه به جاذبه بازدید شده فعلی، بیشتر با وضعیت واقعی مطابقت دارد. به این ترتیب، احتمال شرطی را به عنوان معادله (3) تغییر می دهیم:

ℒ=∑تیتومن∈تی1|تیتومن|∑لک،لک+1∈تیتومنورود به سیستمپ(لک+1|لک)

جایی که تیکل مسیرهای بازدید همه کاربران را نشان می دهد. لکو لک+1نماینده ک-ام و (ک+1)- بازدید از جاذبه های گردشگری از مسیرهای متعلق به کاربر تومنبه ترتیب و ک=1،2،…،|تیتومن|-1. پ(لک+1|لک)نشان دهنده احتمال شرطی از لکبه لک+1. معادله (3) مشابه هدف آموزش جمله Word2Vec، این احتمالات شرطی را در کل مجموعه داده به حداکثر می رساند. تی.

جدا از تأثیر ویژگی های متوالی، زمان روز نیز ممکن است بر انتخاب بازدیدکنندگان از جاذبه های بازدیدکننده توسط کاربران تأثیر بگذارد. نقشه گرمایی در شکل 6 الگوهای بازدید کاربران از پنجاه جاذبه توکیو را در ساعات مختلف در یک روز نشان می دهد. مشاهده می شود که الگوهای بازدید از جاذبه های گردشگری مختلف یکسان نیست. به عنوان مثال، ساعات بازدید از دو جاذبه اول (ID 0 و 1) در شکل 6 بین 10 صبح تا 4 بعد از ظهر متمرکز شده است، در حالی که برخی از جاذبه های گردشگری (مانند ID 43 و 44) به طور مجزا بین ساعت 11 صبح تا 10 شب توزیع شده اند. بنابراین، مدل توصیه را باید تأثیر زمان روز نیز در نظر گرفت.

فرض کنید سناریوی پیشنهادی هدف، استنتاج محتمل‌ترین جاذبه‌های بازدید با توجه به جاذبه‌های بازدید قبلی و زمان فعلی است، معادله اضافه کردن عامل زمانی بر اساس رابطه (3) را می‌توان به صورت زیر فرمول‌بندی کرد:

ℒ=∑تیتومن∈تی1|تیتومن|∑(لک،لک+1)∈تیتومنورود به سیستمپ(لک+1|لک،تیک+1)

جایی که تیک+1نشان دهنده زمان آن کاربر است تومنبازدید کرد (ک+1)-مین جاذبه گردشگری ما زمان روز را به مقادیر صحیح از 0 تا 23 ترسیم می کنیم تا از مشکلات مربوط به شکاف های زمانی زیاد و پراکندگی داده ها جلوگیری کنیم. به عنوان مثال، اگر کاربر بین ساعت 8 صبح تا 9 صبح از یک جاذبه گردشگری بازدید کند (بدون احتساب ساعت 9 صبح)، زمان بازدید به 8 نشان داده می شود.

تابع SoftMax برای تعریف احتمال شرطی استفاده می شود پ(لک+1|لک،تیک+1)و آموزش عوامل نهفته از لک، لک+1و تیک+1(مشخص می شود vلک، vلک+1و vتیک+1، به ترتیب). دو نماد v^جتیو v^nبرای توضیح بهتر معرفی می شوند و به شرح زیر تعریف می شوند: v^جتی=vلک⊕vتیک+1، v^n=vلک+1⊕vلک+1، جایی که ⊕عملگر الحاق را نشان می دهد. محصول درونی از v^جتیو v^nرا می توان به صورت زیر نشان داد: v^n⋅v^جتی=vلک⋅vلک+1+vتیک+1⋅vلک+1. سپس پ(لک+1|لک،تیک+1)را می توان به صورت زیر فرموله کرد:

پ(لک+1|لک،تیک+1)=انقضا(v^n⋅v^جتی)∑لک∈Lانقضا(v^n⋅v^جتی)

با این حال، هزینه محاسبه معادله (5) به دلیل تابع SoftMax غیرعملی بالا است. بنابراین، روش نمونه گیری منفی به عنوان یک الگوریتم تقریبی کارآمد محاسباتی در رابطه (4) به کار گرفته شده است. بنابراین، معادله (4) را می توان به معادله (6) تبدیل کرد:

ℒ=∑تیتومن∈تی1|تیتومن|∑لک،لک+1∈تیتومن(ورود به سیستمσ(v^n⋅v^جتی)+∑(لک،لnه)∉تیتومنکnهورود به سیستم(1-σ(v^nه⋅v^جتی)))

جایی که σ(ایکس)تابع سیگموئید است. لnهنشان دهنده جاذبه های نمونه منفی و کnهتعداد نمونه های منفی است. به دلیل محدودیت فواصل مکانی، گردشگران ممکن است یک جاذبه گردشگری نزدیک به جاذبه گردشگری فعلی را ترجیح دهند. به عبارت دیگر، گردشگران کمتر یک جاذبه گردشگری دور از جاذبه فعلی را انتخاب می کنند. بنابراین، این ایده محدودیت فاصله فضایی را به فرآیند نمونه گیری منفی معرفی می کنیم، یعنی نمونه های منفی به طور تصادفی انتخاب نمی شوند، بلکه از جاذبه هایی انتخاب می شوند که فاصله آنها با جاذبه بازدیدکننده فعلی بزرگتر از آستانه فاصله از پیش تعریف شده است. مجموعه نمونه های منفی را می توان به صورت معادله (7) فرموله کرد:

Lnهg={لnهg∈L\لک+1:دمنس(لک،لnهg)≥Δدمنس}

جایی که Δدمنسیک آستانه فاصله از پیش تعریف شده است. جایگزین Lnهبا Lnهgدر معادله (6)، و نمایش نهایی تعبیه مکانی-زمانی را می توان به صورت زیر نشان داد:

ℒاستی=∑تیتومن∈تی1|تیتومن|∑لک،لک+1∈تیتومن(ورود به سیستمσ(v^n⋅v^جتی)+∑(لک،لnهg)∉تیتومنکnهورود به سیستم(1-σ(v^nه⋅v^جتی)))
3.4.2. جاسازی بصری

همانطور که در بالا تحلیل شد، عامل بصری نیز یکی از عوامل اساسی است که بر تصمیم گردشگران برای انتخاب جاذبه های گردشگری تاثیر می گذارد. بنابراین، مدل توصیه باید با اطلاعات بصری ترکیب شود. روشن شده توسط ویژوال بیزی رتبه بندی شخصی (VBPR) پیشنهاد شده توسط او و همکاران. [ 44 ]، ما همچنین سعی می‌کنیم تعبیه‌های بصری جاذبه‌های توریستی را با فاکتورسازی ماتریسی و رتبه‌بندی شخصی بیزی ترکیب کنیم. فاکتورسازی ماتریسی “کاربران-جاذبه های توریستی” را می توان به صورت زیر ایجاد کرد:

ℒ=vتومن·vلj

جایی که vتومنتعبیه کاربر است من، و vلjتعبیه جاذبه گردشگری است j. ابعاد آنها هر دو است f2. ما از محصول درونی تعبیه بصری استفاده می کنیم ه¯لjتولید شده در بخش 3.3 و یک ماتریس پارامتر دبلیوتولنشان دادن vلj:

vلj=دبلیوتول·ه¯لj

جایی که دبلیوتولهست یک f2×fهماتریس پارامتر و fهتعداد ابعاد برای تعبیه بصری است ه¯لj(2048 همانطور که در بالا ذکر شد). جایگزین vلjبا معادله (10) و اصطلاح سوگیری را بیشتر معرفی کنید βدر معادله (9)، نمایش تعبیه بصری را می توان به صورت زیر فرمول بندی کرد:

ℒV=vتومن·(دبلیوتول·ه¯لj)+β·ه¯لj

بهینه سازی کنید ℒVبا VBPR، که فرض می کند کاربر این جاذبه را بر سایر جاذبه ها ترجیح می دهد. به طور تصادفی نمونه منفی را انتخاب کنید لnه”. فرض کنید تعداد نمونه های منفی است کnه”، سپس ℒVرا می توان به صورت زیر فرموله کرد:

ℒV=∑1کnه”vتومن·(دبلیوتول·(ه¯لj-ه¯لnه”))+β·(ه¯لj-ه¯لnه”)

برای کل مجموعه داده آموزشی، ترجیح بصری کاربران برای جاذبه های گردشگری را می توان به صورت معادله (13) مدل کرد:

ℒV=∑تیتومن∈تی1|تیتومن|∑لک∈تیتومن∑1کnه”vتومن·(دبلیوتول·(ه¯لj-ه¯لnه”))+β·(ه¯لj-ه¯لnه”)
3.4.3. یادگیری مدل

ما معادله (8) را با معادله (13) با روش جمع وزنی خطی و تابع هدف مدل STVE پیشنهادی که اطلاعات مکانی، زمانی و بصری را ترکیب می‌کند، ترکیب می‌کنیم که به صورت زیر فرموله می‌شود:

θ=argmaxθ(α·ℒاستی+(1-α)·ℒV)

جایی که θمجموعه پارامتری است که می تواند مقدار را به حداکثر برساند (α·ℒاستی+(1-α)·ℒV)از طریق آموزش، و θ={VL،Vن،Vتی،VU،دبلیوتول،β}. vلک، vلک+1، vتیک+1، و vتومننشان داده شده در معادله بخش 3.4.1 و بخش 3.4.2 متعلق به جاسازی زیرنویس مربوطه در ماتریس است. VL، Vن، Vتی، و VU، به ترتیب. αپارامتر خطی برای کنترل وزن است ℒاستیو ℒV، و در این آزمایش آن را 0.7 قرار دادیم.

جزئیات فرآیند یادگیری STVE در الگوریتم 1 نشان داده شده است. ورودی آموزش STVE شامل مجموعه داده های آموزشی است. تیو مجموعه پارامترها θ. برای به‌روزرسانی پارامترها، از شیب صعود دسته‌ای کوچک استفاده می‌کنیم و پارامتر نسبت را تنظیم می‌کنیم. ببه عنوان 0.5. دوران آموزش است مترآایکس_هپoجساعت، و η1و η2میزان یادگیری هستند ℒاستیو ℒV، به ترتیب. Δدمنسپارامتر آستانه فاصله قطع است. ابتدا تمام پارامترها را با توزیع نرمال مقداردهی کنید (خط 1) و فرمول به روز رسانی پارامترها به شرح زیر است:

θتی+1=θتی+η·∂ℒ(θ)∂θ

جایی که ηمیزان یادگیری است. به روز رسانی vتیک+1، vلکو vلک+1برای بالای هر کاربر ( |تیتوj|-1) جاذبه های بازدید شده (خط 6 تا 9)، و انتخاب کنید کnهنمونه های منفی از Lnهgبرای به روز رسانی vتیک+1، vلکو vلمتر(خط 10 تا 14)، که فرآیند به روز رسانی پارامترها در ℒاستیبخش در مورد ℒVبخش، ما تعریف می کنیم ایکس^تومنلکلnمانند:

ایکس^تومنلکلn=ایکس^تومنلک-ایکس^تومنلn=vتومن·(دبلیوتول·(ه¯لک-ه¯لn))+β·(ه¯لک-ه¯لn)

جایی که ایکس^تومنلکلnو ایکس^تومنلnبا معادله (11) تعریف می شوند. به روز رسانی vتومن، βو دبلیوتولبا VBPR (خط 17 تا 20):

∑(تومن،لj،لک)∈تیلn σ(ایکس^تومنلjلک)-λθ||θ||2

جایی که λθپارامتر منظم سازی است. در اینجا تنظیم کردیم vتومن، βو دبلیوتولبه عنوان همان مقدار λ.

الگوریتم 1: مدل STVE
ورودی: تی-مجموعه داده؛ θ={VL،Vن،Vتی،VU،دبلیوتول،β}; مترآایکس_هپoجساعت-تعداد دوره؛ ب-نسبت اندازه دسته η1-نرخ یادگیری از ℒاستی; η2-نرخ یادگیری از ℒV; Δدمنسفاصله برش؛ کnه-تعداد نمونه منفی در ℒاستی; کnه”-تعداد نمونه منفی در ℒV; λ-پارامتر منظم سازی
خروجی: θ
1 مقدار دهی اولیه کنید θبا توزیع عادی
2 برای من=0; من<مترآایکس_هپoجساعتانجام دادن
3   تیتوس ←انتخاب تصادفی ( تیتو، ب)
4 برای j=0; j<|تیتوس|; تیتوj∈تیتوس انجام دادن
5   برای ک=0; ک<|تیتوj|; لک∈تیتوj انجام دادن
6    اگر ک<|تیتوj|-1 انجام دادن
7      vتیک+1←vتیک+1+αη1(1-σ(v^n⋅v^جتی))vلک+1
8      vلک←vلک+αη1(1-σ(v^n⋅v^جتی))vلک+1
9      vلک+1←vلک+1+αη1(1-σ(v^n⋅v^جتی))(vتیک+1+vلک)
10      Lnهg={لnهg∈L\لک+1:دمنس(لک،لnه)≥Δدمنس}
11     برای متر=0; متر<کnه; لمتر∈Lnهg انجام دادن
12       vتیک+1←vتیک+1-αη1(1-σ(1-v^n⋅v^جتی))vلمتر
13       vلک←vلک-αη1(1-σ(1-v^n⋅v^جتی))vلمتر
14       vلمتر←vلمتر-αη1(1-σ(1-v^n⋅v^جتی))(vتیک+1+vلک)
15     پایان
16    پایان
17    برای n=0; n<کnه”; لn∈Lnه” انجام دادن
18      vتومن←vتومن+(1-α)η2(1-σ(ایکس^تومنلکلn))دبلیوتول(ه¯لj-ه¯لک)-λvتومن
19      β←β+(1-α)η2(1-σ(ایکس^تومنلکلn))(ه¯لj-ه¯لک)-λβ
20      دبلیوتول←دبلیوتول+(1-α)η2(1-σ(ایکس^تومنلکلn))vتومن(ه¯لj-ه¯لک)تی-λدبلیوتول
21    پایان
22   پایان
23 پایان
24 پایان

4. نتیجه تجربی

4.1. تنظیمات آزمایش

4.1.1. معیارهای ارزیابی

ما از چهار معیار برای ارزیابی مدل STVE خود استفاده می کنیم، از جمله دقت، یادآوری، میانگین رتبه متقابل (MRR) و میانگین خطای فاصله (MDE). Precision@N به نسبت جاذبه‌های گردشگری با حقیقت زمینی اشاره دارد که در لیست توصیه‌شده برتر N گنجانده شده‌اند، و Recall@N به معنای نسبت بین تعداد جاذبه‌های واقعی زمین در نتایج توصیه‌شده top-N و تعداد جاذبه های گردشگری که کاربر بازدید کرده است. این دو معیار رایج برای ارزیابی کیفیت توصیه هستند و می‌توانند به ترتیب به صورت معادلات (18) و (19) فرموله شوند:

پrهجمنسمنon@ن=1|تی|∑تیتومن∈تی1|تیتومن|×∑لک∈تیتومن|آرن(تومن)∩لک|ن
آرهجآلل@ن=1|تی|∑تیتومن∈تی1|تیتومن|×∑لک∈تیتومن|آرن(تومن)∩لک||لک|

جایی که آرن(تومن)مجموعه ای از بالا است ننتایج توصیه، و لکنشان دهنده جاذبه گردشگری واقعی است که کاربر از آن بازدید کرده است.

MRR معیارهای رتبه بندی توصیه است که به صورت زیر تعریف می شود:

مآرآر=1|تی|∑تیتومن∈تی1|تیتومن|×1∑لک∈تیتومنrآnکلک

جایی که rآnکلکشماره رتبه بندی جاذبه زمین-حقیقت در لیست توصیه شده است.

MDE میانگین حداقل فاصله جغرافیایی بین جاذبه‌های گردشگری واقعی و هر یک از مکان‌های برتر را محاسبه می‌کند. نجاذبه های پیش بینی شده این یک معیار کلی برای ارزیابی سیستم توصیه نیست، اما می توان از آن برای ارزیابی خطای فاصله نتایج توصیه ها استفاده کرد، که در مطالعه یائو و همکاران نیز استفاده شد. [ 45 ] مربوط به پیش بینی مکان. MDE را می توان به صورت زیر فرموله کرد:

مDE@ن=1|تی|∑تیتومن∈تی1|تیتومن|×∑لک∈تیتومن،لکn∈آرن(تومن)دمنس(لک،لکn)

جایی که لکnهر جاذبه ای را در بالا نشان می دهد نلیست، و دمنس(ایکس،y)نشان دهنده فاصله بین ایکسو y، با فاصله هاورسین تعریف می شود. مقدار کوچکتر MDE نشان دهنده عملکرد بهتر در خطای فاصله است.

4.1.2. روش های مقایسه
ما چندین مدل توصیه را برای مقایسه عملکرد مدل خود انتخاب کردیم، از جمله:
  • فیلتر مشارکتی مبتنی بر کاربر (UCF): UCF یک مدل توصیه مبتنی بر حافظه کلاسیک است که عمدتاً از سایر کاربران با ترجیحات مشابه برای ارائه توصیه‌ها استفاده می‌کند [ 46 ، 47 ].
  • فاکتورسازی ماتریس رتبه‌بندی شخصی بیزی (BPR-MF): BPR-MF یک روش فاکتورسازی ماتریس ساده «کاربر آیتم» است که با رتبه‌بندی شخصی بیزی بهینه شده است.
  • فاکتورسازی زنجیره‌های مارکوف شخصی شده با مناطق محلی (FPMC-LR): FPMC-LR [ 15 ] یک روش توصیه‌ای است که با افزودن محدودیت فاصله جغرافیایی به روش‌های زنجیره مارکوف شخصی‌سازی شده (FPMC) [ 14 ] بهبود یافته است.
  • VBPR: VBPR یک مدل فاکتورسازی ماتریسی با اطلاعات بصری با هدف توصیه‌های خرید آنلاین است [ 44 ].
  • Geo-Teaser: Geo-Teaser روشی بود که اطلاعات زمانی و جغرافیایی را با استراتژی نمونه گیری منفی Word2Vec و رتبه بندی زوجی سلسله مراتبی برای ارائه توصیه ها ادغام می کرد [ 19 ].

4.2. مقایسه عملکرد

شکل 7 عملکرد مدل STVE و سایر روش های پایه را در معیارهای دقت ( شکل 7 الف)، یادآوری ( شکل 7 ب)، MRR ( شکل 7 ج)، و MDE ( شکل 7 د) نشان می دهد. از شکل 7، می توانیم نتیجه بگیریم که مدل STVE از هر روش پایه دیگری در چهار معیار عملکرد بهتری دارد. به ویژه در یادآوری و MRR خوب عمل می‌کند، که نشان‌دهنده نسبت نسبتاً بالایی از نتایج توصیه‌شده در برخورد با جاذبه‌های گردشگری واقعی، و میانگین رتبه‌بندی بالای جاذبه‌های گردشگری حقیقت زمینی در فهرست توصیه‌شده است. علاوه بر این، عملکرد مدل STVE در MDE نیز نسبت به سایر مدل ها برتر است. شکاف بین FPMC-LR و STVE به ویژه بزرگ است، که ممکن است به استراتژی های مختلف انتخاب نمونه منفی بین آنها مربوط باشد. مقدار بالای MDE FPMC-LR نشان می دهد که انتخاب نمونه های منفی در فاصله قطع ممکن است با وضعیت واقعی مطابقت نداشته باشد.
ما نتایج سایر مدل‌های پایه را بیشتر تحلیل می‌کنیم. به‌عنوان تنها روش CF مبتنی بر حافظه، عملکرد UCF در چهار معیار بسیار پایین‌تر از مدل‌های دیگر است، که دشواری CF مبتنی بر حافظه را در حل مشکل پراکندگی داده و شروع سرد نشان می‌دهد. از سوی دیگر، حتی اگر BPR-MF، CF مبتنی بر مدل کلاسیک، هیچ گونه اطلاعات متنی و محتوایی را با هم ترکیب نمی کند، همچنان بهتر از UCF عمل می کند، که به این معنی است که انتخاب CF مبتنی بر مدل به عنوان روش اصلی STVE مدل می تواند به طور موثری دقت توصیه را بهبود بخشد و بر مشکل پراکندگی داده ها در مقایسه با CF مبتنی بر حافظه غلبه کند. FPMC-LR و VBPR مدل های بهبود یافته ای هستند که زمینه یا محتوا را بر اساس BPR-MF اضافه می کنند. هر دو نتایج بهتری نسبت به BPR-MF دارند، که نشان می دهد انتخاب و ادغام زمینه و محتوای مناسب در فاکتورسازی ماتریس می تواند دقت توصیه را بهبود بخشد. در نهایت، Geo-Teaser به عنوان مدلی که دارای مشابه ترین ساختار و فاکتورهای مدل با STVE است، از نظر عملکرد نسبت به سایر مدل های پایه برتری دارد. اگرچه چنین نتایجی حاکی از مزایای ساختار مدل Geo-Teaser است، عملکرد Geo-Teaser هنوز در رتبه دوم پس از STVE قرار دارد. ممکن است به دو دلیل باشد: اول، هنگام مدل‌سازی اطلاعات متوالی با Word2Vec، Geo-Teaser به طور غیرمستقیم جاذبه‌های بازدید شده قبلی و بعدی جاذبه‌های فعلی را به عنوان «کلمات» متنی در نظر می‌گیرد. STVE احتمال شرطی را در معادله (3) بهبود می‌بخشد زیرا پیش‌بینی جاذبه بعدی با توجه به جاذبه فعلی بیشتر با وضعیت واقعی مطابقت دارد. دومین،

4.3. تجزیه و تحلیل حساسیت پارامتر

در این بخش، نحوه تأثیرگذاری مقدار پارامترها بر نتایج را مورد بحث قرار می دهیم. پارامترهای اصلی شامل تعداد ابعاد است f1و f2، تعداد نمونه های منفی کnهو کnه”، و میزان یادگیری η1و η2. ما عمدتاً از Recall@2 و MDE@3 برای مقایسه عملکرد استفاده می کنیم. برای هر مقدار از پارامترها، آزمایش را سه بار تکرار می کنیم و میانگین نتایج را می گیریم. وزن خطی را نیز تنظیم می کنیم α0.5 به طور موقت برای کاهش تأثیر وزن های مختلف دو جزء بر نتیجه.

4.3.1. تاثیر ابعاد

ابتدا در مورد تأثیر عدد بعد بحث می کنیم f1و f2. شکل 8 و شکل 9 نمودار خطی را با میله های خطای ضربه نشان می دهد f1و f2، به ترتیب. ما ارزش را تغییر می دهیم f1از 10 تا 50 با گام 10 و آن از f2از 40 تا 100. زمانی که مقدار f1از 10 به 20، مقدار Recall@2 به طور قابل توجهی افزایش یافته است. با این حال، افزایش سرعت کاهش می یابد و تقریبا ثابت می ماند f1مقدار از 20 تا 50 متغیر است. به طور مشابه، زمانی که تعداد f2به 70 یا 80 می رسد، افزایش مقدار Recall@2 کند می شود و حتی کمی نوسان دارد. روند رایج این است که در حالی که تعداد ابعاد افزایش می یابد، عملکرد بهبود می یابد، اما هزینه زمان نیز افزایش می یابد. تفاوت این است که ارزش f2به اندازه نتیجه روی نتیجه تاثیر نمی گذارد f1، اما تأثیر آن بر هزینه زمان بسیار بیشتر از تأثیر آن است f1زیرا تعبیه vتومنبا f2بعد باید محصول داخلی با تعبیه‌های بصری با ابعاد بالا باشد. بنابراین، همانطور که در بالا تجزیه و تحلیل شد، مقدار را تعیین می کنیم f1به عنوان 40 و f2به عنوان 60 در این مقاله.
4.3.2. تاثیر نمونه های منفی
تاثیر نمونه های منفی در مقایسه با بعد کمتر مورد بحث قرار گرفته است. شکل 10 و شکل 11 تاثیر آن را نشان می دهد کnهو کnه”، به ترتیب. به نظر می رسد که افزایش تعداد نمونه منفی لزوماً عملکرد را بهتر نمی کند: عملکرد دو معیار زمانی که کمی بهتر می شود کnهارزش افزایش می یابد، در حالی که عملکرد حتی بدتر می شود کnه”ارزش افزایش می یابد. با این وجود، تعداد نمونه‌های منفی به اندازه ابعاد بر روی نتیجه تأثیر نمی‌گذارد و عملکرد کلی همچنان می‌تواند رضایت‌بخش باقی بماند. بنابراین، مقدار آن را بدست می آوریم کnهو کnه”به طور مستقیم از نمودارها که به ترتیب 5 و 1 تنظیم شده اند.
4.3.3. تاثیر نرخ یادگیری
η1و η2نرخ یادگیری از ℒاستیو ℒVبه ترتیب. تنظیم نرخ های مختلف یادگیری برای مدل های ترکیبی در مطالعات قبلی آزمایش شده است [ 19 ]. شکل 12 نشان می دهد که چگونه ترکیبی از η1و η2مقادیر روی مقدار recall@2 تأثیر می‌گذارند . در آزمایش، ما متفاوت بودیم η2از 0.001 تا 0.075 و η1از 0.001 تا 0.0075 زیرا متوجه شدیم که STVE زمانی که به شدت بدتر می شود η1بزرگتر از 0.001 است. این ممکن است به این دلیل باشد که نرخ یادگیری بسیار زیاد منجر به واگرایی می شود. چه زمانی η1برابر با 0.001 است، مقدار Recall@2 به طور کلی بالا است. علاوه بر این، در محدوده 0.001 تا 0.01 از η2ارزش، نتیجه کلی نیز با افزایش ارزش بهتر می شود. بعد از η2مقدار بزرگتر از 0.01 است، نتیجه ثابت می ماند. ما مقدار را انتخاب می کنیم η1و η2هنگامی که آنها با هم به نقطه بهینه، و مقدار η1و η2به ترتیب 0.001 و 0.01 است.

4.4. مطالعه جزء عاقلانه

ما بیشتر بررسی می کنیم که چگونه هر جزء بر عملکرد تأثیر می گذارد زیرا STVE یک مدل ترکیبی با در نظر گرفتن عوامل مختلف است. ما هر جزء را تقسیم می کنیم و عملکرد آنها را با هم مقایسه می کنیم و هر جزء / مدل شامل موارد زیر است: (1) فقط بخش مکانی و زمانی ℒاستی(در زیر با “ST” مشخص شده است)، به عنوان مثال، αدر رابطه (14) به صورت 1 تنظیم شده است. (2) ℒاستیکه محدودیت فاصله مکانی را حذف می کند، به عنوان مثال، αبه عنوان 1 تنظیم می شود و به جای انتخاب در مجموعه نمونه منفی خارج از فاصله قطع (با علامت “T”) نمونه های منفی را به طور تصادفی انتخاب کنید. (3) فقط بخش بصری ℒV، یعنی αبه عنوان 0 تنظیم شده است (با علامت “V”). (4) مدل کامل STVE. جدول 2 مقایسه نتایج بین STVE و اجزای آن را در معیارهای دقت@2 ، recall@2 ، MDE@3 نشان می دهد.و MRR. عملکرد هر جزء به خوبی مدل STVE کامل نیست – یک نتیجه رایج در مدل های ترکیبی. در میان این سه جزء، شکاف ST بین STVE نسبتاً کوچک است. به دنبال مولفه T. مولفه V زمانی که به تنهایی استفاده می شود بدترین عملکرد را دارد، اما پس از ترکیب با مولفه ST، عملکرد کلی در مقایسه با استفاده از ST بهبود می یابد. علاوه بر این، ترکیب اطلاعات محتوا نیز می تواند نقش مهمی در حل مشکل شروع سرد داشته باشد. نتیجه نشان می‌دهد که مدل STVE ما می‌تواند به طور موثری دقت توصیه‌ها را در مقایسه با هر جزء منفرد بهبود بخشد.

4.5. نتایج برای کاربر شروع سرد

ما به طور مختصر نحوه عملکرد STVE در مسئله شروع سرد را تجزیه و تحلیل می کنیم. ما کاربرانی را که کمتر از شش جاذبه گردشگری را بازدید کرده‌اند، کاربران شروع سرد فرض می‌کنیم و سایر کاربران را حذف می‌کنیم. تعداد مسیرهای باقی مانده 659 است. STVE و پنج روش پایه را با این مسیرهای باقی مانده آموزش دهید و عملکرد آنها را در چهار معیار مقایسه کنید. همانطور که شکل 13 نشان می دهد، مدل STVE ما همچنان بهترین عملکرد را در بین این مدل ها به دست می آورد، اما فاصله آن با سایر مدل های پایه بیشتر است. به عنوان مثال، برای همه کاربران در شکل 7تفاوت مقدار MRR بین Geo-Teaser و UCF به ترتیب 0.0792 و 0.2528 است، در حالی که، برای کاربران شروع سرد، تفاوت مقدار MRR به ترتیب 0.1531 و 0.3837 است. علاوه بر این، عملکرد VBPR در سه معیار قبلی تفاوت چندانی با FPMC-LR ندارد و برای همه کاربران از Geo-Teaser پایین‌تر است، در حالی که برای کاربران شروع سرد، VBPR در رتبه دوم پس از STVE قرار دارد. ممکن است به این دلیل باشد که VBPR نوعی مدل مبتنی بر محتوا است و مدل مبتنی بر محتوا به موضوع شروع سرد حساس نیست. به طور مشابه، STVE محتوای بصری را بر اساس اصل VBPR ترکیب می کند و بنابراین عملکرد خوبی در مسئله شروع سرد به دست می آورد. نتیجه چشمگیر دیگر این است که تفاوت بین UCF و BPR-MF برای کاربران شروع سرد کمتر از همه کاربران است. دوباره مقدار MRR را به عنوان مثال در نظر بگیرید. تفاوت بین UCF و BPR-MF برای همه کاربران 0.0734 است، در حالی که برای کاربران شروع سرد 0.0381 است. این نشان می‌دهد که هر دو CF مبتنی بر حافظه و مدل، زمانی که هیچ محتوا و اطلاعات متنی را با هم ترکیب نمی‌کنند، تحت تأثیر مسئله شروع سرد قرار می‌گیرند.

5. نتیجه گیری ها

در این مقاله، ما یک مدل توصیه جاذبه توریستی ترکیبی را پیشنهاد می‌کنیم که جاسازی‌های مکانی، زمانی و بصری را برای عکس‌های دارای برچسب جغرافیایی فلیکر (STVE) ترکیب می‌کند. در مراحل پیش پردازش، ما از چارچوبی برای فیلتر کردن خودکار عکس‌های پر سر و صدا و زائد استفاده می‌کنیم و تصاویر معرف جاذبه‌های گردشگری را انتخاب می‌کنیم تا جاسازی‌های بصری را تا حد امکان دقیق استخراج کنیم. برای ساخت مدل STVE، تابع هدف Skip-gram را اصلاح کرده و از استراتژی نمونه‌گیری منفی Word2Vec برای مدل‌سازی عوامل مکانی و زمانی استفاده می‌کنیم. سپس ما از فاکتورسازی ماتریس برای ترکیب جاسازی‌های بصری جاذبه‌های گردشگری و آموزش با رتبه‌بندی شخصی بیزی ویژوال استفاده می‌کنیم. ما توکیو را به عنوان منطقه مورد مطالعه برای ارزیابی مدل STVE خود انتخاب می کنیم.
نتایج مقایسه نشان می‌دهد که مدل STVE ما می‌تواند مشکل دقت کم روش‌های مبتنی بر محتوا و مسئله شروع سرد روش‌های مبتنی بر CF را کاهش دهد. ما همچنین حساسیت پارامترهای اصلی را تجزیه و تحلیل کردیم و بررسی کردیم که چگونه هر جزء بر نتایج توصیه‌ها تأثیر می‌گذارد. مجموعه‌ای از نتایج، برتری STVE را در ارائه توصیه‌ای با دقت بالا نشان می‌دهد و انگیزه بیشتری برای پیگیری تحقیقات خود به ما می‌دهد. در کار آینده، با افزودن اطلاعات زمینه ای بیشتر (مانند آب و هوا و فصل) و ویژگی های کاربر (مانند سن و جنسیت) به بهبود مدل های توصیه خود ادامه خواهیم داد. علاوه بر این، ما سعی خواهیم کرد مدل خود را در برنامه های کاربردی مبتنی بر وب یا سایر پلتفرم ها برای استفاده واقعی پیاده سازی کنیم.

منابع

  1. هندلر، جی. وب 3.0 در حال ظهور. کامپیوتر 2009 ، 42 ، 111-113. [ Google Scholar ] [ CrossRef ]
  2. رودمن، آر. بروور، آر. تعریف وب 3.0: فرصت ها و چالش ها. الکترون. Libr 2016 ، 34 ، 132-154. [ Google Scholar ] [ CrossRef ]
  3. شورای جهانی سفر و گردشگری در دسترس آنلاین: https://www.wttc.org (در 25 فوریه 2020 قابل دسترسی است).
  4. سازمان جهانی گردشگری نکات مهم گردشگری UNWTO ، ویرایش 2019. UNWTO: مادرید، اسپانیا، 2018. [ Google Scholar ]
  5. گزارش سفر مستقل جهانی. 2017. در دسترس آنلاین: https://www.mafengwo.cn/activity/sales_.report2017/index (در 28 دسامبر 2019 قابل دسترسی است).
  6. گائو، ی. تانگ، جی. هونگ، آر. دای، Q. چوآ، تی اس؛ جین، R. W2Go: یک سیستم راهنمای سفر با رتبه‌بندی خودکار. در مجموعه مقالات هجدهمین کنفرانس بین المللی ACM در چند رسانه ای، Firenze، ایتالیا، 25-29 اکتبر 2010. صص 123-132. [ Google Scholar ]
  7. ژو، ایکس. خو، سی. کیمونز، ب. تشخیص مقاصد گردشگری با استفاده از تجزیه و تحلیل جغرافیایی مقیاس پذیر بر اساس پلت فرم رایانش ابری. محاسبه کنید. محیط زیست سیستم شهری 2015 ، 54 ، 144-153. [ Google Scholar ] [ CrossRef ]
  8. رفسنجانی، AHN; سلیم، ن. اقدم، ع. فرد، سیستم های توصیه KB: یک بررسی. بین المللی جی. کامپیوتر. مهندس Res. 2013 ، 3 ، 47-52. [ Google Scholar ]
  9. ون مترن، آر. Van Someren, M. استفاده از فیلترینگ مبتنی بر محتوا برای توصیه. در مجموعه مقالات یادگیری ماشین در عصر اطلاعات جدید کارگاه آموزشی MLnet/ECML2000، بارسلون، اسپانیا، 30 مه 2000. صص 47-56. [ Google Scholar ]
  10. شافر، جی بی. فرانکوفسکی، دی. هرلوکر، جی. Sen, S. سیستم های توصیه کننده فیلتر مشترک ; Springer: برلین/هایدلبرگ، آلمان، 2007; صص 291-324. [ Google Scholar ]
  11. بائو، جی. ژنگ، ی. ویلکی، دی. موکبل، توصیه های MF در شبکه های اجتماعی مبتنی بر مکان: یک نظرسنجی. GeoInformatica 2015 ، 19 ، 525-565. [ Google Scholar ] [ CrossRef ]
  12. آدوماویسیوس، جی. سانکارانارایانان، ر. سن، اس. Tuzhilin، A. ترکیب اطلاعات زمینه ای در سیستم های توصیه گر با استفاده از یک رویکرد چند بعدی. ACM Trans. Inf. سیستم 2005 ، 23 ، 103-145. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  13. رنجیت، اس. سریکومار، ا. Jathavedan, M. یک مطالعه گسترده در مورد تکامل سیستم‌های توصیه‌کننده سفر شخصی‌شده آگاه از زمینه. به اطلاع رساندن. روند. مدیریت 2020 , 57 , 102078. [ Google Scholar ] [ CrossRef ]
  14. رندل، اس. فرودنتالر، سی. Schmidt-Thieme، L. فاکتورسازی زنجیره های مارکوف شخصی شده برای توصیه سبد بعدی. در مجموعه مقالات نوزدهمین کنفرانس بین المللی پشتیبانی معماری از زبان های برنامه نویسی و سیستم عامل ها؛ انجمن ماشین‌های محاسباتی (ACM)، رالی، NC، ایالات متحده آمریکا، 26 تا 30 آوریل 2010. صص 811-820. [ Google Scholar ]
  15. چنگ، سی. یانگ، اچ. لیو، ام آر؛ King, I. جایی که دوست دارید در مرحله بعد بروید: توصیه نقطه مورد علاقه پی در پی. در مجموعه مقالات بیست و سومین کنفرانس بین المللی مشترک هوش مصنوعی، پکن، چین، 3 تا 9 اوت 2013. [ Google Scholar ]
  16. فنگ، اس. لی، ایکس. زنگ، ی. Chee, YM تعبیه متریک رتبه بندی شخصی برای توصیه poi جدید بعدی. در مجموعه مقالات بیست و چهارمین کنفرانس مشترک بین المللی در مورد هوش مصنوعی، بوئنوس آیرس، آرژانتین، 25 تا 31 ژوئیه 2015. ص 2069–2075. [ Google Scholar ]
  17. تانگ، جی. کو، م. وانگ، ام. ژانگ، ام. یان، جی. Mei, Q. Line: تعبیه شبکه اطلاعات در مقیاس بزرگ. در مجموعه مقالات بیست و چهارمین کنفرانس بین المللی وب جهانی، نیویورک، نیویورک، ایالات متحده آمریکا، 18 تا 22 مه 2015; صص 1067–1077. [ Google Scholar ]
  18. زی، ام. یین، اچ. وانگ، اچ. خو، اف. چن، دبلیو. وانگ، اس. آموزش جاسازی پوی مبتنی بر نمودار برای توصیه مبتنی بر مکان. در مجموعه مقالات بیست و پنجمین کنفرانس بین المللی ACM در مورد مدیریت اطلاعات و دانش، ایندیاناپولیس، IN، ایالات متحده، 24-28 اکتبر 2016. صص 15-24. [ Google Scholar ]
  19. ژائو، اس. ژائو، تی. کینگ، آی. Lyu, MR Geo-teaser: رتبه جاسازی متوالی جغرافیایی-زمانی برای توصیه نقطه مورد علاقه. در مجموعه مجموعه مقالات بیست و ششمین کنفرانس بین المللی در مورد همنشین وب جهانی، ژنو، سوئیس، 3 تا 7 آوریل 2017؛ صص 153-162. [ Google Scholar ]
  20. بله، م. یین، پی. لی، W.-C. لی، دی.-ال. بهره‌برداری از نفوذ جغرافیایی برای توصیه مشترک نقطه‌ای از علاقه. در مجموعه مقالات سی و چهارمین کنفرانس بین المللی ACM SIGIR در مورد تحقیق و توسعه در اطلاعات – SIGIR ’11، پکن، چین، 25-29 ژوئیه 2011; صص 325-334. [ Google Scholar ]
  21. ژانگ، ز. زو، سی. دینگ، آر. Chen, Z. VCG: بهره‌برداری از محتوای بصری و نفوذ جغرافیایی برای توصیه‌های نقطه‌ای از علاقه محاسبات عصبی 2019 ، 357 ، 53-65. [ Google Scholar ] [ CrossRef ]
  22. چنگ، سی. یانگ، اچ. کینگ، آی. لیو، MR فاکتورسازی ماتریس ذوب شده با نفوذ جغرافیایی و اجتماعی در شبکه های اجتماعی مبتنی بر مکان. در مجموعه مقالات بیست و ششمین کنفرانس AAAI در مورد هوش مصنوعی، تورنتو، ON، کانادا، 22 ژوئیه 2012; صص 17-23. [ Google Scholar ]
  23. لیان، دی. ژائو، سی. Xie، X. سان، جی. چن، ای. Rui, Y. GeoMF: مدل‌سازی جغرافیایی مشترک و فاکتورسازی ماتریسی برای توصیه نقطه‌نظر. در مجموعه مقالات بیستمین کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی، نیویورک، نیویورک، ایالات متحده آمریکا، 24 تا 27 اوت 2014. صص 831-840. [ Google Scholar ]
  24. او، جی. لی، ایکس. لیائو، ال. آهنگ، دی. Cheung، WK استنباط یک مدل توصیه‌ای شخصی‌شده نقطه‌ای از علاقه بعدی با الگوهای رفتاری پنهان. در مجموعه مقالات سی امین کنفرانس AAAI در مورد هوش مصنوعی، فینیکس، AZ، ​​ایالات متحده آمریکا، 12 تا 17 فوریه 2016; صص 137-143. [ Google Scholar ]
  25. گائو، اچ. تانگ، جی. هوان، ال. لیو، اچ. بررسی اثرات زمانی برای توصیه مکان در شبکه های اجتماعی مبتنی بر مکان. در مجموعه مقالات هفتمین کنفرانس ACM در مورد سیستم های توصیه کننده، هنگ کنگ، چین، 12 تا 17 اکتبر 2013. صص 93-100. [ Google Scholar ]
  26. یوان، Q. کنگ، جی. ما، ز. سان، ا. Thalmann، NM توصیه نقطه مورد علاقه آگاه از زمان. در مجموعه مقالات سی و ششمین کنفرانس بین المللی ACM SIGIR در مورد تحقیق و توسعه در بازیابی اطلاعات – SIGIR ’13، دوبلین، ایرلند، 28 ژوئیه تا 1 اوت 2013. صص 363-372. [ Google Scholar ]
  27. شی، ی. سردیوکوف، پ. هانجالیچ، ع. Larson, M. توصیه‌های شاخص شخصی بر اساس برچسب‌های جغرافیایی از سایت‌های اشتراک‌گذاری عکس. در مجموعه مقالات پنجمین کنفرانس بین المللی AAAI در وبلاگ ها و رسانه های اجتماعی، بارسلون، اسپانیا، 17 تا 21 ژوئیه 2011. [ Google Scholar ]
  28. ممون، آی. چن، ال. مجید، ع. Lv، M. حسین، من. چن، جی. توصیه سفر با استفاده از عکس‌های دارای برچسب جغرافیایی در رسانه‌های اجتماعی برای گردشگران. کلوو اشتراک. 2015 ، 80 ، 1347–1362. [ Google Scholar ] [ CrossRef ]
  29. چن، Y.-Y.; چنگ، A.-J. Hsu، WH توصیه سفر توسط ویژگی‌های افراد معدن و انواع گروه‌های سفر از عکس‌های مشارکت‌شده در جامعه. IEEE Trans. چندتایی. 2013 ، 15 ، 1283-1295. [ Google Scholar ] [ CrossRef ]
  30. سوبرامانیاسوامی، وی. ویجایاکومار، وی. لوگش، ر. Indragandhi، V. سیستم توصیه سفر هوشمند با ویژگی‌های استخراج از عکس‌های ارائه‌شده توسط جامعه. Procedia Comput. علمی 2015 ، 50 ، 447-455. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  31. آلبانا، بی. ساکر، م. موسی، س. Moawad, I. سیستم توصیه‌کننده مبتنی بر مکان آگاه از علاقه با استفاده از رسانه‌های اجتماعی دارای برچسب جغرافیایی. ISPRS Int. J. Geo.-Inf. 2016 ، 5 ، 245. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  32. لیو، ز. ژو، ایکس. شی، دبلیو. Zhang، A. توصیه مناطق موضوعی جذاب با تشخیص جامعه معنایی با داده های VGI چند منبعی. بین المللی جی. جئوگر. Inf. علمی 2019 ، 33 ، 1520-1544. [ Google Scholar ] [ CrossRef ]
  33. کائو، ال. لو، جی. گالاگر، ا. جین، ایکس. هان، جی. Huang, TS یک سیستم توصیه گردشگری در سراسر جهان بر اساس عکس های وب دارای برچسب جغرافیایی. در مجموعه مقالات کنفرانس بین المللی IEEE در سال 2010 در مورد آکوستیک، گفتار و پردازش سیگنال، دالاس، تگزاس، ایالات متحده آمریکا، 14 تا 19 مارس 2010. ص 2274-2277. [ Google Scholar ]
  34. جیانگ، ک. وانگ، پی. Yu, N. ContextRank: توصیه گردشگری شخصی شده با بهره برداری از اطلاعات زمینه عکس های وب دارای برچسب جغرافیایی. در مجموعه مقالات ششمین کنفرانس بین المللی تصویر و گرافیک 2011، هفی، چین، 12 تا 15 اوت 2011; ص 931-937. [ Google Scholar ]
  35. وانگ، اس. وانگ، ی. تانگ، جی. شو، ک. رانگانات، اس. لیو، اچ. تصاویر شما چه چیزی را نشان می‌دهند: بهره‌برداری از محتوای بصری برای توصیه‌های مورد علاقه. در مجموعه مقالات بیست و ششمین کنفرانس بین المللی وب جهانی، پرت، استرالیا، 3 تا 7 آوریل 2017؛ صص 391-400. [ Google Scholar ]
  36. تومی، بی. Shamma، DA; فریدلند، جی. الیزالد، بی. نی، ک. لهستان، دی. Li، LJ YFCC100M: داده های جدید در تحقیقات چند رسانه ای. اشتراک. ACM 2016 ، 59 ، 64-73. [ Google Scholar ] [ CrossRef ]
  37. منک، ا. سباستیا، ال. فریرا، آر. سیستم های توصیه ای برای گردشگری بر اساس شبکه های اجتماعی: نظرسنجی. arXiv 2019 ، arXiv:1903.12099. [ Google Scholar ]
  38. نظرسنجی در مورد بازدیدکنندگان از توکیو در سال 2018. در دسترس به صورت آنلاین: https://www.metro.tokyo.jp/english/topics/.2019/0828_01.html (در 20 دسامبر 2019 قابل دسترسی است).
  39. هان، اس. رن، اف. دو، س. Gui, D. استخراج تصاویر نمایندگی از جاذبه های گردشگری از فلیکر با ترکیب یک روش خوشه ای بهبود یافته و چندین مدل یادگیری عمیق. ISPRS Int. J. Geo.-Inf. 2020 ، 9 ، 81. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  40. وانگ، جی. آهنگ، ی. لئونگ، تی. روزنبرگ، سی. وانگ، جی. فیلبین، جی. چن، بی. Wu, Y. یادگیری تشابه تصویر ریز دانه با رتبه بندی عمیق. در مجموعه مقالات کنفرانس IEEE 2014 در مورد بینایی کامپیوتری و تشخیص الگو، کلمبوس، OH، ایالات متحده آمریکا، 23 تا 28 ژوئن 2014. صص 1386–1393. [ Google Scholar ]
  41. لیو، دبلیو. آنگلوف، دی. ایرهان، د. سگدی، سی. رید، اس. Fu، C.-Y.; Berg, AC Ssd: آشکارساز چند جعبه ای تک شات. در مجموعه مقالات کنفرانس اروپایی بینایی کامپیوتر، آمستردام، هلند، 11 تا 14 اکتبر 2016؛ ص 21-37. [ Google Scholar ]
  42. Li، FL; فرگوس، آر. Perona، P. یادگیری مدل‌های بصری مولد از چند نمونه آموزشی: یک رویکرد بیزی افزایشی که بر روی 101 دسته شی آزمایش شده است. محاسبه کنید. Vis. تصویر لغو. 2007 ، 106 ، 59-70. [ Google Scholar ]
  43. ژو، بی. لاپدریزا، ا. خسلا، ع. اولیوا، ا. Torralba, A. Places: یک پایگاه داده 10 میلیونی تصویر برای تشخیص صحنه. IEEE Trans. الگوی مقعدی ماخ هوشمند 2018 ، 40 ، 1452-1464. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  44. او، ر. McAuley، J. VBPR: رتبه‌بندی شخصی بیزی ویژوال از بازخورد ضمنی. در مجموعه مقالات سی امین کنفرانس AAAI در مورد هوش مصنوعی، فینیکس، AZ، ​​ایالات متحده آمریکا، 12 تا 17 فوریه 2016; صص 144-150. [ Google Scholar ]
  45. یائو، دی. ژانگ، سی. هوانگ، جی. Bi, J. Serm: مدلی تکرارشونده برای پیش‌بینی مکان بعدی در مسیرهای معنایی. در مجموعه مقالات ACM 2017 در کنفرانس مدیریت اطلاعات و دانش، سنگاپور، 6 تا 10 نوامبر 2017؛ ص 2411-2414. [ Google Scholar ]
  46. آدوماویسیوس، جی. توژیلین، الف. به سوی نسل بعدی سیستم‌های توصیه‌گر: بررسی پیشرفت‌های پیشرفته و احتمالی. IEEE Trans. بدانید. مهندسی داده 2005 ، 17 ، 734-749. [ Google Scholar ] [ CrossRef ]
  47. مجید، ع. چن، ال. چن، جی. میرزا، ح.ت. حسین، من. Woodward, J. یک سیستم توصیه مسافرتی شخصی‌شده آگاه از زمینه مبتنی بر داده‌کاوی رسانه‌های اجتماعی دارای برچسب جغرافیایی. بین المللی جی. جئوگر. Inf. علمی 2013 ، 27 ، 662-684. [ Google Scholar ] [ CrossRef ]
شکل 1. چارچوب کلی مطالعه.
شکل 2. توزیع فضایی عکس های دارای برچسب جغرافیایی مورد استفاده در مطالعه (در توکیو، ژاپن).
شکل 3. نتایج خوشه ای از برخی جاذبه های گردشگری در توکیو.
شکل 4. ساخت مسیر بازدید کاربر.
شکل 5. ساختار STVE و ارتباط آن با مراحل پیش پردازش.
شکل 6. الگوهای بازدید از جاذبه های گردشگری در ساعات مختلف در یک روز در منطقه مورد مطالعه.
شکل 7. مقایسه عملکرد بین STVE و مدل‌های دیگر در موارد: ( الف ) دقت، ( ب ) یادآوری، ( ج ) میانگین رتبه متقابل، و ( د ) خطای میانگین فاصله.
شکل 8. تأثیر مقدار 1 روی ( a ) Recall@2 ، ( b ) MDE@3 تغییر می کند.
شکل 9. تأثیر مقدار 2 روی ( a ) Recall@2 ، ( b ) MDE@3 تغییر می کند.
شکل 10. تأثیر تغییر مقدار kne بر ( a ) Recall @2 ، ( b ) MDE@3.
شکل 11. تأثیر مقدار k ‘ ne بر روی ( a ) Recall@2 ، ( b ) MDE@3 تغییر می کند.
شکل 12. تاثیر η1و η2مقدار ‘s در Recall@2 تغییر می کند.
شکل 13. مقایسه عملکرد بین STVE و سایر مدل ها برای کاربران شروع سرد در موارد: ( الف ) دقت، ( ب ) یادآوری، ( ج ) میانگین رتبه متقابل، و ( د ) خطای میانگین فاصله.

بدون دیدگاه

دیدگاهتان را بنویسید