خلاصه

روش‌های توصیه مکان سفر با استفاده از عکس‌های دارای برچسب جغرافیایی مشارکت‌شده توسط جامعه، بر اساس اعلام حضورهای گذشته است. بنابراین، این روش ها نمی توانند به طور موثر برای مکان های سفر جدید کار کنند، یعنی از مشکل شروع سرد محل سفر رنج می برند. در این مطالعه، ما یک شبکه عصبی کانولوشن و روش پیشنهاد مکان سفر مبتنی بر فاکتورسازی ماتریس را برای رسیدگی به این مشکل پیشنهاد می‌کنیم. به طور خاص، یک روش فاکتورسازی ماتریس وزن دار برای به دست آوردن نمایش عامل پنهان مکان های سفر استفاده می شود. نمایش عامل پنهان برای یک مکان سفر جدید از عکس های آن با استفاده از یک شبکه عصبی کانولوشن تخمین زده می شود. نتایج تجربی روی یک مجموعه داده فلیکر نشان می‌دهد که روش پیشنهادی می‌تواند توصیه‌های بهتری نسبت به روش‌های موجود ارائه دهد.

کلید واژه ها:

توصیه مکان سفر ؛ فاکتورسازی ماتریسی ; شبکه عصبی کانولوشنال ; مشکل شروع سرد

 

چکیده گرافیکی

1. معرفی

رشد مداوم سایت‌های اشتراک‌گذاری عکس (به عنوان مثال، فلیکر و پانورامیو) حجم عکس‌های دارای برچسب جغرافیایی (CCGP) که در وب در دسترس هستند را افزایش داده است. این مقادیر زیاد CCGP شامل اطلاعات غنی می شود (به عنوان مثال، برچسب های ارائه شده توسط کاربر، زمان و محتوای بصری، همانطور که در شکل 1 و جدول 1 نشان داده شده است ). این اطلاعات برای سیستم‌های توصیه مکان سفر [ 1 ] بسیار مفید است، با در نظر گرفتن ترجیحات سفر کاربران بسته به بررسی‌های قبلی‌شان، و توسعه سیستم‌های توصیه مکان سفر.
CCGP ها معمولاً شامل ابرداده ها هستند، به عنوان مثال، روابط اجتماعی، ویژگی های متنی و زمینه ای [ 2 ، 3 ، 4 ، 5 ]. فیلتر مشارکتی (CF) به طور گسترده توسط روش‌های توصیه مکان سفر مبتنی بر CCGP استفاده می‌شود، که بر اساس حدس ساده توصیه یک مکان سفر به کاربر است، اگر کاربران مشابه با مکان سفر تعامل داشته باشند [6 ، 7 ] . به دلیل سادگی، مقیاس‌پذیری و انعطاف‌پذیری، فاکتورسازی ماتریسی، که یک روش CF محبوب است که یک عامل پنهان را برای نشان دادن رتبه‌بندی‌های تعامل یاد می‌گیرد، به مدلی پرکاربرد برای توصیه مکان سفر تبدیل می‌شود [8 ، 9 ]]. رتبه‌بندی‌ها در تعامل مکان کاربر-سفر، اطلاعات صریحی هستند که در روش‌های اولیه توصیه مکان سفر عمیقاً مورد استفاده قرار گرفته‌اند. برای پرداختن به رتبه‌بندی‌های پراکنده، ویژگی‌های کمکی، به عنوان مثال، ویژگی‌های متنی و متنی [ 10 ، 11 ]، در فاکتورسازی ماتریس ادغام می‌شوند. با این حال، روش‌های یکپارچه موجود فقط بر روی مشکلات پیش‌بینی رتبه‌بندی ضمنی/صریح کار می‌کنند، و نمایش عامل پنهان به طور موثر با اطلاعات محتوای بسیار پراکنده یاد نمی‌گیرد. بنابراین، این روش‌ها نمی‌توانند اطلاعات مکان سفر را به‌طور کامل جمع‌آوری کنند و یک مکان سفر را بدون هیچ گونه بررسی قبلی، یعنی مشکل شروع سرد مکان سفر، توصیه کنند [ 12 ، 13 ، 14 ].
اخیراً، شبکه‌های عصبی کانولوشنال (CNN) از توانایی‌های یادگیری بازنمایی قدرتمند، عملکرد بالایی را در حوزه‌های مختلف نشان می‌دهند، به عنوان مثال، پردازش سیگنال [ 15 ] و پردازش زبان طبیعی [ 16 ]. CNN به طور موثر ویژگی های محلی را از لایه های مختلف می گیرد و ویژگی ها را به یک بردار تبدیل می کند [ 17 ]. بنابراین، CNN می تواند برای تخمین بازنمایی عوامل پنهان مکان های سفر جدید با ارائه درک جامع از عکس ها استفاده شود.
برای رسیدگی به مشکل فوق الذکر، یعنی نمی‌توانیم فاکتور پنهان مکان سفر را از ورودهای قبلی بدست آوریم. ما پیشنهاد می کنیم از یک CNN برای تخمین عامل پنهان مکان سفر جدید از عکس های آن استفاده کنیم. ما به طور یکپارچه CNN را در فاکتورسازی ماتریس وزن دار (WMF) ادغام می کنیم، که معمولاً برای توصیه مکان های سفر استفاده می شود. علاوه بر این، ما از وزن شباهت بین کاربران (و مکان‌های سفر) برای بهره‌برداری از ویژگی‌های کمکی استفاده می‌کنیم که در فرآیند WMF برای توصیه مکان‌های سفر ادغام شده‌اند. تا آنجا که ما می دانیم، کار ما اولین کاری است که مشکل شروع سرد مکان توصیه مکان سفر را با استفاده از عکس ها بررسی می کند. مشارکت های اصلی این مطالعه به شرح زیر خلاصه می شود.
  • یک روش CNNMF پیشنهاد کنید که CNN و WMF را ادغام کند. اگر یک مکان مسافرتی هیچ گونه بررسی قبلی نداشته باشد، این روش از CNN برای تخمین بازنمایی عامل پنهان آن از عکس‌هایش استفاده می‌کند.
  • از وزن‌های شباهت بین کاربران (و مکان‌های سفر) برای بهره‌برداری از ویژگی‌های متنی (یعنی زمان، آب و هوا و فصل)، ویژگی‌های متنی (یعنی برچسب‌ها) و ویژگی‌های جغرافیایی (یعنی فاصله) استفاده کنید.
  • روش پیشنهادی را بر روی مجموعه داده های CCGP که نه شهر محبوب در سراسر جهان را پوشش می دهد، ارزیابی کنید. نتایج تجربی نشان می‌دهد که CNNMF می‌تواند به طور موثر مشکل شروع سرد مکان سفر را برطرف کند و به عملکرد توصیه رقابتی دست یابد.
بقیه مقاله به شرح زیر سازماندهی شده است: بخش 2 کار مرتبط را ارائه می دهد. بخش 3 مفاهیم اساسی را ارائه می کند و مشکل را تعریف می کند. بخش 4 انگیزه و طراحی روش شناسی را معرفی می کند. بخش 5 آزمایش ها را ارائه می کند. بخش 6 مقاله را به پایان می رساند و برخی از توصیه های کاری آینده را ارائه می دهد.

2. کارهای مرتبط

در این بخش، برخی از کارهای اخیر مرتبط با مطالعه خود را بررسی می‌کنیم که شامل: (1) توصیه‌های مکان سفر مبتنی بر CCGP و (2) استفاده از داده‌های اضافی برای رسیدگی به مشکل شروع سرد مکان است.

2.1. توصیه مکان سفر مبتنی بر CCGP

روش‌های توصیه مکان سفر مبتنی بر CCGP بر دو نوع توصیه تمرکز دارند: توصیه‌های مکانی سفر عمومی و شخصی. روش‌های توصیه عمومی مکان سفر بر توصیه مکان‌ها و توالی‌های محبوب سفر متمرکز است، که معمولاً مکان‌ها و توالی‌های سفر را از ورودهای گذشته استخراج و دسته‌بندی می‌کنند. جیانگ و همکاران [ 18 ] پیشنهاد به دست آوردن توالی سفر از CCGP با در نظر گرفتن چندین ویژگی (مانند زمان، هزینه و برچسب ها) را ارائه کرد. لیو و همکاران [ 19 ] از یک روش مولد و شبکه کانولوشن برای مدلسازی توالی ورود کاربران استفاده کرد. روش‌های معمولی دیگر برای توصیه مکان‌ها و توالی‌ها در یک منطقه جغرافیایی معین استفاده شده است [ 20 ، 21 ]. ژنگ و همکاران [ 20] رابطه بین الگوهای گردشگران و مناطق جذب را تحلیل کرد. چن و همکاران [ 21 ] عکس های دارای برچسب جغرافیایی و اعلام حضور برای توصیه مسیر.
در مقابل، روش‌های شخصی‌سازی شده توصیه مکان سفر بر توصیه مکان‌های مسافرتی که برای ترجیحات کاربران مناسب است، تمرکز دارند. مجید و همکاران [ 1 ، 22 ] پیشنهاد کرد که مکان های سفر را با استفاده از ترجیحات کاربران در بررسی های گذشته با استفاده از زمینه های مختلف (مانند زمان و آب و هوا) توصیه کند. در سال‌های اخیر، ویژگی‌های کاربر (به عنوان مثال، سن و جنسیت) از محتویات عکس برای ساختن نمایه‌های کاربر استخراج شده است [ 23 ، 24 ]. چنگ و همکاران [ 23 ] ویژگی‌های کاربر را از محتوای عکس استخراج کرد، که برای شامل نوع گروه سفر (مانند زوج‌ها، دوستان و خانواده‌ها) گسترش یافت. 24]]، و تکامل با ادغام ویژگی های ذکر شده در بالا با فاکتورسازی ماتریس برای توصیه مکان سفر ادامه یافت [ 9 ]. این روش‌ها روش‌های جایگزینی برای رفع محدودیت‌های فراداده با به‌دست آوردن اولویت‌های سفر کاربران از محتوای CCGP هستند (به عنوان مثال، اطلاعات سن و جنسیت کاربران)، که نمی‌توانند به طور موثر برای کاهش مشکل شروع سرد مکان سفر کار کنند.

2.2. استفاده از داده های اضافی برای رفع مشکل شروع سرد محل سفر

محققان همچنین بر رفع مشکل شروع سرد محل سفر تمرکز کرده اند. گائو و همکاران [ 12 و 13 ] اطلاعات شبکه های اجتماعی را با همبستگی جغرافیایی-اجتماعی برای ضبط فاصله جغرافیایی و شبکه اجتماعی از شبکه های اجتماعی مبتنی بر مکان برای کاهش مشکل ترکیب کرد. سان و همکاران [ 3 ] ادغام اطلاعات زمینه را با یک ماشین بردار پشتیبان برای حل مشکل رگرسیون پیشنهاد کرد. هدف اصلی استخراج ویژگی های بیشتر برای رسیدگی به مشکل است. با این حال، مطالعات کمی مشکل شروع سرد مکان سفر را بررسی کرده اند. با وجود اثربخشی آنها برای وظایف مختلف داده کاوی، محتوای عکس برای کاهش مشکل مورد مطالعه قرار نگرفته است.
مطالعات زیادی در مورد استفاده از محتویات عکس برای استخراج اطلاعات مکان سفر، که بر اساس رنگ، بافت، یا نمایش شکل است، انجام شده است [ 25 ، 26 ، 27 ]. که و همکاران [ 25 ] روشی را پیشنهاد کرد که مسئله حاشیه نویسی عکس را به یک مسئله یادگیری چند برچسبی تبدیل می کند. کوانگ و همکاران [ 26 ] اطلاعات بصری را از عکس ها توسط برچسب های مرتبط در یک منطقه محلی تخمین زد. زینگ و همکاران [ 27 ] ویژگی‌هایی را از عکس‌ها استخراج کرد تا اولویت‌های کاربران و ویژگی‌های مکان سفر را به دست آورد. ویاند و همکاران [ 28] با تقسیم سطح زمین به هزاران سلول جغرافیایی چند مقیاسی، مشخص کرد که یک عکس فقط از پیکسل های آن کجا گرفته شده است. وانگ و همکاران [ 29 ] روشی را برای استخراج محتویات بصری از عکس‌ها برای کمک به یادگیری بازنمایی عوامل پنهان پیشنهاد کرد. روش احتمال یادگیری در به دست آوردن مکان های دقیق سفر از ویژگی های پنهان شکست خورده است. دلیل آن این است که هر مکان سفر دارای عکس های محدودی است که برای توصیف مکان سفر کافی نیست.
روش ما با روش های فوق متفاوت است. ما از CNN برای تخمین عامل پنهان مکان سفر جدید از روی عکس های آن استفاده می کنیم. عوامل پنهان به‌دست‌آمده با اعمال WMF در بررسی‌های گذشته به عنوان حقایق زمینی برای آموزش CNN استفاده می‌شوند.

3. مقدمات و تعریف مسئله

تعاریف زیر از مفاهیم و اصطلاحات اساسی خاص برای رسمی کردن روش ما ارائه شده است.

تعریف  1

(عکس دارای برچسب جغرافیایی). یک عکس دارای برچسب جغرافیایی مکان سفر را نشان می دهد که در عکس تعبیه شده است و می تواند به صورت چندتایی تعریف شود. dd ، تی  )ℎ=(��,�, ����, �). هر عکس حاوی یک شناسه منحصر به فرد است من d��و هماهنگ کنید ج یا د _ ���� ، که توسط کاربر تگ شده است تودر زمان تی.

تعریف  2

(اعلام حضور). یک تعامل مکان کاربر-سفر به صورت یک تاپل نمایش داده می شود βt )�=(�,�,�)، که به معنی کاربر است تواز مکان سفر بازدید می کند لدر زمان تی.

تعریف  3

(محل سفر). یک مکان مسافرتی لیک مکان جغرافیایی خاص است که کاربر می تواند از آن بازدید کرده و عکس بگیرد.

تعریف  4

(مجموعه عکس). مجموعه ای از عکس های گرفته شده توسط همه کاربران به صورت یک مجموعه نمایش داده می شود که در آن مجموعه عکس های گرفته شده توسط کاربر قرار دارد توn��.

تعریف  5

(نمایندگی محل سفر جدید). یک عامل پنهان مکان سفر جدید از عکس های آن با استفاده از معماری CNN به عنوان تابعی که یک عکس خام را به عنوان ورودی می گیرد، تخمین زده می شود، در حالی که خروجی بردارهای پنهان هر عکس است که به عنوان یک تاپل تعریف شده است. لjسیننW،rj)��′=���(�,��)، جایی که دبلیوتمام متغیرهای وزن و سوگیری را نشان می دهد و rj��بردار ویژگی خام عکس مکان سفر را نشان می دهد j.
مسئله تحقیق ما را می توان به صورت زیر فرموله کرد. اگر یک مکان سفر دارای چک‌های قبلی نباشد، CNNMF از یک CNN برای تخمین بازنمایی فاکتور پنهان خود از عکس‌هایش استفاده می‌کند و به‌طور یکپارچه CNN را در WMF ادغام می‌کند، که از آنجا قصد داریم مکان‌های سفر جدید را به کاربران توصیه کنیم.

4. روش شناسی

چارچوب CNNMF در شکل 2 نشان داده شده است . مکان های سفر با استفاده از مجاورت فضایی CCGP ها تعیین می شوند. سپس، از مکان‌های سفر بازدید شده، ماتریس موقعیت مکانی تعامل کاربر-سفر را ایجاد می‌کنیم. ابرداده‌های ناهمگن برای بهره‌برداری از ویژگی‌های متنی (یعنی زمان، آب و هوا و فصل)، ویژگی‌های متنی (یعنی برچسب‌ها) و ویژگی‌های جغرافیایی (یعنی فاصله) استخراج می‌شوند که در فرآیند WMF برای توصیه مکان‌های سفر گنجانده شده‌اند. ما همچنین از CNN برای پردازش محتوای عکس ها برای تخمین عوامل پنهان در موارد شروع سرد مکان سفر استفاده می کنیم.

4.1. کشف مکان های سفر از CCGP

کشف مکان های سفر از CCGP ها را می توان یک مشکل خوشه بندی در نظر گرفت. الگوریتم‌های خوشه‌بندی، مانند تغییر میانگین، برای کشف مکان‌های سفر از CCGP [ 30 ] استفاده شده‌اند. الگوریتم DBSCAN [ 31 ] دارای مزایای زیر در مقایسه با سایر الگوریتم‌های خوشه‌بندی است: (1) به حداقل دانش دامنه برای تعیین پارامترها نیاز دارد و خوشه‌ها را با سبک نقطه‌ای شناسایی می‌کند. (2) می تواند به طور موثر با داده های در مقیاس بزرگ کار کند. با این حال، الگوریتم DBSCAN برای استخراج مکان های سفر از CCGP ها به دلیل اندازه ها و تراکم های مختلف نامناسب است. برای رفع این مشکل، کیسیلویچ و همکاران. [ 32] یک الگوریتم خوشه بندی جدید مبتنی بر DBSCAN به نام P-DBSCAN ارائه کرد که برای بررسی مکان و رویداد با استفاده از ترکیبی از CCGP ها مناسب است و می تواند با استفاده از چگالی تطبیقی، تعریف چگالی مستقیم قابل دستیابی را ارائه دهد.
در مطالعه ما، الگوریتم خوشه‌بندی P-DBSCAN برای یافتن مکان‌های سفر از CCGP استفاده می‌شود. مجموعه ای از مکان های سفر را به دست می آوریم {ل1،ل2… ,لn}�={�1,�2,…,��}. هر عنصر مکان به صورت تعریف شده است ل= { پل، ج یا آردل��,�����}، جایی که پل��مجموعه ای از عکس های خوشه ای و ج یا آردل�����در مختصات جغرافیایی مرکز CCGP ها ظاهر می شود.

4.2. به دست آوردن اطلاعات صریح

4.2.1. مدل سازی اطلاعات متنی

اطلاعات مهر زمان امکان بازیابی شرایط آب و هوا را فراهم می کند w، ایجاد یک زمینه زمانی از روز تی، و زمینه فصل را دریافت می کند س. خدمات وب هواشناسی (WWS) معمولاً اطلاعات مربوط به وضعیت آب و هوا را در پایه ساعتی، روزانه یا ماهانه در اختیار ما قرار می دهد. با استفاده از WWS با مهر زمان، می‌توانیم زمینه w (از جمله دما و وضعیت آسمان) را هنگام بازدید کشف کنیم.βt )�=(�,�,�)ساخته شده. ما از API wunderground.com برای به دست آوردن اطلاعات آب و هوا استفاده می کنیم. برای به دست آوردن زمینه تی، ما از میانگین زمان گرفته شده از عکس های متعلق به یک بازدید سوء استفاده می کنیم. متن نوشته سسپس مشتق می شود. تعاریف دقیق در مورد زمان روز، فصل و شرایط آب و هوایی به شرح زیر است:
  • زمان روز: صبح روز هفته، بعد از ظهر روز هفته، صبح آخر هفته و بعد از ظهر آخر هفته.
  • فصل: بهار (مارس-آوریل-مه)، تابستان (ژوئن-ژوئیه-اوت)، پاییز (سپتامبر-اکتبر-نوامبر) و زمستان (دسامبر-ژانویه-فوریه).
  • دمای هوا: گرم (≥25 درجه سانتیگراد)، گرم (15-25 درجه سانتیگراد)، خنک (5-15 درجه سانتیگراد) و سرد (<5 درجه سانتیگراد).
  • وضعیت آب و هوا-آسمان: آفتابی، ابری، بارانی، برفی و مه آلود.
4.2.2. مدل سازی اطلاعات متنی
ابرداده های CCGP دارای اطلاعات ناهمگون غنی هستند (به عنوان مثال، اطلاعات متنی). برچسب ها تحت اطلاعات متنی طبقه بندی می شوند که برای مدل سازی کاربران و مکان های سفر ضروری است [ 7 ، 33 ]. مدل موضوع، به عنوان مثال، تخصیص نهفته دیریکله (LDA) [ 34 ]، فرض می‌کند که هر سند مجموعه‌ای (پیکره) است که می‌تواند به عنوان ترکیبی از موضوعات توصیف شود، که در آن هر موضوع با مجموعه‌ای از «معمولی» یا «احتمالی» تعریف می‌شود. ” کلمات نمایش مدل گرافیکی مدل LDA در شکل 3 ارائه شده است که به صورت زیر عمل می کند:
  • پارامترها را انتخاب کنید θمن��-𝐷𝑖 r ( α)، جایی که θمن��توزیع موضوعی سند است iو 𝐷𝑖 r ( α) توزیع دیریکله پارامتر 𝛼 است.
  • برای هر کلمه:
    • یک موضوع را انتخاب کنید zچند جمله ای ( θi��).
    • یک کلمه را انتخاب کنید wچند جمله ای ( βz��).
روش ما از مدل موضوع برای به دست آوردن گسترش موضوع پنهان کاربران و مکان های سفر برای پرداختن به اطلاعات متنی CCGP ها استفاده می کند. مجموعه برچسب تمام عکس های یک مکان سفر lو همچنین کاربر u، به عنوان یک سند در نظر گرفته می شود و ما از مدل موضوع برای به دست آوردن توزیع موضوع استفاده می کنیم txtl ���� و txtu����.

4.3. به دست آوردن اطلاعات صریح

پس از به دست آوردن ویژگی های صریح، ویژگی های کاربر و مکان سفر به عنوان ساخته می شوند u=(wu,su, tu,txtu)�=(��,��, ��,����)و l=(wl, sl, tl، تی xتیل، dمنسل) �=(��, ��, ��, ����, ����) . ترکیبی از ویژگی های کاربر و مکان سفر در فاکتورسازی ماتریس اعمال می شود. مl���نشان دهنده ماتریس شباهت بین دو مکان سفر است، و متو تو���نشان دهنده ماتریس شباهت بین دو کاربر است. هر دو مl���و متو تو���برای کمک به فاکتورسازی ماتریس مکان کاربر-سفر استفاده می شود. مقدار شباهت بین 0 و 1 است و مقدار بزرگ نشان دهنده شباهت زیاد است. dمن هستم (لj،لک)���(��,��)فاصله جغرافیایی بین دو مکان سفر است. شباهت مکان سفر-مکان سفر را می توان با معادله (1) محاسبه کرد:

سیمل(لj،لک) =yq1ایکسq×ایکسqyq1ایکس2q——–√yq1ایکس2q——–√،Sim�(��,��)=∑�=1����×���∑�=1����2·∑�=1����2,

جایی که ایکسq���و ایکسq���نماینده qتی ساعت��ℎویژگی مکان های سفر لj��و لک��، به ترتیب. yتعداد امکانات است. شباهت کاربر-کاربر را می توان با معادله (2) محاسبه کرد:

سیمتو(تومن،توک) =yg1ایکسمن g×ایکسgyg1ایکس2من g——–√yg1ایکس2g——–√،Sim�(��,��)=∑�=1�′���×���∑�=1�′���2·∑�=1�′���2,

جایی که ایکسمن g���و ایکسg���. نماینده gتی ساعت��ℎویژگی کاربران تومن��و توک��، به ترتیب. y�′. تعداد امکانات است. وزن مکان های سفر و شباهت کاربران را می توان به ترتیب با معادلات (3) و (4) محاسبه کرد.

سیمل(لj،لک) =a×siمترل(لj،لک) +b×1dمن هستم (لj،لک)،Sim�(��,��)=�×����(��,��)+�×11+���(��,��),
سیمتو(تومن،توک) = × iمترتو(تومن،توک) ،Sim�(��,��)=�×����(��,��),

جایی که یک ،�,و ب _�,. نشان دهنده وزن شباهت بین مکان های سفر و جوزن شباهت بین کاربران را نشان می دهد که برای کمک به فاکتورسازی تعامل مکان کاربر-سفر استفاده می شود. وزن ها به شرح زیر تعیین می شود: =15/a=b=15و =14/c=14.

4.4. فاکتورسازی تعامل کاربر-محل سفر

تعامل مکان کاربر و سفر نقش مهمی در زمینه توصیه مکان سفر ایفا می کند. اجازه دهید rمن ج���تعداد دفعات آن کاربر باشد مناز مکان سفر بازدید کرده است j، که می توان از بررسی های گذشته دریافت کرد. برای محاسبه اثر وزنی کاربر و مکان سفر، از الگوریتم WMF [ 35 ] استفاده می کنیم. اجازه دهید پمن ج���ترجیح کاربر باشد منبه محل سفر j، که از باینریزه کردن به دست می آید rمن ج���همانطور که در رابطه (5) نشان داده شده است. اجازه دهید سیمن ج���اعتماد به نفس باشد پمن ج���که از رابطه (6) بدست می آید.

پمن ج{1 rمن ج00 rمن ج0���={1 ���>00 ���=0
سیمن جγورود به سیستم +ϵ– 1rمن ج) ،���=1+�log(1+�−1���),

جایی که γو ϵپارامترهای هایپر هستند. فرض کنید که تومنآرن× k��∈ℝ�×�ترجیحات پنهان کاربران باشد، لjآرم× k��∈ℝ�×�مکان های سفر خواص نهفته باشد. روش اصلی توصیه مکان سفر تقریبی است تومنس��′�ترجیحات نهفته در یک بازدید نشده لj��با حل مسئله بهینه سازی زیر.

دقیقهتو∗ ،ل12من ، جسیمن ج(پمن جتوتیمنلj)2،min�∗,�∗12∑�,����(���−�����)2,

جایی که سیمن جآرن× م���∈ℝ�×�چک در وزن ماتریس با است سیمن ج1���=1نشان می دهد که تومن��در ثبت نام کرده است لj��، سیمن ج0���=0در غیر این صورت. به دنبال کار قبلی [ 9 ]، اطلاعات شباهت ناهمگن، شباهت کاربر-کاربر را معرفی می کند و شباهت مکان سفر-محل سفر می تواند برای محدود کردن یک WMF برای توصیه مکان سفر، که در معادله (8) ارائه شده است، استفاده شود:

دقیقهتو∗ ،ل12من ، جسیمن ج(پمن جتوتیمنلj)2+λ12(1مترg∈ )من _مترتوk ) ∥تومنتوک2اف+1nq∈ )من _مترلk ) ∥لjلک2اف)+λ22تومن2افلj2اف) ،min�∗,�∗12∑�,����(���−�����)2+�12(∑�=1�∑�∈�(�)����(�,�)‖��−��‖�2+∑�=1�∑�∈�(�)����(�,�)‖��−��‖�2)+�22(‖��‖�2+‖��‖�2),

جایی که تومن��بردار عامل پنهان کاربر است من، و لj��بردار عامل پنهان مکان سفر است j، دو اصطلاح تنظیم تومن2اف‖��‖�2و لj2اف‖��‖�2برای جلوگیری از نصب بیش از حد استفاده می شود و )�(�)و )�(�)شباهت های کاربر و مکان سفر کاربر است منو محل سفر j، به ترتیب. λ1�1و λ2�2پارامترهای غیرمنفی هستند که برای کنترل شرایط منظم سازی و شباهت اصطلاحات منظم سازی استفاده می شوند.

4.5. بهره برداری از محتوای بصری

با توانایی های یادگیری بازنمایی قدرتمند، CNN به طور گسترده ای برای بهبود وضعیت پیشرفته، به عنوان مثال، پردازش سیگنال [ 15 ] و پردازش زبان طبیعی [ 16 ] استفاده می شود. CNN می تواند به طور موثر ویژگی های محلی را از لایه های مختلف بگیرد و ویژگی ها را به یک بردار واحد تبدیل کند [ 17 ]. ما معماری پیشرفته CNN VGG-16 [ 36 ] را انتخاب می کنیم که از 16 لایه، شامل 13 کانولوشن، 3 کاملا متصل (FC)، 5 max-pooling و 1 لایه softmax تشکیل شده است، همانطور که در شکل نشان داده شده است . 4 . اندازه عکس ورودی است 224 × 224 × 3224×224×3، جایی که 33تعداد کانال ها (یعنی RGB) است و اندازه هر CCGP به آن تغییر می کند 224 × 224224×224. مطالعات اخیر یادگیری انتقال نشان داده است که CNN آموزش دیده بر روی یک مجموعه داده بزرگ را می توان برای استخراج ویژگی های CNN برای سایر مجموعه های داده تعمیم داد و از رویکردهای پیشرفته در این مجموعه داده های جدید برای وظایف مختلف بهتر عمل کرد [37 ، 38 ] . بنابراین، برای مقداردهی اولیه وزن‌های VGG-16 در پایگاه داده مکان، از Pre-trained استفاده می‌کنیم. اجازه دهید fل��نمایه سازی لتی ساعت��ℎلایه کانولوشن، vل��تعداد فیلترها در لتی ساعت��ℎلایه پیچیدگی، zل��اندازه فضایی فیلتر باشد و مترل��اندازه فضایی نقشه ویژگی خروجی باشد. به روز رسانی از دبلیومحاسبات لایه پیچیدگی بر آن غالب است و پیچیدگی زمانی برای یک هزینه ورودی است ای (fلz2لvلمتر2ل)�(����2����2)[ 39 ]. آخرین لایه‌های FC و softmax را که برای مقاصد طبقه‌بندی استفاده می‌شوند، حذف می‌کنیم و خروجی لایه دوم FC (یعنی FC7) را به عنوان نمایش یک CCGP می‌گیریم، به عنوان مثال،  rj ��.

4.6. تخمین فاکتور نهفته از عکس ها

برآورد عوامل پنهان برای یک مکان سفر معین از CCGP مربوطه یک مشکل رگرسیونی است. از آنجایی که عوامل پنهان دارای ارزش واقعی هستند، هدف اصلی به حداقل رساندن میانگین مربعات خطای برآوردها است. اجازه دهید لj��بردار عامل پنهان مکان باشد j، که توسط WMF بدست می آید و لj��′پیش بینی مربوطه توسط CNN است. سپس مسئله کمینه سازی به صورت زیر ارائه می شود:

دقیقهθjلjلj2.min�∑�‖��−��′‖2.

4.7. توصیه مکان سفر

نمایش چارچوب CNNMF در شکل 2 نشان داده شده است . با ادغام رابطه (8) و معادله (9)، تابع هدف CNNMF را می توان به صورت زیر نوشت:

دقیقهتو∗ ،ل،ل121متر1nسیمن ج(پمن جتوتیمنلj)2+λ12(1مترg∈ )من _مترتوk ) ∥تومنتوک2اف+1nq∈ )من _مترلk ) ∥لjلک2اف)+λ32(jلjلj2اف) +λ22تومن2افلj2اف) +λ42لj2اف) ، min�∗,�∗,�∗’12∑�=1�∑�=1����(���−�����)2+�12(∑�=1�∑�∈�(�)����(�,�)‖��−��‖�2+∑�=1�∑�∈�(�)����(�,�)‖��−��‖�2)+�32(∑�‖��−��’‖�2)+�22(‖��‖�2+‖��‖�2)+�42(‖��’‖�2) ,

جایی که λ3�3و λ4�4پارامترهایی هستند که برای کنترل تخمین عامل نهفته و اصطلاحات منظم‌سازی استفاده می‌شوند. معادلات (11) تا (13) که بر اساس نزول گرادیان است، برای به روز رسانی کاربر استفاده می شود. تومن��و محل سفر لj��، به ترتیب.

تومنتومنα (پمن جتوتیمنلj)لjλ1g∈ )من _مترتومن ، ک ) (تومنتوک) –λ2تومن)��←��+�((���−�����)��−�1∑�∈�(�)����(�,�)(��−��)−�2��)
لjلjα (پمن جتوتیمنلj)تومنλ1q∈ )من _مترلk ) (لjلک) +λ3j(لjلj)لjλ2لj)��←��+�((���−�����)��−�1∑�∈�(�)����(�,�)(��−��)+�3∑�(��−��′)��′−�2��)
لjلjα (λ3j(لjلj)لjλ4لj)��′←��′+�(�3∑�(��−��′)��−�4��′)

4.8. الگوریتم یادگیری CNNMF

با قوانین به‌روزرسانی فوق، الگوریتم CNNMF در الگوریتم 1 خلاصه می‌شود. چارچوب پیشنهادی CNNMF از وزن شباهت بین کاربران (و مکان‌های سفر) برای بهره‌برداری از ویژگی‌های کمکی استفاده می‌کند که در فرآیند WMF برای توصیه مکان‌های سفر ادغام می‌شوند. برای یک مکان سفر جدید، وزن‌های VGG16 را با وزنه‌های از پیش آموزش‌دیده در پایگاه داده مکان برای طبقه‌بندی عکس مقداردهی اولیه می‌کنیم. پایگاه داده مکان یک مجموعه داده عکس بسیار بزرگ است که شامل 7,076,580 عکس از 476 دسته صحنه است. این با مقداردهی اولیه CNN با استفاده از وزنه های از پیش آموزش دیده در پایگاه داده مکان نشان داده می شود. در عمل، لایه های قبلی را ثابت نگه می داریم. این به دلیل مشاهده این است که ویژگی های قبلی یک CNN حاوی ویژگی های عمومی بیشتری است که باید برای بسیاری از وظایف مفید باشد. اما لایه های بعدی CNN به تدریج به جزئیات مجموعه داده اصلی اختصاصی تر می شوند و باید برای توصیه مکان سفر مفید باشند. به طور خلاصه، همه عوامل پنهان کاربر و مکان سفر در به روز می شوند ای (ک2nپ+ک3ن+ک3م)�(�2��+�3�+�3�)جایی که nپ��تعداد رتبه های مشاهده شده است. توجه داشته باشید که بردارهای پنهان عکس هنگام به روز رسانی محاسبه می شوند دبلیو. پیچیدگی زمانی برای به روز رسانی دبلیومحاسبات لایه کانولوشن بر آن غالب است و بنابراین تمام متغیرهای وزن و بایاس CNN در به روز می شوند. ای (دلv– 1.z2ل.vل.متر2ل)�(∑����−1.��2.��.��2)[ 39 ]. کل پیچیدگی زمانی در هر دوره است Oدبلیوماف(ک2nپ+ک3ن+ک3م) +Oسینن(دلv– 1.z2ل.vل.متر2ل)����(�2��+�3�+�3�)+����(∑����−1.��2.��.��2)، و این فرآیند بهینه سازی به صورت خطی با اندازه داده های داده شده مقیاس می شود. در نهایت امتیاز را محاسبه می کنیم توتیمنلj�����، و مکان های سفر با بالاترین امتیاز را توصیه کنید.
الگوریتم 1. چارچوب پیشنهادی CNNMF
ورودی:
P ، ماتریس ترجیحی مکان کاربر-سفر
Sim u (u i ، k ): شباهت های کاربر-کاربر
Sim l ( j ، k ): مکان سفر-شباهت های مکان سفر
پ𝒫j برای l j ∈ L
خروجی :
بردار عامل پنهان کاربر و مکان سفر i , j ;
1: مقداردهی اولیه وزن VGG-16 در پایگاه داده مکان
2: مقداردهی اولیه i , j و لj��′
3:  برای هر i انجام می دهم
4: به روز رسانی با معادله (10)
5:  پایان برای
6:  برای هر j انجام
7: به روز رسانی با معادله (11)
8:  پایان برای
9:     اگر مکان سفر j جدید است ،
10: برآورد لj��′توسط CNN ( W , j )
11: به روز رسانی توسط معادله (12)
12:   پایان اگر
13:  برگرداندن مکان های برتر سفر توسط ij

5. آزمایشات

در این بخش، آزمایش‌هایی را برای ارزیابی عملکرد روش پیشنهادی تنظیم می‌کنیم. ما با معرفی مجموعه داده‌ها، تنظیمات پارامتر، تأثیر تعداد موضوع و تأثیر انواع مختلف اطلاعات شروع می‌کنیم و سپس روش پیشنهادی را با روش‌های پیشنهادی مکان سفر مقایسه می‌کنیم.

5.1. مجموعه داده

ما از مجموعه داده CCGP استفاده می کنیم Dتوسط جیانگ و همکاران استفاده شده است. [ 18 ] که حاوی بارگذاری هایی از 73877387کاربران مجموعه داده شامل آلبوم‌های عکس مرتبط با اعلام حضورهای گذشته است که در ۹ شهر تور محبوب (یعنی نیویورک، لس آنجلس، شیکاگو، بارسلونا، برلین، لندن، پاریس، رم، و سانفرانسیسکو) گرفته شده‌اند. عکس‌های بدون طول و عرض جغرافیایی و همچنین «عکس‌های سلفی» را حذف کردیم، زیرا این عکس‌ها نمی‌توانند اطلاعات کافی درباره مکان‌های سفر ارائه دهند. آمار نهایی مجموعه داده در جدول 2 نشان داده شده است و توزیع فضایی عکس ها در شهرهای تور محبوب در شکل 5 نشان داده شده است .

5.2. تنظیمات پارامتر

در این بخش، تنظیمات چند پارامتر مورد استفاده در آزمایشات خود را ارائه می دهیم.
  • برای فعال کردن P-DBSCAN برای شناسایی مکان های سفر از CCGP ها، یک تنظیم می کنیم ممن U50��������=50، شعاع ε n ) = 100 � (�������)=100متر و نسبت چگالی ω 0.5�=0.5.
  • برای به دست آوردن اطلاعات تعامل کاربر-محل سفر، به طور تجربی آستانه مدت زمان بازدید را تعیین کردیم  iتیتی ه آر6 ������ℎ�=6ساعت
  • در تمام آزمایش‌های زیر بر اساس روش‌های فاکتورسازی ماتریسی، پارامترها را تنظیم می‌کنیم λ10.01�1=0.01، λ20.1�2=0.1، λ30.001�3=0.001، λ41�4=1، و α 0.5�=0.5.
  • سی ان ان برای تخمین عوامل پنهان مکان های سفر جدید استفاده می شود. پارامتر نرخ یادگیری است 0.0010.001برای 6060اندازه دوره و مینی بچ 128 است. تکانه 0.9 است. کاهش وزن 0.0005 است. وزن ها به طور تصادفی پس از کار قبلی [ 40 ] مقداردهی اولیه می شوند.

در آزمایش‌های زیر، با توجه به زمان بازدید، مجموعه داده را تقسیم کردیم Dبه مجموعه آموزشی Dn������(80%) و مجموعه تست Dt�����(20%). سپس، استفاده از معیارهای ارزیابی، یعنی MAP@n و AP@n ، برای ارزیابی اثربخشی توصیه‌ها با معادلات محاسبه‌شده (13) و (14) به کار گرفته شد.

AP =(n1(من1من _کjمن )  n  ،AP@�=(∑�=1�(∑�=1�����)/�)  �  ,
نقشه n   (متر1آپمن)متر،MAP@�   (∑�=1����)�,

جایی که nتعداد مکان های پیشنهادی سفر را نشان می دهد و مترمترتعداد کاربران را نشان می دهد. ارزش ربط من _کj1لمنک�=1اگر کاربر از مکان سفر بازدید کرده باشد. در غیر این صورت، من _کj0لمنک�=0.

5.3. تاثیر شماره موضوع

تعداد موضوعات ککیک پارامتر مهم است و بر عملکرد توصیه ها تأثیر دارد. برای تصمیم گیری در مورد تعداد بهینه موضوعات، آزمایشی را برای بررسی تأثیر آن انجام می دهیم. نتیجه در شکل 6 نشان داده شده است ، که از آن می توانیم دریابیم که MAP تا 30.7 %30.7%چه زمانی ککاست 99. در نتیجه، ککدر آزمایش‌های زیر روی 9 تنظیم شد.

5.4. تأثیر انواع گوناگون اطلاعات

برای بررسی تأثیر انواع مختلف اطلاعات در توصیه مکان سفر، ما تنظیم کردیم λ3d  λ40�3، آ�د �4=0، باعث می شود که چارچوب CNNMF مانند رابطه (7) به هم بخورد، سپس اطلاعات «زمان»، «آب و هوا»، «فصل»، «برچسب ها» و «فاصله جغرافیایی» را به ترتیب حذف کنید. نتایج در جدول 3 آورده شده است که می تواند گرایش های زیر را پیدا کند:
  • انواع مختلف اطلاعات عملکرد توصیه را به درجات مختلف افزایش می دهد. بر اساس درجه نفوذ، اطلاعات را می توان به صورت زیر رتبه بندی کرد: اطلاعات فصل > اطلاعات آب و هوا > اطلاعات متنی > اطلاعات زمانی > اطلاعات فاصله جغرافیایی. عملکرد حذف اطلاعات “فصل” کمترین است، به این معنی که اطلاعات “فصل” مهمترین اطلاعات برای توصیه مکان سفر است. عملکرد حذف اطلاعات «فاصله جغرافیایی» بالاترین است، به این معنی که اطلاعات «فاصله جغرافیایی» بی‌اهمیت‌ترین اطلاعات است، زیرا اکثر مکان‌های سفر از یکدیگر دور نیستند.
  • نقشه روش پیشنهادی به طور قابل‌توجهی بهتر از پنج نوع دیگر است، که نشان می‌دهد روش پیشنهادی اطلاعات متنی، متنی و جغرافیایی را با هم ادغام می‌کند و بنابراین می‌تواند توصیه‌های بهبود یافته را ارائه دهد.

5.5. مقایسه عملکرد روش‌های پیشنهادی

برای بررسی قابلیت روش پیشنهادی برای توصیه مکان‌های سفر، آن را با روش‌های نمایندگی زیر مقایسه کردیم.
  • مدل موضوع پویا و فاکتورسازی ماتریس (DTMMF): DTMMF مدل موضوع را با فاکتورسازی ماتریس ادغام می کند تا مکان های سفر را توصیه کند. DTM برای به دست آوردن اطلاعات ضمنی استفاده می شود، در حالی که اطلاعات صریح از بررسی های گذشته و محتوای بصری (به عنوان مثال، سن و جنسیت) برای ساخت پروفایل های کاربر و مکان سفر به دست می آید [9 ] .
  • فیلتر مشارکتی مبتنی بر شبکه عصبی (NCF): NCF فاکتورسازی ماتریس را با پرسپترون چند لایه ترکیب می‌کند تا تعاملات مکان سفر-کاربر غیرخطی را ثبت کند [ 41 ]. محتوای بصری در نظر گرفته نمی شود.
  • مدل عامل‌سازی ماتریس احتمالی بصری (VPMF): VPMF از ویژگی‌های بصری برای یادگیری ترجیحات کاربر با استفاده از بررسی‌های گذشته کاربران استفاده می‌کند. سپس، ترجیحات کاربر را با محدودیت های مکان سفر برای برنامه ریزی سفر یکپارچه می کند [ 42 ].
  • رتبه‌بندی شخصی بیزی بصری (VBPR): VBPR ویژگی‌های بصری را از عکس‌ها با استفاده از یک روش از پیش آموزش‌دیده بدون هیچ گونه اطلاعات زمینه استخراج می‌کند [ 5 ]. ویژگی بصری استخراج شده برای پیش بینی امتیازات نظرات افراد استفاده می شود.
  • توصیه POI افزایش یافته محتوای بصری (VPOI): VPOI از یادگیری مشترک طبقه بندی عکس، تجزیه ماتریس، و وظایف استخراج ویژگی بصری [ 29 ] برای توصیه مکان های سفر به کاربر استفاده می کند. تفاوت با روش پیشنهادی این است که VPOI از عکس‌ها برای یادگیری مشترک بازنمایی‌های بردار فاکتور پنهان استفاده می‌کند.
برای انصاف، همه روش‌های نماینده شامل تعداد کل ابعاد یکسانی هستند. نتایج در جدول 4 آورده شده است و مشاهدات زیر را می توان یافت:
  • روش پیشنهادی به ترتیب از روش‌های دیگر، یعنی DTMMF، NCF، VPMF، VBPR و VPOI، به‌ترتیب به‌طور میانگین 35.21، 32.65، 31.22، 22.87، 9.5 درصد برتری دارد.
  • VPMF بهتر از DTMMF عمل می کند، که ممکن است به این دلیل باشد که VPMF ویژگی های بصری را مستقیماً از کل عکس استخراج می کند، در حالی که DTMMF فقط برخی از ویژگی ها (یعنی سن و جنسیت) را بر اساس تشخیص چهره استخراج می کند.
  • VPOI بهتر از VBPR کار می‌کند، این ممکن است به این دلیل باشد که VPOI عکس‌ها را هم برای کاربران و هم برای مکان‌های سفر مدل‌سازی می‌کند در حالی که VBPR فقط عکس‌ها را برای مکان‌های سفر مدل می‌کند.
  • روش پیشنهادی به طور قابل توجهی بهتر از VPOI است. این به دلیل ترکیب اطلاعات زمینه ای (یعنی زمان، آب و هوا و فصل)، متنی (یعنی برچسب ها) و جغرافیایی (یعنی فاصله) است، در حالی که VPOI فقط از عکس ها برای یادگیری مشترک بازنمایی های بردار عامل پنهان استفاده می کند.
ما چارچوب خود را با همان روش‌های نماینده ذکر شده در بالا برای رسیدگی به مشکل شروع سرد مکان سفر مقایسه می‌کنیم. ما به طور تصادفی 5 درصد از عکس های مکان های سفر را از مجموعه آموزشی انتخاب می کنیم و اعلام حضور آنها را حذف می کنیم. علاوه بر این، آلبوم های عکس را از 20٪ باقیمانده حذف می کنیم و از آنها به عنوان مجموعه آزمایشی استفاده می کنیم. همه آلبوم‌های عکس با اعلام حضور در مجموعه داده فلیکر ما مرتبط هستند. این مکان‌های سفر (5٪) همچنان عکس‌هایی بدون اعلام حضور دارند، که می‌تواند به کاهش مشکل شروع سرد مکان سفر کمک کند. نتایج در جدول 5 آورده شده است و مشاهدات زیر را می توان یافت:
  • به طور کلی، با ارائه مشکل شروع سرد مکان سفر، عملکرد همه روش ها کاهش می یابد. به عنوان مثال، عملکرد DTMMF از نظر MAP@10 تا 14.65٪ کاهش می یابد.
  • روش پیشنهادی برای مکان‌های سفر با شروع سرد به ترتیب به ترتیب 40.17%، 41.43، 40.17%، 29.06%، 11.63% از روش‌های دیگر مانند DTMMF، NCF، VPMF، VBPR و VPOI می‌گذرد.
  • کاهش عملکرد VBPR بسیار کمتر از DTMMF است، زیرا VBPR یک لایه اضافی را برای بهره برداری از ابعاد بصری یاد می گیرد، که می تواند به کاهش مشکل شروع سرد مکان سفر کمک کند، در حالی که DTMMF از محتویات بصری فقط برای استخراج ویژگی ها استفاده می کند (یعنی سن. و جنسیت) بر اساس تشخیص چهره.
  • روش پیشنهادی CNNMF به طور قابل توجهی بهتر از VPOI است، در حالی که هر دو روش از محتوای بصری استفاده می کنند. تفاوت‌های بین CNNMF و VPOI عبارتند از: CNNMF مستقیماً فاکتور پنهان را از عکس‌های خود به عنوان توضیحات مکان‌های سفر به دست می‌آورد. در حالی که VPOI از عکس ها برای کمک به یادگیری بازنمایی بردار فاکتور پنهان استفاده می کند.

6. نتیجه گیری و کار آینده

در این مطالعه، ما یک CNNMF را پیشنهاد می‌کنیم که CNN و WMF را ادغام می‌کند تا نمایش‌های عامل پنهان را برای مکان‌های سفر جدید به دست آورد. ما از وزن شباهت بین کاربران (و مکان‌های سفر) برای بهره‌برداری از ویژگی‌های کمکی استفاده می‌کنیم که در فرآیند WMF برای توصیه مکان‌های سفر ادغام شده‌اند. اگر یک مکان سفر دارای چک‌های قبلی نباشد، روش پیشنهادی از CNN برای تخمین بازنمایی عامل پنهان آن از عکس‌هایش استفاده می‌کند. نتایج تجربی نشان می دهد که CNNMF به طور قابل توجهی از روش های موجود بهتر عمل می کند. تحقیقات آینده می تواند در جهت های زیر گسترش یابد: (1) استخراج اطلاعات بیشتر از عکس ها (به عنوان مثال، همبستگی های اجتماعی)، که می تواند به کاهش مشکل شروع سرد کاربر کمک کند. (2) روش‌های پیشنهادی رقابتی دیگر را به کار ببرید.

منابع

  1. مجید، ع. چن، ال. چن، جی. میرزا، ح.ت. حسین، من. Woodward, J. یک سیستم توصیه مسافرتی شخصی‌شده آگاه از زمینه مبتنی بر داده‌کاوی رسانه‌های اجتماعی دارای برچسب جغرافیایی. بین المللی جی. جئوگر. Inf. علمی 2013 ، 27 ، 662-684. [ Google Scholar ] [ CrossRef ]
  2. لیو، جی. ژانگ، ز. لیو، سی. کیو، ا. Zhang، F. بهره‌برداری از تأثیرات اجتماعی دو بعدی جغرافیایی و ترکیبی برای توصیه مکان. ISPRS Int. J. Geo-Inf. 2020 ، 9 ، 285. [ Google Scholar ] [ CrossRef ]
  3. سان، ایکس. هوانگ، ز. پنگ، ایکس. چن، ی. لیو، ی. ساخت یک رویکرد توصیه شخصی مبتنی بر مدل برای جاذبه‌های گردشگری از داده‌های رسانه‌های اجتماعی دارای برچسب جغرافیایی. بین المللی جی دیجیت. زمین 2019 ، 12 ، 661–678. [ Google Scholar ] [ CrossRef ]
  4. وانگ، ز. ژانگ، دی. ژو، ایکس. یانگ، دی. یو، ز. Yu, Z. کشف و نمایه سازی جوامع همپوشانی در شبکه های اجتماعی مبتنی بر مکان. IEEE Trans. سیستم مرد سایبرن. سیستم 2014 ، 44 ، 499-509. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  5. یانگ، دی. ژانگ، دی. یو، ز. Wang, Z. یک سیستم توصیه موقعیت مکانی شخصی سازی شده با احساسات. در مجموعه مقالات بیست و چهارمین کنفرانس ACM در مورد فرامتن و رسانه های اجتماعی، پاریس، فرانسه، 1 تا 3 مه 2013. صص 119-128. [ Google Scholar ]
  6. ژانگ، جی دی. Chow، CY iGSLR: توصیه موقعیت جغرافیایی-اجتماعی شخصی: یک رویکرد تخمین چگالی هسته. در مجموعه مقالات بیست و یکمین کنفرانس بین المللی ACM SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی، اورلاندو، فلوریدا، ایالات متحده آمریکا، 5 تا 8 نوامبر 2013. صص 334-343. [ Google Scholar ]
  7. خو، ز. چن، ال. Chen, G. روش توصیه سفر مبتنی بر زمینه آگاه با استفاده از عکس‌های دارای برچسب جغرافیایی. محاسبات عصبی 2015 ، 155 ، 99-107. [ Google Scholar ] [ CrossRef ]
  8. شی، ی. سردیوکوف، پ. هانجالیچ، ع. لارسون، ام. توصیه شاخص غیر ضروری با استفاده از عکس‌های دارای برچسب جغرافیایی. ACM Trans. هوشمند سیستم تکنولوژی 2013 ، 4 ، 1-27. [ Google Scholar ] [ CrossRef ]
  9. خو، ز. چن، ال. دای، ی. چن، جی. یک مدل موضوع پویا و روش توصیه سفر مبتنی بر فاکتورسازی ماتریس با بهره‌برداری از داده‌های همه جا حاضر. IEEE Trans. چندتایی. 2017 ، 19 ، 1933-1945. [ Google Scholar ] [ CrossRef ]
  10. کیم، دی. پارک، سی. اوه، جی. لی، اس. یو، اچ. فاکتورسازی ماتریس کانولوشنال برای توصیه آگاه از زمینه سند. در مجموعه مقالات دهمین کنفرانس ACM در مورد سیستم‌های توصیه‌کننده، بوستون، MA، ایالات متحده آمریکا، 15 تا 19 سپتامبر 2016. صص 233-240. [ Google Scholar ]
  11. کای، جی. تره فرنگی.؛ Lee, I. سیستم توصیه‌کننده برنامه سفر با استخراج الگوی مسیر معنایی از عکس‌های دارای برچسب جغرافیایی. سیستم خبره Appl. 2018 ، 94 ، 32-40. [ Google Scholar ] [ CrossRef ]
  12. گائو، اچ. تانگ، جی. لیو، اچ. gSCorr: مدل‌سازی همبستگی‌های جغرافیایی-اجتماعی برای بررسی‌های جدید در شبکه‌های اجتماعی مبتنی بر مکان. در مجموعه مقالات بیست و یکمین کنفرانس بین المللی ACM در مدیریت اطلاعات و دانش، مائوئی، HI، ایالات متحده آمریکا، 29 اکتبر تا 2 نوامبر 2012. صص 1582-1586. [ Google Scholar ]
  13. گائو، اچ. تانگ، جی. لیو، اچ. پرداختن به مشکل شروع سرد در توصیه مکان با استفاده از همبستگی های جغرافیایی-اجتماعی. حداقل داده بدانید. کشف کنید. 2015 ، 29 ، 299-323. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  14. شی، اچ. چن، ال. خو، ز. لیو، دی. توصیه موقعیت مکانی شخصی شده با استفاده از اطلاعات استفاده از تلفن همراه. Appl. هوشمند 2019 ، 49 ، 3694–3707. [ Google Scholar ] [ CrossRef ]
  15. ون دن اوورد، آ. دیلمان، اس. Schrauwen، B. توصیه موسیقی مبتنی بر محتوای عمیق. In Advances in Neural Information Processing Systems 26: 27th Annual Conference on Neural Information Processing Systems 2013, Lake Tahoe, NV, USA, 5-8 دسامبر 2013 ; NeurIPS: سن دیگو، کالیفرنیا، ایالات متحده آمریکا، 2013; صص 2643-2651. [ Google Scholar ]
  16. Kim, Y. شبکه های عصبی کانولوشن برای طبقه بندی جملات. در مجموعه مقالات کنفرانس روشهای تجربی در پردازش زبان طبیعی (EMNLP)، دوحه، قطر، 25-29 اکتبر 2014. صفحات 1746-1751. [ Google Scholar ]
  17. یو-هی نگ، جی. یانگ، اف. دیویس، LS بهره برداری از ویژگی های محلی از شبکه های عمیق برای بازیابی تصویر. در مجموعه مقالات کنفرانس IEEE در کارگاه های آموزشی بینایی کامپیوتری و تشخیص الگو، بوستون، MA، ایالات متحده آمریکا، 7 تا 12 ژوئن 2015. صص 53-61. [ Google Scholar ]
  18. جیانگ، اس. کیان، ایکس. می، تی. Fu, Y. توصیه توالی سفر شخصی شده در رسانه های اجتماعی بزرگ چند منبعی. IEEE Trans. کلان داده 2016 ، 2 ، 43-56. [ Google Scholar ] [ CrossRef ]
  19. لیو، سی. لیو، جی. خو، اس. وانگ، جی. لیو، سی. چن، تی. جیانگ، تی. یک شبکه کانولوشنال متسع فضایی-زمانی برای توصیه نقطه مورد علاقه. ISPRS Int. J. Geo-Inf. 2020 ، 9 ، 113. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  20. ژنگ، YT; ژا، زجی؛ الگوهای سفر معدن Chua، TS از عکس های دارای برچسب جغرافیایی. ACM Trans. هوشمند سیستم تکنولوژی 2012 ، 3 ، 1-18. [ Google Scholar ] [ CrossRef ]
  21. چن، سی. چن، ایکس. وانگ، ز. وانگ، ی. Zhang، D. ScenicPlanner: برنامه ریزی مسیرهای سفر خوش منظره با استفاده از ردپای دیجیتال ناهمگون تولید شده توسط کاربر. جلو. محاسبه کنید. علمی 2017 ، 11 ، 61-74. [ Google Scholar ] [ CrossRef ]
  22. مجید، ع. چن، ال. میرزا، ح.ت. حسین، من. Chen, G. سیستمی برای استخراج مکان‌های گردشگری جالب و توالی سفر از عکس‌های برچسب‌گذاری شده جغرافیایی عمومی. دانستن داده ها مهندس 2015 ، 95 ، 66-86. [ Google Scholar ] [ CrossRef ]
  23. چنگ، ای جی؛ چن، YY; هوانگ، YT; Hsu، WH; Liao، HYM با استخراج ویژگی‌های افراد از عکس‌های ارائه‌شده توسط جامعه، توصیه سفر شخصی‌سازی شده است. در مجموعه مقالات نوزدهمین کنفرانس بین المللی ACM در چند رسانه ای، اسکاتسدیل، AZ، ​​ایالات متحده، 28 نوامبر تا 1 دسامبر 2011. صص 83-92. [ Google Scholar ]
  24. چن، YY; چنگ، ای جی؛ Hsu، WH توصیه سفر با استخراج ویژگی های افراد و انواع گروه های سفر از عکس های ارائه شده توسط جامعه. IEEE Trans. چندتایی. 2013 ، 15 ، 1283-1295. [ Google Scholar ] [ CrossRef ]
  25. Ke، X. زو، جی. Niu, Y. حاشیه نویسی خودکار تصویر از انتها به انتها بر اساس cnn عمیق و تقویت داده های چند برچسبی. IEEE Trans. چندتایی. 2019 ، 21 ، 2093–2106. [ Google Scholar ] [ CrossRef ]
  26. کوانگ، اچ. زو، اس. السادیک، الف. تقویت پیش بینی موقعیت جغرافیایی برای تصاویر وب از طریق یکپارچه سازی منابع دانش متعدد. در مجموعه مقالات پنجمین کنفرانس بین المللی ACM در مورد بازیابی چند رسانه ای، شانگهای، چین، 23 تا 26 ژوئن 2015. صص 559-562. [ Google Scholar ]
  27. زینگ، اس. وانگ، کیو. ژائو، ایکس. لی، تی. توصیه‌های نقطه‌نظر از محتوا مبتنی بر شبکه عصبی کانولوشنال. Appl. هوشمند 2019 ، 49 ، 858-871. [ Google Scholar ] [ CrossRef ]
  28. ویاند، تی. کوستریکوف، آی. فیلبین، جی. موقعیت جغرافیایی عکس سیاره با شبکه های عصبی کانولوشنال. در مجموعه مقالات چهاردهمین کنفرانس اروپایی بینایی کامپیوتری-ECCV 2016، آمستردام، هلند، 11 تا 14 اکتبر 2016؛ صص 37-55. [ Google Scholar ]
  29. وانگ، اس. وانگ، ی. تانگ، جی. شو، ک. رانگانات، اس. لیو، اچ. تصاویر شما چه چیزی را نشان می‌دهند: بهره‌برداری از محتوای بصری برای توصیه‌های مورد علاقه. در مجموعه مقالات بیست و ششمین کنفرانس بین‌المللی وب جهانی، پرث، WA، استرالیا، 3 تا 7 آوریل 2017؛ صص 391-400. [ Google Scholar ]
  30. کراندال، دی جی; بکستروم، ال. هاتنلوچر، دی. کلینبرگ، جی. نقشه برداری از عکس های جهان. در مجموعه مقالات هجدهمین کنفرانس بین المللی وب جهانی، مادرید، اسپانیا، 20-24 آوریل 2009; صص 761-770. [ Google Scholar ]
  31. یو، ی. ژائو، ی. یو، جی. وانگ، جی. الگوهای معادن از مسیرهای عکس اینستاگرام برای توصیه مسیرهای مسافرتی محبوب. جلو. محاسبه کنید. علمی 2017 ، 11 ، 1007–1022. [ Google Scholar ] [ CrossRef ]
  32. کیسیلویچ، اس. منزمن، اف. Keim, D. P-DBSCAN: الگوریتم خوشه‌بندی مبتنی بر چگالی برای اکتشاف و تجزیه و تحلیل مناطق جذاب با استفاده از مجموعه عکس‌های دارای برچسب جغرافیایی در مجموعه مقالات اولین کنفرانس بین المللی و نمایشگاه محاسبات برای تحقیقات و کاربردهای جغرافیایی، واشنگتن، دی سی، ایالات متحده آمریکا، 21 تا 23 ژوئن 2010. صص 1-4. [ Google Scholar ]
  33. ماتسو، اس. شیمودا، دبلیو. Yanai, K. توئیتر موقعیت جغرافیایی عکس با استفاده از ویژگی های متنی و بصری. در مجموعه مقالات سومین کنفرانس بین المللی IEEE درباره داده های بزرگ چندرسانه ای، لاگونا هیلز، کالیفرنیا، ایالات متحده آمریکا، 19 تا 21 آوریل 2017؛ ص 22-25. [ Google Scholar ]
  34. Blei، DM; Ng، AY؛ جردن، MI تخصیص دیریکله نهفته. جی. ماخ. فرا گرفتن. Res. 2003 ، 3 ، 993-1022. [ Google Scholar ]
  35. هو، ی. کورن، ی. وولینسکی، سی. فیلترینگ مشترک برای مجموعه داده های بازخورد ضمنی. در مجموعه مقالات کنفرانس بین المللی IEEE در مورد داده کاوی، پیزا، ایتالیا، 15-19 دسامبر 2008. صص 263-272. [ Google Scholar ]
  36. سیمونیان، ک. Zisserman, A. شبکه های پیچیده بسیار عمیق برای تشخیص تصویر در مقیاس بزرگ. در مجموعه مقالات کنفرانس بین‌المللی نمایش‌های یادگیری 2015، سن دیگو، کالیفرنیا، ایالات متحده آمریکا، 7 تا 9 مه 2015. ص 1409-1556. [ Google Scholar ]
  37. دوناهو، جی. جیا، ی. وینیالز، او. هافمن، جی. ژانگ، ن. تزنگ، ای. Darrell, T. Decaf: یک ویژگی فعال‌سازی پیچیده عمیق برای تشخیص بصری عمومی. در مجموعه مقالات سی و یکمین کنفرانس یادگیری ماشینی، پکن، چین، 21 تا 26 ژوئن 2014. صص 647-655. [ Google Scholar ]
  38. شریف رضویان، ع. عزیزپور، ح. سالیوان، جی. Carlsson، S. CNN ویژگی‌های خارج از قفسه: یک خط پایه شگفت‌انگیز برای شناسایی. در مجموعه مقالات بیست و هفتمین کنفرانس IEEE در کارگاه های آموزشی بینایی کامپیوتری و تشخیص الگو، کلمبوس، OH، ایالات متحده، 24-27 ژوئن 2014. ص 806-813. [ Google Scholar ]
  39. او، ک. Sun، J. شبکه های عصبی کانولوشنال با هزینه زمانی محدود. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، بوستون، MA، ایالات متحده آمریکا، 7 تا 12 ژوئن 2015. صص 5353–5360. [ Google Scholar ]
  40. ژو، بی. لاپدریزا، ا. شیائو، جی. تورالبا، ا. Oliva, A. یادگیری ویژگی های عمیق برای تشخیص صحنه با استفاده از پایگاه داده مکان ها. در مجموعه مقالات پیشرفت‌ها در سیستم‌های پردازش اطلاعات عصبی 27: کنفرانس سالانه سیستم‌های پردازش اطلاعات عصبی 2014، مونترال، QC، کانادا، 8 تا 13 دسامبر 2014. صص 487-495. [ Google Scholar ]
  41. او، ر. McAuley, J. VBPR: رتبه‌بندی شخصی‌شده بیزی از بازخورد ضمنی. در مجموعه مقالات سی امین کنفرانس AAAI در مورد هوش مصنوعی، فینیکس، AZ، ​​ایالات متحده آمریکا، 12 تا 17 فوریه 2016. [ Google Scholar ]
  42. ژائو، پی. خو، سی. لیو، ی. شنگ، VS; ژنگ، ک. شیونگ، اچ. Zhou, X. Photo2trip: بهره‌برداری از محتوای بصری در عکس‌های دارای برچسب جغرافیایی برای توصیه تور شخصی‌شده. در مجموعه مقالات بیست و پنجمین کنفرانس بین المللی ACM در چند رسانه ای، دره سیلیکون، کالیفرنیا، ایالات متحده، 23 تا 27 اکتبر 2017. [ Google Scholar ]
شکل 1. نمونه‌هایی از عکس‌های برچسب‌گذاری‌شده توسط جامعه (CCGP).
شکل 2. چارچوب روش های پیشنهادی: فاکتورسازی ماتریس وزن دار (WMF) بخش در وسط (آبی چین دار). بخش شبکه عصبی کانولوشن (CNN) در سمت چپ (قرمز چین)؛ روش های تعبیه در سمت راست (سبز خط تیره) (بهترین رنگی دیده می شود).
شکل 3. مدل گرافیکی موضوع تخصیص دیریکله نهفته (LDA).
شکل 4. معماری VGG-16. تعداد نقشه های ویژگی از 64 شروع می شود و تا 512 افزایش می یابد و اندازه فیلتر روی 3 ثابت است.
شکل 5. توزیع فضایی عکس ها در 9 شهر محبوب در سراسر جهان: ( الف ) بارسلونا، ( ب ) برلین، ( ج ) شیکاگو، ( د ) لندن، ( ه ) لس آنجلس، ( f ) نیویورک، ( گ ) پاریس، ( h ) رم، و (i ) سانفرانسیسکو، نقشه برداری شده در Google Earth.
شکل 6. تاثیر تعداد موضوع.

بدون دیدگاه

دیدگاهتان را بنویسید