خلاصه

پیش بینی سریع و دقیق مکان داخلی نقش مهمی در خدمات مکان یابی داخلی دارد. این کار یک چارچوب پیش‌بینی مکان داخلی به نام Indoor-WhereNext را پیشنهاد می‌کند. ابتدا، یک الگوریتم جدید، “خوشه بندی فضایی مبتنی بر چگالی مکانی-زمانی داخلی برنامه های کاربردی با نویز” (Indoor-STDBSCAN)، برای شناسایی نقاط ماندن در یک مسیر داخلی و تبدیل آنها به یک توالی مکان پیشنهاد شده است. سپس، یک روش شباهت مکانی- معنایی (SSS) برای اندازه‌گیری شباهت بین توالی‌های مکان تعریف می‌شود. SSS به طور جامع شباهت های مکانی و معنایی بین توالی های مکان را در نظر می گیرد. در نهایت، یک الگوریتم خوشه بندی برای به دست آوردن گروه های کاربری مشابه بر اساس SSS استفاده می شود. این گروه ها برای آموزش مدل های مختلف پیش بینی برای دستیابی به نتایج بهبود یافته استفاده می شوند. آزمایش‌های گسترده‌ای با استفاده از مجموعه داده‌های موقعیت‌یابی Wi-Fi داخلی واقعی که در یک مرکز خرید جمع‌آوری شده بود، انجام شد. نتایج نشان می‌دهد که مدل Indoor-WhereNext به طور قابل‌توجهی از سه روش پایه موجود از نظر دقت و دقت پیش‌بینی بهتر عمل می‌کند.

کلید واژه ها:

پیش بینی مکان داخلی تشابه توالی ; خوشه بندی کاربران مشابه مسیر حرکت داخل ساختمان

1. معرفی

در سال های اخیر، با توسعه سریع تجارت الکترونیک، صنایع سنتی “آجر و ملات” به شدت تحت تاثیر قرار گرفته اند [ 1 ، 2 ]. این صنایع نیاز فوری به توسعه راه هایی برای کمک به بازرگانان برای برقراری روابط با مشتریان و ارائه یک تجربه خرید آفلاین شخصی برای آنها دارند تا توانایی بازاریابی خود را بهبود بخشند [ 3 ]. با توسعه مداوم فناوری موقعیت یابی داخلی و رواج تجهیزات پایانه سیار، داده های مسیر کاربر موبایل داخلی رشد انفجاری نشان داده است [ 4 ، 5 ، 6 ]]. داده های مسیر داخلی پایه مهمی برای خدمات مبتنی بر مکان داخلی هستند و فرصت های جدیدی را برای توسعه صنایع “آجر و ملات” فراهم می کنند [ 7 ، 8 ، 9 ، 10 ].
فناوری پیش‌بینی مکان می‌تواند مکان بعدی کاربر را با توجه به مسیر تاریخی استنباط کند. بنابراین می‌تواند خدمات انعطاف‌پذیری را برای کاربران ارائه کند که یک نگرانی تحقیقاتی در این زمینه بوده است. تحقیقات نشان می دهد که رفتار کاربر قابل پیش بینی است [ 11 ]. تا به امروز، فناوری پیش بینی مکان به طور گسترده در بازسازی مسیر [ 12 ، 13 ]، توصیه مکان [ 14 ، 15 ، 16 ]، حمل و نقل هوشمند [ 17 ، 18 ]، و ارائه خدمات امنیتی [ 19 ] استفاده شده است.]. به عنوان مثال، خدمات مکان یابی داخلی می توانند مکان بعدی کاربر را پیش بینی کنند و اطلاعات مربوط به فروشگاه های مورد علاقه کاربر را ارسال کنند. این نه تنها تجربه خرید شخصی را برای کاربر فراهم می کند، بلکه به تاجر در کسب سود نیز کمک می کند [ 14 ، 15 ، 16 ].
روش‌های پیش‌بینی مکان را می‌توان بر اساس نیازهای پیش‌بینی به دو دسته زیر طبقه‌بندی کرد [ 20 ]: (1) آن‌هایی که مکانی را پیش‌بینی می‌کنند که کاربر بعدی از آن بازدید خواهد کرد [ 10 ، 21 ، 22 ، 23 ، 24 ، 25 ] و (2) آنهایی که مکان کاربر را در بازه زمانی بعدی پیش بینی می کنند [ 26]. تفاوت اصلی این است که اولی یک مسیر منفرد را به یک دنباله مکان تبدیل می کند، در حالی که دومی آن را به عنوان یک توالی بازه زمانی با موقعیت های مرتبط در نظر می گیرد. در این مطالعه تنها نوع اول پیش بینی مکان در نظر گرفته شد. تحقیقات موجود عمدتاً از الگوریتم‌های داده‌کاوی، مانند قانون ارتباط [ 27 ، 28 ]، مدل پنهان مارکوف (HMM) [ 29 ] یا شبکه عصبی بازگشتی (RNN) [ 30 ، 31 ] استفاده می‌کند.]، برای استخراج الگوهای بین دنباله های مکان و سپس ارائه پیش بینی های مکان. برخلاف تحقیقات موجود، رویکرد در این کار عمدتاً بر پیش‌بینی مکان برای فضاهای داخلی متمرکز است که به خدمات مکان‌یابی صنعت آفلاین مانند مراکز خرید بزرگ خدمات می‌دهد. برخلاف پیش‌بینی مکان در فضای باز، یک مسیر داخلی معمولاً دارای ویژگی‌های سه بعدی است، که تبدیل یک مسیر داخلی به دنباله مکان را برای الگوریتم‌های تشخیص نقطه اقامت موجود دشوار می‌کند. دوم، مسیر کاربر بر ترجیح کاربر دلالت دارد [ 32 ]. وقتی تعداد کاربران زیاد باشد، یافتن گروه های شباهت آسان است. استخراج الگوهای مکان در گروه شباهت آسان تر است [ 29 ].
بنابراین، این مقاله یک چارچوب پیش‌بینی مکان داخلی به نام Indoor-WhereNext را پیشنهاد می‌کند. این کار کمک های قابل توجهی دارد که به شرح زیر خلاصه می شود.
(1)
یک روش شباهت مکانی- معنایی جدید (SSS) تعریف شده است. این اطلاعات مکانی و معنایی را برای محاسبه شباهت بین دنباله های مکان و یافتن گروه های شباهت کاربران داخلی ترکیب می کند.
(2)
حافظه کوتاه مدت بلند مدت (LSTM) برای مدل سازی هر گروه از کاربران به منظور بهبود دقت پیش بینی مکان داخلی استفاده می شود.
(3)
عملکرد Indoor-WhereNext با استفاده از مسیرهای داخلی واقعی ارزیابی می شود. نتایج نشان‌دهنده مزایای رویکرد ما در مقایسه با خطوط پایه است.
بقیه این کار به شرح زیر تنظیم شده است. در بخش 2 ، ادبیات فعلی با تمرکز بر مدل‌هایی برای پیش‌بینی مکان از مسیرها مرور می‌شود. در بخش 3 ، یک چارچوب روش شناختی جدید برای پیش بینی مکان داخلی پیشنهاد شده است. عملکرد روش پیشنهادی در کار فعلی با روش‌های پیشنهاد شده در تحقیقات قبلی با استفاده از داده‌های موقعیت‌یابی Wi-Fi داخلی واقعی مقایسه می‌شود. این نتایج در بخش 4 ارائه شده است. در بخش 5 ، کار خلاصه شده و پیشنهاداتی برای مطالعات احتمالی آینده ارائه شده است.

2. کارهای مرتبط

مدل‌های پیش‌بینی مکان موجود که مکان بازدید کاربران را پیش‌بینی می‌کنند، تقریباً به دو نوع تقسیم می‌شوند: مدل‌های پیش‌بینی مبتنی بر فردی و مبتنی بر گروه.
مدل‌های پیش‌بینی مبتنی بر فردی، رفتار حرکتی هر فرد را مستقل در نظر می‌گیرند و بنابراین، تنها از تاریخچه حرکت کاربر برای پیش‌بینی مکان بعدی او استفاده می‌کنند. مسئله اصلی مدل‌های مبتنی بر فرد این است که آنها عمدتاً برای استخراج رفتار دوره‌ای کاربران فردی استفاده می‌شوند. به عنوان مثال، لی و همکاران. [ 22 ] یک الگوی فضایی-زمانی- تناوبی (STP) برای ثبت رفتار دوره ای فرد پیشنهاد کرد. از یک الگوریتم قانون تداعی برای استخراج الگوهای تناوبی در STP استفاده کرد. وو و همکاران [ 33 ، 34] یک چارچوب جدید به نام Jyotish برای یافتن حرکت دوره ای افراد بر اساس داده های موقعیت یابی Wi-Fi/Bluetooth ارائه کرد. طبقه‌بندی‌کننده‌های بیزی و ماشین‌های بردار پشتیبان برای نشان دادن محتمل‌ترین مکان بعدی استفاده شدند. دو و همکاران [ 35 ] مسئله پیش‌بینی مکان را از دیدگاه جدیدی بازتعریف کرد و یک روش هسته احتمالی را برای یادگیری وابستگی بین مکان کاربر و متغیرهای زمینه چند متغیره از داده‌های پراکنده پیشنهاد کرد. وو و همکاران [ 36 ] یک الگوریتم شبکه عصبی مکانی – زمانی – معنایی (STS-LSTM) برای پیش‌بینی مکان پیشنهاد کرد. ژانگ و همکاران [ 17 ] برتری های مربوط به رگرسیون بردار پشتیبان و یادگیری عمیق را برای ارائه یک روش جدید تعبیه داده و یادگیری گروهی ترکیب کرد. یانگ و همکاران [ 37] یک زنجیره مارکوف جدید را از طریق ضرب ماتریس انتقال مارکوف تعریف کرد و مدل DestPD را پیشنهاد کرد. با این حال، کاستی‌های خاصی در مدل‌های مبتنی بر فرد وجود دارد. اولاً، این مدل‌ها به مسیرهای حرکتی طولانی‌مدت تک تک کاربران نیاز دارند و به‌دست آوردن آنها در کاربردهای عملی دشوار است. دوم، مدل‌های مبتنی بر فرد مستلزم ساخت یک مدل مستقل برای هر فرد هستند که در کاربردهای عملی نیز غیرواقعی است.
مدل‌های پیش‌بینی مبتنی بر گروه، رفتار حرکت را برای «پیروی از جمعیت» تا حدی در نظر می‌گیرند و بنابراین، از تاریخچه حرکت سایر کاربران برای پیش‌بینی مکان بعدی کاربر استفاده می‌کنند. این مدل ها عمدتاً برای استخراج رفتارهای شباهت گروهی از کاربران استفاده می شوند. به عنوان مثال، Morzy [ 28 ] یک الگوریتم Apriori بهبود یافته را پیشنهاد کرد که از قوانین ارتباط برای پیش بینی مکان بعدی گروهی از کاربران استفاده می کند. آنگ و همکاران [ 38 ] از زنجیره مارکوف برای تبدیل توالی مکان به احتمالات تبدیل برای پیش بینی مکان استفاده کرد. کیانگ و همکاران [ 30 ] RNN فضایی-زمانی (ST-RNN) را بر اساس RNN [ 31 ] برای مدل‌سازی مکان گروه‌های کاربران پیشنهاد کرد. یینگ و همکاران [ 23] یک چارچوب پیش‌بینی مکان مبتنی بر جغرافیایی-زمانی-معانیی را برای پیش‌بینی مکان بعدی گروهی از کاربران پیشنهاد کرد. برخلاف مدل‌های تک شی، مدل‌های مبتنی بر گروه می‌توانند حرکت گروهی از کاربران را در برخی سناریوها آشکار کنند [ 39 ]. علاوه بر این، مدل های مبتنی بر گروه نیازی به مسیر حرکت طولانی مدت کاربران فردی ندارند. با این حال، کاستی‌های متعددی در مدل‌های گروه‌محور فوق‌الذکر وجود دارد. آنها با نادیده گرفتن وجود زیرگروه های مشابه، یک مدل برای همه کاربران می سازند. بنابراین، برخی از مدل‌ها مسیر حرکتی را فقط برای کسانی به دست می‌آوردند که به نوعی با کاربر مرتبط هستند. ژانگ و همکاران [ 40] دریافت که یک همبستگی قوی بین الگوهای فراخوانی و الگوهای هم سلولی کاربران وجود دارد. بر اساس این یافته، آنها مدل NextCell را پیشنهاد کردند که هدف آن افزایش پیش‌بینی مکان با استفاده از تعامل اجتماعی آشکار در سوابق تماس سلولی است. ون و همکاران [ 41 ] یک مدل مارکوف اجتماعی-زمانی-سلسله مراتبی بازگشتی (FSTHM) پیشنهاد کرد که آنتروپی نمونه متقاطع اصلاح شده را برای کمی کردن شباهت‌های بین فرد و دوستانش برای افزایش عملکرد پیش‌بینی معرفی کرد. لی و همکاران [ 42 ] از یک مدل رگرسیون خطی، که با زیرمجموعه ای از کاربران مرتبط با کاربر پیش بینی شده ساخته شده بود، برای پیش بینی مکان بعدی استفاده کرد.
در این مطالعه، یک چارچوب جدید پیش‌بینی مکان داخلی، Indoor-WhereNext، توسعه داده شد. در چارچوب پیشنهادی، توالی‌های مکان تاریخی که قبلاً جمع‌آوری شده‌اند، ابتدا بر اساس ویژگی‌هایشان (یعنی بر اساس شباهت توالی‌های مکان تاریخی) گروه‌بندی می‌شوند. پس از آن، گروه‌های کاربری مختلف برای آموزش مدل‌های پیش‌بینی مختلف برای دستیابی به نتایج بهبودیافته استفاده می‌شوند.

3. روش شناسی

تعریف 1 (مسیر): یک مسیر تی�آ�={پتیمن}من=1�یک دنباله مرتب از نقاط است پتیمن=(مند،تیمن،ایکسمن،�من،�من)، جایی که مندیک شناسه کاربری منحصر به فرد است. تیمنزمانی است که در آن پتیمنجمع آوری شد؛ و ایکسمن،�من،�منبه ترتیب با طول جغرافیایی، عرض جغرافیایی و کف کاربر در آن زمان مطابقت دارد تیمن.
تعریف 2 (نقطه اقامت): به طور کلی، یک نقطه اقامت سپمند=(ایکس،�،�،آ��تی،له�تی)مخفف یک منطقه جغرافیایی است که در آن کاربر در یک بازه زمانی مشخص، جایی که در آن اقامت داشته است مندیک شناسه کاربری منحصر به فرد است. ایکس،�،�به ترتیب با طول جغرافیایی، عرض جغرافیایی و کف محل اقامت کاربر مطابقت دارد. و (آ��تی،له�تی)به ترتیب زمان ورود و خروج کاربر را با توجه به منطقه جغرافیایی نشان می دهد. به عنوان مثال، نقطه اقامت یک کاربر تونشان داده شده در شکل 1 a به صورت سپتو=(∑من=5�پتیمن.ایکس/(�-4)، ∑من=5�پتیمن.�/(�-4)، 3،پتی5.تی، پتی�.تی).
تعریف 3 (توالی نقطه ماندن): دنباله نقطه ماندن اسمند={سپمنمند}من=1کمجموعه مرتب شده ای از نقاط اقامت است که در مسیر کاربر برای شناسایی شده است سپمنمند.له�تی<سپمن+1مند.آ��تی، جایی که مندیک شناسه کاربری منحصر به فرد است و کتعداد نقاط ماندن در مسیر کاربر را نشان می دهد. به عنوان مثال، دنباله نقطه اقامت یک کاربر تونشان داده شده در شکل 1 b به صورت نشان داده شده استاستو={سپ1تو،سپ2تو،سپ3تو،سپ4تو}.
تعریف 4 (توالی مکان): دنباله مکان ل�جاسه�مند={سساعت�پمنمند}من=1کیک توالی مرتب از مکان‌های بازدید شده توسط کاربر است، جایی که سساعت�پمنمندنشان دهنده مغازه بازدید شده در نقطه اقامت است سپمنمند. به عنوان مثال، توالی مکان کاربر تونشان داده شده در شکل 1 b به صورت نشان داده شده استل�جاسه�تو={آ،ب،سی،�}.
در این بخش چارچوب Indoor-WhereNext برای پیش بینی مکان داخلی ساخته شده است. معماری کلی در شکل 2 نشان داده شده است. این چارچوب بر اساس اصل طراحی از پایین به بالا است و به دو ماژول تقسیم می‌شود: مدل‌سازی مکان مبتنی بر SSS و پیش‌بینی مکان مبتنی بر SSS. در مرحله مدل‌سازی مکان مبتنی بر SSS، مسیرهای کاربر از طریق الگوریتم Indoor-STDBSCAN به دنباله‌های مکان تبدیل می‌شوند. توالی های مکان کاربر برای به دست آوردن گروه های کاربری مشابه بر اساس SSS خوشه بندی می شوند و هر گروه یک مدل را آموزش می دهد. یک نمونه نیز توسط هر گروه برای نشان دادن خود تولید می شود. در مرحله پیش‌بینی مکان مبتنی بر SSS، ماتریس شباهت بین توالی مکان و هر گروه توسط نمونه‌ها محاسبه می‌شود و سپس از مدل‌های مختلف برای پیش‌بینی مکان ممکن بعدی با توجه به ماتریس شباهت استفاده می‌شود.

3.1. روش تشخیص توالی مکان

3.1.1. تشخیص نقطه ماندن

هنگامی که کاربر در یک مکان خاص می ماند، احتمال بیشتری وجود دارد که کاربر اطلاعات سرویس مکان را مشاهده کند [ 43 ]]. بنابراین، تشخیص نقطه ماندن یک مرحله کلیدی در تبدیل توالی مکان است. هنگامی که کاربر برای مدت معینی در یک مکان مشخص می ماند، ترمینال تلفن همراه نقاط مسیر بیشتری را در یک منطقه محدود ثبت می کند. این منجر به خوشه بندی نقاط مسیر می شود. بنابراین، یک الگوریتم خوشه‌بندی برای شناسایی نقاط ماندگاری اعمال می‌شود. با این حال، بر خلاف یک مسیر در فضای باز، یک مسیر داخلی معمولاً دارای ویژگی های سه بعدی است، که باعث می شود الگوریتم های تشخیص فضای باز موجود در مسیر داخلی به سختی اعمال شوند. بنابراین، یک الگوریتم جدید تشخیص نقطه ماندن مسیر داخلی، Indoor-STDBSCAN، پیشنهاد شده است.
الگوریتم Indoor-STDBSCAN یک نسخه بهبودیافته از خوشه بندی فضایی مبتنی بر چگالی مکانی برنامه ها با الگوریتم نویز (ST-DBSCAN) است [ 44 ، 45 ]، که هدف آن تقسیم مسیر کاربر فردی است. تی�آ�={پتیمن}من=1�به کخوشه های نظم ناهمگون {سی1، سی2، …، سیک}. هر خوشه سیمنیک نقطه اقامت ایجاد می کند سپمنمند، و کخوشه ها تولید می کنند کنقاط ماندن، به عنوان مثال، {سپمنمند}من=1ک. الگوریتم Indoor-STDBSCAN دو پیشرفت را در الگوریتم ST-DBSCAN ایجاد می کند: (1) اضافه کردن محدودیت های طبقه، به طوری که نقطه مسیر پتی�در محله فضایی و زمانی در همان طبقه است پتیمن، و (2) اضافه کردن قیود ترتیب، به طوری که شاخص آخرین نقطه مسیر خوشه سیمنبه عنوان معیار جستجوی خوشه عمل می کند سیمن+1، حصول اطمینان از اینکه زمان توقف از سپمن+1مندو سپمنمنددر طول خط زمانی همپوشانی نداشته باشید – یعنی سپمنمند. له�تی<سپمن+1مند.آ��تی. فرآیند کلی Indoor-STDBSCAN در الگوریتم 1 نشان داده شده است.
الگوریتم 1. الگوریتم تشخیص نقطه اقامت در مسیر داخلی.
نیاز: مسیر فردی: تی�آ�={پتیمن}من=1�
شعاع: �1
پنجره زمان: �2
آستانه تراکم همسایگی: ممن�پتیس
اطمینان حاصل کنید: دنباله نقطه اقامت فردی: اسمند={سپمنمند}
1: تابع Indoor-STDBSCAN ( تی�آ�، �1، �2، ممن�پتیس)
2:   جلتوستیه�مند=0; ستیآ�تی=0
3:   برای پردازش نشده بعدی پتی∈تی�آ� انجام
4:    اگر پتی.من�دهایکس<ستیآ�تی سپس
5: ادامه
6:    ن=�هتینهمن�ساعتب��س (پتی، �1، �2)
7:    اگر |ن|>ممن�پتیس سپس
8:     پتی.پ��جهسسهد=تی�توه;پتی.جلتوستیه�مند=جلتوستیه�مند
9:     اسههدس=[]
10:     آدد تو�پ��جهسسهد پ∈ن تی� اسههدس
11:     برای بعدی �∈اسههدس انجام
12:      ن”=�هتینهمن�ساعتب��س(�، �1، �2)
13:      �.پ��جهسسهد=تی�توه;�.جلتوستیه�مند=جلتوستیه�مند
14:      اگر |ن”|>ممن�پتیس سپس
15:       آدد تو�پ��جهسسهد پ∈ن” تی� اسههدس
16:    ستیآ�تی=تی�آ�.�من�د(پ.جلتوستیه�مند==جلتوستیه�مند)[-1].من�دهایکس
17:    جلتوستیه�مند=جلتوستیه�مند+1
18:   برای بعدی من∈[0، 1، …، جلتوستیه�مند-1] انجام
19:    پتیآ�� = تی�آ�.�من�د(پ.جلتوستیه�مند==من)
20:    سپمند.آ��تی=پتیآ��[0].تی;سپمند.له�تی=پتیآ��[له�(پتیآ��)-1].تی
21:    سپمند.ایکس،سپمند.� = ج�مترپتوتیهمهآ�سی���د (پتیآ��);سپمند.�=پتیآ��[0].�
22:    اسمند.آدد (سپمند)
23:   بازگشت اسمند
3.1.2. تبدیل توالی مکان
نقطه اقامت به دست آمده توسط الگوریتم Indoor-STDBSCAN فقط حاوی اطلاعات مکانی است و حاوی اطلاعات معنایی نیست، بنابراین لازم است که به نقطه ماندن معناشناسی اختصاص داده شود. برای این، یک روش تطبیق تعریف شده است. دو رابطه فضایی بین یک نقطه اقامت و یک مغازه وجود دارد: داخل و خارج از مغازه. به عنوان مثال، دنباله نقطه اقامت یک کاربر تونشان داده شده در شکل 3 شامل دو نقطه اقامت استاستو={سپ1تو،سپ2تو}: نقطه بمان سپ1تودر داخل مغازه و نقطه اقامت سپ2توبیرون مغازه برای یک نقطه اقامت در داخل مانند سپ1تو، از روش تقاطع برای به دست آوردن فروشگاه آن کاربر استفاده می شود تودر نقطه اقامت بازدید شد سپ1تو– یعنی کاربر تودر نقطه اقامت سپ1تواز مغازه بازدید کرد ب. برای یک نقطه اقامت خارجی مانند سپ2تو، از روش مماس دایره متحدالمرکز برای محاسبه فروشگاه آن کاربر استفاده می شود تودر نقطه اقامت بازدید شد سپ2تو. با سپ2توبه عنوان مرکز، شعاع �من (من = 1، 2، 3، …)دایره ای رسم می کند و اولین مغازه ای که بر دایره مماس است shop است سی، بنابراین کاربر در نقطه اقامت ماند سپ2توو از مغازه بازدید کرد سی. وقتی تمام اقامت به داخل اشاره کرد استوبا یک فروشگاه، توالی مکان کاربر مطابقت دارند تورا می توان به دست آورد و دنباله مکان به صورت نمایش داده می شود ل�جاسه�تو={ب،سی}.

3.2. روش محاسبه تشابه توالی مکان

هسته چارچوب Indoor-WhereNext این است که توالی های مکان را بهتر خوشه بندی کند. کاربرانی که توالی مکان آنها در یک گروه قرار می گیرد، شباهت زیادی دارند و بالعکس. از این رو، الگوهای مکان کاربران با توالی مکان در یک گروه قرار می‌گیرند آسان‌تر است. چارچوب Indoor-WhereNext با مدل‌سازی کاربران مشابه، به دقت پیش‌بینی بهبود یافته دست می‌یابد. توالی مکان کاربر حاکی از اطلاعات مکانی و معنایی فروشگاه است. اطلاعات مکانی فروشگاه موقعیت مکانی فروشگاه را در داخل مرکز خرید توصیف می کند که دامنه حرکت کاربر را در فضای داخلی محدود می کند. اطلاعات معنایی فروشگاه، ویژگی های معنایی فروشگاه را توصیف می کند که تا حدی نشان دهنده عادات خرید کاربر است. اطلاعات مکانی و اطلاعات معنایی به طور جامع برای تعریف یک روش SSS جدید برای اندازه‌گیری شباهت بین توالی‌های مکان برای تشکیل خوشه در نظر گرفته می‌شوند. روش SSS به دو بخش تشابه فضایی و شباهت معنایی تقسیم می شود.

شباهت فضایی عمدتاً شباهت اطلاعات مکانی ضمنی در توالی مکان را محاسبه می کند و شباهت مسیر حرکت دو دنباله را در فضای جغرافیایی توصیف می کند. وقتی کاربران در یک فروشگاه می مانند، درجه خاصی از شباهت فضایی را نشان می دهند. هر چه تعداد مغازه ها بین توالی های مکان بیشتر باشد، شباهت فضایی بیشتر می شود. بنابراین، طولانی ترین زیر دنباله مشترک (LCSS) [ 46 ] برای محاسبه شباهت فضایی بین دنباله های مکان استفاده می شود. شباهت فضایی بین کاربر توو کاربر مطابق با فرمول های (1) و (2) محاسبه می شود.

�سیاساس({سساعت�پمنتو}من=1�،{سساعت�پ��}�=1متر)={0من� �=0 �� متر=01+�سیاساس({سساعت�پمنتو}من=1�-1،{سساعت�پ��}�=1متر-1)من� سساعت�پ�تو=سساعت�پمتر�مترآایکس(�سیاساس({سساعت�پمنتو}من=1�،{سساعت�پ��}�=1متر-1)،�سیاساس({سساعت�پمنتو}من=1�-1،{سساعت�پ��}�=1متر))در غیر این صورت
اسمتو�سپآ=1-�سیاساس({سساعت�پمنتو}من=1�،{سساعت�پ��}�=1متر)مترمن�(�،متر)

جایی که {سساعت�پمنتو}من=1�و {سساعت�پ��}�=1مترنشان دهنده توالی مکان کاربران است توو ، به ترتیب؛ و مترنشان دهنده تعداد مغازه های بازدید شده توسط کاربران؛ مترآایکس(ایکس،�)تابعی برای به دست آوردن حداکثر مقادیر است ایکسو اسمسپآماتریس شباهت فضایی است. و اسمتو�سپآنشان دهنده شباهت فضایی بین کاربران است توو .

شباهت معنایی عمدتاً شباهت اطلاعات معنایی ضمنی در توالی مکان را محاسبه می کند و میزان شباهت بین دو کاربر را در علایق و رفتارها توصیف می کند. در این مقاله، اطلاعات معنایی یک ویژگی طبقه‌بندی مغازه‌ها نیست، زیرا معتقدیم اطلاعات ویژگی‌های آنها به‌طور مصنوعی مشخص و ذهنی است. اطلاعات معنایی که به آن اشاره می کنیم یک پیام ضمنی است که از طریق رفتار کاربر بیان می شود. به طور کلی، کاربران بیشتر بین انواع مشابهی از فروشگاه ها (مصرف هدفمند) پرش می کنند، که نشان دهنده شباهت معنایی بین آن مغازه ها است. با توجه به این موضوع، توالی های مکان همه کاربران در یک شبکه وزن دار ساخته می شوند جی(�،�،دبلیو)، جایی که نشان دهنده مجموعه فروشگاهی است، نشان دهنده مجموعه انتقال بین مغازه ها و دبلیوزمان انتقال بین مغازه ها را نشان می دهد. با افزایش تعداد توالی های مکان، وزن بین مغازه ها می تواند شباهت بین آنها را منعکس کند. یعنی هر چه شباهت بیشتر باشد وزن آن بیشتر می شود. بر اساس این ویژگی ها، از روش node2vec [ 47 ] برای بردارسازی مغازه ها استفاده می شود. همانطور که در شکل 4 نشان داده شده است ، هنگامی که وزن بین مغازه ها بزرگتر است، فاصله بین بردارهای مربوطه مغازه ها کمتر است. پس از برداری توسط node2vec، هر فروشگاه به طور منحصربه‌فردی با یک بردار مطابقت دارد و شباهت معنایی بین دنباله‌های مکان را می‌توان توسط دنباله‌های برداری مربوطه محاسبه کرد. در این کار، تاب خوردگی زمانی پویا (DTW) [ 48 ، 49 ، 50الگوریتم ] برای محاسبه شباهت معنایی بین دنباله های مکان استفاده می شود. شباهت معنایی بین کاربر توو کاربر مطابق با فرمول های (3) و (4) محاسبه می شود.

�تیدبلیو({سساعت�پمنتو}من=1�،{سساعت�پ��}�=1متر)={0من� متر=0 �=0∞من� متر=0 �� �=0دمنسساعت(سساعت�پ�تو،سساعت�پمتر�+مترمن�(�تیدبلیو({سساعت�پمنتو}من=1�-1،{سساعت�پ��}�=1متر-1)،�تیدبلیو({سساعت�پمنتو}من=1�،{سساعت�پ��}�=1متر-1)،در غیر این صورت�تیدبلیو({سساعت�پمنتو}من=1�-1،{سساعت�پ��}�=1متر))
اسمتو�سهمتر=�تیدبلیو({سساعت�پمنتو}من=1�،{سساعت�پ��}�=1متر)

جایی که {سساعت�پمنتو}من=1�و {سساعت�پ��}�=1مترنشان دهنده توالی مکان کاربران است توو ، به ترتیب؛ و مترنشان دهنده تعداد مغازه های بازدید شده توسط کاربران؛ دمنستیبرای محاسبه فاصله اقلیدسی بین بردارهای مربوطه مغازه ها استفاده می شود سساعت�پ�توو سساعت�پمتر�مترمن�(ایکس،�،�)تابعی برای به دست آوردن حداقل مقادیر است ایکس، ، و اسمسهمترماتریس تشابه معنایی است. و اسمتو�سهمترنشان دهنده شباهت معنایی بین کاربران توو .

پس از محاسبه شباهت های معنایی و فضایی بین توالی ها، شباهت توالی مکان نهایی توسط دو بخش، همانطور که در فرمول (5) تعریف شده است، قرار می گیرد.

اساسم=�∗اسمسپآ-مترمن�(اسمسپآ)مترآایکس(اسمسپآ)-مترمن�(اسمسپآ)+(1-�)∗اسمسهمتر-مترمن�(اسمسهمتر)مترآایکس(اسمسهمتر)-مترمن�(اسمسهمتر)

جایی که اسمسپآاسمسهمترو اساسمبه ترتیب ماتریس شباهت فضایی، ماتریس شباهت معنایی و ماتریس شباهت فضایی- معنایی را نشان می دهد. مترمن�(ایکس)و مترآایکس(ایکس)توابعی برای به دست آوردن حداقل و حداکثر مقادیر به ترتیب در ماتریس ایکس; و یک ضریب وزنی است که سهم شباهت فضایی را در تشابه توالی مکان نشان می دهد. مقدار پیش فرض 0.5 است – یعنی سهم تشابه معنایی و شباهت مکانی به شباهت توالی مکان برابر است.

3.3. چارچوب پیش‌بینی موقعیت مکانی کاربر داخلی

3.3.1. مدل‌سازی مکان مبتنی بر SSS

پس از تعریف روش SSS، برای تقسیم کاربران به گروه های مختلف، چندین الزام باید در نظر گرفته شود. اول اینکه تعداد گروه ها را نمی توان از قبل مشخص کرد. دوم، هر گروه باید یک کاربر نماینده داشته باشد. کاربر نماینده عمدتاً به کاربران جدید کمک می کند تا بدانند از کدام مدل استفاده می کنند. بر اساس دو نکته بالا، الگوریتم انتشار قرابت (AP) [ 51 ] برای خوشه‌بندی توالی مکان همه کاربران استفاده می‌شود. پس از خوشه بندی، LSTM [ 52 ] برای آموزش مدل پیش بینی برای کاربران هر گروه استفاده می شود. فرآیند آموزش چارچوب Indoor-WhereNext در الگوریتم 2 نشان داده شده است.
الگوریتم 2. فرآیند آموزش چارچوب Indoor-WhereNext.
نیاز: مسیرهای همه کاربران: تی�آ�آ��={تی�آ�من}
فراپارامترهای Indoor-STDBSCAN: �1،�2،ممن�پتیس
ضریب وزن: 
اطمینان حاصل کنید: مدل‌های پیش‌بینی: {متر�دهلمن}
مراکز خوشه: {هایکسهمترپلآ�من}
1:  برای بعدی تی�آ�∈تی�آ�آ�� انجام
2:   {سپمنمند}=من�د���-استی�باسسیآن(تی�آ�،�1،�2،ممن�پتیس)
3:   ل�جاسه�مند=سی���ه�سمن��({سپمنمند})
4:   ل�جاسه�آ��.آدد(ل�جاسه�مند)
5:  اساسم=اساساس(ل�جاسه�آ��،�)
6:  {ل�جاسه�استوبآ��من}،{هایکسهمترپلآ�من}=آ��من�منتی�پ��پآ�آتیمن��(اساسم)
7:  برای ل�جاسه�استوبآ��∈{ل�جاسه�استوبآ��من} انجام
8:   متر�دهل=�استیم(ل�جاسه�استوبآ��)
9:   متر�دهلس.آدد(متر�دهل)
10:  بازگشت متر�دهلس،{هایکسهمترپلآ�من}
3.3.2. پیش بینی مکان مبتنی بر SSS
پس از مدل سازی، یک تناظر یک به یک بین مدل هاو نمونه ها– یعنی متر�دهلمنمطابق با هایکسهمترپلآ�من. با توجه به مسیر کاربر جدید، هدف این است که مشخص شود کاربر احتمالاً از کجا بازدید خواهد کرد. ابتدا، گروهی پیدا می‌شود که احتمالاً با توالی خاصی از بازدیدهایی که در کار پیش‌بینی در نظر گرفته می‌شوند مرتبط هستند، و سپس از مدل LSTM مربوطه برای پیش‌بینی محتمل‌ترین مکان استفاده می‌شود. فرآیند پیش‌بینی چارچوب Indoor-WhereNext در الگوریتم 3 نشان داده شده است. در اینجا، {هایکسآمترپلآ�من}برای تعیین اینکه کاربر جدید به کدام گروه تعلق دارد استفاده می شود. در اصل، نمونه ها دنباله های مکان خاصی هستند، بنابراین شباهت بین دنباله مکان جدید و نمونه ها محاسبه می شود. سپس مدلی با بیشترین شباهت برای پیش بینی مکان انتخاب می شود.
الگوریتم 3. فرآیند پیش بینی چارچوب Indoor-WhereNext.
مورد نیاز: مسیر کاربر جدید: تی�آ�={پتیمن}
فراپارامترهای Indoor-STDBSCAN: �1،�2،ممن�پتیس
ضریب وزن: α
مدل های پیش بینی: {متر�دهلمن}
مراکز خوشه: {هایکسهمترپلآ�من}
اطمینان حاصل کنید: اسهتی �� پ�هدمنجتیهد ل�جآتیمن��س
1:  {سپمنمند}=من�د���-استی�باسسیآن (تی�آ�،�1،�2،ممن�پتیس)
2:  ل�جاسه�مند=سی���ه�سمن�� ({سپمنمند})
3:  اساسم=اساساس(ل�جاسه�مند،{هایکسهمترپلآ�من}،�)
4:  مندایکس=آ��مترآایکس(اساسم)
5:  متر�دهل=متر�دهلس[مندایکس]
6:  اسهتی �� پ�هدمنجتیهد ل�جآتیمن��س=متر�دهل (ل�جاسه�مند)
7:  بازگشت اسهتی �� پ�هدمنجتیهد ل�جآتیمن��س

4. نتایج تجربی و تجزیه و تحلیل

4.1. آماده سازی داده ها

4.1.1. منابع اطلاعات

داده‌های آزمایشی عمدتاً شامل داده‌های موقعیت‌یابی Wi-Fi و داده‌های فروشگاه برای یک مرکز خرید در شهر Jinan، چین است. مساحت کل مرکز خرید حدود 350000 متر مربع است . داده های موقعیت یابی Wi-Fi داخلی هشت طبقه مرکز خرید را از 23 دسامبر 2017 تا 6 ژانویه 2018 پوشش می دهد. دقت موقعیت یابی تقریباً 3 متر، تعداد کل مسیرها بیش از 20 میلیون و تعداد کل نقاط مسیر بود. 129,070,836 بود. همانطور که در جدول 1 نشان داده شده است ، فیلد داده شامل شناسه منحصر به فرد کاربر، زمان بارگذاری رکورد ، مختصات X ، Y کاربر و شناسه منحصر به فرد طبقه است. همانطور که در نشان داده شده است جدول 2 نشان داده شده است، 489 مغازه در این مرکز خرید وجود دارد. اندازه متوسط ​​مغازه حدود 40 متر است2 . داده های هر مغازه شامل شناسه منحصر به فرد مغازه، شکل مغازه (یک چند ضلعی متشکل از توالی مختصات)، نام مغازه و شناسه طبقه بود.
4.1.2. پیش پردازش داده ها
داده‌های مسیر اصلی کاربران داخلی از طریق موقعیت‌یابی Wi-Fi جمع‌آوری شد. به دلیل ناپایداری سیگنال ترمینال موبایل و خاموش شدن مصنوعی سیگنال وای فای، داده های غیرعادی، اشتباه و نامعتبر به راحتی تولید می شد. مشخصات آماری مسیرهای اصلی کاربران در شکل 5 نشان داده شده است. پس از پیش پردازش داده ها، در مجموع 345، 824 مسیر کاربر به دست آمد.
(1)
فاصله نمونه برداری برای نقاط مسیر عمدتاً بین 1 تا 5 ثانیه متمرکز بود که تقریباً 82.5٪ را شامل می شود، اما هنوز داده های غیرعادی با فواصل نمونه برداری زیاد و فواصل نمونه برداری 0 ثانیه وجود دارد. به عنوان مثال، نقاط مسیر با فواصل نمونه برداری 0 ثانیه حدود 7.3٪ را تشکیل می دهند.
(2)
تعداد نقاط مسیر موجود در یک مسیر بین 1 تا 7 در اکثر مجموعه ها بود که بیش از 97٪ را شامل می شود. به عبارت دیگر، تعداد زیادی از مسیرها فقط حاوی چند نقطه مسیر بودند و نمی توانستند برای آموزش مدل از آنها استفاده کنند. در کار ما، مسیرهایی که تعداد نقاط مسیر کمتر از 50 بود حذف شدند.
(3)
بازه زمانی نقاط مسیر ثبت‌شده در مرکز خرید 24 ساعت بود، یعنی رکوردهایی حتی در ساعات غیر اداری برای مرکز خرید ایجاد می‌شد و رکوردهای ایجاد شده در این فرآیند نامعتبر بود.

4.2. معیارهای ارزیابی

در این کار آججتو�آج�@کو پ�هجمنسمن��@ک (بالا ک مکان ها)به عنوان شاخص های کمی مدل ارزیابی استفاده شد. آججتو�آج�@کبرای ارزیابی مکان‌های پیش‌بینی بالای k ، برای تعیین اینکه آیا مکان‌های واقعی را نشان می‌دهند یا خیر، استفاده می‌شود. پ�هجمنسمن��@ایکساز میانگین‌گیری کلان برای ارزیابی عملکرد مدل‌ها از منظر طبقه‌بندی‌های متعدد استفاده می‌کند – یعنی مشکلات پیش‌بینی مکان داخلی. آججتو�آج�@کو پ�هجمنسمن��@کدر معادلات (6) و (7) تعریف شده است.

آججتو�آج�@ک=�تومتربه� �� سآمترپلهس ج���هجتیل� پ�هدمنجتیهدتی�تیآل �تومتربه� �� تیهستی سآمترپلهسک∈{1، 3، 5، 7، …}
پ�هجمنسمن��@ک=1ن∑من=1نتیپمنتیپمن+افپمنک∈{1، 3، 5، 7، …}

جایی که نتعداد کل مکان ها و تعداد مغازه ها را نشان می دهد. تیپمنتعداد نمونه هایی را نشان می دهد که در آنها مدل به درستی پیش بینی می کند که کاربر از مکان بازدید می کند سساعت�پمنافنمنتعداد نمونه هایی را نشان می دهد که در آنها مدل به اشتباه پیش بینی می کند که کاربر از مکان بازدید نمی کند سساعت�پمن.

4.3. تخمین متغیر

مقدار فراپارامترها تأثیر قابل توجهی بر عملکرد پیش بینی مدل دارد. زمانی که مقدار فراپارامترها مناسب نباشد، مدل عملکرد پیش‌بینی ضعیفی از خود نشان می‌دهد. در این بخش، ما فراپارامترها را در چارچوب کالیبره کرده و تاثیر فراپارامترها را بر عملکرد پیش‌بینی تحلیل می‌کنیم. هایپرپارامترهای اصلی چارچوب Indoor-WhereNext شعاع �1, پنجره زمانی �2, حداقل امتیاز ممن�پتیسو ضریب وزنی . برای تعیین فراپارامتر بهینه چارچوب، از روش متغیر کنترل برای به دست آوردن ترکیبی از مقادیر پارامتر با بهترین دقت پیش‌بینی استفاده شد. در مرحله تخمین پارامتر ابتدا �1�2و ممن�پتیسدر الگوریتم Indoor-STDBSCAN تعیین شد. سپس با استفاده از این مقادیر ضریب وزنی برای آزمایش تأثیر شباهت‌های معنایی و مکانی بر دقت پیش‌بینی تنظیم شد.

4.3.1. کالیبره کردن پارامترهای Indoor-STDBSCAN

در الگوریتم Indoor-STDBSCAN، پنجره زمان آزمون اصلی �2بر دقت پیش‌بینی تأثیر می‌گذارد، یعنی زمان ماندن در آزمون بر نتیجه پیش‌بینی تأثیر می‌گذارد. در فرآیند کالیبراسیون پارامتر، ضریب وزن شعاع فضا روی 0.5 ثابت شد �1با توجه به میانگین فاصله بین مغازه های سرپوشیده به 5 متر ثابت شد. پنجره زمان �2بهترین پارامتر موجود در [1 دقیقه،3 دقیقه،5 دقیقه،…،13 دقیقه]. حداقل تعداد ممن�پتیسبا توجه به فاصله نمونه‌گیری میانگین داده‌ها و پنجره زمانی �2– یعنی ممن�پتیس=�2آ�ه�آ�ه سآمترپلمن�� من�تیه��آل. اثر پنجره زمانی �2در مورد دقت پیش بینی آججتو�آج�@کدر شکل 6 نشان داده شده است . وقتی ک∈{1، 3، 5، 7، 9}آججتو�آج�@کدر ابتدا افزایش یافت و سپس پایدار شد. وقتی �2≥5 دقیقه، دقت پیش بینی چارچوب تغییر چندانی نکرد. با این حال، با افزایش پنجره زمانی، تعداد توالی های مکان تمایل به کاهش داشت – یعنی تعداد داده های آموزشی کاهش یافت. برای اطمینان از صحت پیش‌بینی و تعداد داده‌های آموزشی همزمان، پنجره زمانی �2روی 7 دقیقه تنظیم شد. پس از کالیبره شدن پارامتر Indoor-STDBSCAN، ما مسیر را با نقاط ماندن بسیار کمی فیلتر کردیم. در نهایت از 45315 مسیر برای آزمایش استفاده شد.
4.3.2. کالیبره کردن ضریب وزن
ضریب وزن عمدتاً تأثیر شباهت فضایی و شباهت معنایی را بر دقت پیش‌بینی آزمایش می‌کند. ابتدا، هایپرپارامترها در الگوریتم Indoor-STDBSCAN ثابت می شوند. سپس، پارامتر بهینه را از [0، 0.1، 0.2، …، 1]. وقتی روی 0 یا 1 تنظیم شده است، به این معنی که تنها یک شباهت در نظر گرفته می شود که بر دقت پیش بینی تأثیر می گذارد. تاثیر ضریب وزن در مورد پیش بینی آججتو�آج�@کدر شکل 7 نشان داده شده است . وقتی ک∈{1، 3، 5، 7، 9}آججتو�آج�@کروند ابتدا افزایشی و سپس کاهشی را نشان داد. وقتی 0.3≤�≤0.6آججتو�آج�@کچارچوب نسبتاً بالا بود. وقتی �=0.4آججتو�آج�@5به 67.6 درصد رسید که به ترتیب 17.6 و 24.1 درصد نسبت به �=0و �=1. این نشان می دهد که هم شباهت معنایی و هم شباهت فضایی به دقت مدل کمک می کند.

4.4. عملکرد Indoor-WhereNext

پس از کالیبراسیون پارامترهای چارچوب، تغییر در دقت پیش‌بینی چارچوب Indoor-WhereNext با تعداد تکرارها مورد تجزیه و تحلیل قرار گرفت. نتایج در شکل 8 نشان داده شده است.
(1)
برای مجموعه داده آموزشی، دقت پیش‌بینی یک روند صعودی پیوسته با افزایش تعداد تکرارها نشان داد.
(2)
برای مجموعه داده آزمایشی، دقت پیش‌بینی ابتدا افزایش یافت، سپس ثابت ماند و در نهایت با افزایش تعداد تکرارها کاهش یافت. با افزایش تعداد تکرارها، چارچوب تمایل بیشتری به تناسب داشت و دقت پیش‌بینی مدل را در مجموعه داده آموزشی بهبود بخشید و در عین حال دقت پیش‌بینی را در مجموعه داده آزمایش بدتر کرد.
(3)
مقایسه آججتو�آج�@کدر مجموعه داده آزمایشی، زمانی که ک∈{1، 3، 5}دقت پیش‌بینی مدل بسیار بهبود یافته است. در آججتو�آج�@5دقت پیش‌بینی 67.6 درصد بود. در مقایسه با آججتو�آج�@1و آججتو�آج�@3دقت پیش‌بینی به ترتیب 32.5% و 22.1% افزایش یافت. با این حال، به عنوان کبا ادامه افزایش، دقت پیش‌بینی مدل به آرامی افزایش یافت. در مقایسه با آججتو�آج�@5آججتو�آج�@7و آججتو�آج�@9تنها به ترتیب 0.9% و 1.5% افزایش یافته است، زیرا فروشگاهی که کاربر بعدی در مرکز خرید از آن بازدید می کند، اغلب مجموعه ای از مغازه ها است تا یک فروشگاه خاص. در مجموعه فروشگاه های پیش بینی شده، مقصد کاربر تصادفی خاصی دارد.

4.5. مقایسه با خطوط پایه

برای اطمینان از کارایی چارچوب پیشنهادی Indoor-WhereNext، با سه مدل پیش‌بینی موجود برای مجموعه داده‌ها مقایسه شد: HMM (اصل-HMM)، مدل مارکوف پنهان بهبود یافته (HMM بهبود یافته)، و مدل LSTM (اصل-LSTM). . از این میان، original-HMM و original-LSTM از دنباله‌های فروشگاه برای ساختن مدلی برای پیش‌بینی مکان بعدی استفاده می‌کنند. Improved-HMM جایگزین LSTM در چارچوب Indoor-WhereNext با HMM می شود و مدل هایی را بر اساس SSS برای پیش بینی مکان بعدی می سازد. دقت پیش‌بینی HMM به تعداد حالت‌ها مربوط می‌شود. در آزمایش مقایسه، تعداد حالت ها در HMM بین 10، 20، 30 و 40 حالت متفاوت بود.
شکل 9 دقت پیش بینی چهار مدل را نشان می دهد. مشاهده می شود که از آنجایی که مدل های اصلی-HMM و اصلی-LSTM پیش بینی مکان را به عنوان یک مسئله مدل سازی سری زمانی در نظر می گیرند، تأثیر شباهت بین دنباله های مکان را بر پیش بینی مکان نادیده می گیرند. بنابراین، عملکرد پیش‌بینی آنها بدتر از عملکرد HMM بهبود یافته و چارچوب پیشنهادی Indoor-WhereNext بود. به ویژه، زمانی که تعداد حالت ها در HMM 10 بود، آججتو�آج�@5چارچوب Indoor-WhereNext 31.2% بیشتر از original-HMM و 23.8% بالاتر از original-LSTM بود. Improved-HMM شباهت‌های بین توالی‌های مکان را به حساب می‌آورد و یک مدل برای کاربران مشابه ایجاد می‌کند. با این حال، زمانی که تعداد حالت ها در HMM 40 بود، آججتو�آج�@1آججتو�آج�@3و آججتو�آج�@5مقادیر چارچوب Indoor-WhereNext به ترتیب 3.2٪، 2.5٪ و 13.8٪ بیشتر از Improved-HMM بود. دلیل آن این است که مدل LSTM در چارچوب Indoor-WhereNext برای مدل‌سازی توالی‌های مکان استفاده می‌شود، که گرفتن الگوهای حرکت در یک دنباله مکان طولانی را آسان‌تر می‌کند. به طور کلی، چارچوب Indoor-WhereNext با افزایش دقت @1 بین 3.2٪ تا 15.1٪، Accuracy @3 بین 2.4٪ تا 18.3٪، و Accuracy @5 بین 13.8٪ و 31.9 ٪، پیش بینی مکان داخلی را بسیار بهبود بخشید. ٪.
شکل 10 دقت پیش بینی چهار مدل را مقایسه می کند. همانطور که در مورد دقت، دقت چارچوب را می توان با 7-27.3٪، 17.8-20.9٪، و 6.9-14.7٪ در مقایسه با آزمایش های پایه بهبود داد. به ویژه، زمانی که k= 5، دقت پیش بینی مدل 61.6٪ بود. با این حال، در مقایسه با دقت چارچوب، دقت چارچوب Indoor-WhereNext 6٪ کاهش می یابد. این کاهش دقت را می‌توان به این دلیل نسبت داد که دقت نشانگر، پیش‌بینی مکان را به عنوان یک مسئله چند طبقه‌بندی در نظر می‌گیرد و نمونه‌های آزمایشی در هر طبقه‌بندی نامتعادل هستند، که منجر به کاهش جزئی در دقت می‌شود. به طور کلی، چارچوب Indoor-WhereNext به طور قابل توجهی از سه روش پایه موجود از نظر دقت پیش‌بینی بهتر عمل می‌کند.

5. نتیجه گیری و کار آینده

چارچوب Indoor-WhereNext برای پیش‌بینی مکان داخلی پیشنهاد شد. ابتدا با توجه به ویژگی‌های سه بعدی و خطای نسبی مسیرهای داخلی، الگوریتم Indoor-STDBSCAN به منظور شناسایی نقاط اقامت کاربر داخلی و تبدیل مسیر کاربر به دنباله مکان و در نتیجه غلبه بر مشکل ارائه شد. شناسایی نقاط اقامت در داخل خانه با استفاده از روش های موجود دشوار است. سپس با توجه به شباهت های مکانی و معنایی توالی های مکان، روش SSS برای به دست آوردن ماتریس شباهت بین توالی های مکان تعریف شد. در نهایت، از الگوریتم AP برای به دست آوردن گروه های کاربری شباهت بر اساس ماتریس شباهت و از گروه ها برای آموزش مدل های مختلف پیش بینی برای بهبود دقت پیش بینی مکان استفاده شد.
در بخش تجربی، یک دوره دو هفته ای از مسیرهای داخلی واقعی برای تأیید کارایی چارچوب پیشنهادی استفاده شد. ابتدا از روش متغیر کنترل برای به دست آوردن ترکیبی از مقادیر پارامتر با بهترین دقت پیش بینی استفاده شد. هنگامی که از پارامترهای بهینه استفاده شد، آججتو�آج�@5به 67.6 درصد رسید. سپس، مقایسه ای با سه روش پایه موجود انجام شد. در مقایسه با original-HMM، original-LSTM و بهبود یافته-HMM، چارچوب پیشنهادی دقت و دقت بهبود یافته ای را ارائه می دهد، به طوری که Accuracy @5 31.2%، 23.8% و 13.8% و Precision @5 27.3%، 20.9 افزایش یافته است. درصد و 14.7 درصد. این کارایی چارچوب Indoor-WhereNext را نشان می دهد.
جنبه های زیر به طور بالقوه می توانند در کارهای آینده بیشتر مورد بررسی قرار گیرند: (1) اعتبار بیشتر چارچوب پیشنهادی با انواع بیشتری از داده ها مانند مسیرهای داخلی بیمارستان و مسیرهای داخلی فرودگاه، (2) مقایسه جامع با سایر مدل های پیش بینی مکان مانند ST- زنجیره RNN و مارکوف، (3) مقایسه مدل‌ها با شاخص‌های ارزیابی جامع‌تر، و (4) ادغام عوامل بیشتر در Indoor-WhereNext برای دستیابی به یک مدل قوی‌تر که دقت پیش‌بینی مکان داخلی را بیشتر بهبود می‌بخشد.

منابع

  1. وانگ، Y.-S. لین، اس.-جی. لی، سی.-ر. Tseng، T. لی، H.-T. لی، جی.-ای. توسعه و اعتبارسنجی یک مدل موفقیت سیستم های باطله الکترونیکی محصول فیزیکی Inf. تکنولوژی مدیریت 2018 ، 19 ، 245-257. [ Google Scholar ] [ CrossRef ]
  2. حاجلی، ن. Featherman، MS تجارت اجتماعی و توسعه جدید در فناوری های تجارت الکترونیک. بین المللی J. Inf. مدیریت 2017 ، 37 ، 177-178. [ Google Scholar ] [ CrossRef ]
  3. لیو، ی. چنگ، دی. پی، تی. شو، اچ. Ge، X. ما، تی. دو، ی. او، ی. وانگ، ام. Xu, L. استنباط جنسیت و سن مشتریان در مراکز خرید از طریق داده های موقعیت یابی داخلی. محیط زیست طرح. مقعد شهری. علوم شهر 2019 . [ Google Scholar ] [ CrossRef ]
  4. ژانگ، اچ. وانگ، ز. چن، اس. Guo, C. توصیه محصول در جوامع آنلاین شبکه های اجتماعی: یک مطالعه تجربی از سوابق و یک واسطه. Inf. مدیریت 2018 , 56 . [ Google Scholar ] [ CrossRef ]
  5. Dixit، VS; گوپتا، اس. جین، پی. یک رویکرد ترکیبی قوی برای توصیه‌های محصول آنلاین شخصی‌شده. Appl. آرتیف. هوشمند 2018 ، 32 ، 785–801. [ Google Scholar ] [ CrossRef ]
  6. چان، NN; گالول، دبلیو. تاتا، اس. یک سیستم توصیه‌کننده بر اساس داده‌های استفاده تاریخی برای کشف سرویس وب. خدمت محاسبات گرا Appl. 2012 ، 6 ، 51-63. [ Google Scholar ] [ CrossRef ]
  7. تومازیک، اس. دوزان، د. Škrjanc، I. محلی سازی فضای داخلی مبتنی بر مدل فازی-فاصله اطمینان. IEEE Trans. الکترون صنعتی 2018 ، 66 ، 2015–2024. [ Google Scholar ] [ CrossRef ]
  8. لی، اچ. لو، اچ. شو، ال. چن، جی. چن، ک. در جستجوی مناطق متراکم داخلی: رویکردی با استفاده از داده های موقعیت یابی داخلی. IEEE Trans. دانستن مهندسی داده 2018 ، 30 ، 1481-1495. [ Google Scholar ] [ CrossRef ]
  9. گوا، اس. شیونگ، اچ. ژنگ، ایکس. ژو، ی. شناسایی فعالیت و توصیف معنایی برای محلی‌سازی موبایل داخلی. Sensors 2017 , 17 , 649. [ Google Scholar ] [ CrossRef ]
  10. کوهلر، سی. بانوویچ، ن. اوکلی، آی. منکف، جی. Dey، AK Indoor-ALPS: یک سیستم پیش‌بینی مکان داخلی تطبیقی. در مجموعه مقالات کنفرانس مشترک بین المللی ACM 2014 در محاسبات فراگیر و همه جا حاضر، سیاتل، WA، ایالات متحده، 13-17 سپتامبر 2014. ACM: نیویورک، نیویورک، ایالات متحده آمریکا، 2014; صص 171-181. [ Google Scholar ] [ CrossRef ]
  11. آهنگ، سی. Qu، Z. بلوم، ن. باراباسی، ع.-ال. محدودیت های قابل پیش بینی در تحرک انسان. Science 2010 ، 327 ، 1018-1021. [ Google Scholar ] [ CrossRef ]
  12. لو، ایکس. وتر، ای. بهارتی، ن. تاتم، ای جی. Bengtsson، L. نزدیک شدن به حد قابل پیش بینی در تحرک انسان. علمی Rep. 2013 , 3 , 2923. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  13. مینگ شیائو، ال. آهنگ، جی. فنگ، ال. Hengcai, Z. بازسازی مسیر حرکت انسان از داده های تلفن همراه با فرکانس پایین در مقیاس بزرگ. محاسبه کنید. محیط زیست سیستم شهری 2019 ، 77 ، 101346. [ Google Scholar ] [ CrossRef ]
  14. بله، م. یین، پی. لی، دبلیو.-سی. توصیه مکان برای شبکه های اجتماعی مبتنی بر مکان. در مجموعه مقالات هجدهمین کنفرانس بین المللی SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی، سن خوزه، کالیفرنیا، ایالات متحده آمریکا، 2-5 نوامبر 2010. ACM: نیویورک، نیویورک، ایالات متحده آمریکا، 2010; ص 458-461. [ Google Scholar ] [ CrossRef ]
  15. کوانگ، ال. یو، ال. هوانگ، ال. وانگ، ی. ما، پ. لی، سی. Zhu, Y. یک رویکرد پیش بینی QoS شخصی برای توصیه خدمات CPS بر اساس شهرت و فیلتر مشارکتی آگاه از مکان. Sensors 2018 , 18 , 1556. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  16. بائو، جی. ژنگ، ی. Mokbel، MF توصیه مبتنی بر موقعیت و اولویت آگاه با استفاده از داده های شبکه های جغرافیایی-اجتماعی پراکنده. در GIS: مجموعه مقالات سمپوزیوم بین المللی ACM در مورد پیشرفت در سیستم های اطلاعات جغرافیایی . ACM: نیویورک، نیویورک، ایالات متحده آمریکا، 2012; ص 199-208. [ Google Scholar ] [ CrossRef ]
  17. ژانگ، ایکس. ژائو، ز. ژنگ، ی. لی، جی. پیش‌بینی مقاصد تاکسی با استفاده از روش جدید جاسازی داده‌ها و یادگیری گروهی. IEEE Trans. هوشمند ترانسپ سیستم 2019 ، 1–11. [ Google Scholar ] [ CrossRef ]
  18. لی، ایکس. لی، ام. گونگ، ی.-جی. ژانگ، X.-L. Yin, J. T-DesP: پیش بینی مقصد بر اساس داده های مسیر بزرگ. IEEE Trans. هوشمند ترانسپ سیستم 2016 ، 17 ، 2344-2354. [ Google Scholar ] [ CrossRef ]
  19. بوگومولوف، آ. لپری، بی. استایانو، جی. الیور، ن. پیانسی، اف. Pentland، A. Once Upon a Crime: Towards Crime Prediction from Demographics and Mobile Data. در مجموعه مقالات شانزدهمین کنفرانس بین المللی تعامل چندوجهی، استانبول، ترکیه، 12 تا 16 نوامبر 2014. ACM: نیویورک، نیویورک، ایالات متحده آمریکا، 2014. [ Google Scholar ]
  20. ژائو، ز. کوتسوپولوس، HN; ژائو، جی. پیش‌بینی تحرک فردی با استفاده از داده‌های کارت هوشمند حمل‌ونقل. ترانسپ Res. قسمت ظهور. تکنولوژی 2018 ، 89 ، 19-34. [ Google Scholar ] [ CrossRef ]
  21. مونریال، آ. پینلی، اف. تراسارتی، ر. Giannotti، F. WhereNext: پیش‌بینی‌کننده مکان در استخراج الگوی مسیر. در مجموعه مقالات کنفرانس بین المللی Acm Sigkdd در مورد کشف دانش و داده کاوی، پاریس، فرانسه، 28 ژوئن تا 1 ژوئیه 2009. ACM: نیویورک، نیویورک، ایالات متحده آمریکا، 2009; صص 637-646. [ Google Scholar ] [ CrossRef ]
  22. لی، اس. لیم، جی. پارک، جی. Kim, K. پیش‌بینی مکان بعدی براساس الگوی مکانی-زمانی استخراج گزارش‌های دستگاه تلفن همراه. Sensors 2016 , 16 , 145. [ Google Scholar ] [ CrossRef ]
  23. یینگ، جی سی. لی، WC; Tseng، در مقابل الگوهای جغرافیایی-زمانی- معنایی معدن در مسیرها برای پیش‌بینی مکان. ACM Trans. هوشمند سیستم تکنولوژی 2014 ، 5 ، 1-33. [ Google Scholar ] [ CrossRef ]
  24. وو، آر. لو، جی. یانگ، کیو. شائو، جی. یادگیری ترجیحات حرکتی و تعامل اجتماعی برای پیش‌بینی مکان. دسترسی IEEE 2018 ، 6 ، 10675–10687. [ Google Scholar ] [ CrossRef ]
  25. Gambs، S. کیلیجیان، م.-او. del Prado Cortez، MN پیش‌بینی مکان بعدی با استفاده از زنجیره مارکوف تحرک. در مجموعه مقالات اولین کارگاه در مورد اندازه گیری، حریم خصوصی و تحرک، MPM’12، برن، سوئیس، 10 آوریل 2012. ACM: نیویورک، نیویورک، ایالات متحده آمریکا، 2012. [ Google Scholar ] [ CrossRef ]
  26. هاولکا، بی. سیتکو، آی. کازاکوپولوس، پ. Beinat, E. پیش‌بینی جمعی ردپای تحرک فردی برای کاربران با تاریخچه داده‌های کوتاه. PLoS ONE 2017 , 12 , e0170907. [ Google Scholar ] [ CrossRef ]
  27. Keles، TI; اوزر، م. توروسلو، آی. کاراگوز، ص. پیش‌بینی مکان کاربران تلفن همراه با استفاده از کاوش دنباله‌ای مبتنی بر پیشینه با پشتیبانی چندگانه. در یادداشت های سخنرانی در هوش مصنوعی (زیر مجموعه یادداشت های سخنرانی در علوم کامپیوتر) ; Springer: برلین/هایدلبرگ، آلمان، 2014; جلد 8983، صص 179–193. [ Google Scholar ] [ CrossRef ]
  28. Morzy, M. پیش‌بینی مکان شی متحرک بر اساس مسیرهای مکرر . Springer: برلین/هایدلبرگ، آلمان، 2006; صص 583-592. [ Google Scholar ] [ CrossRef ]
  29. متیو، دبلیو. راپوسو، آر. مارتینز، بی. پیش‌بینی مکان‌های آینده با مدل‌های پنهان مارکوف. در مجموعه مقالات کنفرانس UbiComp’12-2012 ACM در مورد محاسبات همه جا، پیتسبورگ، پنسیلوانیا، 5 تا 8 سپتامبر 2012. ACM: نیویورک، نیویورک، ایالات متحده آمریکا، 2012; ص 911-918. [ Google Scholar ] [ CrossRef ]
  30. کیانگ، ال. شو، دبلیو. لیانگ، دبلیو. Tan, T. پیش‌بینی مکان بعدی: مدلی تکرارشونده با زمینه‌های مکانی و زمانی. در مجموعه مقالات سی امین کنفرانس AAAI در مورد هوش مصنوعی، فینیکس، AZ، ​​ایالات متحده آمریکا، 12 تا 17 فوریه 2016; مطبوعات AAAI: پالو آلتو، کالیفرنیا، ایالات متحده آمریکا، 2016؛ صص 194–200. [ Google Scholar ]
  31. دی، ی. چائو، ز. هوانگ، جی. Bi, J. SERM: مدلی تکرارشونده برای پیش‌بینی مکان بعدی در مسیرهای معنایی . ACM: نیویورک، نیویورک، ایالات متحده آمریکا، 2017؛ ص 2411-2414. [ Google Scholar ] [ CrossRef ]
  32. بله، ی. ژنگ، ی. چن، ی. فنگ، جی. Xie، X. الگوی زندگی فردی معدن بر اساس تاریخچه مکان. در مجموعه مقالات کنفرانس بین المللی IEEE در مدیریت داده های تلفن همراه، تایپه، تایوان، 18-21 مه 2009. صص 1-10. [ Google Scholar ]
  33. Vu، L. انجام، س. Nahrstedt، K. Jyotish: رویکرد سازنده برای پیش‌بینی زمینه حرکت افراد از ردیابی مشترک Wifi/Bluetooth. اوباش فراگیر. محاسبه کنید. 2011 ، 7 ، 690-704. [ Google Scholar ] [ CrossRef ]
  34. Vu، L. نگوین، پی. Nahrstedt، K. Richerzhagen, B. مشخص کردن و مدل‌سازی حرکت افراد از روی ردیابی‌های حسگر تلفن همراه. اوباش فراگیر. محاسبه کنید. 2015 ، 17 ، 220-235. [ Google Scholar ] [ CrossRef ]
  35. انجام دهید، TMT; دوسه، او. میتینن، ام. Gatica-Perez, D. A Probabilistic Kernel Method for Human Mobility Prediction with Smartphones. محاسبات موبایلی فراگیر 2014 ، 20 ، 13-28. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  36. وو، اف. فو، ک. وانگ، ی. شیائو، ز. فو، ایکس. الگوریتم شبکه عصبی مکانی-زمانی-معنای برای پیش‌بینی مکان روی اجسام متحرک. الگوریتم‌ها 2017 ، 10 ، 37. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  37. ژو، ی. سان، اچ. هوانگ، جی. جیا، ایکس. ژائو، زی. پیش‌بینی کارآمد مقصد بر اساس انتخاب مسیر با بهینه‌سازی ماتریس انتقال. IEEE Trans. دانستن مهندسی داده 2018 , 14 . [ Google Scholar ] [ CrossRef ]
  38. Ang، B.-K. Dahlmeier، D. لین، ز. هوانگ، جی. سیتو، ام.-ال. Shi, H. پیش‌بینی موقعیت مکانی بعدی داخلی با Wi-Fi. در مجموعه مقالات چهارمین کنفرانس بین المللی پردازش اطلاعات دیجیتال و ارتباطات، کوالالامپور، مالزی، 18 تا 20 مارس 2014. [ Google Scholar ]
  39. سپهکار، م. خیام باشی، MR رویکرد مشترک جدید برای پیش بینی مکان در شبکه های تلفن همراه. سیم. شبکه 2018 ، 24 ، 283-294. [ Google Scholar ] [ CrossRef ]
  40. ژانگ، دی. ژانگ، دی. شیونگ، اچ. یانگ، LT; Gauthier, V. NextCell: پیش‌بینی موقعیت مکانی با استفاده از تعامل اجتماعی از ردیابی تلفن همراه. IEEE Trans. محاسبه کنید. 2015 ، 64 ، 452-463. [ Google Scholar ] [ CrossRef ]
  41. ون، ال. شی-زیونگ، ایکس. فنگ، ال. Lei, Z. بهبود پیش‌بینی مکان با کاوش پیوندهای مکانی-زمانی-اجتماعی. ریاضی. مشکل مهندس 2014 ، 2014 ، 1-7. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  42. لی، جی. بروگر، آی. زیبارت، بی. برگرولف، تی. کروفوت، ام. Farine, D. اطلاعات اجتماعی پیش بینی مکان را در طبیعت بهبود می بخشد. در مجموعه مقالات کارگاه های بیست و نهمین کنفرانس AAAI در مورد هوش مصنوعی، آستین، TX، ایالات متحده، 25 تا 30 ژانویه 2015. [ Google Scholar ] [ CrossRef ]
  43. اسپاکاپیترا، اس. پدر و مادر، سی. دامیانی، ام.ال. De Macedo، JA; پورتو، اف. وانگنوت، سی. دیدگاه مفهومی در مسیرها. دانستن داده ها مهندس 2008 ، 65 ، 126-146. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  44. استر، ام. کریگل، اچ پی؛ ساندر، جی. Xu, X. الگوریتم مبتنی بر چگالی برای کشف خوشه‌ها در پایگاه‌های داده فضایی بزرگ با نویز. در مجموعه مقالات کنفرانس بین المللی کشف دانش و داده کاوی، پورتلند، OR، ایالات متحده آمریکا، 2 تا 4 اوت 1996. جلد 96، ص 226–231. [ Google Scholar ]
  45. بیرانت، دی. Kut، A. ST-DBSCAN: الگوریتمی برای خوشه بندی داده های مکانی-زمانی. دانستن داده ها مهندس 2007 ، 60 ، 208-221. [ Google Scholar ] [ CrossRef ]
  46. ایلیوپولوس، CS; رحمان، MS یک الگوریتم کارآمد جدید برای محاسبه طولانی ترین دنباله متداول. محاسبات تئوری. سیستم 2009 ، 45 ، 355-371. [ Google Scholar ] [ CrossRef ]
  47. گروور، ا. Leskovec, J. node2vec: آموزش ویژگی مقیاس پذیر برای شبکه ها. در مجموعه مقالات KDD: کنفرانس بین المللی کشف دانش و داده کاوی، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، 13 تا 17 اوت 2016. صص 855-864. [ Google Scholar ]
  48. یوان، جی. سان، پ. ژائو، جی. لی، دی. وانگ، سی. مروری بر الگوریتم‌های خوشه‌بندی مسیر جسم متحرک. آرتیف. هوشمند Rev. 2016 , 47 , 123-144. [ Google Scholar ] [ CrossRef ]
  49. چن، ال. اوزسو، MT; Oria، V. جستجوی شباهت قوی و سریع برای مسیر حرکت جسم متحرک. در مجموعه مقالات کنفرانس بین المللی ACM SIGMOD 2005، بالتیمور، MD، ایالات متحده آمریکا، 14-16 ژوئن 2005. پ. 491. [ Google Scholar ]
  50. Sankoff، BD; Kruskal، JB Time Warps، String Edits، و Macromolecules: Theory and Practice of Sequence Comparison. ریدینگ، MA: ادیسون-وسلی. J. محاسبات منطقی. 1983 ، 11 ، 356. [ Google Scholar ]
  51. فری، بی جی؛ Dueck, D. خوشه بندی با ارسال پیام بین نقاط داده. Science 2007 ، 315 ، 972-976. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  52. سپ، اچ. یورگن، اس. حافظه کوتاه مدت طولانی. محاسبات عصبی 1997 ، 9 ، 1735-1780. [ Google Scholar ] [ CrossRef ]
شکل 1. محل اقامت و توالی مکان: ( الف ) حرکت کاربر در طبقه سوم و ( ب ) توالی مکان یک کاربر در یک فضای داخلی.
شکل 2. نمودار جریان چارچوب Indoor-WhereNext.
شکل 3. تطابق معنایی نقطه ماندن.
شکل 4. فرآیند تبدیل فروشگاه ها به بردارها: ( الف ) شبکه وزنی که با انتقال مغازه ها شکل می گیرد، ( ب ) شبکه نمایش ماتریس مجاورت، و ( ج ) ماتریس ویژگی کدگذاری شده توسط node2vec.
شکل 5. مشخصات آماری مسیرهای اصلی کاربران داخلی: ( الف ) توزیع فواصل نمونه برداری در دو هفته داده، ( ب ) توزیع تعداد نقاط مسیر در دو هفته داده، ( ج ) تغییر در تعداد کاربران در طول زمان در طول روز، و ( د ) تغییر در تعداد کاربران در هر طبقه در طول زمان در طول یک روز.
شکل 6. تاثیر پارامترها �1�2و ممن�پتیسدر مورد دقت پیش بینی
شکل 7. تاثیر ضریب وزن در مورد دقت پیش بینی
شکل 8. دقت پیش‌بینی مکان قاب Indoor-WhereNext: ( الف ) دقت پیش‌بینی مکان در مجموعه داده آموزشی و ( ب ) دقت پیش‌بینی مکان در مجموعه داده آزمایشی.
شکل 9. دقت با استفاده از خط پایه مجموعه داده: ( الف ) تعداد حالت‌ها در مدل پنهان مارکوف (HMM) 10 است، ( ب ) تعداد حالت‌ها در HMM 20 است، ( ج ) تعداد حالت‌های موجود در HMM 30 است و ( d ) تعداد حالت ها در HMM 40 است.
شکل 10. دقت با استفاده از خط پایه مجموعه داده: ( الف ) تعداد حالت‌ها در مدل پنهان مارکوف (HMM) 10 است، ( ب ) تعداد حالت‌ها در HMM 20 است، ( ج ) تعداد حالت‌های موجود در HMM 30 است و ( d ) تعداد حالت ها در HMM 40 است.

بدون دیدگاه

دیدگاهتان را بنویسید