یک نمایه سازی ترکیبی توزیع شده برای پردازش مستمر پرس و جو KNN بر روی اشیاء متحرک

حجم داده‌های فضایی بسیار پویا به دلیل تکامل آنی فناوری تلفن همراه به سرعت در حال گسترش است که منجر به چالش‌هایی برای جستجوهای مداوم می‌شود. ما یک مدل رویکرد نمایه‌سازی جدید، یعنی رویکرد نمایه‌سازی فضای زمانی سرعت (VeST)، برای پرس‌و‌جوهای پیوسته، عمدتاً K-نزدیک‌ترین همسایه پیوسته (CKNN) و جستارهای محدوده پیوسته با استفاده از اسپارک آپاچی پیشنهاد می‌کنیم. ساختار پیشنهادی بر اساس یک روش پارتیشن بندی با سرعت انتخابی است، به عنوان مثال، از آنجایی که اشیاء مختلف سرعت های متفاوتی دارند، ما اشیاء را با توجه به میانگین سرعت واقعی که قبل از ساخت شاخص و دسترسی به داده ها محاسبه می کنیم به دو مجموعه تقسیم می کنیم. سپس واحد پایه ساختار نمایه سازی اتخاذ شده شامل یک درخت R غیر همپوشانی و یک شبکه دو بعدی است. درخت فضا را به حداقل مناطق مرزی غیر همپوشانی تقسیم می کند که به شبکه ها اشاره می کند. سپس، شبکه یکنواخت داده های شی گره های برگ را ذخیره می کند. این روش دسترسی هزینه به روز رسانی را کاهش می دهد و زمان پاسخ و دقت پرس و جو را بهبود می بخشد. به منظور بهبود عملکرد برای پردازش در مقیاس بزرگ، ما یک ساختار شاخص چندلایه فشرده بر روی یک تنظیم توزیع شده طراحی می‌کنیم و یک الگوریتم جستجوی CKNN را برای نتایج دقیق با استفاده از فرآیند شناسایی سلول نامزد پیشنهاد می‌کنیم. ما یک چشم انداز جامع از مدل نمایه سازی و تکنیک پرس و جو اتخاذ شده ارائه می دهیم. نتایج شبیه سازی نشان می دهد که برای فواصل پرس و جو 100، رویکرد پیشنهادی 13.59 برابر سریعتر از رویکرد سنتی است و میانگین زمان رویکرد VeST برای همه فواصل پرس و جو کمتر از 0.005 است. این روش پیشنهادی زمان پاسخ و دقت پرس و جو را بهبود می بخشد. دقت الگوریتم VeST بدون توجه به طول بازه پرس و جو تقریباً برابر با 100٪ است.

کلید واژه ها:

پرس و جو پیوسته KNN ; نظارت و مدیریت شی متحرک ; شاخص های مکانی-زمانی توزیع شده ; سیستم های داده های جغرافیایی ; پردازش موازی

1. مقدمه

استفاده گسترده از دستگاه های داخلی سیستم موقعیت یابی جهانی (GPS) به سمت گسترش خدمات مبتنی بر مکان (LBS) [ 1 ] و متعاقباً به سمت رشد تصاعدی در بازار LBS بلادرنگ [ 2 ، 3 ] هدایت شده است. پیشرفت های اخیر با تمرکز بر داده های بزرگ مکانی و زمانی و محاسبات مکانی مانند شهرهای هوشمند [ 4 ]، نظارت و ارزیابی محیطی [ 5 ]، خدمات مبتنی بر مکان [ 6 ، 7 ، 8 ]]، و اینترنت اشیا (IoT) بر مدیریت موثر داده های جغرافیایی مرجع تکیه می کنند. داده های جغرافیایی شامل اطلاعاتی است که هم در زمان و هم در مکان جمع آوری می شوند. این اطلاعات شامل اطلاعات مکان، زمان و در نهایت سرعت است [ 9 ]. حسگرهای مختلف مقیاس های بزرگی از داده ها را در فرکانس های بسیار بالا منتقل می کنند که در نتیجه پردازش داده های پویا در مقیاس بزرگ در زمان واقعی انجام می شود و مفهوم نمایه سازی و پرس و جو پیوسته را معرفی می کند. رویکردهای جستجوی فضایی پیوسته باید از انواع جستجوهای پیچیده با استفاده از تکنیک های نمایه سازی پیشرفته پشتیبانی کند. یک سری از گسترش‌های زمانی با نمایش دوگانه داده‌های مبتنی بر شی، مبتنی بر میدان، و جغرافیایی در روش‌های مدل‌سازی اولیه GIS پیشنهاد شد [ 10 ]]. از این رو، پرس و جو مداوم کارآمد بر روی اشیاء متحرک به دلیل ظهور محاسبات تلفن همراه و همه جا حاضر، به عنوان یک فرآیند ضروری برای کاربردهای محاسباتی فضایی متعدد تکامل یافته است. پرس و جوهای فضایی و زمانی در سناریوهای مختلف مانند رویکردهای کنترل ترافیک، سیستم های اطلاعات جغرافیایی (GIS) و اشیاء آگاه از مکان مفید هستند [ 11 ].]. در این مقاله، ما پرس و جوی پیوسته K-nearest همسایه (CKNN) را مطالعه می کنیم، یک کلاس ضروری از پرس و جوهای مکانی-زمانی که K-نزدیک ترین همسایگان (KNN) را در میان مجموعه ای از اشیاء متحرک در هر مهر زمانی بررسی می کند. نمونه ای از پرس و جوی CKNN یافتن دو تاکسی عابر پیاده نزدیک بر اساس سرعت ارائه شده و مکان ترافیک عابر پیاده است. در دهه گذشته، اکثر رویکردهای پرس و جوی CKNN در یک ساختار نمایه سازی فضایی و فواصل زمانی گسسته ادغام شدند که مجموعه kNN را بر اساس مکان آنها در زمان تولید پرس و جو برمی گرداند. این جستجوی فوری بر اساس محاسبات استاتیک فاصله ممکن است یک مجموعه نتایج قدیمی را بازگرداند زیرا ممکن است اشیاء در این مدت در حال حرکت باشند. با این حال، مکان آنها همراه با ارزیابی پرس و جو به روز نشد، که دقت نتایج پرس و جو را کاهش داد. از این رو،12 ].

از آنجایی که دستگاه‌ها و سرویس‌های آگاه از مکان در یک سیستم مکانی آگاه از زمان توزیع می‌شوند، احتمالاً بسیاری از پرس‌وجوهای CKNN به طور همزمان پردازش می‌شوند. کاهش عملکرد سرور آسان است و پاسخگویی به سوالات طولانی است. با توجه به ماهیت بلادرنگ برنامه های کاربردی آگاه از مکان، تاخیرهای قابل توجه پاسخ دادن به سوالات را بی فایده می کند. بنابراین، الگوریتم‌های جدید پردازش پرس و جو که عملکرد و مقیاس‌پذیری را مدیریت می‌کنند باید مجموعه دیگری از پرس‌و‌جوهای CKNN را شامل شوند. بسیاری از راه حل های موجود برای مشکل انتقال شی پرس و جو KNN برای رسیدگی به حجم زیادی از داده ها توسعه نیافته اند. بنابراین، هزینه های ساخت نمایه سازی گران است و متعاقباً بر زمان پاسخ پرس و جو تأثیر می گذارد، زیرا مطمئناً از یک تنظیم متمرکز پیروی می کند که در آن هر دو درخواست به روز رسانی نگهداری می شوند. و پردازش صورت می گیرد [ 13 ,14 ]. پرس و جوهای پیوسته برای جریان های داده در زمینه های فضایی که توسط آثار موجود مورد تجزیه و تحلیل قرار می گیرد، عمدتاً بر اساس روش های بای پس بولی یا تقریبی است که یک عدد تصادفی یا نتیجه تقریبی ارائه می دهد [ 15 ]. فناوری پردازش پرس و جو CKNN در تحقیقات پایگاه داده نگرانی است که بسیاری از محققان بر آن تاکید دارند. بسیاری از برنامه های کاربردی بلادرنگ مانند کنترل توزیع ترافیک، میدان نبرد دیجیتال، خدمات ناوبری شخصی و سایر سیستم هایی که کاربران تلفن همراه را به هم متصل می کنند، دارد. بنابراین، دسترسی به اطلاعات مکانی و اشیاء فضایی محدود به پرس و جو از اشیاء در یک شبکه جاده ای است [ 16 ]]، که شامل چالش‌های زیادی است که عمدتاً به پیچیدگی ویژگی‌های شبکه فضایی مانند شناسایی گره و هرس شی برای ارزیابی پرس و جو مربوط می‌شود.

هدف اصلی این مطالعه افزایش کارایی و دقت یک پرس و جوی CKNN بر روی اجسام متحرک با استفاده از شاخص های فضایی توزیع شده است. علاوه بر این، این کار با هدف استخراج موثر اطلاعات شی از شاخص های توزیع شده بر اساس الگوریتم های عملی و فناوری هرس کارآمد برای مدیریت چالش های پرس و جو مستمر است. این مقاله عملکردهای پرس و جوی CKNN را بررسی و بهینه سازی می کند تا از محدودیت های کار قبلی ذکر شده در بالا جلوگیری کند. برای مطالعه تجربی، سناریوهای مختلفی را در نظر گرفتیم، فاصله بین دو شی به عنوان کوتاه‌ترین مسیر بین آنها در شبکه تعریف می‌شود. مجموعه CKNN یک نقطه پرس و جو برای مهر زمانی باید به طور کامل تعریف شود. به منظور کاهش قابل توجه جستجوی تکراری و هزینه محاسباتی، ما روشی طراحی کردیم که از اطلاعات سرعت نسبی جسم متحرک استفاده می‌کند و تعدادی تکرار را محدود به دو می‌کند. فاصله بین دو شی متحرک در هر مهر زمانی تنها به عنوان یک عملیات جدول زمانی ارائه می شود و با استفاده از این رویکرد به راحتی محاسبه می شود. کار ما کمبودهای قابل توجه کارهای مربوط به گذشته را برطرف می کند و روش دقیق و کارآمدتری برای مشکل CKNN ارائه می دهد. طرح کلی این مقاله به شرح زیر است:

ما یک رویکرد نمایه‌سازی جدید، یعنی رویکرد نمایه‌سازی فضای زمانی سرعت (VeST)، برای پرس‌و‌جوی پیوسته، عمدتاً K-نزدیک‌ترین همسایه پیوسته (CKNN) و جستارهای محدوده پیوسته پیشنهاد می‌کنیم.
ما یک ساختار شاخص چندلایه فشرده بر روی یک تنظیم توزیع شده طراحی می کنیم و یک الگوریتم جستجوی CKNN را برای نتایج دقیق با استفاده از فرآیند شناسایی سلول نامزد پیشنهاد می کنیم.
ما یک چشم انداز جامع از مدل نمایه سازی و تکنیک پرس و جو اتخاذ شده ارائه می دهیم.
ما مجموعه ای جامع از آزمایش ها را انجام دادیم، نتایج خود را با رویکردهای موجود مقایسه کردیم و از تکنیک های توزیع مختلف استفاده کردیم.

بقیه این مقاله به شرح زیر سازماندهی شده است. ما کار مرتبط را برای جستارهای پیوسته KNN و اشیاء متحرک در شبکه های جاده ای در بخش 2 بررسی می کنیم. بخش 3 مقدمات و رویکرد پیشنهادی را تشریح می کند. بخش 4 رویکرد نمایه سازی مکانی-زمانی سرعت، از جمله معماری، مرحله ساخت نمایه، و پردازش پرس و جو توزیع شده را ارائه می کند. بخش 5 مجموعه داده ها و نتایج شبیه سازی را در مورد عملکرد روش ما پوشش می دهد. در بخش 6 ، مقاله را با دستورالعمل هایی برای کار آینده به پایان می رسانیم.

2. بررسی ادبیات

پارادایم های نمایه سازی و پرس و جو از اجسام متحرک (MO) را می توان با توجه به واحد پایه ساختار شاخص، مانند شاخص های مبتنی بر شبکه، شاخص های درخت مانند و شاخص های ترکیبی، به کلاس های مختلفی طبقه بندی کرد [ 17 ]. پیچیدگی رویکردهای مرتبط با مکان، به طور کلی، و پردازش پیوسته MO به عوامل مختلفی مانند داده ها و تنوع وابسته است. داده‌های نمایه‌سازی‌شده به‌طور پیوسته نوسان بیشتری دارند و حجم قابل‌توجهی از داده‌ها وجود دارد. دگرگونی های خودهمبستگی داده ها در عنصر مکانی-زمانی اجسام متحرک به آرامی در طول زمان رخ می دهد، بدون در نظر گرفتن محدودیت های کار مربوط به CKNN، از جمله عدم قطعیت سرعت که در بسیاری از کارهای مربوط به سرعت نامشخص اجسام متحرک وجود دارد، که صرفاً بر روی فضاهای اقلیدسی متمرکز است. [ 18، 19 ]. با این حال، با ارزیابی اشیاء روی یک شبکه جاده، دقت مکان [ 20 ] مربوط به ارزیابی مجدد پرس و جوی تکراری اضافی است. مقدار فازی از تکرارهای جستجوی CKNN رخ می‌دهد، و مقدار قابل‌توجهی از الگوریتم‌های جستجو بر اساس تعداد نامشخصی از تکرارها برای یافتن ناحیه KNN است که منجر به هزینه‌های ارتباطی اضافی [ 18 ] در یک محیط توزیع‌شده می‌شود. توزیع اریب داده ها بر روی گره ها به دلیل توزیع غیریکنواخت در فضا، اجراها را کاهش می دهد.

یک جستار پیوسته K-nearest همسایه (k-NN) چندین سرویس مبتنی بر مکان را پشتیبانی می کند و به طور پیوسته داده های K-nearest شی را به محیط پرس و جو برمی گرداند. بسیاری از رویکردهای فعلی به این موضوع بر روی تنظیمات متمرکز متمرکز شده‌اند که نشان‌دهنده مقیاس‌پذیری کمتر برای پرداختن به مجموعه داده‌های مهم و پراکنده است. در [ 21]، نویسندگان یک راه حل کارآمد و توزیع شده برای پرس و جوهای kNN پیشنهاد کردند، به طوری که اشیاء می توانند برای پردازش داده های گسترده تر جابجا شوند. راه حل پیشنهادی شامل یک شاخص مبتنی بر شبکه جدید به نام Block Grid Index (BGI) و یک روش جستجوی توزیع شده KNN مبتنی بر BGI بود. BGI یک نمایه در حافظه مبتنی بر شبکه لایه ای توزیع شده برای پرس و جوهای KNN است که در STORM ساخته شده است. از این فرض شروع می‌شود که اجسام متحرک متعلق به ناحیه‌ای هستند که در سلول‌های هم اندازه بدون همپوشانی تقسیم می‌شوند و هر سلول، اشیاء متحرک خود را نمایه می‌کند. هیچ الگوی از پیش تعریف شده ای برای حرکت اجسام وجود ندارد. حداقل و حداکثر تعداد از پیش تعریف شده از اشیاء در هر بلوک وجود دارد. هر بلوک دارای یک عدد N است. چند مزیت برای رویکرد آنها وجود دارد. راه اندازی و نگهداری BGI در یک محیط توزیع شده آسان است. الگوریتم پرس و جو می تواند نتایج را پس از دو تکرار جستجو برگرداند و عملکرد پرس و جو k-NN را بهبود بخشد. اثربخشی راه حل آنها از طریق آزمایش های گسترده بر روی میلیون ها گره ثابت شده است.

تمرکز بسیاری از برنامه های کاربردی با اشیاء پویا، پردازش پرس و جوهای k-NN است. اکثر رویکردهای فعلی برای تنظیمات متمرکز طراحی شده اند که در آن پرس و جوها در همان سرور برای رسیدگی به این مشکل پردازش می شوند. اگر نگوییم غیرقابل تصور، مقیاس کردن تنظیمات توزیع شده برای رسیدگی به حجم زیادی از داده ها و جستجوهای همگام سازی که به طور فزاینده ای در چنین برنامه هایی یافت می شوند، چالش برانگیز است. برای پرداختن به این موضوع، Ziqiang و همکاران. [ 22] مجموعه ای از توضیحات را پیشنهاد کرد که می تواند پردازش توزیع شده مقیاس پذیر پرس و جوهای k-NN را حفظ کند. مهمتر از همه، آنها یک ساختار شاخص ترکیبی جدید به نام شاخص نوار پویا (DSI) معرفی کردند که بهتر برای توزیع های مختلف داده تنظیم می شد. ساختار به خوشه‌ها تقسیم شد و آن را برای پردازش توزیعی مناسب ساخت. آنها همچنین الگوریتم جستجوی K-NN مبتنی بر DSI (DKNN) را توصیه کردند. DKNN کارآمدتر و قابل پیش بینی تر از روش های سنتی است، زیرا از تعداد نامشخص تکرارهای بالقوه گران جلوگیری می کند. DSI و DKNN در بالای Apache S4، یک رسانه جریان توزیع شده منبع باز اجرا شدند. به منظور مطالعه ویژگی های DSI و DKNN، آنها یک مطالعه تجربی جامع را برای بررسی چارچوب و مقایسه آن با سه رویکرد اساسی نمایه سازی و پرس و جو انجام دادند.

شبکه‌های حسگر مقیاس بزرگی از داده‌های بسیار پویا که دائماً به‌روز می‌شوند را تولید می‌کنند که به صورت بسته‌هایی در جریان داده ارسال می‌شوند. فرکانس بالا و ماهیت پیوسته جریان داده، یادگیری از مشاهدات اولیه را دشوار می کند. مقاله بولانگ و همکاران. [ 23] یک نمای کلی به روز از تجزیه و تحلیل بصری داده های جریان جغرافیایی و جهانی ارائه کرد و چارچوبی را پیشنهاد کرد که توسط شکاف های مشخص شده در بررسی ایجاد شده است. این چارچوب شامل یک نمونه اولیه داده‌ای بود که داده‌های نظارت حسگر را نشان می‌داد، یک مدل کاربر که پرس و جوهای کاربر را مدیریت می‌کرد و دانش دامنه سازمان‌دهی می‌کرد، یک نمونه اولیه طراحی برای الگوهای کشف‌شده و تجسم‌های مربوط به آن‌ها، و همچنین یک مدل بصری برای پردازش داده‌های رندر. مدل مفهومی به این نتیجه رسید که جریان بازخورد حسگر به ابزارهایی نیاز دارد که بتواند نمایشگرهای سری زمانی چند متغیره را مدیریت کند. مدل‌های طراحی نشان داد که مدل‌های ارزشمند متعدد نسبت‌ها، انحرافات و داده‌ها را با هم ترکیب می‌کنند. مدل کاربر بر لزوم رسیدگی به داده‌های از دست رفته، ناهماهنگی‌های فرکانس بالا و تغییرات بررسی تاکید کرد.

بسیاری از اشیاء و بسیاری از سوالات ثابت محیط آگاه از فضا را مشخص می کند. هم چیزها و هم سوالات ثابت می توانند در طول زمان موقعیت خود را تغییر دهند. در مقاله شیائوپینگ و همکاران. [ 24]، آنها موضوع بررسی پرس و جوهای شبکه عصبی کانولوشنال (CNN) در پایگاه داده فضا-زمان را بررسی کردند. برای حفظ عملکرد پاسخ های پرس و جو CNN، یک الگوریتم اجرای مشترک (SEA-CNN) معرفی شد. SEA-CNN ارزیابی های اضافی را با اجرای مشترک ترکیب می کند تا هزینه به روز رسانی پاسخ به سوالات را کاهش دهد. در ارزیابی افزایشی، تنها سوالاتی که تحت تاثیر حرکت اجسام قرار می گیرند، مورد بررسی مجدد قرار می گیرند. هر پرس و جو با منطقه جستجو بر اساس پاسخ به پرس و جو قبلی برای کاهش زمان ارزیابی مرتبط است. پرس و جوهای سازگاری در یک جدول جستجوی استاندارد در مدل اجرای مشترک گروه بندی می شوند. بنابراین، موضوع بررسی پرس و جوهای متعدد با اتصال محلی بین جدول جستجو و جدول شی حل می شود. SEA-CNN نیز یک چارچوب کلی قابل استفاده است. در درجه نخست، SEA-CNN هیچ استنتاجی در مورد حرکت یک جسم (به عنوان مثال، سرعت، مدار) نمی کند. آنها یک تحلیل نظری از SEA-CNN در مورد هزینه های پیاده سازی، نیازهای حافظه و پیامدهای پارامترهای قابل تنظیم ارائه کردند. تجربه گسترده نشان داد که SE-CNN مقیاس پذیرتر و کارآمدتر از فناوری CNN مبتنی بر درخت R در مورد تعداد IO و هزینه CPU است.

شبکه‌های حسگر بی‌سیم به طور گسترده در کاربردهای متعددی مانند نظارت بر محیط‌زیست، مدیریت تولید، مدیریت دارایی‌های تجاری، اتوماسیون حمل و نقل و صنعت پزشکی مورد استفاده قرار گرفته‌اند. در مقاله Hua و همکاران. [ 25] موضوع جالبی را بررسی می کنند. نظارت مستمر از جمع آوری میانگین k خوانش حسگرها در شبکه های حسگر بزرگ. با توجه به مجموعه ای از حسگرها که اندازه گیری آنها تکامل می یابد، آنها می خواهند میانگین k اندازه گیری را ثابت نگه دارند. هدف بهینه سازی کاهش هزینه های گزارش شبکه است. هدف این است که مرکز داده را از قرائت‌های فعلی با حفظ حداکثر تعداد سنسورها مطلع کنیم. آنها یک درخت گزارش خواندن، یک چارچوب طبقه بندی برای جمع آوری داده ها و تجزیه و تحلیل را برای رسیدگی به این موضوع توصیه می کنند. آنها همچنین چندین روش گزارش‌دهی اقتصادی را با نظارت مستمر k منابع با خواندن درخت گزارش توسعه می‌دهند. اول، یک روش استاندارد نمونه برداری با استفاده از درخت گزارش خوانی می تواند چشم انداز با کیفیت خوبی ارائه دهد. دوم، آنها روشی را برای تعیین مرزها پیشنهاد کردند که تقریباً می تواند کیفیت را تضمین کند. سرانجام، آنها یک رویکرد کند را آزمایش کردند که می تواند محاسبات میانی را به طور قابل توجهی کاهش دهد. برای بررسی ویژگی های روش پیشنهادی، آنها شبیه سازی سیستماتیک را با استفاده از مجموعه داده های مصنوعی ارزیابی کردند.

فرآیند جستجوی پیوسته K نزدیکترین همسایه (CKNN) نزدیکترین k اشیاء را برای مجموعه ارائه شده از اشیاء متحرک می گیرد. نتایج ثابتی را در زمان واقعی با اشیا و نقاط پرس و جو برای نظارت بر انتقال می دهد. فرآیندهای فعلی پرس و جو CKNN معمولاً دارای نگهداری فهرست، به روز رسانی نتایج بلادرنگ و هزینه های پرس و جو هستند که ممکن است مشکل را به طور کامل حل نکنند. برای پرداختن به این موضوع، یو و همکاران. [ 26] یک الگوریتم جستجوی اضافی را توصیه کرد. از روش تخمین تصادفی (RE) برای پردازش پرس و جوهای CKNN برای مقادیر زیادی از اجسام متحرک استفاده می کند. در ترکیب با یک الگوریتم جستجوی افزایشی برای پردازش نمایه سازی CKNN و پرس و جو بر روی حجم عظیمی از اشیاء متحرک، رویکرد RE می تواند به سرعت یک منطقه جستجوی مناسب برای یک پرس و جو پیوسته ایجاد شده بر روی نتایج قبلی پرس و جو را تعیین کند. در مقایسه با سایر رویکردهایی که پرس و جوی مداوم را در یک منطقه دو بعدی مورد علاقه هدف قرار می دهند، این استراتژی به دقت تخمین بالاتری برای شناسایی تعداد آیتم ها در یک منطقه خاص دست یافت که به طور قابل توجهی کارایی پردازش پرس و جو پیوسته kNN را بهبود بخشید.

حیاتی ترین بخش یک سیستم واکنش اضطراری زمان است. بنابراین، ذخیره فوری داده‌های دقیق جدید در پایگاه داده، بازیابی سریع داده‌ها، حفظ ترتیب زمانی و تقویت سیستم، همه در زمان واقعی، ضروری است. یکی دیگر از عناصر حیاتی نظارت بر تهدیدهای محیطی، فعال کردن پرس و جوهای بلادرنگ مبتنی بر ویژگی های مدرن است. ما همچنین به سریع ترین دسترسی به آخرین داده ها نیاز داریم. علاوه بر این، داده‌های بی‌درنگ جمع‌آوری‌شده از حسگرها به کنترل سریع و کارآمد برای انحراف از اشباع حافظه مرکزی نیاز دارند. سروین و همکاران [ 27] روش‌های نمایه‌سازی را برای پشتیبانی از پرسش‌هایی که داده‌های معاصر را هدف قرار می‌دهند، پیشنهاد کرد. راه‌حل نمایه‌سازی پیشنهادی برای داده‌های بی‌درنگ حسگرهای ثابت بود. دومی داده های زمان واقعی و فضایی بود که از طریق حسگرهای فعال جمع آوری شد. در نهایت، آنها یک راه حل کلی برای مدیریت اشباع حافظه در زمان واقعی با توجه به اهمیت داده ها ارائه کردند.

بخشی از داده‌های مکانی-زمانی موجود به دلیل پیشرفت در فناوری جمع‌آوری داده‌های تلفن همراه و دستگاه‌های آگاه از مکان در حال افزایش است. پردازش بی‌درنگ داده‌های فضایی بزرگ به یکی از مرزهای بررسی در سیستم‌های اطلاعات جغرافیایی (GIS) تبدیل شده است. هدف آن کاهش پیچیدگی به روز رسانی داده ها با استفاده از ساختارهای نمایه سازی فضایی توزیع شده خاص است که داده های بسیار پویا را مدیریت می کند. ژانگ و همکاران به منظور پردازش پرس و جوی مستمر در جریان داده های مکانی. [ 17] پسوندی را برای Apache Storm پیشنهاد کرد که یک سیستم محاسباتی بلادرنگ توزیع شده منبع باز است. آنها از یک استراتژی اتصالات فضایی بین مجموعه داده های متحرک با یک شاخص فضایی توزیع شده استاتیک ثانویه برای پردازش پرس و جوهای مداوم استفاده کردند. با این حال، تکنیک‌های پارتیشن‌بندی مبتنی بر شبکه پیشنهادی تنها بر روی داده‌های نقطه‌ای ۲ بعدی متمرکز شده‌اند. علاوه بر این، چنین تکنیک‌های نمایه‌سازی در کاربردهای فضایی به دلیل داده‌های پویا و توزیع‌های پرس‌وجو بی‌اثر بودند. ما یک حالت رویکرد نمایه سازی جدید برای پرس و جوهای محدوده برای رسیدگی به این مسائل پیشنهاد کرده ایم. ما یک ساختار شاخص چندلایه فشرده بر روی یک تنظیم توزیع شده طراحی می کنیم و یک الگوریتم جستجوی CKNN را برای نتایج دقیق و کارآمد پیشنهاد می کنیم.

3. مقدمات

ما برخی از تعاریف و نمادهای مورد استفاده در این مقاله را نشان می دهیم. جدول 1 نمادهای اصلی استفاده شده در این مقاله را فهرست می کند. ما تنظیماتی را در نظر گرفتیم که در آن N جسم در یک فضای دو بعدی با سرعت های مختلف حرکت می کنند که در آن X_Vel و Y_Vel به ترتیب سرعت مطابق با محور X و Y هستند. اجسام متحرک به عنوان اشیاء نقطه ای و فضایی که در آن حرکت می کنند به عنوان یک فضای اقلیدسی دو بعدی مدل سازی شدند. اشیاء اغلب به روز رسانی در مورد مکان خود را به گره اصلی نمایه سازی ارسال می کنند. به روز رسانی ها به صورت سه گانه ارسال شدند (obj_ID، x_loc، y_loc)، که در آن obj_ID شماره شناسایی منحصر به فرد شی است، x_loc نشان دهنده موقعیت طول جغرافیایی، و y_loc نشان دهنده موقعیت عرض جغرافیایی شی است.

تعریف 1.

اجسام متحرک، MO : یک جسم متحرک با یک دنباله مجزا از تاپل ها به شکل {obj_id,(x_loc, y_loc ), (x_vel, y_vel), t)} نمایش داده می شود که در آن obj_id شناسه شی است, (x_loc, y_loc ) مکان فعلی را نشان می دهد، (x_vel، y_vel) سرعت حرکت جسم است و t زمان فعلی است.

تعریف 2.

به روز رسانی ها: در یک زمینه پردازش داده های مکانی پویا، اشیاء متحرک به طور مداوم به روز رسانی های مکان جدید خود را ارسال می کنند تا آنها را در ساختار نمایه سازی منعکس کنند. به منظور اطمینان از دقت، ایندکس باید بتواند حجم زیادی از به روز رسانی ها را به سرعت پردازش کند تا پاسخ هایی با دقت بالا، همچنین با طول بازه های پرس و جوی متفاوت، ارائه دهد.

تعریف 3.

پرس‌وجوهای فضایی : پرس‌وجوهای فضایی بیشتر در تعداد پویا از برنامه‌های کاربردی ایجاد و استفاده می‌شوند. انتظار می رود که چنین درخواست هایی توسط کاربران بر اساس تجزیه و تحلیل داده های زمان واقعی یا تقریباً واقعی پاسخ داده شود. انواع مختلفی از پرس و جوهای فضایی وجود دارد. در این کار، ما بر پرس و جوهای فضایی پیوسته kNN تمرکز می کنیم.

(الف) نقطه پرس و جو: یک نقطه پرس و جو توسط شناسه کاربر (صادرکننده درخواست) تعریف می شود. کاربر باید برای تعیین منطقه و مجموعه kNN در ایندکس قرار گیرد.

(ب) K-nearest Neighbor Query، kNN query: با توجه به یک نقطه پرس و جو در فضا، یک پرس و جو kNN باید k-امین نزدیکترین اشیا به نقطه پرس و جو را بازیابی کند.

ج) پرس و جوهای پیوسته K-نزدیکترین همسایه، پرس و جو CKNN: با توجه به یک نقطه پرس و جو در فضا، یک پرس و جو CKNN باید به طور پیوسته k اشیایی را که نزدیکترین آنها به نقطه پرس و جو هستند ردیابی کند. اشیاء مورد علاقه، همچنین به نام اشیاء کاندید، و/یا نقطه پرس و جو ممکن است در طول ارزیابی پرس و جو در حال حرکت باشند، به این معنی که مکان ها به طور مداوم به روز می شوند.

4. روش پیشنهادی

این مقاله یک روش نمایه‌سازی وابسته به سرعت را برای داده‌های شی متحرک بر اساس طبقه‌بندی سرعت مشابه با استفاده از معادله انحراف استاندارد در توزیع سرعت پیشنهاد می‌کند، که منجر به دو دیدگاه زیرمکانی مجزا برای جلوگیری از چولگی داده‌ها و تکرارهای جستجوی غیرمفید می‌شود. ما یک شاخص مبتنی بر منطقه برای اشیاء دائماً در حال حرکت در هر صحنه در یک محیط توزیع شده طراحی کردیم. ما یک الگوریتم برای انتخاب نامزدهای پرس و جو پویا در CKNN [ 28 ] پیشنهاد کردیم. VeST با ترکیب نمایه سازی زمان-مکان با سرعت سفارشی شد. هنگامی که یک پرس و جو جدید تولید شد، ابتدا با استفاده از مراحل مختلف از طریق شاخص [ 24 ] ارزیابی شد] به منظور یافتن بهترین حجم جستجو برای پرس و جوها برای کاهش هزینه به روز رسانی فهرست. شاخص Velocity SpatioTemporal (VeST) یک نتیجه پرس و جو شبیه به گره های فضایی نقشه برداری شده به دست آورد. از روش ورودی سفارشی برای وارد کردن لیست اشیاء و درخت مربوطه استفاده کرد. این رویکرد عملکرد ساختمان سازه شاخص از جمله زمان ساخت شاخص و همچنین اندازه را بهبود بخشید و هزینه های به روز رسانی شاخص را کاهش داد. شکل 1نمودار Sequence پردازش پرس و جو را نشان می دهد. در جایی که یک پرس‌وجوی CKNN تولید می‌شد، طبقه‌بندی‌کننده Velocity سرعت‌های واقعی اشیاء را برای محاسبه انحراف استاندارد و تعیین آستانه برای راه‌اندازی پارتیشن‌بندی وابسته به سرعت آنالیز می‌کرد. سپس مدیر پرس و جو ابتدا پردازش پرس و جو را از طریق ساختار فهرست جهانی آغاز کرد. پرس و جو بر این اساس بر روی گره های توزیع شده شاخص ارزیابی و به روز شد تا پاسخ پرس و جو ایجاد شود.

5. مدل نمایه سازی مکانی-زمانی سرعت

ما یک مدل شاخص فضایی برای پرس و جو پیوسته پیشنهاد کرده‌ایم. مدل پیشنهادی با ترکیب نمایه سازی مکانی-زمانی با سرعت سازماندهی شده است. شکل 2 معماری شاخص مکانی-زمانی سرعت پیشنهادی (VeST) را برای پرس و جوی شی متحرک CKNN نشان می دهد.

5.1. معماری جلیقه

شاخص مکانی-زمانی سرعت ما شامل داده‌های مکان-زمان و سرعت بود. سرعت اجسام متحرک را تجزیه و تحلیل کرد و سپس داده های آنها را در یک ساختار ترکیبی توزیع شده فهرست کرد. VeST به گونه ای طراحی شد که دارای دو بخش اصلی، اولیه و ثانویه باشد. یک پارادایم اولیه/ثانویه نشان می دهد که یک سرور برای کار به عنوان گره اولیه پیکربندی شده است. سپس هدایت شد تا تمام پرسش‌های نوشته شده را به دست آورد. سپس گره اولیه کوئری‌ها را اجرا و ثبت کرد، که سپس به گره‌های ثانویه فرستاده شد تا داده‌های یکسان را در تمام اجزای همتای خود هدایت و نگهداری کنند. در ساختار اولیه/ثانویه، توابع نوشتن در سطح اولیه و توابع خواندن در سطح ثانویه اجرا شدند [ 29 ]]. بنابراین، تمام درخواست‌های جستجو در ابتدا به گره اصلی رسیدند، یک صف از ارسال‌ها حفظ شد و تابع خواندن صرفاً در پشت انجام عملیات نوشتن انجام شد. یک مشکل رایج در پیکربندی اولیه/ثانویه وجود دارد، که همچنین زمانی که صف گره اولیه بیش از حد بزرگ می شود که نمی توان آن را حفظ کرد، مشاهده می شود. این معماری فرو می ریزد و گره های ثانویه شروع به رفتار به عنوان گره های اولیه می کنند.

5.2. فاز پارتیشن بندی مبتنی بر سرعت

مرحله تقسیم بندی مبتنی بر سرعت به کاهش هزینه های زمانی و کارآمدتر کردن سیستم کمک می کند همانطور که در مطالعه قبلی خود ارائه و اثبات کردیم [ 28 ]. این سیستم سرعت اشیاء را برای دسته بندی موجودیت ها به کلاس های مختلف ارزیابی می کند.

طبقه بندی مبتنی بر سرعت دو کلاس ایجاد کرد، یکی برای کلاس اشیاء سریع و دیگری برای کلاس اشیاء کند. انتخاب بر اساس یک معادله از پیش تعیین شده انجام شد که انحراف سرعت یک شی بلادرنگ را بر اساس توزیع اشیا تخمین زد. سرعت کل ( ) با استفاده از معادله ( 1 ) محاسبه می شود، که در آن n تعداد کل اشیاء در یک زمان معین است، و سرعت جسم است. برای تعیین سرعت استفاده می شود ، که در معادله ( 2 ) مشخص شده است. در نهایت، برای به دست آوردن استفاده می شود با استفاده از معادله ( 3 )، که آستانه بین اجسام سریع و کند است. این پارتیشن دسترسی بیش از حد به موجودیت ها را در یک مکان ذخیره می کند. علاوه بر این، دوره جستجو و هزینه های تقسیم یا ادغام را کاهش می دهد.

(1)

(2)

(3)

شکل 3 ساختار مدل نمایه سازی، اشیاء آن، رفتار و عملیات آنها را نشان می دهد. کلاس “DataAnalysis” حاوی ویژگی های فضایی پرس و جو و انحراف سرعت است که توسط شی “VelocityClassifer” به منظور تقسیم بندی اشیا بر اساس سرعت آنها ایجاد شده است. پارامتر k یک پرس و جو CKNN برای پردازش عملیات جستجوی تکراری بر روی پارتیشن‌های ساختار نمایه پس از تقسیم فضایی منطقه استفاده شد.

5.3. فازهای ساختمان شاخص

مقیاس بزرگ داده های مکانی به طور مداوم در طول زمان تولید می شود و کاربران می توانند انواع مختلفی مانند تاکسی، مردم یا اتوبوس داشته باشند. از این رو یک نقشه هش برای ذخیره ساختار کلید-مقدار یکپارچه شد. نقشه های هش برای مقادیر کم داده و حفظ تحولات مکرر مناسب هستند. سوابق مناطقی را که کاربر بازدید کرده است و ویژگی‌های اضافی که داده‌های مربوطه مانند نوع کاربر را ایجاد می‌کند جمع‌آوری می‌کند: (id، [مسیر]، نوع). نقشه هش یک تکنیک جستجوی نامحدود، یک اسکن خطی را اختصاص می دهد. بنابراین، پیچیدگی زمانی یک پرس و جو O(m) است.

5.4. پردازش پرس و جو توزیع شده

همانطور که در شکل 4 نشان داده شده است، ما استفاده از یک ساختار چند لایه را برای پلت فرم پردازش توزیع شده پیشنهاد کردیم .. ماژول های پردازش توزیع شده از سه لایه تشکیل شده اند، یک لایه اول برای گره نمایه سازی اولیه، یک لایه دوم برای مجموعه مجموعه نمایه سازی ثانویه، و یک لایه پارتیشن بندی داده های مکانی. گره های منفرد شاخص خود را برای تمام رکوردهای رزرو شده محلی در لایه نمایه سازی ثانویه ایجاد کردند. بنابراین، هر گره فهرست کوتاهی از داده های اشیاء داشت. ابتدا یک پرس و جو برای هر گره پخش شد و سپس مشتقات یکپارچه شدند. بنابراین، هر گره دارای تعداد کمتری از لیست های طولانی بود. تحت روش ارزیابی پرس و جو استاندارد، یک پرس و جو ابتدا به گره ای که لیست را برای یک لیست مختصرتر حفظ می کند، هدایت می شود، که سپس کل لیست خود را به گره حاوی لیست اصلی [ 30 ] ارسال می کند.

6. تنظیمات و نتایج تجربی

این بخش تنظیمات شبیه سازی رویکرد پیشنهادی، تجزیه و تحلیل داده های اکتشافی و نتایج ارزیابی را توضیح می دهد. ما از یک مجموعه داده ردیابی GPS تاکسی منبع باز [ 7 ] استفاده کردیم. مجموعه داده شامل بیش از 100000 داده تاکسی در شهر شنژن با سوابق مختلف بود. مجموعه داده شامل شناسه شی، مکان در محور x، مکان در محور y، سرعت در محور x، سرعت در محور y و زمان صدور به‌روزرسانی بود.

6.1. محیط شبیه سازی

آزمایش‌ها روی دسته‌ای از گره‌ها با واحد پردازش Intel Core i7-8500y @ 3.00 گیگاهرتز و حافظه دسترسی تصادفی 16 گیگابایت انجام شد. تنظیمات شبیه سازی به کار گرفته شده در طول دوره اکتشافی در جدول 2 نشان داده شده است.

6.2. تجزیه و تحلیل داده های اکتشافی

شکل 5 مکان نمونه برداری شده از اجسام متحرک در شهر را نشان می دهد. محل تاکسی ها نیز طرح کلی شبکه راه های شهر را ترسیم کرده است. شکل 6 اجسام را پس از طبقه بندی آنها بر اساس سرعت آنها با توجه به انحراف سرعت واقعی نشان می دهد. شکل 6 a نمایش بصری اجسام آهسته با نقاط قرمز را نشان می دهد، در حالی که شکل 6 b اشیاء سریع حرکت را با نقاط سبز نشان می دهد.

حجم کل مجموعه داده های مورد استفاده 46.9 مگابایت بود. داده ها از طریق OpenSourceMap با دامنه فضایی 10000 × 10000 برای شهر شنژن [ 31 ] تولید شد. جدول 3خلاصه مجموعه داده را نشان می دهد. مجموعه داده شامل شش ستون و 1025486 سطر بود که تنها یک سطر حاوی مقادیر تهی بود. ستون اول نشان دهنده شناسه هر شی بود که حداقل شناسه شی 0 و حداکثر شناسه 10928 بود. ستون های دوم و سوم برای مکان X_loc و Y_Loc به ترتیب با توجه به محورهای X و Y بودند که نشان دهنده طول و طول جغرافیایی بودند. عرض جغرافیایی؛ در حالی که X_Vel و Y_Vel نشان دهنده سرعت در محورهای X و Y هستند. حداکثر سرعت ثبت شده در محور X 25/33 و در محور Y 19/33 بود. آخرین ستون، “زمان” حاوی مهرهای زمانی ردیابی بود.

شکل 7 توزیع ویژگی های مختلف مجموعه داده را نشان می دهد. شکل 7 ب توزیع سرعت را در محور X و Y نشان می دهد. بیشتر نقاط بین 30- تا 30 متر بر ثانیه قرار دارند. شکل 7 ب تعداد اشیاء در هر شکاف زمانی را از 0 تا 7199 نشان می دهد. می توان مشاهده کرد که زمان بین 0 تا 1000 بیشترین تعداد اشیاء و 6000 تا 7000 کمترین تعداد اشیاء را شامل می شود. شکل 7 c تعداد اجسام را با توجه به سرعت روی محور X نشان می دهد. شکل 7 d تعداد اجسام را با توجه به سرعت روی محور Y نشان می دهد. در هر دو توزیع سرعت محور X و Y، حداکثر تعداد بین 10- تا 10 بود.

6.3. نتایج تجربی

ما آزمایش های گسترده ای را روی مجموعه داده ارائه شده در بخش قبل انجام دادیم. ما شبیه‌سازی‌ها را انجام دادیم و نمودارهای مختلفی را برای نمایش عملکرد رویکرد پیشنهادی از منظر فرضیه‌های کاری ترسیم کردیم. با هدف بررسی اینکه رویکرد پیشنهادی چقدر سریعتر از رویکردهای مرسوم از نظر زمان پردازش است، زمان پرس و جو را برای فواصل پرس و جوی مختلف برای جستجوی CKNN مقایسه کردیم که در آن k روی 7 تنظیم شده بود. زمان استفاده از روش پیشنهادی را مقایسه کردیم. و اسپارک آپاچی برای ارتقای بیشتر اجراها و استفاده از رویکرد مرسوم. همانطور که در شکل 8 مشاهده می شودبرای فواصل پرس و جو 100 (یعنی تعداد پرس و جوهایی که به صورت موازی شبیه سازی کردیم برابر با 100 بود)، رویکرد پیشنهادی 13.59 برابر سریعتر از رویکرد رقیب بود. اثر طول بازه پرس و جو بر میانگین زمان در شکل 8 نشان داده شده است . همانطور که می بینیم، میانگین زمان رویکرد VeST برای تمام فواصل پرس و جو کمتر از 0.005 ثانیه بود.

ما سه الگوی توزیع داده های مختلف را از یک مجموعه داده برای آزمایش خود شبیه سازی کردیم. در اصلی ترین الگوی توزیع (گاوسی)، 70 درصد از اشیا توزیع گاوسی [ 32 ] را در سراسر شبکه دنبال کردند. ما از معادله ( 4 ) برای تولید یک توزیع گاوسی برای 70% اشیا استفاده کردیم. اشیاء باقی مانده به طور یکنواخت توزیع شدند. الگوی توزیع دوم (یکنواخت) شامل اشیایی بود که از توزیع یکنواخت در سراسر شبکه پیروی می کردند. در الگوی توزیع سوم، اشیا از توزیع Zipf پیروی کردند. همه اشیا به یک مربع واحد نرمال شدند.

(4)

شکل 9 زمان ساخت VeST را با تغییر تعداد اشیا و الگوی توزیع آنها نشان می دهد. اگر پارامترهای بیشتر تغییر نمی کردند، زمان ساخت شاخص تقریباً به صورت خطی با افزایش تعداد اشیا افزایش می یابد. همانطور که ما یک الگوی گاوسی متمرکز بهتر ساختیم، فرآیندهای تقسیم و ادغام اضافی در لایه R-tee برای این مورد وجود داشت. در نتیجه، زمان ساخت در بیشتر موارد در بین سه الگوی توزیع بالاترین بود.

شکل 10 تأثیر اندازه فاصله پرس و جو را بر زمان CPU VeST و رویکردهای رقیب تجزیه و تحلیل می کند. این پیشنهاد با رویکرد IMA پیشنهاد شده توسط موراتیدیس و همکاران مقایسه شد. [ 33 ] و با رویکرد CKNN پیشنهاد شده در [ 34]. روش IMA بر خلاف رویکرد VeST، که در آن از تعداد ناشناخته تکرار اجتناب می‌کنیم، مبتنی بر ارزیابی‌های جستجوی فوری فوری kNN است. هنگامی که به روز رسانی مکان اشیاء رخ می دهد، الگوریتم IMA دوباره پرس و جو KNN عکس فوری را ارزیابی کرد. در آزمایش‌های ما، فاصله به‌روزرسانی IMA (UI) یک بار روی 5 واحد زمانی و سپس به 10 واحد زمانی تنظیم شد تا هر دو مورد را بررسی کرده و آن را با الگوریتم VeST مقایسه کنیم. الگوریتم IMA با فواصل به روز رسانی 5 و 10 واحد زمانی به ترتیب IMA (UI = 5) و IMA (UI = 10) نامیده می شود. از سوی دیگر، الگوریتم CKNN بازه زمانی را به زیر بازه‌های غیرمجاز تقسیم کرد. این زیر بازه ها به طور متوالی در مکان یابی KNN های موجودیت پرس و جو ارزیابی شدند. آزمایش‌ها نشان داد که هزینه CPU با افزایش اندازه بازه پرس و جو برای همه الگوریتم‌ها افزایش می‌یابد. این به این دلیل است که اندازه پرس و جو قابل توجه اشیاء اضافی را برای رویکرد جستجوی پیوسته KNN در نظر گرفته و به‌روزرسانی‌های مکان گسسته بهتری از اشیاء را جمع‌آوری می‌کند. در نتیجه، الگوریتم IMA به پرس و جوهای KNN عکس فوری بیشتری نیاز داشت (هم برای UI = 5 و هم برای UI = 10). بنابراین، زمان CPU در هر دو مورد UI = 5 و UI = 10 بیشتر بود. الگوریتم KNN در مقایسه با IMA عملکرد بهتری را نشان داد زیرا زمان را به مُهرهای زمانی متوالی تقسیم می‌کرد. با این حال، به زمان بیشتری برای جستجوی کامل KNN نیاز داشت و فرض می‌کرد که اجسام با سرعت ثابت حرکت می‌کنند، که غیرواقعی بود. نتایج شبیه‌سازی نشان داد که الگوریتم ارائه‌شده در تمام موارد در حالی که به طور پیوسته ویژگی سرعت پویا را در نظر می‌گیرد از رقبای خود پیشی می‌گیرد. الگوریتم IMA به پرس و جوهای KNN عکس فوری بیشتری نیاز داشت (هم برای UI = 5 و هم برای UI = 10). بنابراین، زمان CPU در هر دو مورد UI = 5 و UI = 10 بیشتر بود. الگوریتم KNN در مقایسه با IMA عملکرد بهتری را نشان داد زیرا زمان را به مُهرهای زمانی متوالی تقسیم می‌کرد. با این حال، به زمان بیشتری برای جستجوی کامل KNN نیاز داشت و فرض می‌کرد که اجسام با سرعت ثابت حرکت می‌کنند، که غیرواقعی بود. نتایج شبیه‌سازی نشان داد که الگوریتم ارائه‌شده در تمام موارد در حالی که به طور پیوسته ویژگی سرعت پویا را در نظر می‌گیرد از رقبای خود پیشی می‌گیرد. الگوریتم IMA به پرس و جوهای KNN عکس فوری بیشتری نیاز داشت (هم برای UI = 5 و هم برای UI = 10). بنابراین، زمان CPU در هر دو مورد UI = 5 و UI = 10 بیشتر بود. الگوریتم KNN در مقایسه با IMA عملکرد بهتری را نشان داد زیرا زمان را به مُهرهای زمانی متوالی تقسیم می‌کرد. با این حال، به زمان بیشتری برای جستجوی کامل KNN نیاز داشت و فرض می‌کرد که اجسام با سرعت ثابت حرکت می‌کنند، که غیرواقعی بود. نتایج شبیه‌سازی نشان داد که الگوریتم ارائه‌شده در تمام موارد در حالی که به طور پیوسته ویژگی سرعت پویا را در نظر می‌گیرد از رقبای خود پیشی می‌گیرد. به زمان بیشتری برای جستجوی کامل KNN نیاز داشت و فرض می‌کرد که اجسام با سرعت ثابت حرکت می‌کنند، که غیرواقعی بود. نتایج شبیه‌سازی نشان داد که الگوریتم ارائه‌شده در تمام موارد در حالی که به طور پیوسته ویژگی سرعت پویا را در نظر می‌گیرد از رقبای خود پیشی می‌گیرد. به زمان بیشتری برای جستجوی کامل KNN نیاز داشت و فرض می‌کرد که اجسام با سرعت ثابت حرکت می‌کنند، که غیرواقعی بود. نتایج شبیه‌سازی نشان داد که الگوریتم ارائه‌شده در تمام موارد در حالی که به طور پیوسته ویژگی سرعت پویا را در نظر می‌گیرد از رقبای خود پیشی می‌گیرد.

شکل 11 اثر اندازه فاصله پرس و جو را بر دقت رویکردهای مختلف نشان می دهد. دقت نسبت واحدهای زمانی است که در آن نتیجه پرس و جو پیوسته KNN بازیابی شده صحیح است، همانطور که با استفاده از رابطه ( 5 ) تعیین می شود که در آن kNNreal تعداد رکوردهای مجموعه نتایج بدست آمده است، و kNNreal تعداد واقعی k نزدیکترین همسایگان به است. نقطه پرس و جو به منظور تعریف مقدار پارامتر k بهینه برای جلوگیری از نویز یا مشکلات عدم تناسب، در این سناریوی تجربی، k را بر اساس انحراف استاندارد اشیاء برابر با 7 قرار دادیم تا یک مثال گویا ایجاد کنیم.

(5)

با توجه به به روز رسانی مداوم مکان اشیاء، دقت برای IMA و kNN به ترتیب زیر 60٪ و 90٪ بود. حتی زمانی که فاصله پرس و جو بزرگتر بود (UI = 10) به 20٪ رسید زیرا به روز رسانی مکان شی در این رویکردها قرار بود گسسته باشد. بنابراین، دو نمونه زمانی به‌روزرسانی متوالی نتایج پرس و جوی نادقیق را به دست می‌آورند. در مقابل، دقت الگوریتم VeST بدون توجه به طول بازه پرس و جو تقریباً برابر با 100٪ بود.

7. بحث

این مقاله چالش های مربوط به پرس و جوهای مداوم بر روی اشیاء متحرک را بررسی می کند. سهم این مقاله چهارگانه است. اول، ارائه یک رویکرد جدید برای پرس و جو مستمر. دوم، توضیح ساختار شاخص چند لایه. و سوم، تکنیک پرس و جو و مرحله نهایی از تکنیک های توزیع مختلف برای بررسی تأثیر رویکرد پیشنهادی استفاده می کند. در این بخش چگونگی پرداختن به شکاف های شناسایی شده توسط چارچوب پیشنهادی مورد بحث قرار می گیرد.

اولین شکاف مربوط به ارائه یک رویکرد جدید برای پرس و جوی مداوم با پیشنهاد یک رویکرد نمایه سازی جدید، یعنی رویکرد نمایه سازی فضای زمانی سرعت (VeST)، برای پرس و جو پیوسته، عمدتاً K-نزدیکترین همسایه پیوسته (CKNN) و پرس و جوهای محدوده پیوسته برطرف شد. شکاف دوم مربوط به توضیح ساختار شاخص چندلایه با طراحی یک ساختار شاخص چندلایه فشرده بر روی یک تنظیم توزیع شده و پیشنهاد یک الگوریتم جستجوی CKNN برای نتایج دقیق با استفاده از فرآیند شناسایی سلول نامزد پرداخته شد. سومین شکاف مربوط به تکنیک پرس و جو با ارائه یک چشم انداز جامع از مدل نمایه سازی ما و تکنیک پرس و جو اتخاذ شده برطرف شد. شکاف چهارم و آخر مربوط به استفاده از تکنیک های مختلف توزیع برای بررسی تأثیر رویکرد پیشنهادی است. ما مجموعه ای جامع از آزمایش ها را انجام دادیم، نتایج خود را با رویکردهای موجود مقایسه کردیم و از تکنیک های توزیع مختلف استفاده کردیم. این روش پیشنهادی هزینه به روز رسانی را کاهش داد و زمان پاسخ و دقت پرس و جو را بهبود بخشید. مجموعه داده در تمام ارقام یکسان بود، اما با نمایش های متفاوت، که یک مجموعه داده در دنیای واقعی بود که یک سیستم ردیابی GPS تاکسی بود که در شهر شنژن ثبت شده بود. ما ویژگی های داده را برای ارائه توضیحات جامع داده ها نشان دادیم. ما همچنین نتایج آزمایش‌های پیشنهادی خود را روی مجموعه داده ارائه کرده‌ایم. ما سه مدل توزیع داده مختلف را از یک مجموعه داده شبیه‌سازی کردیم تا عملکرد رویکرد پیشنهادی برای توزیع‌های داده‌های مختلف با تعداد متفاوتی از اشیاء را بررسی کنیم. نتایج ما را با رویکردهای موجود مقایسه کرد و از تکنیک‌های توزیع مختلف استفاده کرد. این روش پیشنهادی هزینه به روز رسانی را کاهش داد و زمان پاسخ و دقت پرس و جو را بهبود بخشید. مجموعه داده در تمام ارقام یکسان بود، اما با نمایش های متفاوت، که یک مجموعه داده در دنیای واقعی بود که یک سیستم ردیابی GPS تاکسی بود که در شهر شنژن ثبت شده بود. ما ویژگی های داده را برای ارائه توضیحات جامع داده ها نشان دادیم. ما همچنین نتایج آزمایش‌های پیشنهادی خود را روی مجموعه داده ارائه کرده‌ایم. ما سه مدل توزیع داده مختلف را از یک مجموعه داده شبیه‌سازی کردیم تا عملکرد رویکرد پیشنهادی برای توزیع‌های داده‌های مختلف با تعداد متفاوتی از اشیاء را بررسی کنیم. نتایج ما را با رویکردهای موجود مقایسه کرد و از تکنیک‌های توزیع مختلف استفاده کرد. این روش پیشنهادی هزینه به روز رسانی را کاهش داد و زمان پاسخ و دقت پرس و جو را بهبود بخشید. مجموعه داده در تمام ارقام یکسان بود، اما با نمایش های متفاوت، که یک مجموعه داده در دنیای واقعی بود که یک سیستم ردیابی GPS تاکسی بود که در شهر شنژن ثبت شده بود. ما ویژگی های داده را برای ارائه توضیحات جامع داده ها نشان دادیم. ما همچنین نتایج آزمایش‌های پیشنهادی خود را روی مجموعه داده ارائه کرده‌ایم. ما سه مدل توزیع داده مختلف را از یک مجموعه داده شبیه‌سازی کردیم تا عملکرد رویکرد پیشنهادی برای توزیع‌های داده‌های مختلف با تعداد متفاوتی از اشیاء را بررسی کنیم. این روش پیشنهادی هزینه به روز رسانی را کاهش داد و زمان پاسخ و دقت پرس و جو را بهبود بخشید. مجموعه داده در تمام ارقام یکسان بود، اما با نمایش های متفاوت، که یک مجموعه داده در دنیای واقعی بود که یک سیستم ردیابی GPS تاکسی بود که در شهر شنژن ثبت شده بود. ما ویژگی های داده را برای ارائه توضیحات جامع داده ها نشان دادیم. ما همچنین نتایج آزمایش‌های پیشنهادی خود را روی مجموعه داده ارائه کرده‌ایم. ما سه مدل توزیع داده مختلف را از یک مجموعه داده شبیه‌سازی کردیم تا عملکرد رویکرد پیشنهادی برای توزیع‌های داده‌های مختلف با تعداد متفاوتی از اشیاء را بررسی کنیم. این روش پیشنهادی هزینه به روز رسانی را کاهش داد و زمان پاسخ و دقت پرس و جو را بهبود بخشید. مجموعه داده در تمام ارقام یکسان بود، اما با نمایش های متفاوت، که یک مجموعه داده در دنیای واقعی بود که یک سیستم ردیابی GPS تاکسی بود که در شهر شنژن ثبت شده بود. ما ویژگی های داده را برای ارائه توضیحات جامع داده ها نشان دادیم. ما همچنین نتایج آزمایش‌های پیشنهادی خود را روی مجموعه داده ارائه کرده‌ایم. ما سه مدل توزیع داده مختلف را از یک مجموعه داده شبیه‌سازی کردیم تا عملکرد رویکرد پیشنهادی برای توزیع‌های داده‌های مختلف با تعداد متفاوتی از اشیاء را بررسی کنیم. که یک مجموعه داده واقعی بود که یک سیستم ردیابی GPS تاکسی بود که در شهر شنژن ثبت شده بود. ما ویژگی های داده را برای ارائه توضیحات جامع داده ها نشان دادیم. ما همچنین نتایج آزمایش‌های پیشنهادی خود را روی مجموعه داده ارائه کرده‌ایم. ما سه مدل توزیع داده مختلف را از یک مجموعه داده شبیه‌سازی کردیم تا عملکرد رویکرد پیشنهادی برای توزیع‌های داده‌های مختلف با تعداد متفاوتی از اشیاء را بررسی کنیم. که یک مجموعه داده واقعی بود که یک سیستم ردیابی GPS تاکسی بود که در شهر شنژن ثبت شده بود. ما ویژگی های داده را برای ارائه توضیحات جامع داده ها نشان دادیم. ما همچنین نتایج آزمایش‌های پیشنهادی خود را روی مجموعه داده ارائه کرده‌ایم. ما سه مدل توزیع داده مختلف را از یک مجموعه داده شبیه‌سازی کردیم تا عملکرد رویکرد پیشنهادی برای توزیع‌های داده‌های مختلف با تعداد متفاوتی از اشیاء را بررسی کنیم.

عوامل مختلفی می توانند بر عملکرد رویکرد VeST پیشنهادی تأثیر بگذارند. یک عامل تعداد نزدیکترین همسایگان است. یکی دیگر از عوامل موثر بر عملکرد، سرعت حرکت اجسام است. رویکرد پیشنهادی مبتنی بر تقسیم‌بندی سرعت اشیاء قبل از نمایه‌سازی فضایی است. از آنجایی که ویژگی سرعت در پیشنهاد ما ضروری است و بر انجام نمایه سازی و عملکرد پرس و جو تأثیر می گذارد، ما پراکندگی این اطلاعات را از دیدگاه های مختلف نشان دادیم تا نحوه تغییر آن را نشان دهیم که باید در نظر گرفته شود. در آینده می توان از روش های تحلیلی برای تخمین توزیع سرعت و شبکه های سلسله مراتبی استفاده کرد.

8. نتیجه گیری

ما یک مدل رویکرد نمایه‌سازی جدید، یعنی رویکرد نمایه‌سازی فضای زمانی سرعت (VeST)، برای پرس‌وجو پیوسته، عمدتاً K-نزدیک‌ترین همسایه پیوسته (CKNN) و پرس‌وجوهای محدوده پیوسته پیشنهاد کردیم. ما یک ساختار شاخص چندلایه فشرده بر روی یک تنظیم توزیع شده طراحی کردیم و یک الگوریتم جستجوی CKNN را برای نتایج دقیق با استفاده از فرآیند شناسایی سلول نامزد پیشنهاد کردیم. ما یک چشم انداز جامع از مدل نمایه سازی و تکنیک پرس و جو اتخاذ شده ارائه کردیم. ما مجموعه ای جامع از آزمایش ها را انجام دادیم، نتایج خود را با رویکردهای موجود مقایسه کردیم و از تکنیک های توزیع مختلف برای بررسی زمان ساخت سازه شاخص در سناریوهای مختلف استفاده کردیم. برای فواصل پرس و جو برابر با 100، رویکرد پیشنهادی 13.59 برابر سریعتر از روش سنتی بود. علاوه بر این، میانگین زمان رویکرد VeST برای تمام فواصل پرس و جو کمتر از 0.005 بود. این روش پیشنهادی زمان پاسخ و دقت پرس و جو را بهبود بخشید. دقت الگوریتم VeST بدون توجه به طول بازه پرس و جو تقریباً برابر با 100٪ بود. نتایج شبیه‌سازی نشان داد که الگوریتم ارائه‌شده در تمام موارد در حالی که به طور پیوسته ویژگی سرعت پویا را در نظر می‌گیرد از رقبای خود پیشی می‌گیرد. تأثیر استفاده از روش های تحلیلی و شبکه های سلسله مراتبی را می توان در آینده برای افزایش نتایج بررسی کرد. نتایج شبیه‌سازی نشان داد که الگوریتم ارائه‌شده در تمام موارد در حالی که به طور پیوسته ویژگی سرعت پویا را در نظر می‌گیرد از رقبای خود پیشی می‌گیرد. تأثیر استفاده از روش های تحلیلی و شبکه های سلسله مراتبی را می توان در آینده برای افزایش نتایج بررسی کرد. نتایج شبیه‌سازی نشان داد که الگوریتم ارائه‌شده در تمام موارد در حالی که به طور پیوسته ویژگی سرعت پویا را در نظر می‌گیرد از رقبای خود پیشی می‌گیرد. تأثیر استفاده از روش های تحلیلی و شبکه های سلسله مراتبی را می توان در آینده برای افزایش نتایج بررسی کرد.

اختصارات

در این نسخه از اختصارات زیر استفاده شده است:

LBS	خدمات مبتنی بر مکان
جی پی اس	سیستم موقعیت یاب جهانی
MO	اجسام متحرک
KNN	K-نزدیک ترین همسایه ها
CKNN	KNN پیوسته
اینترنت اشیا	اینترنت اشیا (IoT)
GIS	سیستم اطلاعات جغرافیایی
BGI	Block Grid Index
DSI	شاخص پویا خط
DKNN	K-NN مبتنی بر DSI
CNN	شبکه عصبی کانولوشنال
دریا	الگوریتم اجرای مشترک
RE	تخمین تصادفی

منابع

آفانادور، JJC; ریورو، AJL؛ گالیگو، جی.آر. تجزیه و تحلیل دقت موقعیت جغرافیایی توسط GPS: یکپارچه سازی سیگنال پشتیبانی اختصاصی و شبکه مشترک در خدمات مبتنی بر مکان. در مجموعه مقالات پانزدهمین کنفرانس ایبری 2020 در مورد سیستم های اطلاعاتی و فناوری (CISTI)، سویل، اسپانیا، 24 تا 27 ژوئن 2020؛ صص 1-8. [ Google Scholar ]
بصیری، ع. مور، تی. هیل، سی. بهاتیا، پی. چالش های تحلیل بازار خدمات مبتنی بر مکان: توصیف بازار فعلی. در حال پیشرفت در خدمات مبتنی بر مکان 2014 ; Springer: برلین/هایدلبرگ، آلمان، 2015; صص 273-282. [ Google Scholar ]
خان، PW; Byun، موتور استنتاج مبتنی بر قرارداد YC Smart برای سیستم حمل و نقل وسایل نقلیه الکتریکی هوشمند. Sensors 2020 , 20 , 4252. [ Google Scholar ] [ CrossRef ] [ PubMed ]
آرویو اوهوری، ک. دیاکیته، آ. کریجنن، تی. لدوکس، اچ. Stoter، J. پردازش مدل های BIM و GIS در عمل: تجربیات و توصیه های یک پروژه GeoBIM در هلند. Isprs Int. J.-Geo-Inf. 2018 ، 7 ، 311. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
کیم، اچ اس. Sun، CG; چو، HI پهنه بندی زمین آماری مبتنی بر داده های بزرگ جغرافیایی اثرات مکان لرزه ای در منطقه شهری سئول. Isprs Int. J.-Geo-Inf. 2017 ، 6 ، 174. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
هور، ا. جدیدی، ع. Sohn, G. مدل اطلاعات مکانی یکپارچه BIM-GIS با استفاده از وب معنایی و نمودارهای RDF. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. Sci 2016 ، 3 ، 73-79. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
خو، X. شیونگ، ال. ساندرام، وی. لیو، جی. Luo, J. پارتیشن بندی سرعت برای نمایه سازی اجسام متحرک. در مجموعه مقالات سمپوزیوم بین المللی پایگاه های داده مکانی و زمانی، آنلاین، 23 تا 25 اوت 2021؛ Springer: برلین/هایدلبرگ، آلمان، 2015; صص 216-234. [ Google Scholar ]
وو، سی. زو، س. ژانگ، ی. دو، ز. بله، X. کین، اچ. ژو، ی. رویکرد سازماندهی و مدیریت ترکیبی NOSQL-SQL برای داده های مکانی در زمان واقعی: مطالعه موردی نظارت تصویری امنیت عمومی. Isprs Int. J.-Geo-Inf. 2017 ، 6 ، 21. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
د اولیویرا، THM; Painho، M. مشارکت داده های جغرافیایی باز به سمت تحلیل احساسات در بعد انسانی شهرهای هوشمند. در علوم زمین فضایی متن باز برای مطالعات شهری ; Springer: برلین/هایدلبرگ، آلمان، 2021؛ صص 75-95. [ Google Scholar ]
دو، س. ژانگ، اچ. ژائو، ی. وانگ، آ. Xiong، Y. Zuo, J. تحقیق در مورد ساخت پلت فرم تجسم داده های مکانی-زمانی برای فیوژن gis و bim. بین المللی قوس. فتوگرام از راه دور. حس اسپات. Inf. علمی 2020 ، 42 ، 555-563. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
یوان، ز. لیو، اچ. لیو، ی. ژانگ، دی. یی، اف. زو، ن. Xiong، H. شبکه توجه نمودار دوگانه فضایی-زمانی برای تطبیق query-poi. در مجموعه مقالات چهل و سومین کنفرانس بین المللی ACM SIGIR در مورد تحقیق و توسعه در بازیابی اطلاعات، شیان، چین، 25 تا 30 ژوئیه 2020؛ صص 629-638. [ Google Scholar ]
زو، اچ. یانگ، ایکس. وانگ، بی. لی، WC; یین، جی. Xu, J. پردازش پیوسته k پرس و جوهای نزدیکترین همسایه در فضای مسدود با نمودارهای Voronoi. Acm Trans. تف کردن سیستم الگوریتم (TSAS) 2020 ، 7 ، 1-27. [ Google Scholar ] [ CrossRef ]
Cho, HJ الگوریتم پردازش دسته‌ای برای جابجایی K-نزدیک‌ترین همسایه‌ها در شبکه‌های فضایی پویا. J. Korea Soc. محاسبه کنید. Inf. 2021 ، 26 ، 63-74. [ Google Scholar ]
آهنگ، ال. Fei, K. تحقیق در مورد K جستجوی خط افق نزدیکترین همسایه در شبکه جاده وابسته به زمان. J. Phys. Conf. سر. 2021 ، 1848 ، 012140. [ Google Scholar ] [ CrossRef ]
یانگ، آر. Niu، B. جست‌وجوهای پیوسته نزدیک‌ترین همسایه بر روی جریان‌های داده‌های متنی-مکانی مقیاس بزرگ. Isprs Int. J.-Geo-Inf. 2020 ، 9 ، 694. [ Google Scholar ] [ CrossRef ]
جیانگ، دبلیو. لی، جی. آن، جی. سان، ی. چن، اچ. لی، ایکس. تحقیق در مورد نمایه سازی و پرس و جوی KNN اجسام متحرک در محیط شبکه جاده ای. در مجموعه مقالات کنفرانس بین المللی در ارتباطات، پردازش سیگنال و سیستم ها، چانگ بایشان، چین، 4 تا 5 ژوئیه 2020؛ صفحات 1944-1950. [ Google Scholar ]
ژانگ، اف. ژنگ، ی. خو، دی. دو، ز. وانگ، ی. لیو، آر. Ye, X. پرس و جوهای مکانی در زمان واقعی برای اجسام متحرک با استفاده از توپولوژی طوفان. Isprs Int. J.-Geo-Inf. 2016 ، 5 ، 178. [ Google Scholar ] [ CrossRef ]
فن، پ. لی، جی. یوان، ال. Li، Y. مبهم پیوسته K-نزدیکترین همسایه در مورد اجسام متحرک با سرعت نامشخص در شبکه های جاده ای پرس و جو می کند. Inf. سیستم 2012 ، 37 ، 13-32. [ Google Scholar ] [ CrossRef ]
محمود، ع. پونی، س. عارف، WG روش‌های دسترسی فضایی-زمانی: یک بررسی (2010-2017). GeoInformatica 2019 ، 23 ، 1-36. [ Google Scholar ] [ CrossRef ]
تائو، ی. پاپادیاس، دی. Shen, Q. جستجوی مداوم نزدیکترین همسایه. در مجموعه مقالات VLDB’02: مجموعه مقالات بیست و هشتمین کنفرانس بین المللی پایگاه های داده بسیار بزرگ، هنگ کنگ، چین، 20-23 اوت 2002. ص 287-298. [ Google Scholar ]
یانگ، م. ما، ک. Yu, X. یک ساختار شاخص کارآمد برای پردازش پرس و جو K نزدیکترین همسایگان توزیع شده. محاسبات نرم. 2020 ، 24 ، 5539–5550. [ Google Scholar ] [ CrossRef ]
یو، ز. لیو، ی. یو، ایکس. Pu, KQ پردازش توزیع‌شده مقیاس‌پذیر K پرس‌وجوهای نزدیک‌ترین همسایه روی اشیاء متحرک. IEEE Trans. بدانید. مهندسی داده 2014 ، 27 ، 1383–1396. [ Google Scholar ] [ CrossRef ]
Sibolla، BH; کوتزی، اس. Van Zyl، TL چارچوبی برای تجزیه و تحلیل بصری مشاهدات حسگر مکانی-زمانی از جریان داده ها. Isprs Int. J.-Geo-Inf. 2018 ، 7 ، 475. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
Xiong، X. موکبل، MF; عارف، WG Sea-cnn: پردازش مقیاس پذیر پرس و جوهای پیوسته K-نزدیک ترین همسایه در پایگاه داده های مکانی-زمانی. در مجموعه مقالات بیست و یکمین کنفرانس بین المللی مهندسی داده (ICDE’05)، توکیو، ژاپن، 5-8 آوریل 2005. صص 643-654. [ Google Scholar ]
هوآ، ام. لاو، MK; پی، جی. Wu, K. K-به معنای نظارت با هزینه گزارش کم در شبکه های حسگر. IEEE Trans. بدانید. مهندسی داده 2009 ، 21 ، 1679-1691. [ Google Scholar ]
یو، ز. جیائو، ک. پردازش افزایشی K پیوسته پرس و جوهای نزدیکترین همسایه بر روی اجسام متحرک. در مجموعه مقالات کنفرانس بین المللی 2017 در سیستم های کامپیوتری، الکترونیک و کنترل (ICCSEC)، دالیان، چین، 25 تا 27 دسامبر 2017؛ صص 1-4. [ Google Scholar ]
سروین، اس. نوئل، جی. نمایه سازی داده های زمان واقعی و مکانی برای پایگاه های داده مبتنی بر حسگر. در فناوری اطلاعات مکانی برای واکنش اضطراری ; CRC Press: Boca Raton، FL، USA، 2008; صص 123-142. [ Google Scholar ]
بارچه، آی. Xia, Y. شاخص‌سازی توزیع شده با سرعت انتخابی برای مدل اجسام متحرک پیوسته. در مجموعه مقالات کنفرانس بین المللی الگوریتم ها و معماری ها برای پردازش موازی، ملبورن، VIC، استرالیا، 9 تا 11 دسامبر 2019؛ صص 339-348. [ Google Scholar ]
جایچاندران، پ. تونگا، ک. کامات، ن. Nandi، A. ترکیب تعامل کاربر، اجرای پرس و جو و نمونه برداری در سیستم DICE. Proc. VLDB Enddow. 2014 ، 7 ، 1697-1700. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
سوئل، تی. ماتور، سی. Wu, JW; ژانگ، جی. دلیس، ا. خرازی، م. لانگ، X. Shanmugasundaram، K. ODISSEA: معماری همتا به همتا برای جستجوی وب مقیاس پذیر و بازیابی اطلاعات. در مجموعه مقالات کارگاه بین المللی وب و پایگاه های داده (WebDB)، سن دیگو، کالیفرنیا، ایالات متحده آمریکا، 12 تا 13 ژوئن 2003. جلد 3، ص 67–72. [ Google Scholar ]
خو، X. شیونگ، ال. ساندرام، وی. لیو، جی. مجموعه داده Luo، J. VPIndexer. 2022. در دسترس آنلاین: https://www.mathcs.emory.edu/~lxiong/aims/spindex/VPIndexer/data/sz/ (در 20 نوامبر 2020 قابل دسترسی است).
سینو، ز. Bovik، AC معیارهای فضایی-زمانی طبیعی بودن. در مجموعه مقالات کنفرانس بین المللی IEEE 2019 در مورد پردازش تصویر (ICIP)، تایپه، تایوان، 22 تا 25 سپتامبر 2019؛ صفحات 1750-1754. [ Google Scholar ]
موراتیدیس، ک. Yiu، ML; پاپادیاس، دی. Mamoulis، N. نظارت مداوم نزدیکترین همسایه در شبکه های جاده ای. در مجموعه مقالات VLDB 2006: مجموعه مقالات سی و دومین کنفرانس بین المللی در پایگاه های داده بسیار بزرگ، سئول، کره، 12-15 سپتامبر 2006. صص 43-54. [ Google Scholar ]
هوانگ، YK; چن، ZW; لی، سی. جست‌وجوی پیوسته K-نزدیک‌ترین همسایه بر روی اجسام متحرک در شبکه‌های جاده‌ای. در پیشرفت در مدیریت داده و وب ; Springer: برلین/هایدلبرگ، آلمان، 2009; صص 27-38. [ Google Scholar ]