پردازش اطلاعات مکانی پیشرفته در پایگاه های داده NoSQL

خلاصه

اطلاعات مکانی برای بسیاری از زمینه های کاربردی، از جمله برنامه ریزی ترافیک، برنامه ریزی شهری و مدیریت انرژی ضروری بوده است. داده‌های مکانی عمدتاً در پایگاه‌های داده رابطه‌ای ذخیره می‌شوند که در طی چندین دهه توسعه یافته‌اند و بیشتر برنامه‌های اطلاعات جغرافیایی برنامه‌های دسکتاپ هستند. با ورود کلان داده ها، برنامه های اطلاعات مکانی نیز در حال تغییر هستند، به عنوان مثال، پلتفرم های تلفن همراه و سرویس های وب جغرافیایی، که نیاز به طرح های داده قابل تغییر، زمان پاسخ پرس و جو سریع تر و مقیاس پذیری انعطاف پذیرتری نسبت به پایگاه داده های رابطه ای فضایی سنتی در حال حاضر دارند. برای پاسخ به این نیازهای جدید، پایگاه‌های داده NoSQL (نه فقط SQL) اکنون برای ذخیره‌سازی، مدیریت و پرس و جو داده‌های جغرافیایی استفاده می‌شوند. این مقاله به بررسی پیشرفته ترین پردازش داده های مکانی در 10 پایگاه داده محبوب NoSQL می پردازد. ما اشیاء هندسه پشتیبانی شده، توابع هندسه اصلی، نمایه های فضایی، زبان های پرس و جو و قالب های داده این 10 پایگاه داده NoSQL را خلاصه می کنیم.
علاوه بر این، مزایا و معایب این پایگاه‌های داده NoSQL از نظر پردازش داده‌های مکانی تحلیل می‌شوند. بررسی و تجزیه و تحلیل ادبیات نشان داد که پایگاه‌های داده اسناد کنونی ممکن است برای پردازش داده‌های مکانی عظیم نسبت به سایر پایگاه‌های داده NoSQL به دلیل پشتیبانی جامع از اشیاء هندسی و قالب‌های داده و عملکرد، توابع جغرافیایی، روش‌های شاخص و توسعه دانشگاهی مناسب‌تر باشند. با این حال، بسته به سناریوهای برنامه، پایگاه های داده گراف، پایگاه داده های کلید-مقدار و ستون های گسترده مزایای خاص خود را دارند. نمایه های فضایی، زبان های پرس و جو و قالب های داده این 10 پایگاه داده NoSQL. علاوه بر این، مزایا و معایب این پایگاه‌های داده NoSQL از نظر پردازش داده‌های مکانی تحلیل می‌شوند. بررسی و تجزیه و تحلیل ادبیات نشان داد که پایگاه‌های داده اسناد کنونی ممکن است برای پردازش داده‌های مکانی عظیم نسبت به سایر پایگاه‌های داده NoSQL به دلیل پشتیبانی جامع از اشیاء هندسی و قالب‌های داده و عملکرد، توابع جغرافیایی، روش‌های شاخص و توسعه دانشگاهی مناسب‌تر باشند. با این حال، بسته به سناریوهای برنامه، پایگاه های داده گراف، پایگاه داده های کلید-مقدار و ستون های گسترده مزایای خاص خود را دارند. نمایه های فضایی، زبان های پرس و جو و قالب های داده این 10 پایگاه داده NoSQL. علاوه بر این، مزایا و معایب این پایگاه‌های داده NoSQL از نظر پردازش داده‌های مکانی تحلیل می‌شوند. بررسی و تجزیه و تحلیل ادبیات نشان داد که پایگاه‌های داده اسناد کنونی ممکن است برای پردازش داده‌های مکانی عظیم نسبت به سایر پایگاه‌های داده NoSQL به دلیل پشتیبانی جامع از اشیاء هندسی و قالب‌های داده و عملکرد، توابع جغرافیایی، روش‌های شاخص و توسعه دانشگاهی مناسب‌تر باشند. با این حال، بسته به سناریوهای برنامه، پایگاه های داده گراف، پایگاه داده های کلید-مقدار و ستون های گسترده مزایای خاص خود را دارند. بررسی و تجزیه و تحلیل ادبیات نشان داد که پایگاه‌های داده اسناد کنونی ممکن است برای پردازش داده‌های مکانی عظیم نسبت به سایر پایگاه‌های داده NoSQL به دلیل پشتیبانی جامع از اشیاء هندسی و قالب‌های داده و عملکرد، توابع جغرافیایی، روش‌های شاخص و توسعه دانشگاهی مناسب‌تر باشند. با این حال، بسته به سناریوهای برنامه، پایگاه های داده گراف، پایگاه داده های کلید-مقدار و ستون های گسترده مزایای خاص خود را دارند. بررسی و تجزیه و تحلیل ادبیات نشان داد که پایگاه‌های داده اسناد کنونی ممکن است برای پردازش داده‌های مکانی عظیم نسبت به سایر پایگاه‌های داده NoSQL به دلیل پشتیبانی جامع از اشیاء هندسی و قالب‌های داده و عملکرد، توابع جغرافیایی، روش‌های شاخص و توسعه دانشگاهی مناسب‌تر باشند. با این حال، بسته به سناریوهای برنامه، پایگاه های داده گراف، پایگاه داده های کلید-مقدار و ستون های گسترده مزایای خاص خود را دارند.

کلید واژه ها:

داده های جغرافیایی ؛ پایگاه های داده NoSQL ; شاخص فضایی ; توابع جغرافیایی ; مدل های داده

1. معرفی

پیش‌بینی می‌شود که میزان داده‌های موقعیت مکانی شخصی هر سال 20% افزایش یابد، و اطلاعات مربوط به مکان بخش بزرگی از داده‌های تولید شده هر روز را اشغال می‌کند: 2.5 کوئینتیلیون بایت [ 1 ، 2 ]. ظهور عصر داده های بزرگ جغرافیایی نیازمند برنامه های کاربردی جدید و ایجاد چالش های جدید است [ 3 ، 4 ]. نحوه ذخیره، مدیریت و پرس و جو از داده های جغرافیایی به طور موثر به کانون پژوهش تبدیل شده است و مشکلاتی هستند که باید حل شوند [ 3 ، 5 ، 6 ، 7]. در حال حاضر پایگاه های اصلی جغرافیایی به دو نوع پایگاه داده رابطه ای و پایگاه داده NoSQL تقسیم می شوند. پایگاه داده های رابطه ای پرکاربردترین و بالغ ترین سیستم های پایگاه داده هستند و دهه هاست که در صنایع مختلف کاربرد دارند. برای غنی‌سازی توابع جغرافیایی و قابلیت پردازش جغرافیایی، برخی پایگاه‌های اطلاعاتی رابطه‌ای مدرن تغییرات و به‌روزرسانی‌هایی را ایجاد کرده‌اند. نمونه هایی از پایگاه داده های رابطه ای برای اطلاعات جغرافیایی عبارتند از PostGIS [ 8 ]، WebGIS [ 9 ]، Oracle 19c [ 10 ]، پایگاه داده Microsoft Azure SQL [ 11 ] و SQL Server [ 12 ].]. این پایگاه‌های اطلاعاتی رابطه‌ای می‌توانند اشیاء مکانی را تعریف کنند، از انواع داده‌های مکانی اصلی (برای هندسه) پشتیبانی کنند و شاخص‌های مختلفی را برای پرس‌وجوهای سریع فضایی (درخت باینری در SQL Server، درخت دودویی، R-Trees و درخت جستجوی تعمیم‌یافته در PostGIS) اتخاذ کنند. علاوه بر این، بیشتر برنامه‌هایی که از پایگاه‌های داده رابطه‌ای فضایی استفاده می‌کنند، سیستم‌های دسکتاپ (مانند ArcGIS) یا دارای نرم‌افزار سرور نقشه (مانند GeoServer) هستند. پایگاه داده های رابطه ای سنتی طرحواره های ساختار/داده ثابت را اتخاذ می کنند و مقیاس پذیری آنها محدود است.
پایگاه داده های NoSQL سیستم های پایگاه داده توزیع شده عمومی هستند، که ممکن است به داده های ساختاریافته نیاز نداشته باشند، معمولاً برای مقیاس بندی افقی طراحی شده اند و ممکن است منبع باز باشند [ 5 ، 13 ]. برای مقیاس‌پذیری افقی، پایگاه‌های داده NoSQL ویژگی‌های استاندارد ACID (اتمی، سازگاری، جداسازی و دوام) را که توسط پایگاه‌های اطلاعاتی رابطه‌ای ارائه می‌شوند، ارائه نمی‌کنند. با این حال، پایگاه‌های داده NoSQL توانایی ذخیره، مدیریت و فهرست‌بندی مجموعه داده‌های بزرگ دلخواه را نشان می‌دهند در حالی که از تعداد زیادی درخواست همزمان کاربر پشتیبانی می‌کنند [ 14 ]. در حال حاضر، پایگاه های داده NoSQL در حال حاضر به طور گسترده در زمینه های کاربردی مختلف استفاده می شود [ 4 ، 15 ، 16 ، 17 ].
با توسعه ارتباطات سیار، اینترنت اشیا و فناوری های دسترسی به شبکه پرسرعت، نیاز به برنامه های کاربردی اطلاعات جغرافیایی برای خدمات تلفن همراه و خدمات وب به طور فزاینده ای قوی شده است [ 2 ، 3 ، 4 ]]. کاربردهای جدید زمین فضایی به طرح واره داده های انعطاف پذیرتر، زمان پاسخ پرس و جو نسبتاً سریع و مقیاس پذیری بیشتر نسبت به پایگاه داده های رابطه ای فضایی سنتی در حال حاضر نیاز دارند. به عنوان مثال، هنگامی که درخواست‌های پخش جریانی از مشتریان به سرورها به طور ناگهانی افزایش می‌یابد، ممکن است باعث تأخیر قابل توجهی در پاسخ و عدم دسترسی به سرویس شود. برای حل این مشکل مقیاس‌پذیری، یک چارچوب مقیاس‌پذیر بر اساس MongoDB برای پیاده‌سازی استقرار الاستیک برای به اشتراک‌گذاری اطلاعات مکانی با کاربران مشتری که تعدادشان در حال افزایش است، پیشنهاد شد [ 14 ]. در این چارچوب، MongoDB انتخاب شده است زیرا یک پایگاه داده توزیع شده است و از یک طرح ذخیره سازی انعطاف پذیر مناسب برای ذخیره سازی عظیم کاشی نقشه [ 14 ] پشتیبانی می کند.
چندین مطالعه نشان داده‌اند که سیستم‌های مدیریت پایگاه‌داده رابطه‌ای (RDBMS) از نظر ذخیره‌سازی کلان داده و پرس‌وجوها در برخی مناطق خاص، مانند محیط‌های دسترسی همزمان به داده بالا یا مقیاس بزرگ در برنامه‌های مکانی، دارای معایبی هستند [ 4 ، 5 ]. در یک مقایسه کیفی آزمایش‌ها، مشخص شد که پایگاه‌های اطلاعاتی اسناد زمان‌های پاسخ و پرس‌وجوهای تقاطع خطوط سریع‌تر از پایگاه‌های داده SQL دارند، زمانی که تعداد رکوردها در پایگاه‌های داده زیاد است [ 5 ، 18 ]. مطالعات دیگر نشان داده‌اند که پایگاه‌های داده NoSQL نسبت به پایگاه‌های داده رابطه‌ای مزایای بیشتری در پردازش داده‌های مکانی دارند [ 6 ]]. در آزمایش بیشترین استفاده از توابع پرس و جوی فضایی در پایگاه‌های داده مختلف، پایگاه‌های داده NoSQL بهتر از پایگاه‌های داده رابطه‌ای، به ویژه mobile-GIS و Web-GIS عمل کردند [ 18 ، 19 ]. در حال حاضر، بیشتر پایگاه‌های داده NoSQL به‌خوبی برای داده‌های مکانی طراحی نشده‌اند [ 6 ، 20 ]. یکی از آشکارترین کاستی‌های پایگاه‌های داده NoSQL از نظر داده‌های مکانی این است که پایگاه‌های اطلاعاتی NoSQL فقط عملکردهای فضایی اولیه دارند، بسیار کمتر از پایگاه‌های داده رابطه‌ای [ 6 ].]. خوشبختانه، تحقیق روی پایگاه‌های داده NoSQL حوزه‌ای رو به رشد است که توجه بیشتر و بیشتر شرکت‌ها و دانشگاهیان را به خود جلب می‌کند و پیشرفت‌ها و نوآوری‌ها به سرعت پدیدار شده‌اند. علاوه بر این، برخی از پایگاه های داده NoSQL دارای برخی عملکردهای فضایی و شاخص های فضایی هستند [ 18 ، 21 ]. در سال‌های اخیر، برخی از مقالات دانشگاهی کاربردهای پایگاه‌های داده‌های SQL و NoSQL را در زمینه‌های داده‌های جغرافیایی خلاصه و تحلیل کرده‌اند، از جمله یک مطالعه درباره داده‌های بزرگ جغرافیایی [ 3 ]، خلاصه‌ای از بهترین شیوه‌ها برای انتشار داده‌های مکانی در وب [ 22 ]. ، یک مقایسه تجربی بین دو پلت فرم داده های مکانی [ 19 ، 23]، مقایسه بین پایگاه های داده رابطه ای و پایگاه های داده NoSQL در کاربردهای مکانی [ 5 ، 18 ]، و مطالعه ای بر روی مدیریت داده های معنایی مکانی [ 24 ]. با این حال، تحلیل های جامع کمی از پیشرفته ترین پردازش داده های جغرافیایی در پایگاه های داده محبوب NoSQL وجود دارد.
برای تشریح پیشرفته‌ترین پردازش داده‌های جغرافیایی در پایگاه‌های داده محبوب NoSQL، در این مقاله، ابتدا ویژگی‌های داده‌های مکانی و مفاهیم مرتبط را معرفی می‌کنیم و سپس به بررسی پیشرفته‌ترین پردازش داده‌های جغرافیایی در 10 محبوب‌ترین داده‌ها می‌پردازیم. پایگاه های داده NoSQL علاوه بر این، ما مزایا و معایب این پایگاه‌های داده NoSQL را برای پردازش داده‌های مکانی تحلیل می‌کنیم. ساختار کاغذ به شرح زیر است. بخش 2 ویژگی های داده های مکانی و مفاهیم مرتبط را معرفی می کند. بخش 3 روش تحقیق اتخاذ شده برای این مقاله را معرفی می کند. پردازش مکانی پیشرفته در پایگاه های داده NoSQL در بخش 4 ارائه شده است . بخش 5عملکرد پایگاه داده های مختلف NoSQL را از نظر ذخیره سازی داده های مکانی و پرس و جوها مقایسه می کند. بخش 6 شامل یک نتیجه گیری کوتاه است.

2. ویژگی های داده های جغرافیایی و مفاهیم مرتبط

قبل از بحث در مورد پردازش داده‌های مکانی، در اینجا مفاهیم پایه و ویژگی‌های زمین فضایی علم زمین فضایی را معرفی می‌کنیم.
به طور کلی، دو روش اصلی برای نمایش داده های مکانی وجود دارد: داده های شطرنجی و برداری.
  • داده‌های شطرنجی از ماتریسی از سلول‌ها (دانه یا پیکسل) تشکیل شده‌اند که در آن یک سلول دارای یک مقدار مرتبط است که اطلاعاتی را نشان می‌دهد، مانند مقدار روشنایی یا دما، و در ردیف‌ها و ستون‌ها (یا یک شبکه) مرتب شده‌اند.
  • داده های برداری از نقاط منفرد تشکیل شده است که به صورت جفت ( x، y ) در موارد دو بعدی یا ( x، y، z ) در موارد سه بعدی ذخیره می شوند. نقاط از طریق دستورات/قوانین خاصی برای ایجاد خطوط، چندضلعی ها، سطوح و جامدات به هم متصل می شوند. در این مقاله بیشتر بحث ها به داده های برداری اشاره دارد.
ویژگی ها و هندسه ها دو مفهوم اساسی اصلی هستند. یک ویژگی می تواند هر شیئی با موقعیت مکانی مشخص باشد، مانند فرودگاه یا کوه.
  • طبق ISO 19109:2015، یک ویژگی به عنوان “انتزاع پدیده های دنیای واقعی” تعریف می شود. ویژگی‌ها ممکن است دارای ویژگی‌هایی باشند، به‌عنوان مثال، ویژگی‌های فضایی که مکان/وسعت ویژگی را نشان می‌دهند، ویژگی‌های موضوعی که ویژگی‌های توصیفی ویژگی را ارائه می‌دهند، و همچنین انواع دیگری از ویژگی‌ها، مانند فراداده/کیفیت.
  • هندسه هر شکل هندسی است که بتواند ویژگی فضایی یک ویژگی را نشان دهد، مانند یک نقطه (0D)، خط (1D)، چندضلعی/سطح (2D)، یا جامد/حجم (3D). هندسه ها را می توان در فضای 1 بعدی، فضای 2 بعدی یا فضای سه بعدی جاسازی کرد. بعد هندسه باید کوچکتر یا مساوی با بعد فضای تعبیه شده باشد. برای موارد ساده مانند تجسم با استفاده از نقشه های دو بعدی سنتی (فضای دو بعدی)، نقاط، خطوط و چند ضلعی ها ممکن است برای نیازهای کاربر کافی باشد. برای موارد پیچیده تر که نیاز به فضای سه بعدی دارند، سطوح و حجم/جامد نیز مورد نیاز است.
در پایگاه های داده NoSQL، انواع هندسه اصلی عبارتند از Point، MultiPoint، LineString، MultiLineString، Polygon، MultiPolygon و GeometryCollection.
در پایگاه‌های اطلاعاتی رابطه‌ای، بر اساس استاندارد بین‌المللی ISO/IEC 13249: 2016، بسته‌های کاربردی چندرسانه‌ای SQL، 27 نوع هندسه را ارائه می‌کنند که از این میان، 24 نوع هندسه قابل مشاهده هستند و دارای توابع سازنده هستند. انواع هندسه و روش‌های موجود در پایگاه‌های داده رابطه‌ای آشکارا فراوان‌تر از پایگاه‌های داده NoSQL هستند.
برای رسیدگی به موقعیت‌ها و روابط فضایی ویژگی‌ها، سیستم‌های مرجع مختصات مورد نیاز است.
  • یک سیستم مرجع مختصات (CRS) یا یک سیستم مرجع فضایی (SRS)، یک سیستم مبتنی بر مختصات برای مکان یابی واحدهای جغرافیایی و ایجاد روابط آنها است. سیستم های مرجع مختصات معروف شامل سیستم مختصات زمین مرکزی، سیستم مختصات جغرافیایی (مقطع WGS84)، مرکاتور عرضی جهانی (UTM) و سیستم مختصات دکارتی است.
  • در سیستم‌های مرجع مختصات، متن شناخته شده (WKT) یک زبان نشانه‌گذاری متن است که سیستم‌های مرجع مختصات و تبدیل‌ها را بین سیستم‌های مرجع مختصات مختلف، همانطور که توسط کنسرسیوم فضایی باز (OGC) تعریف شده است، نشان می‌دهد.
  • مجموعه داده پارامترهای ژئودتیک EPSG (که رجیستری EPSG نیز نامیده می شود)، که توسط گروه بررسی نفت اروپا (EPSG) در سال 1985 توسعه یافت، مجموعه ای عمومی از تعاریف سیستم های مرجع مختصات و تبدیل مختصات است. کد EPSG به طور گسترده در سیستم های اطلاعات جغرافیایی و کتابخانه های GIS استفاده می شود.
علاوه بر این، روابط توپولوژیکی برای پردازش جغرافیایی و پرس و جوهای داده حیاتی هستند. برخی از مسائل مربوط به روابط نمونه را می توان از طریق روابط توپولوژیکی ویژگی ها حل کرد. علاوه بر توپولوژی گراف سنتی، سه اصل روابط توپولوژیکی رایج وجود دارد: توپولوژی ضمنی در ویژگی های ساده [ 25 ] و توپولوژی مجموعه نقطه ای مانند روابط نه تقاطع Egenhofer [ 26 ] و در روابط RCC8 [ 27 ]. نبرد و همکاران هم ارزی بین سه رابطه فضایی را خلاصه کرد، همانطور که در جدول 1 نشان داده شده است [ 28 ].
ویژگی‌های خاص داده‌های مکانی (به ویژه چند بعدی بودن و اندازه بزرگ مجموعه داده‌ها) پردازش آنها را متفاوت از پردازش سایر داده‌ها می‌کند. این داده‌ها به پلت‌فرم‌های مختلف، مقیاس‌پذیری انعطاف‌پذیر، و سهولت اصلاح، به‌روزرسانی و پرس‌وجو، مانند سناریوهای پرس‌و‌جوی مکانی-زمانی در مقیاس بزرگ [ 29 ] و درخواست‌های دسترسی عظیم بر اساس پلت‌فرم‌های تلفن همراه نیاز دارند [ 14 ].

3. روش تحقیق

بسیاری از پایگاه های داده NoSQL و محصولات مرتبط در حال حاضر به طور مداوم توسعه یافته و به روز می شوند. برای مقایسه و بحث در مورد توسعه جغرافیایی پایگاه های داده NoSQL به طور موثر، 10 پایگاه داده محبوب NoSQL (به عنوان رتبه بندی شده توسط DB-Engines [ 30 ]) برای تجزیه و تحلیل ویژگی ها و عملکرد آنها از نظر پردازش داده های مکانی انتخاب شدند. این پایگاه‌های داده NoSQL در شش نوع مدل پایگاه داده قرار می‌گیرند: پایگاه‌های داده اسناد، پایگاه‌های داده گراف، پایگاه‌های داده ستون گسترده، پایگاه‌های داده کلید-مقدار، پایگاه‌های داده چند مدل و موتور جستجو، همانطور که در جدول 2 فهرست شده است.. ما از نام هر یک از 10 پایگاه داده و “geospatial OR spatial” به عنوان کلمات کلیدی جستجو برای جستجوی مقالات در پایگاه‌های عمومی دانشگاهی، از جمله Web of Science Core Collection، Google Scholar Citations و پایگاه داده Scopus استفاده کردیم. پس از فیلتر کردن برخی از مقالات تکراری و نامرتبط، مجموعه نهایی مقالات خود را به دست آوردیم. تعداد موجود در هر پایگاه داده در داخل پرانتزهای گرد در جدول 2 نشان داده شده است . از طریق تجزیه و تحلیل پایگاه‌های داده NoSQL و تحقیقات مرتبط، ما پیشرفته‌ترین پردازش اطلاعات مکانی را در پایگاه‌های داده NoSQL بررسی کردیم. تعداد کمی از پایگاه های داده NoSQL از صحنه های داده سه بعدی پشتیبانی می کنند، بنابراین اگر حاشیه نویسی خاصی وجود نداشته باشد، توابع هندسی و نمایه ها صحنه های داده دو بعدی را نشان می دهند.

4. پیشرفته ترین پردازش جغرافیایی در پایگاه های داده NoSQL

در این بخش، اطلاعات اولیه در مورد این پایگاه های داده در جدول 3 نشان داده شده است . پس از آن، برخی از اطلاعات مختصر در مورد ویژگی های مکانی در این پایگاه ها معرفی می شود. علاوه بر این، تحقیقات مرتبط از پایگاه های داده مختلف نیز خلاصه شده است.

4.1. MongoDB

MongoDB یک پایگاه داده اسنادی است که داده‌ها را در اسناد مقیاس‌پذیر، انعطاف‌پذیر و شبیه JSON، با فیلدهای داده متفاوت و ساختار داده‌ای قابل تغییر، ذخیره می‌کند. MongoDB از زبان پرس و جوی اعلامی پشتیبانی نمی کند: پرس و جوها در MongoDB توسط API یا درایورهای اختصاصی ساخته و صادر می شوند. MongoDB از ذخیره سازی و جستجوی داده های مکانی پشتیبانی می کند. برای توصیف داده‌های GeoJSON، MongoDB از یک سند جاسازی شده با نوع شی GeoJSON و سپس مختصات شی استفاده می‌کند و ابتدا طول جغرافیایی و سپس عرض جغرافیایی را فهرست می‌کند:
<field>: {type: <GeoJSON type>، مختصات: <coordinates> }
به عنوان مثال، برای تعیین یک نقطه GeoJSON:
محل: {
             نوع: “نقطه”
             مختصات: [-43.342412, 54.678421]
}
MongoDB از چندین شی هندسی پشتیبانی می کند، همانطور که در جدول 4 ذکر شده است . علاوه بر این، MongoDB از سیستم مرجع WGS84 برای جستجوهای مکانی اشیاء GeoJSON استفاده می کند. مقادیر طول جغرافیایی معتبر بین -180 و 180 (شامل) و مقادیر معتبر عرض جغرافیایی بین -90 و 90 (شامل) هستند.
MongoDB داده های مکان اشیاء را به عنوان جفت مختصات قدیمی ذخیره می کند و از محاسبات سطح کروی از طریق یک شاخص 2dsphere پشتیبانی می کند، که دو نمایش داده وجود دارد: یک آرایه (ترجیح MongoDB) و یک سند جاسازی شده در جفت مختصات قدیمی:
  • یک آرایه: <field>: [ <x>، <y> ]
  • یک سند جاسازی شده: <field>: {<field1>: <x>، <field2>: <y> }.
MongoDB دو نوع شاخص جغرافیایی فراهم می کند: geohash برای 2dsphere و 2d. در شاخص‌های 2dsphere، پرس‌وجوهای مربوطه از طریق محاسبه هندسه‌ها در کره‌ای شبیه زمین پیاده‌سازی می‌شوند. در نمایه های 2 بعدی، پرس و جوها از طریق محاسبه هندسه ها در یک صفحه دو بعدی پیاده سازی می شوند. برای پرس و جوهای کروی، باید از نمایه های 2dsphere استفاده شود، زیرا استفاده از نمایه های 2d برای پرس و جوهای کروی ممکن است منجر به نتایج نادرست شود. چهار عملیات پرس و جو توپولوژیکی در MongoDB برای داده های مکانی ارائه شده است: $ geoIntersects، $ geoWithin، $ near، و $ nearSphere.
در مقایسه کمی پردازش داده‌های بزرگ جغرافیایی بین پایگاه‌های داده PostGIS و MongoDB، MongoDB با پرس‌و‌جوهای «داخل» و «تقاطع» [ 18 ، 31 ] و از نظر زمان پاسخ برای بارگذاری داده‌های بزرگ مکانی مزایایی داشت [ 32 ] . در همین حال، در مقایسه بین ArcGIS و MongoDB، عملکرد بازیابی فضایی MongoDB بهتر از ArcGIS بود و این مزیت با افزایش مجموعه نقاط آشکارتر بود [ 33 ].
در تحقیقات مرتبط بر روی MongoDB، توجه بر مدیریت و ذخیره سازی داده های جغرافیایی [ 34 ، 35 ، 36 ، 37 ، 38 ، 39 ، 40 ، 41 ، 42 ، 43 ] و روش های توسعه شاخص [ 29 ، 44 ، 45 ، ] متمرکز شده است.]. با استفاده از MongoDB، پلتفرم‌ها و فریم‌ورک‌های متعددی برای رفع نیازهای برنامه‌های کاربردی متنوع طراحی شده‌اند. اگرچه پایگاه های داده NoSQL می توانند اشیاء JSON را ذخیره کنند، اما هنوز یک زبان پرس و جوی استاندارد وجود ندارد، بنابراین افرادی که برنامه نویس نیستند در مدیریت، تجزیه و تحلیل و ارتباط داده های مکانی با مشکل مواجه می شوند. برای حل این مشکلات، یک چارچوب و یک زبان پرس و جو برای دستکاری اشیاء JSON و ارائه عملیات فضایی و غیرمکانی در مجموعه داده های ناهمگن طراحی شد [ 34 ]. برای ارائه یک محیط کاری مشترک چند کاربره، یک سیستم نمونه اولیه بر اساس فناوری‌های وب منبع باز توسعه داده شد که در آن داده‌های مکانی بر اساس استاندارد OGC پردازش شده و به عنوان یک قالب GeoJSON برای ذخیره در MongoDB تغییر داده شد [ 43 ].]. وقتی درخواست‌های چند کاربره به سرورها تا حد معینی افزایش می‌یابد، زمان پاسخگویی و سرویس ممکن است کمتر یا در دسترس نباشد. برای این مشکل مقیاس، یک چارچوب خدمات کاشی نقشه وب مقیاس پذیر (WMTS) با یک خوشه با کارایی بالا برای پیاده سازی استقرار الاستیک با افزایش تعداد درخواست های کاربر طراحی شد [ 14 ]. جدای از مشکلات درخواست های متعدد کاربر، مدیریت مجموعه داده های جغرافیایی بسیار بزرگ نیز یک مشکل فوری است. نرم افزاری به نام GeoRocket برای مدیریت مجموعه داده های مکانی بسیار بزرگ در ابر ایجاد شده است [ 36 ]. GeoRocket مجموعه داده های بزرگ را به تکه ها تقسیم می کند و تکه ها را به صورت جداگانه پردازش می کند. GeoRocket از Elasticsearch برای فهرست بندی و پرس و جو از مجموعه داده های بزرگ استفاده کرده است و از MongoDB برای ذخیره سازی داده ها استفاده می کند [ 36 ].
اگرچه MongoDB روش‌های نمایه‌سازی را ارائه می‌دهد، تحقیقات هنوز برای یافتن شاخص‌های سریع‌تر در حال انجام است. شیانگ و همکاران روشی برای پیاده‌سازی شاخص R-Tree پیشنهاد کرد که پرس و جوی محدوده فضایی و پرس و جوی نزدیکترین همسایه را در MongoDB ترکیب می‌کند [ 44 ]. با استفاده از یک ساختار سند جدولی، آنها شاخص R-Tree را در مجموعه های MongoDB مسطح کردند و آزمایش نشان داد که روش جدید بهتر از شاخص 2dsphere (شاخص فضایی داخلی MongoDB) عمل می کند [ 44 ]]. روش دیگر مورد استفاده برای R-Tree در MongoDB توسط لی و همکاران پیشنهاد شد، در حالی که یک شاخص فضایی مبتنی بر geohash در جستارهای مبتنی بر مکان برای یک سیستم نظارت پزشکی استفاده شده است که مستطیل های حداقل مرزی تو در تو (MBRs) را ترکیب می کند. R-Tree به عنوان یک درخت جهانی برای مکان های بلادرنگ، و B-Tree مبتنی بر geohash به عنوان درخت محلی برای داده های تاریخی [ 45 ]. علاوه بر این، برخی از محققان نیز با استفاده از MongoDB در طراحی شاخص مکانی-زمانی داده‌های مسیر عظیم [ 29 ، 47 ] مشارکت داشته‌اند.
MongoDB یک پلت فرم گسترده و منعطف برای کاربردهای مختلف جغرافیایی فراهم می کند. علاوه بر این، MongoDB برخی از تاکتیک‌ها را برای بهبود عملکرد و در دسترس بودن اتخاذ می‌کند، مانند به‌روزرسانی‌های کپی ناهمزمان و تعادل بار در بین کپی‌ها، اما این تاکتیک‌ها می‌توانند بر ثبات یک یا چند شی تأثیر بگذارند. این امر در سایر پایگاه های داده NoSQL مانند HBase، Cassandra و Neo4j نیز اتفاق می افتد.

4.2. کاناپه

سرور Couchbase یک پایگاه داده منبع باز، توزیع شده و سند محور با ذخیره سازی سریع کلید-مقدار و یک موتور جستجوی قدرتمند برای اجرای یک زبان پرس و جوی SQL مانند (N1QL) است [ 48 ]]. سرور Couchbase برای برخی از محیط‌های خاص طراحی شده است تا خدمات مدیریت داده با تأخیر کم را ارائه دهد، مانند یک وب تعاملی در مقیاس بزرگ، یک پایانه تلفن همراه یا برنامه‌های کاربردی اینترنت اشیا. سرور Couchbase مانند MongoDB از برخی از هندسه های اولیه پشتیبانی می کند. برای پرس و جوهای مکانی، دو مدل نمایش مکان دارد: مبتنی بر شعاع و مبتنی بر جعبه. در مدل نمایش مکان مبتنی بر شعاع، داده‌های مکان به صورت مکان‌هایی با جفت مختصات طول و عرض جغرافیایی و فاصله بر حسب مایل نشان داده می‌شوند. این فاصله طول شعاع است و محل یک جسم در مرکز دایره است. اگر مکان پرس و جو در دایره باشد، اسناد برگردانده می شوند. در مدل نمایش مکان مبتنی بر جعبه، دو جفت مختصات طول و عرض جغرافیایی مورد نیاز است. که در گوشه های بالا-چپ و پایین-راست یک جعبه قرار دارند. اگر مکان پرس و جو در کادر باشد، اسناد JSON برگردانده می شوند و حاوی مکان درون جعبه هستند. سرور Couchbase شاخص های R-Tree را برای برنامه های کاربردی آگاه از موقعیت مکانی فراهم می کند. علاوه بر این، نمایه های فضایی نیز می توانند توسط کاربران قبل از پرس و جوی مکانی تعریف شوند. بسته به اینکه کدام یک از دو مدل نمایش مکان استفاده می شود (یک مکان یا یک جعبه مرزی)، شاخص های فضایی متفاوت هستند. Couchbase فقط پرس و جوهایی را بر اساس داده های مختصات مکان ارائه می دهد که می تواند برنامه های کاربردی آن را محدود کند. نمایه های فضایی نیز می توانند توسط کاربران قبل از پرس و جوی مکانی تعریف شوند. بسته به اینکه کدام یک از دو مدل نمایش مکان استفاده می شود (یک مکان یا یک جعبه مرزی)، شاخص های فضایی متفاوت هستند. Couchbase فقط پرس و جوهایی را بر اساس داده های مختصات مکان ارائه می دهد که می تواند برنامه های کاربردی آن را محدود کند. نمایه های فضایی نیز می توانند توسط کاربران قبل از پرس و جوی مکانی تعریف شوند. بسته به اینکه کدام یک از دو مدل نمایش مکان استفاده می شود (یک مکان یا یک جعبه مرزی)، شاخص های فضایی متفاوت هستند. Couchbase فقط پرس و جوهایی را بر اساس داده های مختصات مکان ارائه می دهد که می تواند برنامه های کاربردی آن را محدود کند.
یک مقاله در مورد پایگاه داده Couchbase در نتایج جستجو وجود داشت که در بخش 3 ذکر شده است . در آن، یک شبکه اطلاعات محور برای فدرال کردن پایگاه های داده MongoDB و Couchbase [ 35 ] اتخاذ شد. معماری عملکردی پایگاه داده فدرال طراحی شده شامل یک جلوی فدراسیون برای ارتباط موثر بین یک پردازشگر پرس و جو و کاربران است. پردازنده پرس و جو برای تعامل با DBS های محلی و راه دور. و یک آداپتور DBMS برای ترجمه پرس و جو فدرال به زبان پرس و جو محلی در یک DBMS محلی [ 35 ].

4.3. Neo4j

Neo4j محبوب ترین پایگاه داده گراف است و از Cypher به عنوان زبان پرس و جو خود استفاده می کند، اما تنها از یک نوع هندسه فضایی، Point، در آخرین نسخه 3.5 پشتیبانی می کند. هر نقطه در Neo4j می تواند نمایش دو بعدی یا سه بعدی داشته باشد و می تواند به عنوان یک سیستم مرجع مختصات جغرافیایی یا یک سیستم مرجع مختصات دکارتی مشخص شود. از آنجایی که Neo4j تنها یک نوع هندسه فضایی دارد، پایگاه داده توابع فضایی مربوط به نقطه را ارائه می دهد، مانند distance()، point()-WGS 84 2D، point()-WGS 84 3D، point()-Cartesian 2D، و point. ()-دکارتی سه بعدی. مثالی از کتابچه راهنمای Cypher [ 49 ] این است:
  • با نقطه ({latitude:toFloat(‘13.43’)، طول جغرافیایی:toFloat(‘56.21’)}) به عنوان p1،
  • نقطه ({latitude:toFloat(‘13.10’), طول جغرافیایی:toFloat(‘56.41’)}) AS p2
  • بازگشت به عدد صحیح (فاصله (p1، p2)/1000) AS کیلومتر
یک کتابخانه کاربردی به نام Neo4j Spatial وجود دارد که دستکاری فضایی داده ها را تسهیل می کند. Neo4j Spatial از هفت نوع هندسه رایج پشتیبانی می کند: Point، LineString، Polygon، MultiPoint، MultiLineString، MultiPolygon، و GeometryCollection و عملیات توپولوژی. علاوه بر این، Neo4j Spatial یک شاخص R-Tree برای پرس و جوهای فضایی اتخاذ می کند و چندین روش فضایی را ارائه می دهد [ 50 ].
در تحقیقات مرتبط، سروات و همکاران. یک پرس و جو قابلیت دسترسی را با یک محدوده فضایی که در پایگاه داده گراف Neo4j پیش بینی شده است، اجرا کرد، و تلاش کرد تا دریابد که آیا یک نقطه ورودی می تواند به هر نقطه فضایی که در محدوده فضایی ورودی قرار دارد برسد یا خیر [ 51 ]. به دلیل عدم بهینه سازی گزاره های فضایی در پردازشگرهای پرس و جوی نمودار موجود، Sun و همکاران. یک عملگر پرس و جو را پیشنهاد کرد، GEOEXPAND، که آگاهی داده های مکانی را به DBMS گرافیکی اضافه می کند تا پرس و جوهای گراف را با محمولات فضایی به طور موثر اجرا کند [ 52 ]. علاوه بر این، یک سیستم تطبیق carpool طراحی شد تا کارپول ها را بر اساس مسیرهای مکرر هفتگی وسایل نقلیه توصیه کند [ 53]. با استفاده از کتابخانه GraphAware Neo4j TimeTree، یک سری زمانی از مکان‌ها در یک مسیر به هم متصل شدند. برای داده‌های مکانی، کتابخانه فضایی Neo4j برای مدل‌سازی و جستجوی داده‌های مسیر استفاده شد. با استفاده از یک استراتژی تطبیق کارپول، کارایی و کارایی سیستم پیشنهادی مورد ارزیابی قرار گرفت [ 53 ]. Neo4j همچنین در کاربردهای کشاورزی و دامپروری استفاده شده است، به عنوان مثال، با استفاده از فناوری وب و پوسته Neo4j برای ارزیابی وضعیت محصولات بر اساس داده‌های مکانی [ 54 ] و شناسایی روابط بین اعضای یک گله گاو بر اساس پایگاه داده های فضایی و نموداری [ 55 ].
از آنجایی که Neo4j فقط از نوع هندسه نقطه و توابع فضایی مبتنی بر نقطه پشتیبانی می کند، به طور کلی در برنامه های مرتبط با مکان استفاده می شود.

4.4. آپاچی کاساندرا

آپاچی کاساندرا یک سیستم مدیریت پایگاه داده ذخیره سازی با ستون های گسترده و منبع باز است. کاساندرا و زبان پرس و جو کاساندرا (CQL) از پرس و جوهای فضایی پشتیبانی نمی کنند. روش اصلی Cassandra برای پشتیبانی از داده‌های مکانی، Stratio’s Lucene Index for Cassandra است، افزونه‌ای برای آپاچی کاساندرا، که از نمایه‌سازی داده‌های مکانی (نقطه، خطوط، چند ضلعی، و غیره)، تبدیل‌های مکانی (جعبه مرزی، مرکز، بدنه محدب، بافر، اتحاد) پشتیبانی می‌کند. ، تفاوت، تقاطع) و عملیات جغرافیایی (تقاطع، شامل، و غیره). نمایه‌های Lucene، توسعه‌ای از نمایه‌های ثانویه کاساندرا، می‌توانند از طریق یک عبارت CQL CREATE CUSTOM INDEX ایجاد شوند. نحو عبارت است از:
  • ایجاد نمایه سفارشی (اگر وجود ندارد)؟ <index_name>
  •                                                                روشن <table_name> ()
  •                                                                استفاده از “com.stratio.cassandra.lucene.Index”
  •                                                                WITH OPTIONS = <options>
در کاساندرا، اشیاء هندسی اصلی عبارتند از Point، LineString و Polygon، در حالی که خود Cassandra یک شاخص فضایی ارائه نمی دهد.
Cassandra یک ذخیره‌گاه داده بسیار مقیاس‌پذیر و با کارایی بالا است، اما قابلیت‌های محدودی را برای تجزیه و تحلیل داده‌ها و عملکردهای مقیاس‌پذیر محدود، از جمله عدم پشتیبانی کافی برای عملیات داده‌های مکانی، فراهم می‌کند. برای غلبه بر این مشکلات، تحقیق در مورد پسوند زبان پرس و جو کاساندرا برای پیاده سازی پرس و جوهای فضایی در پایگاه داده کاساندرا [ 56 ] توسعه یافت.]. این تحقیق توسعه ای عمدتاً مقادیر طولی/طولی را به یک ویژگی geohash عددی تبدیل کرده و آنها را با داده ها در طول عملیات ذخیره سازی داده مرتبط می کند. سپس یک تجزیه کننده پرس و جو فضایی و نحو فضایی طراحی و به عنوان یک پسوند فضایی CQL تعریف شد. پس از آن، یک الگوریتم تجمیع برای کاهش فضای جستجو و بهینه سازی پرس و جوهای فرعی ارسال شده به گره های خوشه اجرا شد. داده های ذخیره شده را می توان از طریق یک تکنیک geohashing نمایه کرد [ 56 ]. علاوه بر این، یک رویکرد جدید برای جفت کردن کاساندرا با Secondo DBMS توسط Nidzwetzki و همکاران ارائه شد. برای پشتیبانی از تمام توابع DBMS، از جمله مدل‌های داده‌های مکانی و شی متحرک با در دسترس بودن و مقیاس‌پذیری بالا [ 57 ]. با استفاده از آن کار، Nidzwetzki و همکاران. این رویکرد را بیشتر گسترش داد [ 58] برای ساختن یک DBMS که توزیع شده، همه منظوره، قابل تحمل خطا و موازی باشد. به طور مشابه، برای حل مسائل مربوط به پرس و جوهای فضایی در پایگاه داده کاساندرا، چارچوبی با ادغام Hadoop و Cassandra برای داده های پرس و جو فضایی ذخیره شده در Cassandra توسعه داده شد [ 59 ]. نتایج تجربی نشان داد که یک تکنیک پارتیشن بندی تعریف شده توسط کاربر، به نام پارتیشن بندی مبتنی بر پیشوند، در جستجوی مکانی بهتر از الگوریتم پارتیشن بندی پیش فرض کاساندرا [ 59 ] عمل کرد.
برای اهداف مشابه، چارچوب دیگری با ترکیب Spark و Cassandra برای ارائه راه‌حل‌های بارگذاری و بازیابی داده برای داده‌های مکانی پیشنهاد شد [ 60 ]. این چارچوب شامل یک لایه ذخیره‌سازی داده‌های مکانی (بر اساس Cassandra)، یک لایه هسته Spark (با استفاده از APIهای هسته استاندارد Spark)، یک لایه پردازش داده‌های مکانی (به عنوان رابطی برای جستجوی داده‌های مکانی و غیر مکانی) و یک لایه کاربردی، که در آن یک اتصال دهنده Spark-Cassandra [ 61 ] یکپارچگی یکپارچه بین Spark و Cassandra [ 60 ] را فراهم می کند.
کاساندرا انواع هندسه، شاخص‌های هندسه و توابع محدودی را ارائه می‌کند، بنابراین کارها یا ابزارها/مؤلفه‌های طراحی اضافی در پردازش داده‌های مکانی مورد نیاز است، مانند پسوند فهرست [ 56 ] و ترکیب با ابزارهای دیگر [ 59 ، 60 ، 61 ].

4.5. آپاچی اچ بیس

Apache HBase یک پایگاه داده معماری منبع باز، توزیع شده، نسخه بندی شده و مبتنی بر دیسک است. HBase از زبان پرس و جوی اعلانی پشتیبانی نمی کند و پرس و جوها در HBase از طریق API های اختصاصی به دست می آیند. HBase دارای توابع جغرافیایی خاصی برای پشتیبانی از ذخیره سازی داده های مکانی و پرس و جو نیست [ 62 ]. با این حال، محققان روش‌ها و کاربردهایی را برای پردازش داده‌های مکانی در HBase توسعه دادند [ 63 ، 64 ، 65 ، 66 ، 67 ، 68 ، 69 ، 70 ]، مانند یک پایگاه داده جغرافیایی با شاخص‌های فضایی مبتنی بر geohash [ 63 ، 71 ].]، پردازش داده های فضایی بزرگ با آپاچی اسپارک [ 72 ]، یک مدل داده های مکانی [ 64 ]، و یک روش جستجوی فضایی جدید بر اساس نمایه سازی کلیدهای اولیه [ 73 ]. علاوه بر این، مجموعه ای از ابزارهای منبع باز، GeoMesa، برای پیاده سازی تجزیه و تحلیل های مکانی در مقیاس بزرگ و پرس و جو در فضای ابری یا در ارتباط با پایگاه های داده HBase و Cassandra طراحی شده است [ 74 ].
علاوه بر تحقیقات فوق در مورد پردازش مکانی در HBase، تحقیقات دیگری نیز در رابطه با پردازش مکانی انجام شده است. اولین مورد بر اساس مکانیسم MapReduce [ 75 ، 76 ] است. Hadoop MapReduce یک چارچوب نرم‌افزاری است که از طریق آن طراحان می‌توانند به راحتی برنامه‌هایی بنویسند تا مقادیر عظیمی از داده‌ها را به صورت موازی در خوشه‌های بزرگی از سخت‌افزار کالا پردازش کنند [ 77 ]، در حالی که HBase از کلاس‌های پایه برای پشتیبانی از مشاغل MapReduce با جداول HBase استفاده می‌کند [ 76 ]. ایده اصلی MapReduce این است که مجموعه داده های عظیم ابتدا به تکه های مستقل ذخیره شده در خوشه ها تقسیم می شوند و این تکه ها با تطبیق وظایف و روش های مختلف به صورت موازی پردازش می شوند [ 75 ، 76 ]].
سایر محققان ساختار شاخص جدیدی را برای مدیریت داده ها برای HBase طراحی کرده اند [ 69 ، 70 ، 78 ، 79 ]. دو و همکاران یک ساختار شاخص ترکیبی جدید برای سازماندهی داده ها با توسعه یک R-Tree مبتنی بر شبکه آماری برای نمایه سازی فضا و با استفاده از منحنی هیلبرت برای همسایه یابی [ 78 ] پیشنهاد کرد. در HBase، یک ساختار شاخص فضایی جدید با رمزگذاری geohash طراحی شد [ 69 ، 80 ]. علاوه بر این، جو و همکاران. یک ساختار شاخص سلسله مراتبی برای پردازش پرس و جوی فضایی موثر در HBase ایجاد کرد که به نام درخت Q-MBR (مستطیل مرزی حداقل مبتنی بر ربع) [ 79 ]]. از طریق Q-MBR، فضا به ربع تقسیم می شود و MBR در هر ربع ایجاد می شود. سپس، اشیاء فضایی از طریق درخت شاخص به صورت سلسله مراتبی قابل دسترسی هستند. بر اساس درخت Q-MBR، الگوریتم های مختلفی برای عملیات پرس و جوی مختلف طراحی شده است [ 79 ].
سومین جهت تحقیق، ساخت مدل‌ها/طرحواره‌های ذخیره‌سازی داده‌های مکانی در HBase است [ 67 ، 73 ، 81 ، 82 ، 83 ]. وانگ و همکاران یک طرح ذخیره سازی Z با کلیدهای ردیف بر اساس منحنی Z برای داده های برداری فضایی عظیم در HBase [ 67 ] پیشنهاد کرد. پس از آن، ژانگ و همکاران. این طرح ذخیره سازی Z را بهبود بخشید، و آزمایشات آنها نشان داد که طرح ذخیره سازی Z نسبت به طرح ذخیره سازی مبتنی بر درخت (طرح ذخیره سازی چهار درخت و طرح ذخیره سازی R-Tree) کارایی پرس و جو فضایی بالاتری دارد [ 83 ].
علاوه بر این، ژای و همکاران. پایگاه داده HBase توزیع شده و یک شبکه زیربخش جهانی را برای مدیریت موثر داده ها ترکیب کرد: با روش خود، ژئوکدهای شبکه موقعیت مکانی یک شی را ارائه کردند و به عنوان یک مقدار کلید در HBase در نظر گرفته شدند [ 81 ]. در همین حال، ژنگ و همکاران. مجاورت فضایی را در نظر گرفتند و یک استراتژی بهینه سازی ذخیره سازی داده های مکانی را برای پایگاه داده HBase پیشنهاد کردند: روش آنها اشیاء فضایی مجاور را در یک قطعه داده ذخیره می کند [ 84 ].
از آنجایی که HBase از انواع هندسه، شاخص‌های هندسی یا توابع پشتیبانی نمی‌کند، برای پردازش داده‌های مکانی به کارها یا ابزارها/مؤلفه‌های طراحی اضافی نیاز است.

4.6. ردیس

Redis یک پایگاه داده منبع باز (مجوز BSD) است که از ساختارهای داده های متعدد، از جمله رشته ها، هش ها، لیست ها، مجموعه ها، بیت مپ ها، نمایه های مکانی با پرس و جوهای شعاع و جریان ها پشتیبانی می کند. ردیس پرس و جوها را از طریق APIهای خاص پیاده سازی می کند و شش دستور مرتبط با زمین مکانی را ارائه می دهد: geoadd، geodist، geohash، geopos، georadius و georadiusbymember. اجرای این دستورات در عملیات داده های جغرافیایی آسان است. به عنوان مثال، فرمت دستور geoadd “GEOADD (نام مجموعه) طول جغرافیایی طول جغرافیایی (نام شی)” است و کاربر شیء جغرافیایی مشخص شده (طول جغرافیایی، طول جغرافیایی، نام) را به کلید مشخص شده اضافه می کند. داده ها در کلید به عنوان یک مجموعه مرتب شده ذخیره می شوند و به این ترتیب، شی را می توان با استفاده از یک پرس و جو از شعاع با دستورات georadius یا georadiusbymember بازیابی کرد.
یک مثال این است:
  • GEOADD ساختمان 15.45244 -76.78506 my-house
برای حذف یک عضو از Geo Set، Redis دستور ZREM را ارائه می دهد:
  • redis.zrem (ساختمان، خانه من)
Redis یک پایگاه داده در حافظه است، اما روی دیسک ثابت است. هنگامی که یک تغییر مهم در داده ها ایجاد می شود، لازم است به Redis دستور داده شود که تغییر را در دیسک ذخیره کند. علاوه بر این، Redis توانایی محدودی برای ایجاد روابط بین اشیاء داده دارد.
با توجه به ویژگی‌هایش، Redis عموماً برای سیستم‌های ردیابی پاسخ سریع، مانند ردیابی کشتی [ 16 ] و ردیابی وسایل نقلیه حمل‌ونقل عمومی [ 85 ] استفاده می‌شود، که در آن داده‌های بلادرنگ باید به موقع نمایش یا پردازش شوند، در حالی که نیازی نیست که داده های حافظه فوری ذخیره شوند.

4.7. آمازون DynamoDB

Amazon DynamoDB یک پایگاه داده NoSQL است که عملکرد سریع و قابل پیش بینی را با مقیاس پذیری یکپارچه، ذخیره سازی اسناد، ذخیره سازی با ارزش کلید و API های سطح پایین (رابط در سطح پروتکل) برای مدیریت جداول و فهرست های پایگاه داده ارائه می دهد. به منظور ساخت آسان برنامه های مبتنی بر مکان، کتابخانه Geo برای Amazon DynamoDB طراحی شده است، به طوری که یک GeoPoint (با یک مقدار طولی و یک مقدار طولی) در یک رشته GeoJSON کدگذاری می شود. علاوه بر این، از شاخص‌های geohash برای پرس و جوهای مبتنی بر مکان سریع، از جمله پرس‌وجوهای جعبه و پرس‌وجوهای شعاع استفاده می‌شود. علاوه بر این، DynamoDB چندین توابع عملیات جغرافیایی مانند GeoPoint، putPoint، deletePoint، updatePoint، queryRectangle و queryRadius را ارائه می‌کند. هیچ مقاله دانشگاهی مرتبطی در مورد پردازش جغرافیایی بر اساس تحقیقات روی DynamoDB یافت نشد.

4.8. Elasticsearch

Elasticsearch یک موتور جستجو و پایگاه داده اسناد است که در جاوا توسعه یافته است. Elasticsearch یک زبان پرس و جو به نام Domain Specific Language (DSL) را بر اساس JSON برای تعریف پرس و جو و پشتیبانی ارائه می دهد. همچنین از دو نوع داده جغرافیایی، از جمله نوع داده ژئونقطه (جفت طول و عرض جغرافیایی) و نوع داده ژئوشکل، که از نقاط، خطوط، دایره ها، چند ضلعی ها، چند چند ضلعی و غیره پشتیبانی می کند. از نظر پرس و جو، Elasticsearch چهار عملکرد دارد: geo_shape، geo_bounding_box، geo_distance و geo_polygon، و چندین PrefixTree از جمله GeohashPrefixTree و QuadPrefixTree را ارائه می دهد. علاوه بر این، داده های مکانی را می توان با استفاده از قالب GeoJSON یا متن شناخته شده (WKT) نشان داد. نمونه ای از GeoJSON در اینجا نشان داده شده است:
  • POST /example/_doc
  • {
  •            “محل” : {
  •                       “نوع”: “نقطه”
  •                       “مختصات” : [-77.03653, 38.897676]
  •                       }
  • }
ما تعدادی مقاله در Elasticsearch یافتیم، از جمله یکی در مورد استفاده از Elasticsearch برای پرس و جوها و ذخیره اطلاعات جغرافیایی محلی [ 86 ] و یکی در Elasticsearch به عنوان یک سرویس در Elastic’s Elastic Cloud [ 87 ]. Elasticsearch همچنین برای نمایه سازی و پرس و جو از مجموعه داده های مکانی بزرگ در سیستم GeoRocket استفاده می شود [ 36 ].

4.9. اسپلانک

Splunk Inc. محصولات نرم افزاری زیادی با قابلیت جستجو و تجزیه و تحلیل قدرتمند برای مدیریت داده های سازمانی دارد. یکی از آن‌ها Splunk Enterprise است که می‌تواند داده‌ها را از وب‌سایت‌ها و اینترنت اشیا (اینترنت اشیا) واکشی کند و دارای عملکرد عالی مدیریت داده و استخراج است. زبان پرس و جو Splunk Splunk Process Language (SPL) نامیده می شود. در نرم افزار Splunk، ابتدا باید از جستجوهای مکانی برای تولید پرس و جو استفاده کرد و نتایج پرس و جو با تجسم نقشه choropleth نشان داده می شود. یک جستجوی مکانی، مختصات مکان رویداد/شی را در یک مجموعه ویژگی های جغرافیایی، به نام فایل Keyhole Markup Zipped (KMZ) یا فایل Keyhole Markup Language (KML) نشان می دهد. قالبی برای ایجاد جستجوی مکانی در زیر تعریف شده است:
  • [<lookup_name>]
  • خارجی_نوع = جغرافیایی
  • نام فایل = <name_of_KMZ_file>
  • feature_id_element = <XPath_expression>
Splunk Enterprise دو جستجوی مکانی برای ایالات متحده و سایر کشورها ارائه می دهد. هیچ مقاله آکادمیک مرتبطی در مورد پردازش جغرافیایی بر اساس کاربردها و تحقیقات Splunk یافت نشد.

4.10. سولر

Solr یک پلت فرم جستجوی منبع باز با قابلیت اطمینان بالا، نمایه سازی مقیاس پذیر، توابع جستجو، تحمل خطا و پرس و جوی متعادل بار است. تجزیه کننده پرس و جو پیش فرض آن تجزیه کننده پرس و جو “Lucene” است. برای ذخیره داده‌های مکانی، Solr از فرمت WKT و GeoJSON پشتیبانی می‌کند، اما قالب داده‌ها باید از طریق یک «نام نوع قالب» تعیین شود تا بتوان داده‌ها را ذخیره کرد. دو پارامتر داخلی وجود دارد: f برای نام فیلد و w برای نام قالب.
یک مثال این است:
  • geojson: [geo f=mySpatialField w=GeoJSON].
برای پرس‌و‌جوهای داده‌های مکانی، Solr نقاط نمایه‌سازی یا اشکال دیگر، جستجوی نتایج از یک جعبه یا دایره یا اشکال دیگر، مرتب‌سازی نتایج تحقیقات بر حسب فاصله، یا حتی افزایش نتایج از نظر فاصله را فراهم می‌کند. علاوه بر این، Solr چهار نوع فیلد اصلی را برای جستجوهای فضایی فراهم می کند، از جمله:
  • LatLonPointSpatialField : این بیشتر برای داده های نقطه طول و عرض جغرافیایی استفاده می شود.
  • RptWithGeometrySpatialField : برای نمایه سازی و جستجوی داده های غیر نقطه ای (می تواند نقاط را نیز انجام دهد، اما نمی تواند مرتب سازی/تقویت انجام دهد).
  • BBoxField : برای نمایه سازی جعبه های محدود کننده، پرس و جوها با استفاده از یک کادر، یا تعیین یک گزاره جستجو (تقاطع، درون، شامل، جدا، برابر).
  • LatLonType (اکنون از بین رفته): هنوز وجود دارد، اما با LatLonPointSpatialField جایگزین شده است.
در اینجا، ما دو مثال برای جستجوی یک فروشگاه در 5 کیلومتری یک مکان (45.15، 93.85-) می‌آوریم:
  • &q=*:*&fq={!bbox sfield=store} & pt=45.15,-93.85 & d=5
  • &q=*:*&fq={!geofilt sfield=store} & pt=45.15,-93.85 & d=5
پارامترها به معنی موارد زیر هستند:
  • d فاصله شعاعی است که معمولاً بر حسب کیلومتر است.
  • pt نقطه مرکزی با استفاده از قالب “طول و عرض جغرافیایی” است.
  • sfield یک فیلد شاخص فضایی است.
  • فیلتر ژئوفیلت نتایج را بر اساس فاصله جغرافیایی (فاصله دایره) با استفاده از یک نقطه معین به عنوان مرکز دایره و d به عنوان شعاع بازیابی می کند.
  • فیلتر bbox (جعبه مرزی) از جعبه مرزی دایره ژئوفیلت استفاده می کند.
از آنجایی که جعبه مرزی شل است، ممکن است برخی از فروشگاه ها که در واقع بیش از 5 کیلومتر دورتر هستند پیدا شوند، اما geofit در 5 کیلومتری دقیق است.
به عنوان یک سرور بک‌اند، Solr برای فهرست‌بندی و جستجوی خدمات فراداده در گره فهرست فدراسیون شبکه زمین (ESGF)، که می‌تواند به داده‌های مکانی توزیع‌شده دسترسی داشته باشد، استفاده شده است [ 88 ]. از نظر پردازش داده های مکانی، Solr به طور گسترده ای به عنوان یک موتور تحقیقاتی استفاده می شود، نه برای ذخیره سازی داده ها [ 89 ، 90 ]، بنابراین ترکیب آن با پایگاه های داده دیگر مورد نیاز است.

5. مقایسه پردازش داده های مکانی در پایگاه های داده NoSQL

برای مقایسه 10 پایگاه داده مختلف NoSQL، ویژگی های مکانی آنها در جدول 4 خلاصه شده است که شامل اصول هندسه، توابع هندسه اصلی، شاخص های فضایی، زبان پرس و جو و قالب داده است. در جدول 4 مشاهده می شود که از 10 پایگاه داده، 9 پایگاه داده های مکانی را پشتیبانی می کنند و به جز HBase، عملکردها یا رویه های خاصی دارند. با این حال، شاید به دلیل عدم وجود ویژگی‌های مکانی و عملکردهای مکانی در HBase، تحقیقات جغرافیایی اغلب در پایگاه داده HBase انجام می‌شود.
از نظر آبجکت های هندسی، اکثر پایگاه های داده NoSQL از چندین شی هندسی پشتیبانی می کنند، به جز آمازون DynamoDB، HBase، Neo4j و Redis. DynamoDB و Redis فقط از شی نقطه پشتیبانی می کنند، در حالی که پایگاه داده HBase هیچ شی هندسی را پشتیبانی نمی کند. Neo4j همچنین فقط شی هندسه نقطه ای را پشتیبانی می کند، اما یک کتابخانه توسعه یافته، Neo4j Spatial، از هفت شی هندسی پشتیبانی می کند. MongoDB، DynamoDB و Elasticsearch از توابع هندسه جامع تری نسبت به سایر پایگاه های داده NoSQL پشتیبانی می کنند و شامل عملیات نقطه، فاصله و برد هستند. برای نمایه‌سازی فضایی، geohash رایج‌ترین روش است و در پایگاه‌های اطلاعاتی اسناد، پایگاه‌های داده ستون‌مدار و پایگاه‌های داده کلید-مقدار به کار گرفته شده است. ساختار درختی یکی دیگر از ساختارهای رایج است که برای نمایه سازی داده های مکانی در پایگاه های داده NoSQL استفاده می شود. از نظر زبان پرس و جو، برخی از پایگاه های داده NoSQL از زبان پرس و جوی اعلامی پشتیبانی نمی کنند، از جمله MongoDB، HBase، Redis و Amazon DynamoDB. آنها از پرس و جوهای REST و یک API اختصاصی برای ساخت و صدور پرس و جو پشتیبانی می کنند. از نظر فرمت‌های داده‌های مکانی پشتیبانی شده، هشت پایگاه داده از هر 10 پایگاه داده، فرمت‌های عمومی داده GeoJSON یا WKT را ارائه می‌کنند، به جز HBase و Splunk.
در پایگاه‌های داده NoSQL، مدل‌های داده (شامل مدل‌های چندگانه و موتورهای جستجو) را می‌توان به چهار دسته اصلی طبقه‌بندی کرد: کلید-مقدار، مدل نمودار، ستون گسترده و ذخیره‌سازی اسناد. در واقع، همه این مدل‌های داده می‌توانند داده‌های مکانی را مدیریت و مدیریت کنند. با این حال، پایگاه داده های مختلف NoSQL می توانند داده های مکانی را به روش های مختلف با توجه به مدل داده خاص ذخیره و نمایش دهند.
پایگاه داده های گراف بر اساس گره ها (0D) و یال ها (1D)، شبیه به مدل توپولوژی گراف مربوط به داده های مکانی است. دو گره و یک لبه (ارتباط بین دو گره) می توانند به راحتی دو تقاطع جاده و یک جاده بین دو تقاطع را در یک رابطه توپولوژی نشان دهند. با این حال، پایگاه‌های داده گراف از چهره‌های توپولوژیکی گراف (2D) پشتیبانی نمی‌کنند، یعنی فضای محدود شده توسط یک لبه. از آنجایی که Neo4j یک پایگاه داده گراف است، می تواند به طور بومی ویژگی های توپولوژیکی گراف 0D و 1D داده های مکانی را مدیریت کند و می تواند عملیات پیمایش سریع را ارائه دهد [ 21 ].
در حالت کلید-مقدار (Redis)، یک ساختمان تاریخی (نام ساختمان) و موقعیت این ساختمان (طول و عرض جغرافیایی)، تاریخچه و اطلاعات ساخت و ساز نیز به راحتی در Redis ذخیره می شود (نام ساختمان یک کلید است و اطلاعات دیگر). مقادیر ذخیره شده است). پایگاه داده کلید-مقدار یک فروشگاه درون حافظه است که در آن بارگذاری داده ها و اجرای بار کاری فوق العاده سریع است [ 13 ]. پایگاه داده Redis به دلیل ذخیره در حافظه آن، عموماً در سیستم‌های خاصی که نیاز به تصویرسازی داده‌ها در زمان واقعی دارند و نیازی به ذخیره دائمی همه داده‌ها، مانند ردیابی کشتی، ندارند، استفاده می‌شود [ 16 ].
با این حال، به دلیل ویژگی های این دو مدل داده، Neo4j و Redis عمدتا از شی هندسه نقطه پشتیبانی می کنند. بنابراین، پایگاه‌های داده کلید-مقدار (Redis) [ 7 ، 91 ] و پایگاه‌های اطلاعاتی گراف (Neo4j) [ 53 ، 54 ، 55 ] فقط پرس‌و‌جوها و توابع جغرافیایی محدودی از جمله محاسبات فاصله و جست‌وجوهای مکان ارائه می‌کنند. مدل‌های داده‌های مکانی محدود، به دلیل پیچیدگی داده‌های مکانی، به‌ویژه اشیاء چند خطی و چند ضلعی، مانع از کاربردهایی می‌شوند که پایگاه‌های داده کلیدی-مقدار (Redis) و پایگاه‌های داده‌های نموداری (Neo4j) برای آنها مفید هستند.
پایگاه‌های اطلاعاتی اسناد می‌توانند در جزئیات متفاوت باشند، اما همه پایگاه‌های اطلاعاتی اسناد، اطلاعات را در قالب استاندارد معینی رمزگذاری و در اسناد محصور می‌کنند. فرمت‌های رایج رمزگذاری استاندارد شامل زبان نشانه‌گذاری توسعه‌یافته (XML)، نشانه‌گذاری شی جاوا اسکریپت (JSON) و باینری JSON (BSON) است. برای داده‌های مکانی، پایگاه‌های داده اسناد از فرمت GeoJSON مانند MongoDB، Couchbase، Amazon DynamoDB و Elasticsearch استفاده می‌کنند.
پایگاه داده های سند روابط پیچیده ای با سایر پایگاه های داده NoSQL دارند. به عنوان مثال، موتور جستجو Elasticsearch عملیات گسترده ای را برای اسناد ارائه می دهد و به عنوان یک پایگاه داده سند محور در نظر گرفته می شود. علاوه بر این، گاهی اوقات یک پایگاه داده سند را می توان به عنوان یک پایگاه داده با ارزش کلیدی مانند Redis، Couchbase و Amazon DynamoDB مشاهده کرد. MongoDB یک پایگاه داده کلید-مقدار نیست، اما از مفهوم جفت کلید-مقدار استفاده می کند و اسناد با استفاده از یک کلید قابل دسترسی هستند. اگرچه پایگاه‌های داده اسناد ارتباط نزدیکی با پایگاه‌های داده کلیدی-مقدار دارند، پایگاه‌های اطلاعاتی سند گرا، مانند MongoDB، Couchbase، و Elasticsearch، داده‌های مکانی را به طور مؤثرتری نسبت به پایگاه‌های داده با ارزش کلیدی پردازش و مدیریت می‌کنند [ 7 ]]. این عمدتاً به این دلیل است که پایگاه‌های داده اسناد دارای پرس‌وجوهای انعطاف‌پذیرتری برای بازیابی داده‌های مکانی نسبت به پایگاه‌های داده کلید-مقدار هستند، از جمله جستارهای مجاورتی و توابع تحلیل توپولوژی تعبیه‌شده [ 17 ]، و از طریق قالب GeoJSON، بسیاری از پایگاه‌های داده اسناد به راحتی مدیریت داده‌های مکانی را پشتیبانی یا گسترش می‌دهند. علاوه بر این، پایگاه‌های اطلاعاتی اسناد در پرسش‌های داده‌های مکانی [ 18 ، 31 ]، بازیابی داده‌های مکانی [ 33 ]، و از نظر زمان پاسخ برای بارگذاری داده‌های بزرگ مکانی [ 32 ] به خوبی عمل می‌کنند. MongoDB همچنین بهترین زمان پرس و جو را برای پرس و جوهای گره در مقایسه با Neo4j و PostgreSQL دارد [ 92 ].
پایگاه‌های داده ستون گسترده، Cassandra و HBase، جداول داده‌ها را به جای ردیف‌ها در ستون‌ها ذخیره می‌کنند، و آنها پایگاه‌های داده منبع باز، غیر رابطه‌ای و توزیع شده هستند. HBase از پردازش جغرافیایی پشتیبانی نمی کند. با این حال، از طریق MapReduce [ 75 ، 76 ، 93 ] و با طراحی ساختارهای شاخص جدید [ 69 ، 70 ، 78 ، 79 ] و مدل ها/طرحواره های ذخیره سازی [ 67 ، 73 ، 81 ، 82 ، 83 ]، پایگاه داده HBaseospatial اکنون می تواند gege را پردازش کند. داده ها برای برنامه های مختلف همانند Hbase، Cassandra همچنین می‌تواند از Hadoop MapReduce برای پردازش داده‌های مکانی استفاده کند.59 ]. با این حال، HBase یک ذخیره‌سازی داده‌های کلیدی-مقدار ستون‌گرا است و Cassandra اساساً ترکیبی بین یک سیستم مدیریت پایگاه داده کلید-مقدار و جدولی است. هیچکدام راهی برای پرس و جو بر اساس ستون و مقدار ارائه نمی کنند، و عملکرد پرس و جو عمدتاً به کلیدهای محدود بستگی دارد، بنابراین پایگاه داده های خانواده ستون را می توان به طور موثر برای برخی از برنامه های مکانی خاص که به پرس و جوهای جغرافیایی ساده، درج داده های انبوه و بازیابی سریع داده ها نیاز دارند استفاده کرد. 21 ]. علاوه بر این، بیشتر تحقیقات مبتنی بر HBase بر روی داده‌های مکانی برداری [ 66 ، 67 ، 83 ، 93 ، 94 ] متمرکز شده‌اند، در حالی که پایگاه‌های داده اسناد می‌توانند داده‌های شطرنجی [ 7 ] و داده‌های مکانی برداری [ 36 ] را مدیریت کنند.]. از آنجایی که پایگاه‌های داده ستون عریض دارای توابع و پرس و جوهای کافی برای پشتیبانی از پردازش داده‌های مکانی نیستند، یکی دیگر از ضعف‌های پایگاه‌های داده ستون گسترده (HBase) این است که برای طراحی نمایه‌های جغرافیایی و طراحی توابع نیاز به کار اضافی دارند [ 69 ، 78 ، 94 ]. این ممکن است باعث ایجاد محدودیت هایی در قابلیت همکاری و اشتراک طرح ها در مقایسه با نمایه ها و عملکردهای پایگاه داده های داخلی شود. شاخص‌های فضایی و عملکردهای پایگاه داده داخلی، راحتی و کارایی را در کارهای طراحی فراهم می‌کنند، اما شاخص‌ها و توابع ثابت ممکن است انعطاف‌پذیری آنها را در برخی از برنامه‌ها محدود کنند. طراحان و توسعه دهندگان باید بین راحتی و انعطاف پذیری یک پروژه طراحی و همچنین در نظر گرفتن حجم کار و پیچیدگی طراحی تعادل ایجاد کنند.
علاوه بر این، نمایه سازی مکانی برای پرس و جوهای جغرافیایی در پایگاه های داده NoSQL حیاتی است. برای عملکرد بهتر پرس و جو، برخی از محققان روش های نمایه سازی فعلی را برای پایگاه های داده های مختلف NoSQL، از جمله R-Tree برای MongoDB [ 44 ، 46 ]، پسوندهای geohash برای MongoDB [ 45 ، 47 ]، یک درخت توسعه مبتنی بر نمودار (GET) برای Neo4j گسترش داده اند. [ 95 ]، و یک طرح نمایه سازی ترکیبی جدید به نام HB+-trie برای ذخیره سازی کلید-مقدار [ 96 ].
در حال حاضر، پایگاه‌های اطلاعاتی اسناد و ستون‌های گسترده از نظر پردازش داده‌های مکانی، توجه آکادمیک بیشتری نسبت به پایگاه‌های اطلاعاتی نمودار و ارزش کلیدی دارند. تحقیقات روی پایگاه‌های داده اسناد عمدتاً بر بهبود شاخص [ 44 ، 45 ]، تجزیه و تحلیل عملکرد [ 18 ، 23 ] و کاربردهای عملی [ 38 ، 39 ، 40 ] متمرکز شده است. علاوه بر این، به دلیل عملکرد بالای درج و بازیابی داده ها در HBase، بسیاری از محققان سیستم ها و برنامه هایی را برای داده های مکانی بر اساس HBase طراحی کرده اند [ 63 ، 73 ، 79 ، 82 ، 94 .].
یک مقایسه اساسی از اشیاء هندسه، توابع هندسه اصلی، شاخص های فضایی، و قالب های داده پشتیبانی شده توسط این پایگاه های داده NoSQL در جدول 4 نشان داده شده است . خلاصه ای از پردازش داده های مکانی در پایگاه های داده های مختلف NoSQL (بر اساس بررسی و تحلیل ادبیات ما) در جدول 5 فهرست شده است. از میان پایگاه‌های داده NoSQL، پایگاه‌های داده اسناد با توجه به اشیاء هندسی که پشتیبانی می‌کنند، فرمت‌های داده‌ها، عملکرد پرس و جو، توابع جغرافیایی، روش‌های نمایه‌سازی و میزان توجه دانشگاهی که دریافت می‌کنند، پردازش داده‌های جغرافیایی را به بهترین نحو انجام می‌دهند. سایر پایگاه های داده مزایای خاص خود را برای سناریوهای خاص دارند.

6. نتیجه گیری

در این مقاله، ما پیشرفته‌ترین پردازش داده‌های مکانی مورد استفاده در 10 پایگاه داده محبوب NoSQL را خلاصه کرده و عملکرد آنها را بر اساس اشیاء هندسی پشتیبانی‌شده، توابع هندسی، شاخص‌های فضایی، قالب‌های داده، زبان‌های پرس و جو و استفاده در آن مقایسه کردیم. تحقیقات دانشگاهی. علاوه بر این، ما مزایا و معایب این پایگاه‌های داده NoSQL را در پردازش داده‌های مکانی تحلیل کردیم. پایگاه‌های اطلاعاتی گراف و پایگاه‌های داده کلید-مقدار تمایل دارند شی نقطه هندسی را بیان کنند، بدون پشتیبانی کافی برای سایر ساختارهای هندسی. این کارکردها و کاربردهای هندسی آنها را محدود می کند. علاوه بر این، این دو نوع پایگاه داده از نظر پردازش داده های مکانی مورد توجه دانشگاهی کمی قرار گرفته اند. پایگاه‌های اطلاعاتی اسناد از انواع ساختارهای هندسی پشتیبانی می‌کنند و مجموعه‌ای غنی‌تر از توابع جغرافیایی را نسبت به پایگاه‌های داده گراف و ارزش کلیدی ارائه می‌دهند. پایگاه داده های ستون گسترده تنها از تعداد محدودی از پرس و جوها و توابع جغرافیایی پشتیبانی می کنند. با این حال، پایگاه داده های ستونی گسترده برای بسیاری از کاربردها پذیرفته شده است و به طور گسترده توسط دانشگاهیان مورد مطالعه قرار گرفته است، همانطور که پایگاه داده اسناد نیز انجام شده است. بر اساس بررسی ادبیات ما، که شامل مقایسه سیستماتیک ویژگی های پایگاه داده NoSQL است، به این نتیجه رسیدیم که پایگاه های داده اسناد بهترین بستر برای پردازش داده های مکانی هستند، زیرا آنها سریع بارگذاری می شوند و زمان اجرای خوب، عملکرد پرس و جو خوب و فضای مکانی فراوان دارند. توابع و روش های شاخص آنها همچنین مورد توجه دانشگاهی زیادی قرار گرفته اند. پایگاه داده های ستون گسترده تنها از تعداد محدودی از پرس و جوها و توابع جغرافیایی پشتیبانی می کنند. با این حال، پایگاه داده های ستونی گسترده برای بسیاری از کاربردها پذیرفته شده است و به طور گسترده توسط دانشگاهیان مورد مطالعه قرار گرفته است، همانطور که پایگاه داده اسناد نیز انجام شده است. بر اساس بررسی ادبیات ما، که شامل مقایسه سیستماتیک ویژگی های پایگاه داده NoSQL است، به این نتیجه رسیدیم که پایگاه های داده اسناد بهترین بستر برای پردازش داده های مکانی هستند، زیرا آنها سریع بارگذاری می شوند و زمان اجرای خوب، عملکرد پرس و جو خوب و فضای مکانی فراوان دارند. توابع و روش های شاخص آنها همچنین مورد توجه دانشگاهی زیادی قرار گرفته اند. پایگاه داده های ستون گسترده تنها از تعداد محدودی از پرس و جوها و توابع جغرافیایی پشتیبانی می کنند. با این حال، پایگاه داده های ستونی گسترده برای بسیاری از کاربردها پذیرفته شده است و به طور گسترده توسط دانشگاهیان مورد مطالعه قرار گرفته است، همانطور که پایگاه داده اسناد نیز انجام شده است. بر اساس بررسی ادبیات ما، که شامل مقایسه سیستماتیک ویژگی های پایگاه داده NoSQL است، به این نتیجه رسیدیم که پایگاه های داده اسناد بهترین بستر برای پردازش داده های مکانی هستند، زیرا آنها سریع بارگذاری می شوند و زمان اجرای خوب، عملکرد پرس و جو خوب و فضای مکانی فراوان دارند. توابع و روش های شاخص آنها همچنین مورد توجه دانشگاهی زیادی قرار گرفته اند. که شامل مقایسه سیستماتیک ویژگی های پایگاه داده NoSQL است، نتیجه می گیریم که پایگاه های داده اسناد بهترین بستر برای پردازش داده های مکانی هستند، زیرا آنها سریع بارگذاری می شوند و زمان اجرای خوب، عملکرد پرس و جو خوب، و توابع جغرافیایی فراوان و روش های شاخص دارند. آنها همچنین مورد توجه دانشگاهی زیادی قرار گرفته اند. که شامل مقایسه سیستماتیک ویژگی های پایگاه داده NoSQL است، نتیجه می گیریم که پایگاه های داده اسناد بهترین بستر برای پردازش داده های مکانی هستند، زیرا آنها سریع بارگذاری می شوند و زمان اجرای خوب، عملکرد پرس و جو خوب، و توابع جغرافیایی فراوان و روش های شاخص دارند. آنها همچنین مورد توجه دانشگاهی زیادی قرار گرفته اند.
بسته به سناریوی برنامه، پایگاه‌های داده گراف، پایگاه‌های داده کلید-مقدار و پایگاه‌های داده ستون گسترده نیز مزایای خاص خود را دارند. علاوه بر این، محاسبات سطح هندسه و پردازش حجم در پایگاه داده های NoSQL موجود انجام نمی شود. این می تواند جهت جدیدی برای تحقیقات پردازش فضایی باشد.

منابع

  1. وتساوایی، ر.ر. گانگولی، ا. چاندولا، وی. استفانیدیس، ا. کلاسکی، اس. Shekhar, S. داده کاوی فضایی و زمانی در عصر داده های مکانی بزرگ: الگوریتم ها و کاربردها. در مجموعه مقالات اولین کارگاه بین المللی ACM SIGSPATIAL در تجزیه و تحلیل داده های بزرگ جغرافیایی، 6 نوامبر 2012. ACM: ردوندو بیچ، کالیفرنیا، ایالات متحده آمریکا، 2012; صص 1-10. [ Google Scholar ]
  2. لی، جی.-جی. کانگ، ام. داده های بزرگ جغرافیایی: چالش ها و فرصت ها. بیگ دیتا Res. 2015 ، 2 ، 74-81. [ Google Scholar ] [ CrossRef ]
  3. لیو، ز. گوا، اچ. وانگ، سی. ملاحظات در مورد داده های بزرگ جغرافیایی. IOP Conf. سر. 2016 , 46 , 012058. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  4. یو، پی. جیانگ، LC BigGIS: چگونه داده های بزرگ می توانند GIS نسل بعدی را شکل دهند. در مجموعه مقالات سومین کنفرانس بین المللی آگرو-ژئوانفورماتیک، پکن، چین، 11 تا 14 اوت 2014. ص 413-418. [ Google Scholar ]
  5. بارالیس، ای. واله، AD; گرزا، پ. روسی، سی. Scullino، F. پایگاه های داده SQL در مقابل NoSQL برای کاربردهای مکانی. در مجموعه مقالات کنفرانس بین المللی IEEE 2017 در مورد داده های بزرگ، IEEE، بوستون، MA، ایالات متحده، 11-14 دسامبر 2017؛ صص 3388-3397. [ Google Scholar ]
  6. اشمید، اس. گالیچ، ای. Reinhardt, W. بررسی عملکرد پایگاه‌های داده انتخابی SQL و NoSQL. In Proceedings of the AGILE 2015، لیسبون، پرتغال، 9 تا 12 ژوئن 2015. [ Google Scholar ]
  7. هو، اف. Xu، MC; یانگ، جی سی. لیانگ، YS؛ Cui، KJ; کوچک، MM. Lynnes، CS; دافی، دی کیو؛ Yang, CW ارزیابی ظروف داده منبع باز برای مدیریت داده های شطرنجی بزرگ جغرافیایی. ISPRS Int. J. Geo Inf. 2018 ، 7 ، 144. [ Google Scholar ]
  8. اوبه، RO; Hsu, LS PostGIS in Action , 2nd ed.; Manning Publications Co.: Shelter Island, NY, USA, 2015. [ Google Scholar ]
  9. ژونگ، ی. هان، جی. ژانگ، تی. Fang, J. یک چارچوب ذخیره سازی و پردازش داده های مکانی توزیع شده برای WebGIS در مقیاس بزرگ. در مجموعه مقالات بیستمین کنفرانس بین المللی ژئوانفورماتیک 2012، هنگ کنگ، چین، 15 تا 17 ژوئن 2012. صص 1-7. [ Google Scholar ]
  10. اسناد پایگاه داده اوراکل. در دسترس آنلاین: https://docs.oracle.com/en/database/oracle/oracle-database/index.html (دسترسی در 4 اکتبر 2019).
  11. او، سی. Rischpater، R. داده های جغرافیایی با پایگاه داده Azure SQL. در Microsoft Mapping: Geospatial Development در ویندوز 10 با Bing Maps و C# . Apress: برکلی، کالیفرنیا، ایالات متحده آمریکا، 2015; صص 33-53. [ Google Scholar ]
  12. Microsoft SQL Server/Data Geospatial. در دسترس آنلاین: https://en.wikibooks.org/wiki/Microsoft_SQL_Server/Geospatial_Data (در 8 مه 2018 قابل دسترسی است).
  13. تانگ، EQ; مقایسه عملکرد فن، YS بین پنج پایگاه داده NoSQL. در مجموعه مقالات هفتمین کنفرانس بین المللی 2016 در محاسبات ابری و داده های بزرگ، ماکائو، چین، 16 تا 18 نوامبر 2016؛ صص 105-109. [ Google Scholar ]
  14. چنگ، بی. Guan, X. طراحی و ارزیابی چارچوب خدمات کاشی نقشه وب با همزمانی بالا بر روی یک خوشه با کارایی بالا. بین المللی J. Grid Distrib. محاسبه کنید. 2016 ، 9 ، 127-142. [ Google Scholar ] [ CrossRef ]
  15. رمضان، س. باجوا، IS; کاظمی، ر آمنا. چالش‌های ذخیره‌سازی داده‌های توزیع‌شده مبتنی بر NoSQL: مروری بر ادبیات سیستماتیک. Electronics 2019 ، 8 ، 29. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  16. اکبر، امام; پورنما، IKE; نوگروهو، اس ام اس; Hariadi, M. نقشه مبتنی بر خوشه سریع و کارآمد برای ردیابی کشتی. در مجموعه مقالات کنفرانس بین المللی 2018 مهندسی کامپیوتر، شبکه و چند رسانه ای هوشمند، سورابایا، اندونزی، 26-27 نوامبر 2018؛ ص 265-269. [ Google Scholar ]
  17. پولاکوا، م. Vitols، G. استفاده از فناوری NoSQL برای تجزیه و تحلیل داده های فضایی بدون ساختار. در تحقیق برای توسعه روستایی 2018 ; Treija, S., Skujeniece, S., Eds. دانشگاه علوم و فنون زیستی لتونی: یلگاوا، لتونی، 2018; جلد 2، ص 267–270. [ Google Scholar ]
  18. آگاروال، اس. راجان، KS تجزیه و تحلیل عملکرد MongoDB در مقابل پایگاه های داده PostGIS/PostGreSQL برای پرس و جوهای فضایی تقاطع خط و محدودیت نقطه. تف کردن Inf. Res. 2016 ، 24 ، 671-677. [ Google Scholar ] [ CrossRef ]
  19. آگاروال، اس. راجان، ک. تجزیه و تحلیل عملکرد پایگاه داده های NoSQL در مقابل SQL برای پرس و جوهای فضایی و جمعی. در مجموعه مقالات کنفرانس نرم افزار رایگان و منبع باز برای زمین فضایی (FOSS4G)، بوستون، MA، ایالات متحده آمریکا، 14 تا 19 اوت 2017. [ Google Scholar ]
  20. سیموندز، آر. واتسون، پی. Halliday, J. Antares: ذخیره‌گاه داده‌های مقیاس‌پذیر، بی‌درنگ و تحمل‌پذیر خطا برای تحلیل فضایی. در سال 2015 کنگره جهانی خدمات IEEE (SERVICES) ؛ Zhang, LJ, Bahsoon, R., Eds. IEEE: شهر نیویورک، نیویورک، ایالات متحده آمریکا، 2015؛ صص 105-112. [ Google Scholar ]
  21. امیریان، پ. بصیری، ع. Winstanley، A. ارزیابی سیستم های مدیریت داده برای داده های بزرگ جغرافیایی. در علوم محاسباتی و کاربردهای آن-ICCSA 2014 ; Springer International Publishing: Guimarães، پرتغال، 2014; صص 678-690. [ Google Scholar ]
  22. لبه، LVD; برنقی، پ. تندی، جی. اتمزینگ، جی. اتکینسون، آر. کاکرین، بی. فتحی، ی. کاسترو، آر جی. هالر، ا. هارث، ا. و همکاران بهترین روش ها برای انتشار، بازیابی و استفاده از داده های مکانی در وب. سمنت. وب 2019 ، 10 ، 95-114. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  23. بیشتر، NP; نیکام، وی بی. Sen، بررسی تجربی SS از بسترهای داده های بزرگ جغرافیایی. در مجموعه مقالات بیست و پنجمین کنفرانس بین المللی Ieee 2018 در کارگاه محاسباتی با عملکرد بالا، بنگالورو، هند، 17 تا 20 دسامبر 2018؛ صص 137-143. [ Google Scholar ]
  24. پاترومپاس، ک. جیانوپولوس، جی. Athanasiou، S. Towards GeoSpatial Semantic Data Management: قوت ها، ضعف ها و چالش های پیش رو. در مجموعه مقالات سمپوزیوم بین‌المللی ACM در مورد پیشرفت‌ها در سیستم‌های اطلاعات جغرافیایی، انجمن ماشین‌های محاسباتی، نیویورک، نیویورک، ایالات متحده آمریکا، 7 تا 10 اوت 2017؛ صص 301-310. [ Google Scholar ]
  25. کنسرسیوم، استاندارد پیاده‌سازی OG OpenGIS® برای اطلاعات جغرافیایی – دسترسی به ویژگی‌های ساده – بخش 1: معماری مشترک. در دسترس آنلاین: https://www.ogc.org/standards/sfa (در 4 دسامبر 2011 قابل دسترسی است).
  26. Egenhofer، MJ; Franzosa، روابط فضایی توپولوژیکی مجموعه نقطه RD. بین المللی جی. جئوگر. Inf. سیستم 1991 ، 5 ، 161-174. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  27. راندل، دی. کوی، ز. Cohn, AG یک منطق فضایی مبتنی بر مناطق و اتصال. در مجموعه مقالات سومین کنفرانس بین المللی اصول بازنمایی و استدلال دانش، کمبریج، MA، ایالات متحده آمریکا، 23-25 ​​اکتبر 1992; صص 165-176. [ Google Scholar ]
  28. نبرد، آر. کولاس، دی. فعال کردن وب معنایی مکانی با پارلمان و GeoSPARQL. سمنت. وب 2012 ، 3 ، 355-370. [ Google Scholar ] [ CrossRef ]
  29. کیان، سی. یی، سی. چنگ، CQ; Pu، GL; وی، ایکس اف؛ ژانگ، شاخص فضایی-زمانی مبتنی بر HC GeoSOT داده‌های مسیر عظیم. ISPRS Int. J. Geo Inf. 2019 ، 8 ، 284. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  30. رتبه بندی موتورهای DB. در دسترس آنلاین: https://db-engines.com/en/ranking (در 8 اکتبر 2019 قابل دسترسی است).
  31. بارتوشفسکی، دی. پیورکوفسکی، آ. Lupa, M. مقایسه کارایی پردازش داده‌های مکانی برای پایگاه‌های داده PostGIS و MongoDB، در پایگاه‌های فراتر. در معماری و سازه. هموار کردن مسیر پردازش و تحلیل هوشمند داده ها . Kozielski, S., Mrozek, D., Kasprowski, P., Małysiak-Mrozek, B., Kostrzewa, D., Eds. Springer: Cham، سوئیس، 2019; صص 291-302. [ Google Scholar ]
  32. Laksono، D. آزمایش تحویل داده های مکانی در پایگاه داده SQL و NoSQL با استفاده از NodeJS Fullstack Web App. در مجموعه مقالات چهارمین کنفرانس بین المللی علم و فناوری 2018، ICST 2018، یوگیاکارتا، اندونزی، 7 تا 8 اوت 2018. [ Google Scholar ]
  33. دوان، ام آر. چن، جی. ارزیابی عملکرد بازیابی فضایی MongoDB. در مجموعه مقالات بیست و سومین کنفرانس بین المللی ژئوانفورماتیک 2015، ووهان، چین، 19 تا 21 ژوئن 2015. [ Google Scholar ]
  34. بوردوگنا، جی. Ciriello، DE; Psaila، G. چارچوب انعطاف پذیر برای تجزیه و تحلیل متقابل اطلاعات چند منبع جغرافیایی ناهمگن: پیشنهاد J-CO-QL و اجرای آن. در مجموعه مقالات کنفرانس بین المللی IEEE/Wic/Acm 2017 در زمینه هوش وب، انجمن ماشین های محاسباتی، لایپزیگ، آلمان، 23 تا 26 اوت 2017؛ صص 499-508. [ Google Scholar ]
  35. دتی، ا. روسی، جی. Melazzi، NB بهره برداری از شبکه اطلاعات محور برای فدرال پایگاه داده های فضایی. دسترسی IEEE 2019 ، 7 ، 165248–165261. [ Google Scholar ] [ CrossRef ]
  36. Krämer, M. GeoRocket: یک فروشگاه داده مقیاس پذیر و مبتنی بر ابر برای فایل های بزرگ مکانی. SoftwareX 2020 , 11 , 100409. [ Google Scholar ] [ CrossRef ]
  37. Rainho، FD; Bernardino, J. Web GIS: یک سیستم جدید برای ذخیره داده های مکانی با استفاده از GeoJSON در MongoDB. در مجموعه مقالات سیزدهمین کنفرانس ایبری 2018 در مورد سیستم‌های اطلاعاتی و فناوری‌ها، کاسرس، اسپانیا، 13 تا 16 ژوئن 2018. [ Google Scholar ]
  38. یاقوت، م. Trigunarsyah, B. Web-GIS برای پشتیبانی از سیستم گزارش دهی تعمیر و نگهداری: کاربرد در عربستان سعودی. زیرساخت. مدیریت دارایی 2018 ، 5 ، 14-21. [ Google Scholar ] [ CrossRef ]
  39. ژانگ، XM؛ آهنگ، دبلیو. لیو، LM یک رویکرد پیاده سازی برای ذخیره داده های مکانی GIS در پایگاه داده NoSQL. در مجموعه مقالات بیست و دومین کنفرانس بین المللی ژئوانفورماتیک 2014، کائوسیونگ، تایوان، 25 تا 27 ژوئیه 2014. [ Google Scholar ]
  40. ژائو، سی ایکس؛ وو، ق. تائو، YC; گائو، WC; لیو، جی. طراحی و اجرای پلت فرم چارچوب جغرافیایی بنیادی پکن. در مجموعه مقالات آرشیو بین المللی فتوگرامتری، سنجش از دور و علوم اطلاعات فضایی، سوژو، چین، 14 تا 16 مه 2014. [ Google Scholar ]
  41. فرو، م. فراگوسو، آر. فیدالگو، آر. انبار داده های مکانی مبتنی بر سند: ارزیابی تجربی پرس و جوهای SOLAP. در مجموعه مقالات بیست و یکمین کنفرانس IEEE در انفورماتیک تجاری، CBI 2019، مسکو، روسیه، 15 تا 17 ژوئیه 2019. [ Google Scholar ]
  42. فرو، م. لیما، آر. Fidalgo, R. ارزیابی افزونگی و پارتیشن بندی داده های مکانی در انبارهای داده مدار مدار. در یادداشت های سخنرانی در علوم کامپیوتر (از جمله یادداشت های سخنرانی های فرعی در هوش مصنوعی و یادداشت های سخنرانی در بیوانفورماتیک) ؛ Springer: Geneve, Switzerland, 2019; ص 221-235. [ Google Scholar ]
  43. جون، اس. لی، اس. سیستم نمونه اولیه برای به اشتراک گذاری ساختمان داده های مکانی با استفاده از فناوری وب منبع باز توسعه یافته است. تف کردن Inf. Res. 2017 ، 25 ، 725-733. [ Google Scholar ] [ CrossRef ]
  44. شیانگ، ال جی؛ شائو، XT; Wang، DH ارائه پشتیبانی R-Tree برای MongoDB. ISPRS Int. قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2016 ، XLI-B4 ، 545–549. [ Google Scholar ] [ CrossRef ]
  45. لی، ی. کیم، دی. روش شاخص فضایی شین، BS Geohashed برای یک سیستم نظارت بر داده های WBAN با موقعیت مکانی مبتنی بر NoSQL. J. Inf. روند. سیستم 2016 ، 12 ، 263-274. [ Google Scholar ]
  46. شیانگ، ال جی؛ هوانگ، جی تی. شائو، XT; Wang، DH مدیریت داده‌های فضایی مسطح مبتنی بر MongoDB با درخت R مسطح. ISPRS Int. J. Geo Inf. 2016 ، 5 ، 119. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  47. Guan، XF; بو، سی. لی، ZQ; Yu، YJ ST-Hash: یک شاخص فضایی و زمانی کارآمد برای داده های مسیر عظیم در یک پایگاه داده NoSQL. در مجموعه مقالات بیست و پنجمین کنفرانس بین المللی ژئوانفورماتیک ۲۰۱۷، بوفالو، نیویورک، ایالات متحده آمریکا، ۲ تا ۴ اوت ۲۰۱۷. [ Google Scholar ]
  48. چرا Couchbase؟ در دسترس آنلاین: https://docs.couchbase.com/server/6.0/introduction/intro.html (دسترسی در 10 ژوئن 2019).
  49. ارزش های فضایی در دسترس به صورت آنلاین: https://neo4j.com/docs/cypher-manual/3.5/syntax/spatial/ (در 2 سپتامبر 2019 قابل دسترسی است).
  50. Neo4j Spatial v0.24-neo4j-3.1.4. در دسترس آنلاین: https://neo4j-contrib.github.io/spatial/0.24-neo4j-3.1/index.html (در 1 ژوئن 2017 قابل دسترسی است).
  51. سروات، م. Sun، YH; IEEE. پاسخگویی به پرس و جوهای قابلیت دسترسی به گراف آگاه از موقعیت مکانی در داده های جغرافیایی اجتماعی. در مجموعه مقالات سی و سومین کنفرانس بین المللی مهندسی داده IEEE 2017، سن دیگو، کالیفرنیا، ایالات متحده آمریکا، 19 تا 22 آوریل 2017؛ ص 207-210. [ Google Scholar ]
  52. Sun، YH; Sarwat، M. یک عملگر گسترش راس فضایی هرس شده در سیستم پایگاه داده گراف Neo4j. Geoinformatica 2019 ، 23 ، 397–423. [ Google Scholar ] [ CrossRef ]
  53. باکال، اف. ساواس، NS; ایکن، س. سیار، الف. مدلسازی و پرس و جو مسیرها با استفاده از Neo4j Spatial و TimeTree برای تطبیق Carpool. در مجموعه مقالات کنفرانس بین المللی Ieee 2017 در مورد نوآوری ها در سیستم ها و برنامه های هوشمند، Gdynia، لهستان، 3 تا 5 ژوئیه 2017؛ ص 219-222. [ Google Scholar ]
  54. Idziaszek، P. مولر، دبلیو. گورنا، ک. اوکان، پی. بونیکی، پی. کوزیلا، ک. فوجود، الف. شناسایی وضعیت محصولات زراعی بر اساس داده های مکانی جاسازی شده در پایگاه داده های گراف. در مجموعه مقالات نهمین کنفرانس بین المللی پردازش تصویر دیجیتال، هنگ کنگ، چین، 19 تا 22 مه 2017. [ Google Scholar ]
  55. مولر، دبلیو. رودویچ-ناوروکا، ج. اوترزاسک، جی. Idziaszek، P. Weres, J. داده های فضایی و پایگاه های نموداری برای شناسایی روابط بین اعضای گله گاو. آگاه کردن. Geoinf. سنسور از راه دور Conf. Proc. Sgem 2016 ، 1 ، 835-842. [ Google Scholar ]
  56. بن براهیم، ​​م. دریرا، دبلیو. فیلالی، ف. حمدی، N. پسوند داده های فضایی برای پایگاه داده NoSQL Cassandra. J. Big Data 2016 , 3 , 11. [ Google Scholar ] [ CrossRef ]
  57. Nidzwetzki، JK; Guting، RH Distributed SECONDO: یک سیستم بسیار در دسترس و مقیاس پذیر برای پردازش داده های مکانی. در پیشرفت در پایگاه داده های مکانی و زمانی ; Claraunt, C., Schneider, M., Wong, RC-W., Xiong, L., Loh, W.-K., Shahabi, C., Li, KJ, Eds. Springer: Genève, Switzerland, 2015; ص 491-496. [ Google Scholar ]
  58. Nidzwetzki، JK; Guting، RH DISTRIBUTED SECONDO: یک سیستم مدیریت پایگاه داده قابل توسعه و مقیاس پذیر. توزیع کنید. پایگاه های داده موازی 2017 ، 35 ، 197-248. [ Google Scholar ] [ CrossRef ]
  59. واساوی، س. پریا نماینده مجلس Gokhale، چارچوب AA برای پردازش پرس و جوی مکانی با ادغام cassandra با هادوپ. در محاسبات دانش و کاربردهای آن: روش های دستکاری و پردازش دانش: جلد 1 ; Springer: سنگاپور، 2018; صص 131-160. [ Google Scholar ]
  60. شاه، پ. Chaudhary, S. چارچوب تجزیه و تحلیل داده های بزرگ برای داده های مکانی. در یادداشت های سخنرانی در علوم کامپیوتر (از جمله یادداشت های سخنرانی های فرعی در هوش مصنوعی و یادداشت های سخنرانی در بیوانفورماتیک) ؛ Springer: Geneve, Switzerland, 2018; ص 250-265. [ Google Scholar ]
  61. وب سایت Spark-Cassandra-Connector. در دسترس آنلاین: https://github.com/datastax/spark-cassandra-connector (در 4 ژانویه 2020 قابل دسترسی است).
  62. راهنمای مرجع Apache HBase™. در دسترس آنلاین: https://hbase.apache.org/book.html (در 16 آوریل 2020 قابل دسترسی است).
  63. Le، HV; تاکاسو، A. G-HBase: یک پایگاه داده جغرافیایی با کارایی بالا بر اساس HBase. Ieice Trans. Inf. سیستم 2018 ، 101 ، 1053-1065. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  64. هان، دی. Stroulia، E. HGrid: یک مدل داده برای مجموعه داده های جغرافیایی بزرگ در HBase. در مجموعه مقالات ششمین کنفرانس بین المللی IEEE در سال 2013 در محاسبات ابری، سانتا کلارا، کالیفرنیا، ایالات متحده آمریکا، 28 ژوئن تا 3 ژوئیه 2013. ص 910-917. [ Google Scholar ]
  65. هان، دی. Stroulia، E. فدراسيون برنامه‌هاي تحت وب در ابر سلسله مراتبي. در مجموعه مقالات هفتمین کنفرانس بین المللی IEEE در سال 2014 در محاسبات ابری، انکوریج، AK، ایالات متحده آمریکا، 27 ژوئن تا 2 ژوئیه 2014. IEEE: Anchorage, AK, USA, 2014; ص 946-947. [ Google Scholar ]
  66. ژانگ، نیویورک؛ ژنگ، جی.زی. چن، اچ جی. چن، جی. Chen, X. HBaseSpatial: ذخیره‌سازی داده‌های فضایی مقیاس‌پذیر بر اساس HBase. در مجموعه مقالات سیزدهمین کنفرانس بین المللی IEEE 2014 در مورد اعتماد، امنیت و حریم خصوصی در محاسبات و ارتباطات، پکن، چین، 24 تا 26 سپتامبر 2014. صص 644-651. [ Google Scholar ]
  67. وانگ، ی. لی، سی جی; لی، ام. طرحواره های ذخیره سازی Liu، ZL HBase برای داده های برداری فضایی عظیم. خوشه. محاسبه کنید. J. Netw. نرم افزار ابزارهای کاربردی 2017 ، 20 ، 3657–3666. [ Google Scholar ] [ CrossRef ]
  68. کار.؛ یونگ، S. روش نمایه سازی درخت مستطیل محدود مبتنی بر ربع برای جستارهای تشابه بر روی داده های فضایی بزرگ در HBase. Sensors 2018 , 18 , 3032. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  69. او، SW; چو، LX؛ Li، XY پردازش پرس و جو فضایی برای برنامه مبتنی بر مکان در Hbase. در مجموعه مقالات دومین کنفرانس بین المللی IEEE 2017 در مورد تجزیه و تحلیل داده های بزرگ، پکن، چین، 10 تا 12 مارس 2017؛ صص 115-119. [ Google Scholar ]
  70. چن، XY; ژانگ، سی. جی، بی. Xiao، WD Spatio-Temporal Queries در HBase. در مجموعه مقالات کنفرانس بین المللی IEEE 2015 در مورد داده های بزرگ، سانتا کلارا، کالیفرنیا، ایالات متحده، 29 اکتبر تا 1 نوامبر 2015؛ صفحات 1929-1937. [ Google Scholar ]
  71. لی، LH; لیو، WD; ژونگ، زی؛ Huang، CQ SP-Phoenix: یک سیستم مدیریت داده های نقطه ای عظیم مبتنی بر فونیکس. در مجموعه مقالات بیستمین کنفرانس بین المللی IEEE برای محاسبات و ارتباطات با عملکرد بالا/ شانزدهمین کنفرانس بین المللی شهر هوشمند/IEEE چهارمین کنفرانس بین المللی علم و سیستم های داده، اکستر، بریتانیا، 28 تا 30 ژوئن 2018؛ صفحات 1634-1641. [ Google Scholar ]
  72. شانگگوان، بی. یو، پی. وو، زی. جیانگ، ال. پردازش داده های فضایی بزرگ با اسپارک آپاچی. در مجموعه مقالات ششمین کنفرانس بین المللی 2017 در Agro-Geoinformatics، Agro-Geoinformatics، Fairfax، VA، ایالات متحده آمریکا، 7 تا 10 اوت 2017. [ Google Scholar ]
  73. ژنگ، ک. ژنگ، ک. Fang، FL; ژانگ، ام. لی، کیو. وانگ، YH; Zhao، WY یک طرح سلسله مراتبی فضایی اضافی در ذخیره کلید-مقدار. خوشه. محاسبه کنید. J. Netw. نرم افزار ابزارهای کاربردی 2019 ، 22 ، S6483–S6497. [ Google Scholar ] [ CrossRef ]
  74. GeoMesa: ذخیره، فهرست، پرس و جو، و تبدیل داده های فضایی-زمانی در مقیاس در HBase، Accumulo، Cassandra، Kafka و Spark. در دسترس آنلاین: https://www.geomesa.org/index.html (در 16 اوت 2018 قابل دسترسی است).
  75. چو، دبلیو. چوی، ای. مبنای تحلیل داده های بزرگ فضایی با سیستم تطبیق نقشه. خوشه. محاسبه کنید. J. Netw. نرم افزار ابزارهای کاربردی 2017 ، 20 ، 2177–2192. [ Google Scholar ] [ CrossRef ]
  76. گائو، اف. یو، پی. وو، زی. Zhang، M. ذخیره سازی داده های جغرافیایی بر اساس HBase و MapReduce. در مجموعه مقالات ششمین کنفرانس بین المللی 2017 در زمینه آگرو-ژئوانفورماتیک، فیرفکس، VA، ایالات متحده آمریکا، 7 تا 10 اوت 2017; صص 55-58. [ Google Scholar ]
  77. آموزش MapReduce. در دسترس آنلاین: https://hadoop.apache.org/docs/r1.2.1/mapred_tutorial.html (در 22 آگوست 2019 قابل دسترسی است).
  78. Du، NB; ژان، جی اف. ژائو، ام. شیائو، DR; Xie، مدل شاخص داده مکانی-زمانی YC از اجسام متحرک در شبکه های ثابت با استفاده از HBase. در مجموعه مقالات کنفرانس بین المللی Ieee در سال 2015 در زمینه هوش محاسباتی و فناوری ارتباطات، 2015، قاضی آباد، هند، 13 تا 14 فوریه 2015; صص 247-251. [ Google Scholar ]
  79. کار.؛ Jung، S. تکنیک نمایه سازی MBR-Tree مبتنی بر ربع برای جستجوی محدوده از طریق HBase. در مجموعه مقالات هفتمین کنفرانس بین المللی پایگاه های داده در حال ظهور: فناوری ها، کاربردها و نظریه، بوسان، کره، 7 تا 9 اوت 2017؛ Lee, W., Choi, W., Jung, S., Song, M., Eds. Springer: سنگاپور، 2018; ص 14-24. [ Google Scholar ]
  80. وان، LH; تاکاسو، A. یک شاخص توزیع شده کارآمد برای پایگاه‌های داده مکانی. در مجموعه مقالات کنفرانس بین المللی پایگاه داده و برنامه های کاربردی سیستم های خبره، والنسیا، اسپانیا، 1 تا 4 سپتامبر 2015. ص 28-42. [ Google Scholar ]
  81. ژای، WX; یانگ، ز. وانگ، ال. وو، فلوریدا؛ Cheng، CQ مدل مدیریت داده های مکانی غیر sql در زمان کلان داده. در مجموعه مقالات سمپوزیوم بین المللی زمین شناسی و سنجش از دور IEEE 2015، میلان، ایتالیا، 26 تا 31 ژوئیه 2015. ص 4506-4509. [ Google Scholar ]
  82. وانگ، ک. لیو، جی ال. ژای، م. وانگ، ZW; Zhou، CY ساخت یک مدل ذخیره سازی کارآمد از اطلاعات مکانی-زمانی بر اساس HBase. جی. اسپات. علمی 2019 ، 64 ، 301-317. [ Google Scholar ] [ CrossRef ]
  83. ژانگ، دی اف. وانگ، ی. لیو، ZL; Dai, SJ بهبود طرح واره ذخیره سازی NoSQL بر اساس منحنی Z برای داده های برداری فضایی. دسترسی IEEE 2019 ، 7 ، 78817–78829. [ Google Scholar ] [ CrossRef ]
  84. ژنگ، ک. گو، دی. نیش، اف. ژانگ، ام. ژنگ، ک. لی، کیو. استراتژی بهینه سازی ذخیره سازی داده ها در پایگاه داده ستون محور توزیع شده با در نظر گرفتن مجاورت فضایی. خوشه. محاسبه کنید. J. Netw. نرم افزار ابزارهای کاربردی 2017 ، 20 ، 2833-2844. [ Google Scholar ] [ CrossRef ]
  85. توماس، جی. الکساندر، جی. Sasi، PM طراحی نقشه مبتنی بر خوشه با کارایی بالا برای ردیابی وسایل نقلیه وسایل نقلیه حمل و نقل عمومی در شهر هوشمند. در مجموعه مقالات سمپوزیوم بین المللی IEEE منطقه 10 در سال 2017 در زمینه فناوری برای شهرهای هوشمند، کوچین، هند، 14 تا 16 ژوئیه 2017. [ Google Scholar ]
  86. بارتلت، آر. ذخیره و پرس و جو اطلاعات جغرافیایی محلی با استفاده از elasticsearch. در مجموعه مقالات سیزدهمین کارگاه در مورد بازیابی اطلاعات جغرافیایی، لیون، فرانسه، 28 تا 29 نوامبر 2019. [ Google Scholar ]
  87. Toepke، SL از جستجوی elastics و botometer برای کشف اطلاعات جغرافیایی داوطلبانه استفاده می کند. در مجموعه مقالات کنفرانس بین المللی ISCRAM، روچستر، نیویورک، ایالات متحده آمریکا، 20 تا 23 مه 2018. [ Google Scholar ]
  88. Cinquini، L. کرایتون، دی. متمن، سی. هارنی، جی. شیپمن، جی. وانگ، FY; آنانتاکریشنان، ر. میلر، ن. دنویل، اس. مورگان، ام. و همکاران فدراسیون شبکه سیستم زمین: یک زیرساخت باز برای دسترسی به داده های جغرافیایی توزیع شده. ژنرال آینده. محاسبه کنید. سیستم بین المللی J. Grid Comput. علوم 2014 ، 36 ، 400-417 . [ Google Scholar ] [ CrossRef ]
  89. فلورانس، پی. مک گی، ام. بارنت، سی. مک دونالد، اس. فدراسیون ژئوپورتال باز. J. Map Geogr. Libr 2015 ، 11 ، 376-394. [ Google Scholar ] [ CrossRef ]
  90. کورتی، پی. کرالیدیس، AT; لوئیس، ب. افزایش کشف در زیرساخت های داده های مکانی با استفاده از موتور جستجو. Peerj Comput. علمی 2018 ، 4 ، e152. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  91. Celko, J. راهنمای کامل NoSQL، آنچه که هر حرفه ای SQL باید در مورد پایگاه داده های غیر رابطه ای بداند . مورگان کافمن: بوستون، MA، ایالات متحده آمریکا، 2014; صص 103-117. [ Google Scholar ]
  92. شارما، م. شارما، وی دی. Bundele، MM تجزیه و تحلیل عملکرد پایگاه های داده RDBMS و بدون SQL: PostgreSQL، MongoDB و Neo4j. در مجموعه مقالات سومین کنفرانس بین‌المللی و کارگاه‌های آموزشی در مورد پیشرفت‌ها و نوآوری‌های اخیر در مهندسی، ICRAIE 2018، جیپور، هند، 22 تا 25 نوامبر 2018. [ Google Scholar ]
  93. وانگ، ال. چن، بی. Liu، YH ذخیره‌سازی توزیع‌شده و فهرست داده‌های فضایی برداری بر اساس HBase. در مجموعه مقالات بیست و یکمین کنفرانس بین المللی ژئوانفورماتیک 2013، کایفنگ، چین، 20 تا 22 ژوئن 2013. [ Google Scholar ]
  94. جیانگ، اچ. کانگ، جی اف. Du، ZH; ژانگ، اف. هوانگ، XZ; لیو، RY؛ Zhang، XT ذخیره‌سازی کلان داده‌های فضایی بردار و پرس‌وجو بهینه‌شده بر اساس شاخص شبکه چند سطحی هیلبرت در HBase. اطلاعات 2018 ، 9 ، 116. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  95. ژانگ، HC; لو، اف. Chen, J. یک روش پرس‌وجو دامنه پیوسته مبتنی بر نمودار خطی برای حرکت اجسام در شبکه‌ها. ISPRS Int. J. Geo Inf. 2016 ، 5 ، 246. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  96. Ahn، JS; سئو، سی. مایورام، آر. یاسین، ر. کیم، جی اس؛ Maeng، S. ForestDB: یک سیستم ذخیره سازی سریع کلید-مقدار برای کلیدهای رشته ای با طول متغیر. IEEE Trans. محاسبه کنید. 2016 ، 65 ، 902-915. [ Google Scholar ] [ CrossRef ]

بدون دیدگاه

دیدگاهتان را بنویسید