پردازش اطلاعات مکانی پیشرفته در پایگاه های داده NoSQL
خلاصه
اطلاعات مکانی برای بسیاری از زمینه های کاربردی، از جمله برنامه ریزی ترافیک، برنامه ریزی شهری و مدیریت انرژی ضروری بوده است. دادههای مکانی عمدتاً در پایگاههای داده رابطهای ذخیره میشوند که در طی چندین دهه توسعه یافتهاند و بیشتر برنامههای اطلاعات جغرافیایی برنامههای دسکتاپ هستند. با ورود کلان داده ها، برنامه های اطلاعات مکانی نیز در حال تغییر هستند، به عنوان مثال، پلتفرم های تلفن همراه و سرویس های وب جغرافیایی، که نیاز به طرح های داده قابل تغییر، زمان پاسخ پرس و جو سریع تر و مقیاس پذیری انعطاف پذیرتری نسبت به پایگاه داده های رابطه ای فضایی سنتی در حال حاضر دارند. برای پاسخ به این نیازهای جدید، پایگاههای داده NoSQL (نه فقط SQL) اکنون برای ذخیرهسازی، مدیریت و پرس و جو دادههای جغرافیایی استفاده میشوند. این مقاله به بررسی پیشرفته ترین پردازش داده های مکانی در 10 پایگاه داده محبوب NoSQL می پردازد. ما اشیاء هندسه پشتیبانی شده، توابع هندسه اصلی، نمایه های فضایی، زبان های پرس و جو و قالب های داده این 10 پایگاه داده NoSQL را خلاصه می کنیم.
علاوه بر این، مزایا و معایب این پایگاههای داده NoSQL از نظر پردازش دادههای مکانی تحلیل میشوند. بررسی و تجزیه و تحلیل ادبیات نشان داد که پایگاههای داده اسناد کنونی ممکن است برای پردازش دادههای مکانی عظیم نسبت به سایر پایگاههای داده NoSQL به دلیل پشتیبانی جامع از اشیاء هندسی و قالبهای داده و عملکرد، توابع جغرافیایی، روشهای شاخص و توسعه دانشگاهی مناسبتر باشند. با این حال، بسته به سناریوهای برنامه، پایگاه های داده گراف، پایگاه داده های کلید-مقدار و ستون های گسترده مزایای خاص خود را دارند. نمایه های فضایی، زبان های پرس و جو و قالب های داده این 10 پایگاه داده NoSQL. علاوه بر این، مزایا و معایب این پایگاههای داده NoSQL از نظر پردازش دادههای مکانی تحلیل میشوند. بررسی و تجزیه و تحلیل ادبیات نشان داد که پایگاههای داده اسناد کنونی ممکن است برای پردازش دادههای مکانی عظیم نسبت به سایر پایگاههای داده NoSQL به دلیل پشتیبانی جامع از اشیاء هندسی و قالبهای داده و عملکرد، توابع جغرافیایی، روشهای شاخص و توسعه دانشگاهی مناسبتر باشند. با این حال، بسته به سناریوهای برنامه، پایگاه های داده گراف، پایگاه داده های کلید-مقدار و ستون های گسترده مزایای خاص خود را دارند. نمایه های فضایی، زبان های پرس و جو و قالب های داده این 10 پایگاه داده NoSQL. علاوه بر این، مزایا و معایب این پایگاههای داده NoSQL از نظر پردازش دادههای مکانی تحلیل میشوند. بررسی و تجزیه و تحلیل ادبیات نشان داد که پایگاههای داده اسناد کنونی ممکن است برای پردازش دادههای مکانی عظیم نسبت به سایر پایگاههای داده NoSQL به دلیل پشتیبانی جامع از اشیاء هندسی و قالبهای داده و عملکرد، توابع جغرافیایی، روشهای شاخص و توسعه دانشگاهی مناسبتر باشند. با این حال، بسته به سناریوهای برنامه، پایگاه های داده گراف، پایگاه داده های کلید-مقدار و ستون های گسترده مزایای خاص خود را دارند. بررسی و تجزیه و تحلیل ادبیات نشان داد که پایگاههای داده اسناد کنونی ممکن است برای پردازش دادههای مکانی عظیم نسبت به سایر پایگاههای داده NoSQL به دلیل پشتیبانی جامع از اشیاء هندسی و قالبهای داده و عملکرد، توابع جغرافیایی، روشهای شاخص و توسعه دانشگاهی مناسبتر باشند. با این حال، بسته به سناریوهای برنامه، پایگاه های داده گراف، پایگاه داده های کلید-مقدار و ستون های گسترده مزایای خاص خود را دارند. بررسی و تجزیه و تحلیل ادبیات نشان داد که پایگاههای داده اسناد کنونی ممکن است برای پردازش دادههای مکانی عظیم نسبت به سایر پایگاههای داده NoSQL به دلیل پشتیبانی جامع از اشیاء هندسی و قالبهای داده و عملکرد، توابع جغرافیایی، روشهای شاخص و توسعه دانشگاهی مناسبتر باشند. با این حال، بسته به سناریوهای برنامه، پایگاه های داده گراف، پایگاه داده های کلید-مقدار و ستون های گسترده مزایای خاص خود را دارند.
کلید واژه ها:
داده های جغرافیایی ؛ پایگاه های داده NoSQL ; شاخص فضایی ; توابع جغرافیایی ; مدل های داده
1. معرفی
پیشبینی میشود که میزان دادههای موقعیت مکانی شخصی هر سال 20% افزایش یابد، و اطلاعات مربوط به مکان بخش بزرگی از دادههای تولید شده هر روز را اشغال میکند: 2.5 کوئینتیلیون بایت [ 1 ، 2 ]. ظهور عصر داده های بزرگ جغرافیایی نیازمند برنامه های کاربردی جدید و ایجاد چالش های جدید است [ 3 ، 4 ]. نحوه ذخیره، مدیریت و پرس و جو از داده های جغرافیایی به طور موثر به کانون پژوهش تبدیل شده است و مشکلاتی هستند که باید حل شوند [ 3 ، 5 ، 6 ، 7]. در حال حاضر پایگاه های اصلی جغرافیایی به دو نوع پایگاه داده رابطه ای و پایگاه داده NoSQL تقسیم می شوند. پایگاه داده های رابطه ای پرکاربردترین و بالغ ترین سیستم های پایگاه داده هستند و دهه هاست که در صنایع مختلف کاربرد دارند. برای غنیسازی توابع جغرافیایی و قابلیت پردازش جغرافیایی، برخی پایگاههای اطلاعاتی رابطهای مدرن تغییرات و بهروزرسانیهایی را ایجاد کردهاند. نمونه هایی از پایگاه داده های رابطه ای برای اطلاعات جغرافیایی عبارتند از PostGIS [ 8 ]، WebGIS [ 9 ]، Oracle 19c [ 10 ]، پایگاه داده Microsoft Azure SQL [ 11 ] و SQL Server [ 12 ].]. این پایگاههای اطلاعاتی رابطهای میتوانند اشیاء مکانی را تعریف کنند، از انواع دادههای مکانی اصلی (برای هندسه) پشتیبانی کنند و شاخصهای مختلفی را برای پرسوجوهای سریع فضایی (درخت باینری در SQL Server، درخت دودویی، R-Trees و درخت جستجوی تعمیمیافته در PostGIS) اتخاذ کنند. علاوه بر این، بیشتر برنامههایی که از پایگاههای داده رابطهای فضایی استفاده میکنند، سیستمهای دسکتاپ (مانند ArcGIS) یا دارای نرمافزار سرور نقشه (مانند GeoServer) هستند. پایگاه داده های رابطه ای سنتی طرحواره های ساختار/داده ثابت را اتخاذ می کنند و مقیاس پذیری آنها محدود است.
پایگاه داده های NoSQL سیستم های پایگاه داده توزیع شده عمومی هستند، که ممکن است به داده های ساختاریافته نیاز نداشته باشند، معمولاً برای مقیاس بندی افقی طراحی شده اند و ممکن است منبع باز باشند [ 5 ، 13 ]. برای مقیاسپذیری افقی، پایگاههای داده NoSQL ویژگیهای استاندارد ACID (اتمی، سازگاری، جداسازی و دوام) را که توسط پایگاههای اطلاعاتی رابطهای ارائه میشوند، ارائه نمیکنند. با این حال، پایگاههای داده NoSQL توانایی ذخیره، مدیریت و فهرستبندی مجموعه دادههای بزرگ دلخواه را نشان میدهند در حالی که از تعداد زیادی درخواست همزمان کاربر پشتیبانی میکنند [ 14 ]. در حال حاضر، پایگاه های داده NoSQL در حال حاضر به طور گسترده در زمینه های کاربردی مختلف استفاده می شود [ 4 ، 15 ، 16 ، 17 ].
با توسعه ارتباطات سیار، اینترنت اشیا و فناوری های دسترسی به شبکه پرسرعت، نیاز به برنامه های کاربردی اطلاعات جغرافیایی برای خدمات تلفن همراه و خدمات وب به طور فزاینده ای قوی شده است [ 2 ، 3 ، 4 ]]. کاربردهای جدید زمین فضایی به طرح واره داده های انعطاف پذیرتر، زمان پاسخ پرس و جو نسبتاً سریع و مقیاس پذیری بیشتر نسبت به پایگاه داده های رابطه ای فضایی سنتی در حال حاضر نیاز دارند. به عنوان مثال، هنگامی که درخواستهای پخش جریانی از مشتریان به سرورها به طور ناگهانی افزایش مییابد، ممکن است باعث تأخیر قابل توجهی در پاسخ و عدم دسترسی به سرویس شود. برای حل این مشکل مقیاسپذیری، یک چارچوب مقیاسپذیر بر اساس MongoDB برای پیادهسازی استقرار الاستیک برای به اشتراکگذاری اطلاعات مکانی با کاربران مشتری که تعدادشان در حال افزایش است، پیشنهاد شد [ 14 ]. در این چارچوب، MongoDB انتخاب شده است زیرا یک پایگاه داده توزیع شده است و از یک طرح ذخیره سازی انعطاف پذیر مناسب برای ذخیره سازی عظیم کاشی نقشه [ 14 ] پشتیبانی می کند.
چندین مطالعه نشان دادهاند که سیستمهای مدیریت پایگاهداده رابطهای (RDBMS) از نظر ذخیرهسازی کلان داده و پرسوجوها در برخی مناطق خاص، مانند محیطهای دسترسی همزمان به داده بالا یا مقیاس بزرگ در برنامههای مکانی، دارای معایبی هستند [ 4 ، 5 ]. در یک مقایسه کیفی آزمایشها، مشخص شد که پایگاههای اطلاعاتی اسناد زمانهای پاسخ و پرسوجوهای تقاطع خطوط سریعتر از پایگاههای داده SQL دارند، زمانی که تعداد رکوردها در پایگاههای داده زیاد است [ 5 ، 18 ]. مطالعات دیگر نشان دادهاند که پایگاههای داده NoSQL نسبت به پایگاههای داده رابطهای مزایای بیشتری در پردازش دادههای مکانی دارند [ 6 ]]. در آزمایش بیشترین استفاده از توابع پرس و جوی فضایی در پایگاههای داده مختلف، پایگاههای داده NoSQL بهتر از پایگاههای داده رابطهای، به ویژه mobile-GIS و Web-GIS عمل کردند [ 18 ، 19 ]. در حال حاضر، بیشتر پایگاههای داده NoSQL بهخوبی برای دادههای مکانی طراحی نشدهاند [ 6 ، 20 ]. یکی از آشکارترین کاستیهای پایگاههای داده NoSQL از نظر دادههای مکانی این است که پایگاههای اطلاعاتی NoSQL فقط عملکردهای فضایی اولیه دارند، بسیار کمتر از پایگاههای داده رابطهای [ 6 ].]. خوشبختانه، تحقیق روی پایگاههای داده NoSQL حوزهای رو به رشد است که توجه بیشتر و بیشتر شرکتها و دانشگاهیان را به خود جلب میکند و پیشرفتها و نوآوریها به سرعت پدیدار شدهاند. علاوه بر این، برخی از پایگاه های داده NoSQL دارای برخی عملکردهای فضایی و شاخص های فضایی هستند [ 18 ، 21 ]. در سالهای اخیر، برخی از مقالات دانشگاهی کاربردهای پایگاههای دادههای SQL و NoSQL را در زمینههای دادههای جغرافیایی خلاصه و تحلیل کردهاند، از جمله یک مطالعه درباره دادههای بزرگ جغرافیایی [ 3 ]، خلاصهای از بهترین شیوهها برای انتشار دادههای مکانی در وب [ 22 ]. ، یک مقایسه تجربی بین دو پلت فرم داده های مکانی [ 19 ، 23]، مقایسه بین پایگاه های داده رابطه ای و پایگاه های داده NoSQL در کاربردهای مکانی [ 5 ، 18 ]، و مطالعه ای بر روی مدیریت داده های معنایی مکانی [ 24 ]. با این حال، تحلیل های جامع کمی از پیشرفته ترین پردازش داده های جغرافیایی در پایگاه های داده محبوب NoSQL وجود دارد.
برای تشریح پیشرفتهترین پردازش دادههای جغرافیایی در پایگاههای داده محبوب NoSQL، در این مقاله، ابتدا ویژگیهای دادههای مکانی و مفاهیم مرتبط را معرفی میکنیم و سپس به بررسی پیشرفتهترین پردازش دادههای جغرافیایی در 10 محبوبترین دادهها میپردازیم. پایگاه های داده NoSQL علاوه بر این، ما مزایا و معایب این پایگاههای داده NoSQL را برای پردازش دادههای مکانی تحلیل میکنیم. ساختار کاغذ به شرح زیر است. بخش 2 ویژگی های داده های مکانی و مفاهیم مرتبط را معرفی می کند. بخش 3 روش تحقیق اتخاذ شده برای این مقاله را معرفی می کند. پردازش مکانی پیشرفته در پایگاه های داده NoSQL در بخش 4 ارائه شده است . بخش 5عملکرد پایگاه داده های مختلف NoSQL را از نظر ذخیره سازی داده های مکانی و پرس و جوها مقایسه می کند. بخش 6 شامل یک نتیجه گیری کوتاه است.
2. ویژگی های داده های جغرافیایی و مفاهیم مرتبط
قبل از بحث در مورد پردازش دادههای مکانی، در اینجا مفاهیم پایه و ویژگیهای زمین فضایی علم زمین فضایی را معرفی میکنیم.
به طور کلی، دو روش اصلی برای نمایش داده های مکانی وجود دارد: داده های شطرنجی و برداری.
-
دادههای شطرنجی از ماتریسی از سلولها (دانه یا پیکسل) تشکیل شدهاند که در آن یک سلول دارای یک مقدار مرتبط است که اطلاعاتی را نشان میدهد، مانند مقدار روشنایی یا دما، و در ردیفها و ستونها (یا یک شبکه) مرتب شدهاند.
-
داده های برداری از نقاط منفرد تشکیل شده است که به صورت جفت ( x، y ) در موارد دو بعدی یا ( x، y، z ) در موارد سه بعدی ذخیره می شوند. نقاط از طریق دستورات/قوانین خاصی برای ایجاد خطوط، چندضلعی ها، سطوح و جامدات به هم متصل می شوند. در این مقاله بیشتر بحث ها به داده های برداری اشاره دارد.
ویژگی ها و هندسه ها دو مفهوم اساسی اصلی هستند. یک ویژگی می تواند هر شیئی با موقعیت مکانی مشخص باشد، مانند فرودگاه یا کوه.
-
طبق ISO 19109:2015، یک ویژگی به عنوان “انتزاع پدیده های دنیای واقعی” تعریف می شود. ویژگیها ممکن است دارای ویژگیهایی باشند، بهعنوان مثال، ویژگیهای فضایی که مکان/وسعت ویژگی را نشان میدهند، ویژگیهای موضوعی که ویژگیهای توصیفی ویژگی را ارائه میدهند، و همچنین انواع دیگری از ویژگیها، مانند فراداده/کیفیت.
-
هندسه هر شکل هندسی است که بتواند ویژگی فضایی یک ویژگی را نشان دهد، مانند یک نقطه (0D)، خط (1D)، چندضلعی/سطح (2D)، یا جامد/حجم (3D). هندسه ها را می توان در فضای 1 بعدی، فضای 2 بعدی یا فضای سه بعدی جاسازی کرد. بعد هندسه باید کوچکتر یا مساوی با بعد فضای تعبیه شده باشد. برای موارد ساده مانند تجسم با استفاده از نقشه های دو بعدی سنتی (فضای دو بعدی)، نقاط، خطوط و چند ضلعی ها ممکن است برای نیازهای کاربر کافی باشد. برای موارد پیچیده تر که نیاز به فضای سه بعدی دارند، سطوح و حجم/جامد نیز مورد نیاز است.
در پایگاه های داده NoSQL، انواع هندسه اصلی عبارتند از Point، MultiPoint، LineString، MultiLineString، Polygon، MultiPolygon و GeometryCollection.
در پایگاههای اطلاعاتی رابطهای، بر اساس استاندارد بینالمللی ISO/IEC 13249: 2016، بستههای کاربردی چندرسانهای SQL، 27 نوع هندسه را ارائه میکنند که از این میان، 24 نوع هندسه قابل مشاهده هستند و دارای توابع سازنده هستند. انواع هندسه و روشهای موجود در پایگاههای داده رابطهای آشکارا فراوانتر از پایگاههای داده NoSQL هستند.
برای رسیدگی به موقعیتها و روابط فضایی ویژگیها، سیستمهای مرجع مختصات مورد نیاز است.
-
یک سیستم مرجع مختصات (CRS) یا یک سیستم مرجع فضایی (SRS)، یک سیستم مبتنی بر مختصات برای مکان یابی واحدهای جغرافیایی و ایجاد روابط آنها است. سیستم های مرجع مختصات معروف شامل سیستم مختصات زمین مرکزی، سیستم مختصات جغرافیایی (مقطع WGS84)، مرکاتور عرضی جهانی (UTM) و سیستم مختصات دکارتی است.
-
در سیستمهای مرجع مختصات، متن شناخته شده (WKT) یک زبان نشانهگذاری متن است که سیستمهای مرجع مختصات و تبدیلها را بین سیستمهای مرجع مختصات مختلف، همانطور که توسط کنسرسیوم فضایی باز (OGC) تعریف شده است، نشان میدهد.
-
مجموعه داده پارامترهای ژئودتیک EPSG (که رجیستری EPSG نیز نامیده می شود)، که توسط گروه بررسی نفت اروپا (EPSG) در سال 1985 توسعه یافت، مجموعه ای عمومی از تعاریف سیستم های مرجع مختصات و تبدیل مختصات است. کد EPSG به طور گسترده در سیستم های اطلاعات جغرافیایی و کتابخانه های GIS استفاده می شود.
علاوه بر این، روابط توپولوژیکی برای پردازش جغرافیایی و پرس و جوهای داده حیاتی هستند. برخی از مسائل مربوط به روابط نمونه را می توان از طریق روابط توپولوژیکی ویژگی ها حل کرد. علاوه بر توپولوژی گراف سنتی، سه اصل روابط توپولوژیکی رایج وجود دارد: توپولوژی ضمنی در ویژگی های ساده [ 25 ] و توپولوژی مجموعه نقطه ای مانند روابط نه تقاطع Egenhofer [ 26 ] و در روابط RCC8 [ 27 ]. نبرد و همکاران هم ارزی بین سه رابطه فضایی را خلاصه کرد، همانطور که در جدول 1 نشان داده شده است [ 28 ].
ویژگیهای خاص دادههای مکانی (به ویژه چند بعدی بودن و اندازه بزرگ مجموعه دادهها) پردازش آنها را متفاوت از پردازش سایر دادهها میکند. این دادهها به پلتفرمهای مختلف، مقیاسپذیری انعطافپذیر، و سهولت اصلاح، بهروزرسانی و پرسوجو، مانند سناریوهای پرسوجوی مکانی-زمانی در مقیاس بزرگ [ 29 ] و درخواستهای دسترسی عظیم بر اساس پلتفرمهای تلفن همراه نیاز دارند [ 14 ].
3. روش تحقیق
بسیاری از پایگاه های داده NoSQL و محصولات مرتبط در حال حاضر به طور مداوم توسعه یافته و به روز می شوند. برای مقایسه و بحث در مورد توسعه جغرافیایی پایگاه های داده NoSQL به طور موثر، 10 پایگاه داده محبوب NoSQL (به عنوان رتبه بندی شده توسط DB-Engines [ 30 ]) برای تجزیه و تحلیل ویژگی ها و عملکرد آنها از نظر پردازش داده های مکانی انتخاب شدند. این پایگاههای داده NoSQL در شش نوع مدل پایگاه داده قرار میگیرند: پایگاههای داده اسناد، پایگاههای داده گراف، پایگاههای داده ستون گسترده، پایگاههای داده کلید-مقدار، پایگاههای داده چند مدل و موتور جستجو، همانطور که در جدول 2 فهرست شده است.. ما از نام هر یک از 10 پایگاه داده و “geospatial OR spatial” به عنوان کلمات کلیدی جستجو برای جستجوی مقالات در پایگاههای عمومی دانشگاهی، از جمله Web of Science Core Collection، Google Scholar Citations و پایگاه داده Scopus استفاده کردیم. پس از فیلتر کردن برخی از مقالات تکراری و نامرتبط، مجموعه نهایی مقالات خود را به دست آوردیم. تعداد موجود در هر پایگاه داده در داخل پرانتزهای گرد در جدول 2 نشان داده شده است . از طریق تجزیه و تحلیل پایگاههای داده NoSQL و تحقیقات مرتبط، ما پیشرفتهترین پردازش اطلاعات مکانی را در پایگاههای داده NoSQL بررسی کردیم. تعداد کمی از پایگاه های داده NoSQL از صحنه های داده سه بعدی پشتیبانی می کنند، بنابراین اگر حاشیه نویسی خاصی وجود نداشته باشد، توابع هندسی و نمایه ها صحنه های داده دو بعدی را نشان می دهند.
4. پیشرفته ترین پردازش جغرافیایی در پایگاه های داده NoSQL
در این بخش، اطلاعات اولیه در مورد این پایگاه های داده در جدول 3 نشان داده شده است . پس از آن، برخی از اطلاعات مختصر در مورد ویژگی های مکانی در این پایگاه ها معرفی می شود. علاوه بر این، تحقیقات مرتبط از پایگاه های داده مختلف نیز خلاصه شده است.
4.1. MongoDB
MongoDB یک پایگاه داده اسنادی است که دادهها را در اسناد مقیاسپذیر، انعطافپذیر و شبیه JSON، با فیلدهای داده متفاوت و ساختار دادهای قابل تغییر، ذخیره میکند. MongoDB از زبان پرس و جوی اعلامی پشتیبانی نمی کند: پرس و جوها در MongoDB توسط API یا درایورهای اختصاصی ساخته و صادر می شوند. MongoDB از ذخیره سازی و جستجوی داده های مکانی پشتیبانی می کند. برای توصیف دادههای GeoJSON، MongoDB از یک سند جاسازی شده با نوع شی GeoJSON و سپس مختصات شی استفاده میکند و ابتدا طول جغرافیایی و سپس عرض جغرافیایی را فهرست میکند:
<field>: {type: <GeoJSON type>، مختصات: <coordinates> }
به عنوان مثال، برای تعیین یک نقطه GeoJSON:
محل: {
نوع: “نقطه”
مختصات: [-43.342412, 54.678421]
}
MongoDB از چندین شی هندسی پشتیبانی می کند، همانطور که در جدول 4 ذکر شده است . علاوه بر این، MongoDB از سیستم مرجع WGS84 برای جستجوهای مکانی اشیاء GeoJSON استفاده می کند. مقادیر طول جغرافیایی معتبر بین -180 و 180 (شامل) و مقادیر معتبر عرض جغرافیایی بین -90 و 90 (شامل) هستند.
MongoDB داده های مکان اشیاء را به عنوان جفت مختصات قدیمی ذخیره می کند و از محاسبات سطح کروی از طریق یک شاخص 2dsphere پشتیبانی می کند، که دو نمایش داده وجود دارد: یک آرایه (ترجیح MongoDB) و یک سند جاسازی شده در جفت مختصات قدیمی:
-
یک آرایه: <field>: [ <x>، <y> ]
-
یک سند جاسازی شده: <field>: {<field1>: <x>، <field2>: <y> }.
MongoDB دو نوع شاخص جغرافیایی فراهم می کند: geohash برای 2dsphere و 2d. در شاخصهای 2dsphere، پرسوجوهای مربوطه از طریق محاسبه هندسهها در کرهای شبیه زمین پیادهسازی میشوند. در نمایه های 2 بعدی، پرس و جوها از طریق محاسبه هندسه ها در یک صفحه دو بعدی پیاده سازی می شوند. برای پرس و جوهای کروی، باید از نمایه های 2dsphere استفاده شود، زیرا استفاده از نمایه های 2d برای پرس و جوهای کروی ممکن است منجر به نتایج نادرست شود. چهار عملیات پرس و جو توپولوژیکی در MongoDB برای داده های مکانی ارائه شده است: $ geoIntersects، $ geoWithin، $ near، و $ nearSphere.
در مقایسه کمی پردازش دادههای بزرگ جغرافیایی بین پایگاههای داده PostGIS و MongoDB، MongoDB با پرسوجوهای «داخل» و «تقاطع» [ 18 ، 31 ] و از نظر زمان پاسخ برای بارگذاری دادههای بزرگ مکانی مزایایی داشت [ 32 ] . در همین حال، در مقایسه بین ArcGIS و MongoDB، عملکرد بازیابی فضایی MongoDB بهتر از ArcGIS بود و این مزیت با افزایش مجموعه نقاط آشکارتر بود [ 33 ].
در تحقیقات مرتبط بر روی MongoDB، توجه بر مدیریت و ذخیره سازی داده های جغرافیایی [ 34 ، 35 ، 36 ، 37 ، 38 ، 39 ، 40 ، 41 ، 42 ، 43 ] و روش های توسعه شاخص [ 29 ، 44 ، 45 ، ] متمرکز شده است.]. با استفاده از MongoDB، پلتفرمها و فریمورکهای متعددی برای رفع نیازهای برنامههای کاربردی متنوع طراحی شدهاند. اگرچه پایگاه های داده NoSQL می توانند اشیاء JSON را ذخیره کنند، اما هنوز یک زبان پرس و جوی استاندارد وجود ندارد، بنابراین افرادی که برنامه نویس نیستند در مدیریت، تجزیه و تحلیل و ارتباط داده های مکانی با مشکل مواجه می شوند. برای حل این مشکلات، یک چارچوب و یک زبان پرس و جو برای دستکاری اشیاء JSON و ارائه عملیات فضایی و غیرمکانی در مجموعه داده های ناهمگن طراحی شد [ 34 ]. برای ارائه یک محیط کاری مشترک چند کاربره، یک سیستم نمونه اولیه بر اساس فناوریهای وب منبع باز توسعه داده شد که در آن دادههای مکانی بر اساس استاندارد OGC پردازش شده و به عنوان یک قالب GeoJSON برای ذخیره در MongoDB تغییر داده شد [ 43 ].]. وقتی درخواستهای چند کاربره به سرورها تا حد معینی افزایش مییابد، زمان پاسخگویی و سرویس ممکن است کمتر یا در دسترس نباشد. برای این مشکل مقیاس، یک چارچوب خدمات کاشی نقشه وب مقیاس پذیر (WMTS) با یک خوشه با کارایی بالا برای پیاده سازی استقرار الاستیک با افزایش تعداد درخواست های کاربر طراحی شد [ 14 ]. جدای از مشکلات درخواست های متعدد کاربر، مدیریت مجموعه داده های جغرافیایی بسیار بزرگ نیز یک مشکل فوری است. نرم افزاری به نام GeoRocket برای مدیریت مجموعه داده های مکانی بسیار بزرگ در ابر ایجاد شده است [ 36 ]. GeoRocket مجموعه داده های بزرگ را به تکه ها تقسیم می کند و تکه ها را به صورت جداگانه پردازش می کند. GeoRocket از Elasticsearch برای فهرست بندی و پرس و جو از مجموعه داده های بزرگ استفاده کرده است و از MongoDB برای ذخیره سازی داده ها استفاده می کند [ 36 ].
اگرچه MongoDB روشهای نمایهسازی را ارائه میدهد، تحقیقات هنوز برای یافتن شاخصهای سریعتر در حال انجام است. شیانگ و همکاران روشی برای پیادهسازی شاخص R-Tree پیشنهاد کرد که پرس و جوی محدوده فضایی و پرس و جوی نزدیکترین همسایه را در MongoDB ترکیب میکند [ 44 ]. با استفاده از یک ساختار سند جدولی، آنها شاخص R-Tree را در مجموعه های MongoDB مسطح کردند و آزمایش نشان داد که روش جدید بهتر از شاخص 2dsphere (شاخص فضایی داخلی MongoDB) عمل می کند [ 44 ]]. روش دیگر مورد استفاده برای R-Tree در MongoDB توسط لی و همکاران پیشنهاد شد، در حالی که یک شاخص فضایی مبتنی بر geohash در جستارهای مبتنی بر مکان برای یک سیستم نظارت پزشکی استفاده شده است که مستطیل های حداقل مرزی تو در تو (MBRs) را ترکیب می کند. R-Tree به عنوان یک درخت جهانی برای مکان های بلادرنگ، و B-Tree مبتنی بر geohash به عنوان درخت محلی برای داده های تاریخی [ 45 ]. علاوه بر این، برخی از محققان نیز با استفاده از MongoDB در طراحی شاخص مکانی-زمانی دادههای مسیر عظیم [ 29 ، 47 ] مشارکت داشتهاند.
MongoDB یک پلت فرم گسترده و منعطف برای کاربردهای مختلف جغرافیایی فراهم می کند. علاوه بر این، MongoDB برخی از تاکتیکها را برای بهبود عملکرد و در دسترس بودن اتخاذ میکند، مانند بهروزرسانیهای کپی ناهمزمان و تعادل بار در بین کپیها، اما این تاکتیکها میتوانند بر ثبات یک یا چند شی تأثیر بگذارند. این امر در سایر پایگاه های داده NoSQL مانند HBase، Cassandra و Neo4j نیز اتفاق می افتد.
4.2. کاناپه
سرور Couchbase یک پایگاه داده منبع باز، توزیع شده و سند محور با ذخیره سازی سریع کلید-مقدار و یک موتور جستجوی قدرتمند برای اجرای یک زبان پرس و جوی SQL مانند (N1QL) است [ 48 ]]. سرور Couchbase برای برخی از محیطهای خاص طراحی شده است تا خدمات مدیریت داده با تأخیر کم را ارائه دهد، مانند یک وب تعاملی در مقیاس بزرگ، یک پایانه تلفن همراه یا برنامههای کاربردی اینترنت اشیا. سرور Couchbase مانند MongoDB از برخی از هندسه های اولیه پشتیبانی می کند. برای پرس و جوهای مکانی، دو مدل نمایش مکان دارد: مبتنی بر شعاع و مبتنی بر جعبه. در مدل نمایش مکان مبتنی بر شعاع، دادههای مکان به صورت مکانهایی با جفت مختصات طول و عرض جغرافیایی و فاصله بر حسب مایل نشان داده میشوند. این فاصله طول شعاع است و محل یک جسم در مرکز دایره است. اگر مکان پرس و جو در دایره باشد، اسناد برگردانده می شوند. در مدل نمایش مکان مبتنی بر جعبه، دو جفت مختصات طول و عرض جغرافیایی مورد نیاز است. که در گوشه های بالا-چپ و پایین-راست یک جعبه قرار دارند. اگر مکان پرس و جو در کادر باشد، اسناد JSON برگردانده می شوند و حاوی مکان درون جعبه هستند. سرور Couchbase شاخص های R-Tree را برای برنامه های کاربردی آگاه از موقعیت مکانی فراهم می کند. علاوه بر این، نمایه های فضایی نیز می توانند توسط کاربران قبل از پرس و جوی مکانی تعریف شوند. بسته به اینکه کدام یک از دو مدل نمایش مکان استفاده می شود (یک مکان یا یک جعبه مرزی)، شاخص های فضایی متفاوت هستند. Couchbase فقط پرس و جوهایی را بر اساس داده های مختصات مکان ارائه می دهد که می تواند برنامه های کاربردی آن را محدود کند. نمایه های فضایی نیز می توانند توسط کاربران قبل از پرس و جوی مکانی تعریف شوند. بسته به اینکه کدام یک از دو مدل نمایش مکان استفاده می شود (یک مکان یا یک جعبه مرزی)، شاخص های فضایی متفاوت هستند. Couchbase فقط پرس و جوهایی را بر اساس داده های مختصات مکان ارائه می دهد که می تواند برنامه های کاربردی آن را محدود کند. نمایه های فضایی نیز می توانند توسط کاربران قبل از پرس و جوی مکانی تعریف شوند. بسته به اینکه کدام یک از دو مدل نمایش مکان استفاده می شود (یک مکان یا یک جعبه مرزی)، شاخص های فضایی متفاوت هستند. Couchbase فقط پرس و جوهایی را بر اساس داده های مختصات مکان ارائه می دهد که می تواند برنامه های کاربردی آن را محدود کند.
یک مقاله در مورد پایگاه داده Couchbase در نتایج جستجو وجود داشت که در بخش 3 ذکر شده است . در آن، یک شبکه اطلاعات محور برای فدرال کردن پایگاه های داده MongoDB و Couchbase [ 35 ] اتخاذ شد. معماری عملکردی پایگاه داده فدرال طراحی شده شامل یک جلوی فدراسیون برای ارتباط موثر بین یک پردازشگر پرس و جو و کاربران است. پردازنده پرس و جو برای تعامل با DBS های محلی و راه دور. و یک آداپتور DBMS برای ترجمه پرس و جو فدرال به زبان پرس و جو محلی در یک DBMS محلی [ 35 ].
4.3. Neo4j
Neo4j محبوب ترین پایگاه داده گراف است و از Cypher به عنوان زبان پرس و جو خود استفاده می کند، اما تنها از یک نوع هندسه فضایی، Point، در آخرین نسخه 3.5 پشتیبانی می کند. هر نقطه در Neo4j می تواند نمایش دو بعدی یا سه بعدی داشته باشد و می تواند به عنوان یک سیستم مرجع مختصات جغرافیایی یا یک سیستم مرجع مختصات دکارتی مشخص شود. از آنجایی که Neo4j تنها یک نوع هندسه فضایی دارد، پایگاه داده توابع فضایی مربوط به نقطه را ارائه می دهد، مانند distance()، point()-WGS 84 2D، point()-WGS 84 3D، point()-Cartesian 2D، و point. ()-دکارتی سه بعدی. مثالی از کتابچه راهنمای Cypher [ 49 ] این است:
-
با نقطه ({latitude:toFloat(‘13.43’)، طول جغرافیایی:toFloat(‘56.21’)}) به عنوان p1،
-
نقطه ({latitude:toFloat(‘13.10’), طول جغرافیایی:toFloat(‘56.41’)}) AS p2
-
بازگشت به عدد صحیح (فاصله (p1، p2)/1000) AS کیلومتر
یک کتابخانه کاربردی به نام Neo4j Spatial وجود دارد که دستکاری فضایی داده ها را تسهیل می کند. Neo4j Spatial از هفت نوع هندسه رایج پشتیبانی می کند: Point، LineString، Polygon، MultiPoint، MultiLineString، MultiPolygon، و GeometryCollection و عملیات توپولوژی. علاوه بر این، Neo4j Spatial یک شاخص R-Tree برای پرس و جوهای فضایی اتخاذ می کند و چندین روش فضایی را ارائه می دهد [ 50 ].
در تحقیقات مرتبط، سروات و همکاران. یک پرس و جو قابلیت دسترسی را با یک محدوده فضایی که در پایگاه داده گراف Neo4j پیش بینی شده است، اجرا کرد، و تلاش کرد تا دریابد که آیا یک نقطه ورودی می تواند به هر نقطه فضایی که در محدوده فضایی ورودی قرار دارد برسد یا خیر [ 51 ]. به دلیل عدم بهینه سازی گزاره های فضایی در پردازشگرهای پرس و جوی نمودار موجود، Sun و همکاران. یک عملگر پرس و جو را پیشنهاد کرد، GEOEXPAND، که آگاهی داده های مکانی را به DBMS گرافیکی اضافه می کند تا پرس و جوهای گراف را با محمولات فضایی به طور موثر اجرا کند [ 52 ]. علاوه بر این، یک سیستم تطبیق carpool طراحی شد تا کارپول ها را بر اساس مسیرهای مکرر هفتگی وسایل نقلیه توصیه کند [ 53]. با استفاده از کتابخانه GraphAware Neo4j TimeTree، یک سری زمانی از مکانها در یک مسیر به هم متصل شدند. برای دادههای مکانی، کتابخانه فضایی Neo4j برای مدلسازی و جستجوی دادههای مسیر استفاده شد. با استفاده از یک استراتژی تطبیق کارپول، کارایی و کارایی سیستم پیشنهادی مورد ارزیابی قرار گرفت [ 53 ]. Neo4j همچنین در کاربردهای کشاورزی و دامپروری استفاده شده است، به عنوان مثال، با استفاده از فناوری وب و پوسته Neo4j برای ارزیابی وضعیت محصولات بر اساس دادههای مکانی [ 54 ] و شناسایی روابط بین اعضای یک گله گاو بر اساس پایگاه داده های فضایی و نموداری [ 55 ].
از آنجایی که Neo4j فقط از نوع هندسه نقطه و توابع فضایی مبتنی بر نقطه پشتیبانی می کند، به طور کلی در برنامه های مرتبط با مکان استفاده می شود.
4.4. آپاچی کاساندرا
آپاچی کاساندرا یک سیستم مدیریت پایگاه داده ذخیره سازی با ستون های گسترده و منبع باز است. کاساندرا و زبان پرس و جو کاساندرا (CQL) از پرس و جوهای فضایی پشتیبانی نمی کنند. روش اصلی Cassandra برای پشتیبانی از دادههای مکانی، Stratio’s Lucene Index for Cassandra است، افزونهای برای آپاچی کاساندرا، که از نمایهسازی دادههای مکانی (نقطه، خطوط، چند ضلعی، و غیره)، تبدیلهای مکانی (جعبه مرزی، مرکز، بدنه محدب، بافر، اتحاد) پشتیبانی میکند. ، تفاوت، تقاطع) و عملیات جغرافیایی (تقاطع، شامل، و غیره). نمایههای Lucene، توسعهای از نمایههای ثانویه کاساندرا، میتوانند از طریق یک عبارت CQL CREATE CUSTOM INDEX ایجاد شوند. نحو عبارت است از:
-
ایجاد نمایه سفارشی (اگر وجود ندارد)؟ <index_name>
-
روشن <table_name> ()
-
استفاده از “com.stratio.cassandra.lucene.Index”
-
WITH OPTIONS = <options>
در کاساندرا، اشیاء هندسی اصلی عبارتند از Point، LineString و Polygon، در حالی که خود Cassandra یک شاخص فضایی ارائه نمی دهد.
Cassandra یک ذخیرهگاه داده بسیار مقیاسپذیر و با کارایی بالا است، اما قابلیتهای محدودی را برای تجزیه و تحلیل دادهها و عملکردهای مقیاسپذیر محدود، از جمله عدم پشتیبانی کافی برای عملیات دادههای مکانی، فراهم میکند. برای غلبه بر این مشکلات، تحقیق در مورد پسوند زبان پرس و جو کاساندرا برای پیاده سازی پرس و جوهای فضایی در پایگاه داده کاساندرا [ 56 ] توسعه یافت.]. این تحقیق توسعه ای عمدتاً مقادیر طولی/طولی را به یک ویژگی geohash عددی تبدیل کرده و آنها را با داده ها در طول عملیات ذخیره سازی داده مرتبط می کند. سپس یک تجزیه کننده پرس و جو فضایی و نحو فضایی طراحی و به عنوان یک پسوند فضایی CQL تعریف شد. پس از آن، یک الگوریتم تجمیع برای کاهش فضای جستجو و بهینه سازی پرس و جوهای فرعی ارسال شده به گره های خوشه اجرا شد. داده های ذخیره شده را می توان از طریق یک تکنیک geohashing نمایه کرد [ 56 ]. علاوه بر این، یک رویکرد جدید برای جفت کردن کاساندرا با Secondo DBMS توسط Nidzwetzki و همکاران ارائه شد. برای پشتیبانی از تمام توابع DBMS، از جمله مدلهای دادههای مکانی و شی متحرک با در دسترس بودن و مقیاسپذیری بالا [ 57 ]. با استفاده از آن کار، Nidzwetzki و همکاران. این رویکرد را بیشتر گسترش داد [ 58] برای ساختن یک DBMS که توزیع شده، همه منظوره، قابل تحمل خطا و موازی باشد. به طور مشابه، برای حل مسائل مربوط به پرس و جوهای فضایی در پایگاه داده کاساندرا، چارچوبی با ادغام Hadoop و Cassandra برای داده های پرس و جو فضایی ذخیره شده در Cassandra توسعه داده شد [ 59 ]. نتایج تجربی نشان داد که یک تکنیک پارتیشن بندی تعریف شده توسط کاربر، به نام پارتیشن بندی مبتنی بر پیشوند، در جستجوی مکانی بهتر از الگوریتم پارتیشن بندی پیش فرض کاساندرا [ 59 ] عمل کرد.
برای اهداف مشابه، چارچوب دیگری با ترکیب Spark و Cassandra برای ارائه راهحلهای بارگذاری و بازیابی داده برای دادههای مکانی پیشنهاد شد [ 60 ]. این چارچوب شامل یک لایه ذخیرهسازی دادههای مکانی (بر اساس Cassandra)، یک لایه هسته Spark (با استفاده از APIهای هسته استاندارد Spark)، یک لایه پردازش دادههای مکانی (به عنوان رابطی برای جستجوی دادههای مکانی و غیر مکانی) و یک لایه کاربردی، که در آن یک اتصال دهنده Spark-Cassandra [ 61 ] یکپارچگی یکپارچه بین Spark و Cassandra [ 60 ] را فراهم می کند.
کاساندرا انواع هندسه، شاخصهای هندسه و توابع محدودی را ارائه میکند، بنابراین کارها یا ابزارها/مؤلفههای طراحی اضافی در پردازش دادههای مکانی مورد نیاز است، مانند پسوند فهرست [ 56 ] و ترکیب با ابزارهای دیگر [ 59 ، 60 ، 61 ].
4.5. آپاچی اچ بیس
Apache HBase یک پایگاه داده معماری منبع باز، توزیع شده، نسخه بندی شده و مبتنی بر دیسک است. HBase از زبان پرس و جوی اعلانی پشتیبانی نمی کند و پرس و جوها در HBase از طریق API های اختصاصی به دست می آیند. HBase دارای توابع جغرافیایی خاصی برای پشتیبانی از ذخیره سازی داده های مکانی و پرس و جو نیست [ 62 ]. با این حال، محققان روشها و کاربردهایی را برای پردازش دادههای مکانی در HBase توسعه دادند [ 63 ، 64 ، 65 ، 66 ، 67 ، 68 ، 69 ، 70 ]، مانند یک پایگاه داده جغرافیایی با شاخصهای فضایی مبتنی بر geohash [ 63 ، 71 ].]، پردازش داده های فضایی بزرگ با آپاچی اسپارک [ 72 ]، یک مدل داده های مکانی [ 64 ]، و یک روش جستجوی فضایی جدید بر اساس نمایه سازی کلیدهای اولیه [ 73 ]. علاوه بر این، مجموعه ای از ابزارهای منبع باز، GeoMesa، برای پیاده سازی تجزیه و تحلیل های مکانی در مقیاس بزرگ و پرس و جو در فضای ابری یا در ارتباط با پایگاه های داده HBase و Cassandra طراحی شده است [ 74 ].
علاوه بر تحقیقات فوق در مورد پردازش مکانی در HBase، تحقیقات دیگری نیز در رابطه با پردازش مکانی انجام شده است. اولین مورد بر اساس مکانیسم MapReduce [ 75 ، 76 ] است. Hadoop MapReduce یک چارچوب نرمافزاری است که از طریق آن طراحان میتوانند به راحتی برنامههایی بنویسند تا مقادیر عظیمی از دادهها را به صورت موازی در خوشههای بزرگی از سختافزار کالا پردازش کنند [ 77 ]، در حالی که HBase از کلاسهای پایه برای پشتیبانی از مشاغل MapReduce با جداول HBase استفاده میکند [ 76 ]. ایده اصلی MapReduce این است که مجموعه داده های عظیم ابتدا به تکه های مستقل ذخیره شده در خوشه ها تقسیم می شوند و این تکه ها با تطبیق وظایف و روش های مختلف به صورت موازی پردازش می شوند [ 75 ، 76 ]].
سایر محققان ساختار شاخص جدیدی را برای مدیریت داده ها برای HBase طراحی کرده اند [ 69 ، 70 ، 78 ، 79 ]. دو و همکاران یک ساختار شاخص ترکیبی جدید برای سازماندهی داده ها با توسعه یک R-Tree مبتنی بر شبکه آماری برای نمایه سازی فضا و با استفاده از منحنی هیلبرت برای همسایه یابی [ 78 ] پیشنهاد کرد. در HBase، یک ساختار شاخص فضایی جدید با رمزگذاری geohash طراحی شد [ 69 ، 80 ]. علاوه بر این، جو و همکاران. یک ساختار شاخص سلسله مراتبی برای پردازش پرس و جوی فضایی موثر در HBase ایجاد کرد که به نام درخت Q-MBR (مستطیل مرزی حداقل مبتنی بر ربع) [ 79 ]]. از طریق Q-MBR، فضا به ربع تقسیم می شود و MBR در هر ربع ایجاد می شود. سپس، اشیاء فضایی از طریق درخت شاخص به صورت سلسله مراتبی قابل دسترسی هستند. بر اساس درخت Q-MBR، الگوریتم های مختلفی برای عملیات پرس و جوی مختلف طراحی شده است [ 79 ].
سومین جهت تحقیق، ساخت مدلها/طرحوارههای ذخیرهسازی دادههای مکانی در HBase است [ 67 ، 73 ، 81 ، 82 ، 83 ]. وانگ و همکاران یک طرح ذخیره سازی Z با کلیدهای ردیف بر اساس منحنی Z برای داده های برداری فضایی عظیم در HBase [ 67 ] پیشنهاد کرد. پس از آن، ژانگ و همکاران. این طرح ذخیره سازی Z را بهبود بخشید، و آزمایشات آنها نشان داد که طرح ذخیره سازی Z نسبت به طرح ذخیره سازی مبتنی بر درخت (طرح ذخیره سازی چهار درخت و طرح ذخیره سازی R-Tree) کارایی پرس و جو فضایی بالاتری دارد [ 83 ].
علاوه بر این، ژای و همکاران. پایگاه داده HBase توزیع شده و یک شبکه زیربخش جهانی را برای مدیریت موثر داده ها ترکیب کرد: با روش خود، ژئوکدهای شبکه موقعیت مکانی یک شی را ارائه کردند و به عنوان یک مقدار کلید در HBase در نظر گرفته شدند [ 81 ]. در همین حال، ژنگ و همکاران. مجاورت فضایی را در نظر گرفتند و یک استراتژی بهینه سازی ذخیره سازی داده های مکانی را برای پایگاه داده HBase پیشنهاد کردند: روش آنها اشیاء فضایی مجاور را در یک قطعه داده ذخیره می کند [ 84 ].
از آنجایی که HBase از انواع هندسه، شاخصهای هندسی یا توابع پشتیبانی نمیکند، برای پردازش دادههای مکانی به کارها یا ابزارها/مؤلفههای طراحی اضافی نیاز است.
4.6. ردیس
Redis یک پایگاه داده منبع باز (مجوز BSD) است که از ساختارهای داده های متعدد، از جمله رشته ها، هش ها، لیست ها، مجموعه ها، بیت مپ ها، نمایه های مکانی با پرس و جوهای شعاع و جریان ها پشتیبانی می کند. ردیس پرس و جوها را از طریق APIهای خاص پیاده سازی می کند و شش دستور مرتبط با زمین مکانی را ارائه می دهد: geoadd، geodist، geohash، geopos، georadius و georadiusbymember. اجرای این دستورات در عملیات داده های جغرافیایی آسان است. به عنوان مثال، فرمت دستور geoadd “GEOADD (نام مجموعه) طول جغرافیایی طول جغرافیایی (نام شی)” است و کاربر شیء جغرافیایی مشخص شده (طول جغرافیایی، طول جغرافیایی، نام) را به کلید مشخص شده اضافه می کند. داده ها در کلید به عنوان یک مجموعه مرتب شده ذخیره می شوند و به این ترتیب، شی را می توان با استفاده از یک پرس و جو از شعاع با دستورات georadius یا georadiusbymember بازیابی کرد.
یک مثال این است:
-
GEOADD ساختمان 15.45244 -76.78506 my-house
برای حذف یک عضو از Geo Set، Redis دستور ZREM را ارائه می دهد:
-
redis.zrem (ساختمان، خانه من)
Redis یک پایگاه داده در حافظه است، اما روی دیسک ثابت است. هنگامی که یک تغییر مهم در داده ها ایجاد می شود، لازم است به Redis دستور داده شود که تغییر را در دیسک ذخیره کند. علاوه بر این، Redis توانایی محدودی برای ایجاد روابط بین اشیاء داده دارد.
با توجه به ویژگیهایش، Redis عموماً برای سیستمهای ردیابی پاسخ سریع، مانند ردیابی کشتی [ 16 ] و ردیابی وسایل نقلیه حملونقل عمومی [ 85 ] استفاده میشود، که در آن دادههای بلادرنگ باید به موقع نمایش یا پردازش شوند، در حالی که نیازی نیست که داده های حافظه فوری ذخیره شوند.
4.7. آمازون DynamoDB
Amazon DynamoDB یک پایگاه داده NoSQL است که عملکرد سریع و قابل پیش بینی را با مقیاس پذیری یکپارچه، ذخیره سازی اسناد، ذخیره سازی با ارزش کلید و API های سطح پایین (رابط در سطح پروتکل) برای مدیریت جداول و فهرست های پایگاه داده ارائه می دهد. به منظور ساخت آسان برنامه های مبتنی بر مکان، کتابخانه Geo برای Amazon DynamoDB طراحی شده است، به طوری که یک GeoPoint (با یک مقدار طولی و یک مقدار طولی) در یک رشته GeoJSON کدگذاری می شود. علاوه بر این، از شاخصهای geohash برای پرس و جوهای مبتنی بر مکان سریع، از جمله پرسوجوهای جعبه و پرسوجوهای شعاع استفاده میشود. علاوه بر این، DynamoDB چندین توابع عملیات جغرافیایی مانند GeoPoint، putPoint، deletePoint، updatePoint، queryRectangle و queryRadius را ارائه میکند. هیچ مقاله دانشگاهی مرتبطی در مورد پردازش جغرافیایی بر اساس تحقیقات روی DynamoDB یافت نشد.
4.8. Elasticsearch
Elasticsearch یک موتور جستجو و پایگاه داده اسناد است که در جاوا توسعه یافته است. Elasticsearch یک زبان پرس و جو به نام Domain Specific Language (DSL) را بر اساس JSON برای تعریف پرس و جو و پشتیبانی ارائه می دهد. همچنین از دو نوع داده جغرافیایی، از جمله نوع داده ژئونقطه (جفت طول و عرض جغرافیایی) و نوع داده ژئوشکل، که از نقاط، خطوط، دایره ها، چند ضلعی ها، چند چند ضلعی و غیره پشتیبانی می کند. از نظر پرس و جو، Elasticsearch چهار عملکرد دارد: geo_shape، geo_bounding_box، geo_distance و geo_polygon، و چندین PrefixTree از جمله GeohashPrefixTree و QuadPrefixTree را ارائه می دهد. علاوه بر این، داده های مکانی را می توان با استفاده از قالب GeoJSON یا متن شناخته شده (WKT) نشان داد. نمونه ای از GeoJSON در اینجا نشان داده شده است:
-
POST /example/_doc
-
{
-
“محل” : {
-
“نوع”: “نقطه”
-
“مختصات” : [-77.03653, 38.897676]
-
}
-
}
ما تعدادی مقاله در Elasticsearch یافتیم، از جمله یکی در مورد استفاده از Elasticsearch برای پرس و جوها و ذخیره اطلاعات جغرافیایی محلی [ 86 ] و یکی در Elasticsearch به عنوان یک سرویس در Elastic’s Elastic Cloud [ 87 ]. Elasticsearch همچنین برای نمایه سازی و پرس و جو از مجموعه داده های مکانی بزرگ در سیستم GeoRocket استفاده می شود [ 36 ].
4.9. اسپلانک
Splunk Inc. محصولات نرم افزاری زیادی با قابلیت جستجو و تجزیه و تحلیل قدرتمند برای مدیریت داده های سازمانی دارد. یکی از آنها Splunk Enterprise است که میتواند دادهها را از وبسایتها و اینترنت اشیا (اینترنت اشیا) واکشی کند و دارای عملکرد عالی مدیریت داده و استخراج است. زبان پرس و جو Splunk Splunk Process Language (SPL) نامیده می شود. در نرم افزار Splunk، ابتدا باید از جستجوهای مکانی برای تولید پرس و جو استفاده کرد و نتایج پرس و جو با تجسم نقشه choropleth نشان داده می شود. یک جستجوی مکانی، مختصات مکان رویداد/شی را در یک مجموعه ویژگی های جغرافیایی، به نام فایل Keyhole Markup Zipped (KMZ) یا فایل Keyhole Markup Language (KML) نشان می دهد. قالبی برای ایجاد جستجوی مکانی در زیر تعریف شده است:
-
[<lookup_name>]
-
خارجی_نوع = جغرافیایی
-
نام فایل = <name_of_KMZ_file>
-
feature_id_element = <XPath_expression>
Splunk Enterprise دو جستجوی مکانی برای ایالات متحده و سایر کشورها ارائه می دهد. هیچ مقاله آکادمیک مرتبطی در مورد پردازش جغرافیایی بر اساس کاربردها و تحقیقات Splunk یافت نشد.
4.10. سولر
Solr یک پلت فرم جستجوی منبع باز با قابلیت اطمینان بالا، نمایه سازی مقیاس پذیر، توابع جستجو، تحمل خطا و پرس و جوی متعادل بار است. تجزیه کننده پرس و جو پیش فرض آن تجزیه کننده پرس و جو “Lucene” است. برای ذخیره دادههای مکانی، Solr از فرمت WKT و GeoJSON پشتیبانی میکند، اما قالب دادهها باید از طریق یک «نام نوع قالب» تعیین شود تا بتوان دادهها را ذخیره کرد. دو پارامتر داخلی وجود دارد: f برای نام فیلد و w برای نام قالب.
یک مثال این است:
-
geojson: [geo f=mySpatialField w=GeoJSON].
برای پرسوجوهای دادههای مکانی، Solr نقاط نمایهسازی یا اشکال دیگر، جستجوی نتایج از یک جعبه یا دایره یا اشکال دیگر، مرتبسازی نتایج تحقیقات بر حسب فاصله، یا حتی افزایش نتایج از نظر فاصله را فراهم میکند. علاوه بر این، Solr چهار نوع فیلد اصلی را برای جستجوهای فضایی فراهم می کند، از جمله:
-
LatLonPointSpatialField : این بیشتر برای داده های نقطه طول و عرض جغرافیایی استفاده می شود.
-
RptWithGeometrySpatialField : برای نمایه سازی و جستجوی داده های غیر نقطه ای (می تواند نقاط را نیز انجام دهد، اما نمی تواند مرتب سازی/تقویت انجام دهد).
-
BBoxField : برای نمایه سازی جعبه های محدود کننده، پرس و جوها با استفاده از یک کادر، یا تعیین یک گزاره جستجو (تقاطع، درون، شامل، جدا، برابر).
-
LatLonType (اکنون از بین رفته): هنوز وجود دارد، اما با LatLonPointSpatialField جایگزین شده است.
در اینجا، ما دو مثال برای جستجوی یک فروشگاه در 5 کیلومتری یک مکان (45.15، 93.85-) میآوریم:
-
&q=*:*&fq={!bbox sfield=store} & pt=45.15,-93.85 & d=5
-
&q=*:*&fq={!geofilt sfield=store} & pt=45.15,-93.85 & d=5
پارامترها به معنی موارد زیر هستند:
-
d فاصله شعاعی است که معمولاً بر حسب کیلومتر است.
-
pt نقطه مرکزی با استفاده از قالب “طول و عرض جغرافیایی” است.
-
sfield یک فیلد شاخص فضایی است.
-
فیلتر ژئوفیلت نتایج را بر اساس فاصله جغرافیایی (فاصله دایره) با استفاده از یک نقطه معین به عنوان مرکز دایره و d به عنوان شعاع بازیابی می کند.
-
فیلتر bbox (جعبه مرزی) از جعبه مرزی دایره ژئوفیلت استفاده می کند.
از آنجایی که جعبه مرزی شل است، ممکن است برخی از فروشگاه ها که در واقع بیش از 5 کیلومتر دورتر هستند پیدا شوند، اما geofit در 5 کیلومتری دقیق است.
به عنوان یک سرور بکاند، Solr برای فهرستبندی و جستجوی خدمات فراداده در گره فهرست فدراسیون شبکه زمین (ESGF)، که میتواند به دادههای مکانی توزیعشده دسترسی داشته باشد، استفاده شده است [ 88 ]. از نظر پردازش داده های مکانی، Solr به طور گسترده ای به عنوان یک موتور تحقیقاتی استفاده می شود، نه برای ذخیره سازی داده ها [ 89 ، 90 ]، بنابراین ترکیب آن با پایگاه های داده دیگر مورد نیاز است.
5. مقایسه پردازش داده های مکانی در پایگاه های داده NoSQL
برای مقایسه 10 پایگاه داده مختلف NoSQL، ویژگی های مکانی آنها در جدول 4 خلاصه شده است که شامل اصول هندسه، توابع هندسه اصلی، شاخص های فضایی، زبان پرس و جو و قالب داده است. در جدول 4 مشاهده می شود که از 10 پایگاه داده، 9 پایگاه داده های مکانی را پشتیبانی می کنند و به جز HBase، عملکردها یا رویه های خاصی دارند. با این حال، شاید به دلیل عدم وجود ویژگیهای مکانی و عملکردهای مکانی در HBase، تحقیقات جغرافیایی اغلب در پایگاه داده HBase انجام میشود.
از نظر آبجکت های هندسی، اکثر پایگاه های داده NoSQL از چندین شی هندسی پشتیبانی می کنند، به جز آمازون DynamoDB، HBase، Neo4j و Redis. DynamoDB و Redis فقط از شی نقطه پشتیبانی می کنند، در حالی که پایگاه داده HBase هیچ شی هندسی را پشتیبانی نمی کند. Neo4j همچنین فقط شی هندسه نقطه ای را پشتیبانی می کند، اما یک کتابخانه توسعه یافته، Neo4j Spatial، از هفت شی هندسی پشتیبانی می کند. MongoDB، DynamoDB و Elasticsearch از توابع هندسه جامع تری نسبت به سایر پایگاه های داده NoSQL پشتیبانی می کنند و شامل عملیات نقطه، فاصله و برد هستند. برای نمایهسازی فضایی، geohash رایجترین روش است و در پایگاههای اطلاعاتی اسناد، پایگاههای داده ستونمدار و پایگاههای داده کلید-مقدار به کار گرفته شده است. ساختار درختی یکی دیگر از ساختارهای رایج است که برای نمایه سازی داده های مکانی در پایگاه های داده NoSQL استفاده می شود. از نظر زبان پرس و جو، برخی از پایگاه های داده NoSQL از زبان پرس و جوی اعلامی پشتیبانی نمی کنند، از جمله MongoDB، HBase، Redis و Amazon DynamoDB. آنها از پرس و جوهای REST و یک API اختصاصی برای ساخت و صدور پرس و جو پشتیبانی می کنند. از نظر فرمتهای دادههای مکانی پشتیبانی شده، هشت پایگاه داده از هر 10 پایگاه داده، فرمتهای عمومی داده GeoJSON یا WKT را ارائه میکنند، به جز HBase و Splunk.
در پایگاههای داده NoSQL، مدلهای داده (شامل مدلهای چندگانه و موتورهای جستجو) را میتوان به چهار دسته اصلی طبقهبندی کرد: کلید-مقدار، مدل نمودار، ستون گسترده و ذخیرهسازی اسناد. در واقع، همه این مدلهای داده میتوانند دادههای مکانی را مدیریت و مدیریت کنند. با این حال، پایگاه داده های مختلف NoSQL می توانند داده های مکانی را به روش های مختلف با توجه به مدل داده خاص ذخیره و نمایش دهند.
پایگاه داده های گراف بر اساس گره ها (0D) و یال ها (1D)، شبیه به مدل توپولوژی گراف مربوط به داده های مکانی است. دو گره و یک لبه (ارتباط بین دو گره) می توانند به راحتی دو تقاطع جاده و یک جاده بین دو تقاطع را در یک رابطه توپولوژی نشان دهند. با این حال، پایگاههای داده گراف از چهرههای توپولوژیکی گراف (2D) پشتیبانی نمیکنند، یعنی فضای محدود شده توسط یک لبه. از آنجایی که Neo4j یک پایگاه داده گراف است، می تواند به طور بومی ویژگی های توپولوژیکی گراف 0D و 1D داده های مکانی را مدیریت کند و می تواند عملیات پیمایش سریع را ارائه دهد [ 21 ].
در حالت کلید-مقدار (Redis)، یک ساختمان تاریخی (نام ساختمان) و موقعیت این ساختمان (طول و عرض جغرافیایی)، تاریخچه و اطلاعات ساخت و ساز نیز به راحتی در Redis ذخیره می شود (نام ساختمان یک کلید است و اطلاعات دیگر). مقادیر ذخیره شده است). پایگاه داده کلید-مقدار یک فروشگاه درون حافظه است که در آن بارگذاری داده ها و اجرای بار کاری فوق العاده سریع است [ 13 ]. پایگاه داده Redis به دلیل ذخیره در حافظه آن، عموماً در سیستمهای خاصی که نیاز به تصویرسازی دادهها در زمان واقعی دارند و نیازی به ذخیره دائمی همه دادهها، مانند ردیابی کشتی، ندارند، استفاده میشود [ 16 ].
با این حال، به دلیل ویژگی های این دو مدل داده، Neo4j و Redis عمدتا از شی هندسه نقطه پشتیبانی می کنند. بنابراین، پایگاههای داده کلید-مقدار (Redis) [ 7 ، 91 ] و پایگاههای اطلاعاتی گراف (Neo4j) [ 53 ، 54 ، 55 ] فقط پرسوجوها و توابع جغرافیایی محدودی از جمله محاسبات فاصله و جستوجوهای مکان ارائه میکنند. مدلهای دادههای مکانی محدود، به دلیل پیچیدگی دادههای مکانی، بهویژه اشیاء چند خطی و چند ضلعی، مانع از کاربردهایی میشوند که پایگاههای داده کلیدی-مقدار (Redis) و پایگاههای دادههای نموداری (Neo4j) برای آنها مفید هستند.
پایگاههای اطلاعاتی اسناد میتوانند در جزئیات متفاوت باشند، اما همه پایگاههای اطلاعاتی اسناد، اطلاعات را در قالب استاندارد معینی رمزگذاری و در اسناد محصور میکنند. فرمتهای رایج رمزگذاری استاندارد شامل زبان نشانهگذاری توسعهیافته (XML)، نشانهگذاری شی جاوا اسکریپت (JSON) و باینری JSON (BSON) است. برای دادههای مکانی، پایگاههای داده اسناد از فرمت GeoJSON مانند MongoDB، Couchbase، Amazon DynamoDB و Elasticsearch استفاده میکنند.
پایگاه داده های سند روابط پیچیده ای با سایر پایگاه های داده NoSQL دارند. به عنوان مثال، موتور جستجو Elasticsearch عملیات گسترده ای را برای اسناد ارائه می دهد و به عنوان یک پایگاه داده سند محور در نظر گرفته می شود. علاوه بر این، گاهی اوقات یک پایگاه داده سند را می توان به عنوان یک پایگاه داده با ارزش کلیدی مانند Redis، Couchbase و Amazon DynamoDB مشاهده کرد. MongoDB یک پایگاه داده کلید-مقدار نیست، اما از مفهوم جفت کلید-مقدار استفاده می کند و اسناد با استفاده از یک کلید قابل دسترسی هستند. اگرچه پایگاههای داده اسناد ارتباط نزدیکی با پایگاههای داده کلیدی-مقدار دارند، پایگاههای اطلاعاتی سند گرا، مانند MongoDB، Couchbase، و Elasticsearch، دادههای مکانی را به طور مؤثرتری نسبت به پایگاههای داده با ارزش کلیدی پردازش و مدیریت میکنند [ 7 ]]. این عمدتاً به این دلیل است که پایگاههای داده اسناد دارای پرسوجوهای انعطافپذیرتری برای بازیابی دادههای مکانی نسبت به پایگاههای داده کلید-مقدار هستند، از جمله جستارهای مجاورتی و توابع تحلیل توپولوژی تعبیهشده [ 17 ]، و از طریق قالب GeoJSON، بسیاری از پایگاههای داده اسناد به راحتی مدیریت دادههای مکانی را پشتیبانی یا گسترش میدهند. علاوه بر این، پایگاههای اطلاعاتی اسناد در پرسشهای دادههای مکانی [ 18 ، 31 ]، بازیابی دادههای مکانی [ 33 ]، و از نظر زمان پاسخ برای بارگذاری دادههای بزرگ مکانی [ 32 ] به خوبی عمل میکنند. MongoDB همچنین بهترین زمان پرس و جو را برای پرس و جوهای گره در مقایسه با Neo4j و PostgreSQL دارد [ 92 ].
پایگاههای داده ستون گسترده، Cassandra و HBase، جداول دادهها را به جای ردیفها در ستونها ذخیره میکنند، و آنها پایگاههای داده منبع باز، غیر رابطهای و توزیع شده هستند. HBase از پردازش جغرافیایی پشتیبانی نمی کند. با این حال، از طریق MapReduce [ 75 ، 76 ، 93 ] و با طراحی ساختارهای شاخص جدید [ 69 ، 70 ، 78 ، 79 ] و مدل ها/طرحواره های ذخیره سازی [ 67 ، 73 ، 81 ، 82 ، 83 ]، پایگاه داده HBaseospatial اکنون می تواند gege را پردازش کند. داده ها برای برنامه های مختلف همانند Hbase، Cassandra همچنین میتواند از Hadoop MapReduce برای پردازش دادههای مکانی استفاده کند.59 ]. با این حال، HBase یک ذخیرهسازی دادههای کلیدی-مقدار ستونگرا است و Cassandra اساساً ترکیبی بین یک سیستم مدیریت پایگاه داده کلید-مقدار و جدولی است. هیچکدام راهی برای پرس و جو بر اساس ستون و مقدار ارائه نمی کنند، و عملکرد پرس و جو عمدتاً به کلیدهای محدود بستگی دارد، بنابراین پایگاه داده های خانواده ستون را می توان به طور موثر برای برخی از برنامه های مکانی خاص که به پرس و جوهای جغرافیایی ساده، درج داده های انبوه و بازیابی سریع داده ها نیاز دارند استفاده کرد. 21 ]. علاوه بر این، بیشتر تحقیقات مبتنی بر HBase بر روی دادههای مکانی برداری [ 66 ، 67 ، 83 ، 93 ، 94 ] متمرکز شدهاند، در حالی که پایگاههای داده اسناد میتوانند دادههای شطرنجی [ 7 ] و دادههای مکانی برداری [ 36 ] را مدیریت کنند.]. از آنجایی که پایگاههای داده ستون عریض دارای توابع و پرس و جوهای کافی برای پشتیبانی از پردازش دادههای مکانی نیستند، یکی دیگر از ضعفهای پایگاههای داده ستون گسترده (HBase) این است که برای طراحی نمایههای جغرافیایی و طراحی توابع نیاز به کار اضافی دارند [ 69 ، 78 ، 94 ]. این ممکن است باعث ایجاد محدودیت هایی در قابلیت همکاری و اشتراک طرح ها در مقایسه با نمایه ها و عملکردهای پایگاه داده های داخلی شود. شاخصهای فضایی و عملکردهای پایگاه داده داخلی، راحتی و کارایی را در کارهای طراحی فراهم میکنند، اما شاخصها و توابع ثابت ممکن است انعطافپذیری آنها را در برخی از برنامهها محدود کنند. طراحان و توسعه دهندگان باید بین راحتی و انعطاف پذیری یک پروژه طراحی و همچنین در نظر گرفتن حجم کار و پیچیدگی طراحی تعادل ایجاد کنند.
علاوه بر این، نمایه سازی مکانی برای پرس و جوهای جغرافیایی در پایگاه های داده NoSQL حیاتی است. برای عملکرد بهتر پرس و جو، برخی از محققان روش های نمایه سازی فعلی را برای پایگاه های داده های مختلف NoSQL، از جمله R-Tree برای MongoDB [ 44 ، 46 ]، پسوندهای geohash برای MongoDB [ 45 ، 47 ]، یک درخت توسعه مبتنی بر نمودار (GET) برای Neo4j گسترش داده اند. [ 95 ]، و یک طرح نمایه سازی ترکیبی جدید به نام HB+-trie برای ذخیره سازی کلید-مقدار [ 96 ].
در حال حاضر، پایگاههای اطلاعاتی اسناد و ستونهای گسترده از نظر پردازش دادههای مکانی، توجه آکادمیک بیشتری نسبت به پایگاههای اطلاعاتی نمودار و ارزش کلیدی دارند. تحقیقات روی پایگاههای داده اسناد عمدتاً بر بهبود شاخص [ 44 ، 45 ]، تجزیه و تحلیل عملکرد [ 18 ، 23 ] و کاربردهای عملی [ 38 ، 39 ، 40 ] متمرکز شده است. علاوه بر این، به دلیل عملکرد بالای درج و بازیابی داده ها در HBase، بسیاری از محققان سیستم ها و برنامه هایی را برای داده های مکانی بر اساس HBase طراحی کرده اند [ 63 ، 73 ، 79 ، 82 ، 94 .].
یک مقایسه اساسی از اشیاء هندسه، توابع هندسه اصلی، شاخص های فضایی، و قالب های داده پشتیبانی شده توسط این پایگاه های داده NoSQL در جدول 4 نشان داده شده است . خلاصه ای از پردازش داده های مکانی در پایگاه های داده های مختلف NoSQL (بر اساس بررسی و تحلیل ادبیات ما) در جدول 5 فهرست شده است. از میان پایگاههای داده NoSQL، پایگاههای داده اسناد با توجه به اشیاء هندسی که پشتیبانی میکنند، فرمتهای دادهها، عملکرد پرس و جو، توابع جغرافیایی، روشهای نمایهسازی و میزان توجه دانشگاهی که دریافت میکنند، پردازش دادههای جغرافیایی را به بهترین نحو انجام میدهند. سایر پایگاه های داده مزایای خاص خود را برای سناریوهای خاص دارند.
6. نتیجه گیری
در این مقاله، ما پیشرفتهترین پردازش دادههای مکانی مورد استفاده در 10 پایگاه داده محبوب NoSQL را خلاصه کرده و عملکرد آنها را بر اساس اشیاء هندسی پشتیبانیشده، توابع هندسی، شاخصهای فضایی، قالبهای داده، زبانهای پرس و جو و استفاده در آن مقایسه کردیم. تحقیقات دانشگاهی. علاوه بر این، ما مزایا و معایب این پایگاههای داده NoSQL را در پردازش دادههای مکانی تحلیل کردیم. پایگاههای اطلاعاتی گراف و پایگاههای داده کلید-مقدار تمایل دارند شی نقطه هندسی را بیان کنند، بدون پشتیبانی کافی برای سایر ساختارهای هندسی. این کارکردها و کاربردهای هندسی آنها را محدود می کند. علاوه بر این، این دو نوع پایگاه داده از نظر پردازش داده های مکانی مورد توجه دانشگاهی کمی قرار گرفته اند. پایگاههای اطلاعاتی اسناد از انواع ساختارهای هندسی پشتیبانی میکنند و مجموعهای غنیتر از توابع جغرافیایی را نسبت به پایگاههای داده گراف و ارزش کلیدی ارائه میدهند. پایگاه داده های ستون گسترده تنها از تعداد محدودی از پرس و جوها و توابع جغرافیایی پشتیبانی می کنند. با این حال، پایگاه داده های ستونی گسترده برای بسیاری از کاربردها پذیرفته شده است و به طور گسترده توسط دانشگاهیان مورد مطالعه قرار گرفته است، همانطور که پایگاه داده اسناد نیز انجام شده است. بر اساس بررسی ادبیات ما، که شامل مقایسه سیستماتیک ویژگی های پایگاه داده NoSQL است، به این نتیجه رسیدیم که پایگاه های داده اسناد بهترین بستر برای پردازش داده های مکانی هستند، زیرا آنها سریع بارگذاری می شوند و زمان اجرای خوب، عملکرد پرس و جو خوب و فضای مکانی فراوان دارند. توابع و روش های شاخص آنها همچنین مورد توجه دانشگاهی زیادی قرار گرفته اند. پایگاه داده های ستون گسترده تنها از تعداد محدودی از پرس و جوها و توابع جغرافیایی پشتیبانی می کنند. با این حال، پایگاه داده های ستونی گسترده برای بسیاری از کاربردها پذیرفته شده است و به طور گسترده توسط دانشگاهیان مورد مطالعه قرار گرفته است، همانطور که پایگاه داده اسناد نیز انجام شده است. بر اساس بررسی ادبیات ما، که شامل مقایسه سیستماتیک ویژگی های پایگاه داده NoSQL است، به این نتیجه رسیدیم که پایگاه های داده اسناد بهترین بستر برای پردازش داده های مکانی هستند، زیرا آنها سریع بارگذاری می شوند و زمان اجرای خوب، عملکرد پرس و جو خوب و فضای مکانی فراوان دارند. توابع و روش های شاخص آنها همچنین مورد توجه دانشگاهی زیادی قرار گرفته اند. پایگاه داده های ستون گسترده تنها از تعداد محدودی از پرس و جوها و توابع جغرافیایی پشتیبانی می کنند. با این حال، پایگاه داده های ستونی گسترده برای بسیاری از کاربردها پذیرفته شده است و به طور گسترده توسط دانشگاهیان مورد مطالعه قرار گرفته است، همانطور که پایگاه داده اسناد نیز انجام شده است. بر اساس بررسی ادبیات ما، که شامل مقایسه سیستماتیک ویژگی های پایگاه داده NoSQL است، به این نتیجه رسیدیم که پایگاه های داده اسناد بهترین بستر برای پردازش داده های مکانی هستند، زیرا آنها سریع بارگذاری می شوند و زمان اجرای خوب، عملکرد پرس و جو خوب و فضای مکانی فراوان دارند. توابع و روش های شاخص آنها همچنین مورد توجه دانشگاهی زیادی قرار گرفته اند. که شامل مقایسه سیستماتیک ویژگی های پایگاه داده NoSQL است، نتیجه می گیریم که پایگاه های داده اسناد بهترین بستر برای پردازش داده های مکانی هستند، زیرا آنها سریع بارگذاری می شوند و زمان اجرای خوب، عملکرد پرس و جو خوب، و توابع جغرافیایی فراوان و روش های شاخص دارند. آنها همچنین مورد توجه دانشگاهی زیادی قرار گرفته اند. که شامل مقایسه سیستماتیک ویژگی های پایگاه داده NoSQL است، نتیجه می گیریم که پایگاه های داده اسناد بهترین بستر برای پردازش داده های مکانی هستند، زیرا آنها سریع بارگذاری می شوند و زمان اجرای خوب، عملکرد پرس و جو خوب، و توابع جغرافیایی فراوان و روش های شاخص دارند. آنها همچنین مورد توجه دانشگاهی زیادی قرار گرفته اند.
بسته به سناریوی برنامه، پایگاههای داده گراف، پایگاههای داده کلید-مقدار و پایگاههای داده ستون گسترده نیز مزایای خاص خود را دارند. علاوه بر این، محاسبات سطح هندسه و پردازش حجم در پایگاه داده های NoSQL موجود انجام نمی شود. این می تواند جهت جدیدی برای تحقیقات پردازش فضایی باشد.
منابع
- وتساوایی، ر.ر. گانگولی، ا. چاندولا، وی. استفانیدیس، ا. کلاسکی، اس. Shekhar, S. داده کاوی فضایی و زمانی در عصر داده های مکانی بزرگ: الگوریتم ها و کاربردها. در مجموعه مقالات اولین کارگاه بین المللی ACM SIGSPATIAL در تجزیه و تحلیل داده های بزرگ جغرافیایی، 6 نوامبر 2012. ACM: ردوندو بیچ، کالیفرنیا، ایالات متحده آمریکا، 2012; صص 1-10. [ Google Scholar ]
- لی، جی.-جی. کانگ، ام. داده های بزرگ جغرافیایی: چالش ها و فرصت ها. بیگ دیتا Res. 2015 ، 2 ، 74-81. [ Google Scholar ] [ CrossRef ]
- لیو، ز. گوا، اچ. وانگ، سی. ملاحظات در مورد داده های بزرگ جغرافیایی. IOP Conf. سر. 2016 , 46 , 012058. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- یو، پی. جیانگ، LC BigGIS: چگونه داده های بزرگ می توانند GIS نسل بعدی را شکل دهند. در مجموعه مقالات سومین کنفرانس بین المللی آگرو-ژئوانفورماتیک، پکن، چین، 11 تا 14 اوت 2014. ص 413-418. [ Google Scholar ]
- بارالیس، ای. واله، AD; گرزا، پ. روسی، سی. Scullino، F. پایگاه های داده SQL در مقابل NoSQL برای کاربردهای مکانی. در مجموعه مقالات کنفرانس بین المللی IEEE 2017 در مورد داده های بزرگ، IEEE، بوستون، MA، ایالات متحده، 11-14 دسامبر 2017؛ صص 3388-3397. [ Google Scholar ]
- اشمید، اس. گالیچ، ای. Reinhardt, W. بررسی عملکرد پایگاههای داده انتخابی SQL و NoSQL. In Proceedings of the AGILE 2015، لیسبون، پرتغال، 9 تا 12 ژوئن 2015. [ Google Scholar ]
- هو، اف. Xu، MC; یانگ، جی سی. لیانگ، YS؛ Cui، KJ; کوچک، MM. Lynnes، CS; دافی، دی کیو؛ Yang, CW ارزیابی ظروف داده منبع باز برای مدیریت داده های شطرنجی بزرگ جغرافیایی. ISPRS Int. J. Geo Inf. 2018 ، 7 ، 144. [ Google Scholar ]
- اوبه، RO; Hsu, LS PostGIS in Action , 2nd ed.; Manning Publications Co.: Shelter Island, NY, USA, 2015. [ Google Scholar ]
- ژونگ، ی. هان، جی. ژانگ، تی. Fang, J. یک چارچوب ذخیره سازی و پردازش داده های مکانی توزیع شده برای WebGIS در مقیاس بزرگ. در مجموعه مقالات بیستمین کنفرانس بین المللی ژئوانفورماتیک 2012، هنگ کنگ، چین، 15 تا 17 ژوئن 2012. صص 1-7. [ Google Scholar ]
- اسناد پایگاه داده اوراکل. در دسترس آنلاین: https://docs.oracle.com/en/database/oracle/oracle-database/index.html (دسترسی در 4 اکتبر 2019).
- او، سی. Rischpater، R. داده های جغرافیایی با پایگاه داده Azure SQL. در Microsoft Mapping: Geospatial Development در ویندوز 10 با Bing Maps و C# . Apress: برکلی، کالیفرنیا، ایالات متحده آمریکا، 2015; صص 33-53. [ Google Scholar ]
- Microsoft SQL Server/Data Geospatial. در دسترس آنلاین: https://en.wikibooks.org/wiki/Microsoft_SQL_Server/Geospatial_Data (در 8 مه 2018 قابل دسترسی است).
- تانگ، EQ; مقایسه عملکرد فن، YS بین پنج پایگاه داده NoSQL. در مجموعه مقالات هفتمین کنفرانس بین المللی 2016 در محاسبات ابری و داده های بزرگ، ماکائو، چین، 16 تا 18 نوامبر 2016؛ صص 105-109. [ Google Scholar ]
- چنگ، بی. Guan, X. طراحی و ارزیابی چارچوب خدمات کاشی نقشه وب با همزمانی بالا بر روی یک خوشه با کارایی بالا. بین المللی J. Grid Distrib. محاسبه کنید. 2016 ، 9 ، 127-142. [ Google Scholar ] [ CrossRef ]
- رمضان، س. باجوا، IS; کاظمی، ر آمنا. چالشهای ذخیرهسازی دادههای توزیعشده مبتنی بر NoSQL: مروری بر ادبیات سیستماتیک. Electronics 2019 ، 8 ، 29. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
- اکبر، امام; پورنما، IKE; نوگروهو، اس ام اس; Hariadi, M. نقشه مبتنی بر خوشه سریع و کارآمد برای ردیابی کشتی. در مجموعه مقالات کنفرانس بین المللی 2018 مهندسی کامپیوتر، شبکه و چند رسانه ای هوشمند، سورابایا، اندونزی، 26-27 نوامبر 2018؛ ص 265-269. [ Google Scholar ]
- پولاکوا، م. Vitols، G. استفاده از فناوری NoSQL برای تجزیه و تحلیل داده های فضایی بدون ساختار. در تحقیق برای توسعه روستایی 2018 ; Treija, S., Skujeniece, S., Eds. دانشگاه علوم و فنون زیستی لتونی: یلگاوا، لتونی، 2018; جلد 2، ص 267–270. [ Google Scholar ]
- آگاروال، اس. راجان، KS تجزیه و تحلیل عملکرد MongoDB در مقابل پایگاه های داده PostGIS/PostGreSQL برای پرس و جوهای فضایی تقاطع خط و محدودیت نقطه. تف کردن Inf. Res. 2016 ، 24 ، 671-677. [ Google Scholar ] [ CrossRef ]
- آگاروال، اس. راجان، ک. تجزیه و تحلیل عملکرد پایگاه داده های NoSQL در مقابل SQL برای پرس و جوهای فضایی و جمعی. در مجموعه مقالات کنفرانس نرم افزار رایگان و منبع باز برای زمین فضایی (FOSS4G)، بوستون، MA، ایالات متحده آمریکا، 14 تا 19 اوت 2017. [ Google Scholar ]
- سیموندز، آر. واتسون، پی. Halliday, J. Antares: ذخیرهگاه دادههای مقیاسپذیر، بیدرنگ و تحملپذیر خطا برای تحلیل فضایی. در سال 2015 کنگره جهانی خدمات IEEE (SERVICES) ؛ Zhang, LJ, Bahsoon, R., Eds. IEEE: شهر نیویورک، نیویورک، ایالات متحده آمریکا، 2015؛ صص 105-112. [ Google Scholar ]
- امیریان، پ. بصیری، ع. Winstanley، A. ارزیابی سیستم های مدیریت داده برای داده های بزرگ جغرافیایی. در علوم محاسباتی و کاربردهای آن-ICCSA 2014 ; Springer International Publishing: Guimarães، پرتغال، 2014; صص 678-690. [ Google Scholar ]
- لبه، LVD; برنقی، پ. تندی، جی. اتمزینگ، جی. اتکینسون، آر. کاکرین، بی. فتحی، ی. کاسترو، آر جی. هالر، ا. هارث، ا. و همکاران بهترین روش ها برای انتشار، بازیابی و استفاده از داده های مکانی در وب. سمنت. وب 2019 ، 10 ، 95-114. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- بیشتر، NP; نیکام، وی بی. Sen، بررسی تجربی SS از بسترهای داده های بزرگ جغرافیایی. در مجموعه مقالات بیست و پنجمین کنفرانس بین المللی Ieee 2018 در کارگاه محاسباتی با عملکرد بالا، بنگالورو، هند، 17 تا 20 دسامبر 2018؛ صص 137-143. [ Google Scholar ]
- پاترومپاس، ک. جیانوپولوس، جی. Athanasiou، S. Towards GeoSpatial Semantic Data Management: قوت ها، ضعف ها و چالش های پیش رو. در مجموعه مقالات سمپوزیوم بینالمللی ACM در مورد پیشرفتها در سیستمهای اطلاعات جغرافیایی، انجمن ماشینهای محاسباتی، نیویورک، نیویورک، ایالات متحده آمریکا، 7 تا 10 اوت 2017؛ صص 301-310. [ Google Scholar ]
- کنسرسیوم، استاندارد پیادهسازی OG OpenGIS® برای اطلاعات جغرافیایی – دسترسی به ویژگیهای ساده – بخش 1: معماری مشترک. در دسترس آنلاین: https://www.ogc.org/standards/sfa (در 4 دسامبر 2011 قابل دسترسی است).
- Egenhofer، MJ; Franzosa، روابط فضایی توپولوژیکی مجموعه نقطه RD. بین المللی جی. جئوگر. Inf. سیستم 1991 ، 5 ، 161-174. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- راندل، دی. کوی، ز. Cohn, AG یک منطق فضایی مبتنی بر مناطق و اتصال. در مجموعه مقالات سومین کنفرانس بین المللی اصول بازنمایی و استدلال دانش، کمبریج، MA، ایالات متحده آمریکا، 23-25 اکتبر 1992; صص 165-176. [ Google Scholar ]
- نبرد، آر. کولاس، دی. فعال کردن وب معنایی مکانی با پارلمان و GeoSPARQL. سمنت. وب 2012 ، 3 ، 355-370. [ Google Scholar ] [ CrossRef ]
- کیان، سی. یی، سی. چنگ، CQ; Pu، GL; وی، ایکس اف؛ ژانگ، شاخص فضایی-زمانی مبتنی بر HC GeoSOT دادههای مسیر عظیم. ISPRS Int. J. Geo Inf. 2019 ، 8 ، 284. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
- رتبه بندی موتورهای DB. در دسترس آنلاین: https://db-engines.com/en/ranking (در 8 اکتبر 2019 قابل دسترسی است).
- بارتوشفسکی، دی. پیورکوفسکی، آ. Lupa, M. مقایسه کارایی پردازش دادههای مکانی برای پایگاههای داده PostGIS و MongoDB، در پایگاههای فراتر. در معماری و سازه. هموار کردن مسیر پردازش و تحلیل هوشمند داده ها . Kozielski, S., Mrozek, D., Kasprowski, P., Małysiak-Mrozek, B., Kostrzewa, D., Eds. Springer: Cham، سوئیس، 2019; صص 291-302. [ Google Scholar ]
- Laksono، D. آزمایش تحویل داده های مکانی در پایگاه داده SQL و NoSQL با استفاده از NodeJS Fullstack Web App. در مجموعه مقالات چهارمین کنفرانس بین المللی علم و فناوری 2018، ICST 2018، یوگیاکارتا، اندونزی، 7 تا 8 اوت 2018. [ Google Scholar ]
- دوان، ام آر. چن، جی. ارزیابی عملکرد بازیابی فضایی MongoDB. در مجموعه مقالات بیست و سومین کنفرانس بین المللی ژئوانفورماتیک 2015، ووهان، چین، 19 تا 21 ژوئن 2015. [ Google Scholar ]
- بوردوگنا، جی. Ciriello، DE; Psaila، G. چارچوب انعطاف پذیر برای تجزیه و تحلیل متقابل اطلاعات چند منبع جغرافیایی ناهمگن: پیشنهاد J-CO-QL و اجرای آن. در مجموعه مقالات کنفرانس بین المللی IEEE/Wic/Acm 2017 در زمینه هوش وب، انجمن ماشین های محاسباتی، لایپزیگ، آلمان، 23 تا 26 اوت 2017؛ صص 499-508. [ Google Scholar ]
- دتی، ا. روسی، جی. Melazzi، NB بهره برداری از شبکه اطلاعات محور برای فدرال پایگاه داده های فضایی. دسترسی IEEE 2019 ، 7 ، 165248–165261. [ Google Scholar ] [ CrossRef ]
- Krämer, M. GeoRocket: یک فروشگاه داده مقیاس پذیر و مبتنی بر ابر برای فایل های بزرگ مکانی. SoftwareX 2020 , 11 , 100409. [ Google Scholar ] [ CrossRef ]
- Rainho، FD; Bernardino, J. Web GIS: یک سیستم جدید برای ذخیره داده های مکانی با استفاده از GeoJSON در MongoDB. در مجموعه مقالات سیزدهمین کنفرانس ایبری 2018 در مورد سیستمهای اطلاعاتی و فناوریها، کاسرس، اسپانیا، 13 تا 16 ژوئن 2018. [ Google Scholar ]
- یاقوت، م. Trigunarsyah, B. Web-GIS برای پشتیبانی از سیستم گزارش دهی تعمیر و نگهداری: کاربرد در عربستان سعودی. زیرساخت. مدیریت دارایی 2018 ، 5 ، 14-21. [ Google Scholar ] [ CrossRef ]
- ژانگ، XM؛ آهنگ، دبلیو. لیو، LM یک رویکرد پیاده سازی برای ذخیره داده های مکانی GIS در پایگاه داده NoSQL. در مجموعه مقالات بیست و دومین کنفرانس بین المللی ژئوانفورماتیک 2014، کائوسیونگ، تایوان، 25 تا 27 ژوئیه 2014. [ Google Scholar ]
- ژائو، سی ایکس؛ وو، ق. تائو، YC; گائو، WC; لیو، جی. طراحی و اجرای پلت فرم چارچوب جغرافیایی بنیادی پکن. در مجموعه مقالات آرشیو بین المللی فتوگرامتری، سنجش از دور و علوم اطلاعات فضایی، سوژو، چین، 14 تا 16 مه 2014. [ Google Scholar ]
- فرو، م. فراگوسو، آر. فیدالگو، آر. انبار داده های مکانی مبتنی بر سند: ارزیابی تجربی پرس و جوهای SOLAP. در مجموعه مقالات بیست و یکمین کنفرانس IEEE در انفورماتیک تجاری، CBI 2019، مسکو، روسیه، 15 تا 17 ژوئیه 2019. [ Google Scholar ]
- فرو، م. لیما، آر. Fidalgo, R. ارزیابی افزونگی و پارتیشن بندی داده های مکانی در انبارهای داده مدار مدار. در یادداشت های سخنرانی در علوم کامپیوتر (از جمله یادداشت های سخنرانی های فرعی در هوش مصنوعی و یادداشت های سخنرانی در بیوانفورماتیک) ؛ Springer: Geneve, Switzerland, 2019; ص 221-235. [ Google Scholar ]
- جون، اس. لی، اس. سیستم نمونه اولیه برای به اشتراک گذاری ساختمان داده های مکانی با استفاده از فناوری وب منبع باز توسعه یافته است. تف کردن Inf. Res. 2017 ، 25 ، 725-733. [ Google Scholar ] [ CrossRef ]
- شیانگ، ال جی؛ شائو، XT; Wang، DH ارائه پشتیبانی R-Tree برای MongoDB. ISPRS Int. قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2016 ، XLI-B4 ، 545–549. [ Google Scholar ] [ CrossRef ]
- لی، ی. کیم، دی. روش شاخص فضایی شین، BS Geohashed برای یک سیستم نظارت بر داده های WBAN با موقعیت مکانی مبتنی بر NoSQL. J. Inf. روند. سیستم 2016 ، 12 ، 263-274. [ Google Scholar ]
- شیانگ، ال جی؛ هوانگ، جی تی. شائو، XT; Wang، DH مدیریت دادههای فضایی مسطح مبتنی بر MongoDB با درخت R مسطح. ISPRS Int. J. Geo Inf. 2016 ، 5 ، 119. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
- Guan، XF; بو، سی. لی، ZQ; Yu، YJ ST-Hash: یک شاخص فضایی و زمانی کارآمد برای داده های مسیر عظیم در یک پایگاه داده NoSQL. در مجموعه مقالات بیست و پنجمین کنفرانس بین المللی ژئوانفورماتیک ۲۰۱۷، بوفالو، نیویورک، ایالات متحده آمریکا، ۲ تا ۴ اوت ۲۰۱۷. [ Google Scholar ]
- چرا Couchbase؟ در دسترس آنلاین: https://docs.couchbase.com/server/6.0/introduction/intro.html (دسترسی در 10 ژوئن 2019).
- ارزش های فضایی در دسترس به صورت آنلاین: https://neo4j.com/docs/cypher-manual/3.5/syntax/spatial/ (در 2 سپتامبر 2019 قابل دسترسی است).
- Neo4j Spatial v0.24-neo4j-3.1.4. در دسترس آنلاین: https://neo4j-contrib.github.io/spatial/0.24-neo4j-3.1/index.html (در 1 ژوئن 2017 قابل دسترسی است).
- سروات، م. Sun، YH; IEEE. پاسخگویی به پرس و جوهای قابلیت دسترسی به گراف آگاه از موقعیت مکانی در داده های جغرافیایی اجتماعی. در مجموعه مقالات سی و سومین کنفرانس بین المللی مهندسی داده IEEE 2017، سن دیگو، کالیفرنیا، ایالات متحده آمریکا، 19 تا 22 آوریل 2017؛ ص 207-210. [ Google Scholar ]
- Sun، YH; Sarwat، M. یک عملگر گسترش راس فضایی هرس شده در سیستم پایگاه داده گراف Neo4j. Geoinformatica 2019 ، 23 ، 397–423. [ Google Scholar ] [ CrossRef ]
- باکال، اف. ساواس، NS; ایکن، س. سیار، الف. مدلسازی و پرس و جو مسیرها با استفاده از Neo4j Spatial و TimeTree برای تطبیق Carpool. در مجموعه مقالات کنفرانس بین المللی Ieee 2017 در مورد نوآوری ها در سیستم ها و برنامه های هوشمند، Gdynia، لهستان، 3 تا 5 ژوئیه 2017؛ ص 219-222. [ Google Scholar ]
- Idziaszek، P. مولر، دبلیو. گورنا، ک. اوکان، پی. بونیکی، پی. کوزیلا، ک. فوجود، الف. شناسایی وضعیت محصولات زراعی بر اساس داده های مکانی جاسازی شده در پایگاه داده های گراف. در مجموعه مقالات نهمین کنفرانس بین المللی پردازش تصویر دیجیتال، هنگ کنگ، چین، 19 تا 22 مه 2017. [ Google Scholar ]
- مولر، دبلیو. رودویچ-ناوروکا، ج. اوترزاسک، جی. Idziaszek، P. Weres, J. داده های فضایی و پایگاه های نموداری برای شناسایی روابط بین اعضای گله گاو. آگاه کردن. Geoinf. سنسور از راه دور Conf. Proc. Sgem 2016 ، 1 ، 835-842. [ Google Scholar ]
- بن براهیم، م. دریرا، دبلیو. فیلالی، ف. حمدی، N. پسوند داده های فضایی برای پایگاه داده NoSQL Cassandra. J. Big Data 2016 , 3 , 11. [ Google Scholar ] [ CrossRef ]
- Nidzwetzki، JK; Guting، RH Distributed SECONDO: یک سیستم بسیار در دسترس و مقیاس پذیر برای پردازش داده های مکانی. در پیشرفت در پایگاه داده های مکانی و زمانی ; Claraunt, C., Schneider, M., Wong, RC-W., Xiong, L., Loh, W.-K., Shahabi, C., Li, KJ, Eds. Springer: Genève, Switzerland, 2015; ص 491-496. [ Google Scholar ]
- Nidzwetzki، JK; Guting، RH DISTRIBUTED SECONDO: یک سیستم مدیریت پایگاه داده قابل توسعه و مقیاس پذیر. توزیع کنید. پایگاه های داده موازی 2017 ، 35 ، 197-248. [ Google Scholar ] [ CrossRef ]
- واساوی، س. پریا نماینده مجلس Gokhale، چارچوب AA برای پردازش پرس و جوی مکانی با ادغام cassandra با هادوپ. در محاسبات دانش و کاربردهای آن: روش های دستکاری و پردازش دانش: جلد 1 ; Springer: سنگاپور، 2018; صص 131-160. [ Google Scholar ]
- شاه، پ. Chaudhary, S. چارچوب تجزیه و تحلیل داده های بزرگ برای داده های مکانی. در یادداشت های سخنرانی در علوم کامپیوتر (از جمله یادداشت های سخنرانی های فرعی در هوش مصنوعی و یادداشت های سخنرانی در بیوانفورماتیک) ؛ Springer: Geneve, Switzerland, 2018; ص 250-265. [ Google Scholar ]
- وب سایت Spark-Cassandra-Connector. در دسترس آنلاین: https://github.com/datastax/spark-cassandra-connector (در 4 ژانویه 2020 قابل دسترسی است).
- راهنمای مرجع Apache HBase™. در دسترس آنلاین: https://hbase.apache.org/book.html (در 16 آوریل 2020 قابل دسترسی است).
- Le، HV; تاکاسو، A. G-HBase: یک پایگاه داده جغرافیایی با کارایی بالا بر اساس HBase. Ieice Trans. Inf. سیستم 2018 ، 101 ، 1053-1065. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- هان، دی. Stroulia، E. HGrid: یک مدل داده برای مجموعه داده های جغرافیایی بزرگ در HBase. در مجموعه مقالات ششمین کنفرانس بین المللی IEEE در سال 2013 در محاسبات ابری، سانتا کلارا، کالیفرنیا، ایالات متحده آمریکا، 28 ژوئن تا 3 ژوئیه 2013. ص 910-917. [ Google Scholar ]
- هان، دی. Stroulia، E. فدراسيون برنامههاي تحت وب در ابر سلسله مراتبي. در مجموعه مقالات هفتمین کنفرانس بین المللی IEEE در سال 2014 در محاسبات ابری، انکوریج، AK، ایالات متحده آمریکا، 27 ژوئن تا 2 ژوئیه 2014. IEEE: Anchorage, AK, USA, 2014; ص 946-947. [ Google Scholar ]
- ژانگ، نیویورک؛ ژنگ، جی.زی. چن، اچ جی. چن، جی. Chen, X. HBaseSpatial: ذخیرهسازی دادههای فضایی مقیاسپذیر بر اساس HBase. در مجموعه مقالات سیزدهمین کنفرانس بین المللی IEEE 2014 در مورد اعتماد، امنیت و حریم خصوصی در محاسبات و ارتباطات، پکن، چین، 24 تا 26 سپتامبر 2014. صص 644-651. [ Google Scholar ]
- وانگ، ی. لی، سی جی; لی، ام. طرحواره های ذخیره سازی Liu، ZL HBase برای داده های برداری فضایی عظیم. خوشه. محاسبه کنید. J. Netw. نرم افزار ابزارهای کاربردی 2017 ، 20 ، 3657–3666. [ Google Scholar ] [ CrossRef ]
- کار.؛ یونگ، S. روش نمایه سازی درخت مستطیل محدود مبتنی بر ربع برای جستارهای تشابه بر روی داده های فضایی بزرگ در HBase. Sensors 2018 , 18 , 3032. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- او، SW; چو، LX؛ Li، XY پردازش پرس و جو فضایی برای برنامه مبتنی بر مکان در Hbase. در مجموعه مقالات دومین کنفرانس بین المللی IEEE 2017 در مورد تجزیه و تحلیل داده های بزرگ، پکن، چین، 10 تا 12 مارس 2017؛ صص 115-119. [ Google Scholar ]
- چن، XY; ژانگ، سی. جی، بی. Xiao، WD Spatio-Temporal Queries در HBase. در مجموعه مقالات کنفرانس بین المللی IEEE 2015 در مورد داده های بزرگ، سانتا کلارا، کالیفرنیا، ایالات متحده، 29 اکتبر تا 1 نوامبر 2015؛ صفحات 1929-1937. [ Google Scholar ]
- لی، LH; لیو، WD; ژونگ، زی؛ Huang، CQ SP-Phoenix: یک سیستم مدیریت داده های نقطه ای عظیم مبتنی بر فونیکس. در مجموعه مقالات بیستمین کنفرانس بین المللی IEEE برای محاسبات و ارتباطات با عملکرد بالا/ شانزدهمین کنفرانس بین المللی شهر هوشمند/IEEE چهارمین کنفرانس بین المللی علم و سیستم های داده، اکستر، بریتانیا، 28 تا 30 ژوئن 2018؛ صفحات 1634-1641. [ Google Scholar ]
- شانگگوان، بی. یو، پی. وو، زی. جیانگ، ال. پردازش داده های فضایی بزرگ با اسپارک آپاچی. در مجموعه مقالات ششمین کنفرانس بین المللی 2017 در Agro-Geoinformatics، Agro-Geoinformatics، Fairfax، VA، ایالات متحده آمریکا، 7 تا 10 اوت 2017. [ Google Scholar ]
- ژنگ، ک. ژنگ، ک. Fang، FL; ژانگ، ام. لی، کیو. وانگ، YH; Zhao، WY یک طرح سلسله مراتبی فضایی اضافی در ذخیره کلید-مقدار. خوشه. محاسبه کنید. J. Netw. نرم افزار ابزارهای کاربردی 2019 ، 22 ، S6483–S6497. [ Google Scholar ] [ CrossRef ]
- GeoMesa: ذخیره، فهرست، پرس و جو، و تبدیل داده های فضایی-زمانی در مقیاس در HBase، Accumulo، Cassandra، Kafka و Spark. در دسترس آنلاین: https://www.geomesa.org/index.html (در 16 اوت 2018 قابل دسترسی است).
- چو، دبلیو. چوی، ای. مبنای تحلیل داده های بزرگ فضایی با سیستم تطبیق نقشه. خوشه. محاسبه کنید. J. Netw. نرم افزار ابزارهای کاربردی 2017 ، 20 ، 2177–2192. [ Google Scholar ] [ CrossRef ]
- گائو، اف. یو، پی. وو، زی. Zhang، M. ذخیره سازی داده های جغرافیایی بر اساس HBase و MapReduce. در مجموعه مقالات ششمین کنفرانس بین المللی 2017 در زمینه آگرو-ژئوانفورماتیک، فیرفکس، VA، ایالات متحده آمریکا، 7 تا 10 اوت 2017; صص 55-58. [ Google Scholar ]
- آموزش MapReduce. در دسترس آنلاین: https://hadoop.apache.org/docs/r1.2.1/mapred_tutorial.html (در 22 آگوست 2019 قابل دسترسی است).
- Du، NB; ژان، جی اف. ژائو، ام. شیائو، DR; Xie، مدل شاخص داده مکانی-زمانی YC از اجسام متحرک در شبکه های ثابت با استفاده از HBase. در مجموعه مقالات کنفرانس بین المللی Ieee در سال 2015 در زمینه هوش محاسباتی و فناوری ارتباطات، 2015، قاضی آباد، هند، 13 تا 14 فوریه 2015; صص 247-251. [ Google Scholar ]
- کار.؛ Jung، S. تکنیک نمایه سازی MBR-Tree مبتنی بر ربع برای جستجوی محدوده از طریق HBase. در مجموعه مقالات هفتمین کنفرانس بین المللی پایگاه های داده در حال ظهور: فناوری ها، کاربردها و نظریه، بوسان، کره، 7 تا 9 اوت 2017؛ Lee, W., Choi, W., Jung, S., Song, M., Eds. Springer: سنگاپور، 2018; ص 14-24. [ Google Scholar ]
- وان، LH; تاکاسو، A. یک شاخص توزیع شده کارآمد برای پایگاههای داده مکانی. در مجموعه مقالات کنفرانس بین المللی پایگاه داده و برنامه های کاربردی سیستم های خبره، والنسیا، اسپانیا، 1 تا 4 سپتامبر 2015. ص 28-42. [ Google Scholar ]
- ژای، WX; یانگ، ز. وانگ، ال. وو، فلوریدا؛ Cheng، CQ مدل مدیریت داده های مکانی غیر sql در زمان کلان داده. در مجموعه مقالات سمپوزیوم بین المللی زمین شناسی و سنجش از دور IEEE 2015، میلان، ایتالیا، 26 تا 31 ژوئیه 2015. ص 4506-4509. [ Google Scholar ]
- وانگ، ک. لیو، جی ال. ژای، م. وانگ، ZW; Zhou، CY ساخت یک مدل ذخیره سازی کارآمد از اطلاعات مکانی-زمانی بر اساس HBase. جی. اسپات. علمی 2019 ، 64 ، 301-317. [ Google Scholar ] [ CrossRef ]
- ژانگ، دی اف. وانگ، ی. لیو، ZL; Dai, SJ بهبود طرح واره ذخیره سازی NoSQL بر اساس منحنی Z برای داده های برداری فضایی. دسترسی IEEE 2019 ، 7 ، 78817–78829. [ Google Scholar ] [ CrossRef ]
- ژنگ، ک. گو، دی. نیش، اف. ژانگ، ام. ژنگ، ک. لی، کیو. استراتژی بهینه سازی ذخیره سازی داده ها در پایگاه داده ستون محور توزیع شده با در نظر گرفتن مجاورت فضایی. خوشه. محاسبه کنید. J. Netw. نرم افزار ابزارهای کاربردی 2017 ، 20 ، 2833-2844. [ Google Scholar ] [ CrossRef ]
- توماس، جی. الکساندر، جی. Sasi، PM طراحی نقشه مبتنی بر خوشه با کارایی بالا برای ردیابی وسایل نقلیه وسایل نقلیه حمل و نقل عمومی در شهر هوشمند. در مجموعه مقالات سمپوزیوم بین المللی IEEE منطقه 10 در سال 2017 در زمینه فناوری برای شهرهای هوشمند، کوچین، هند، 14 تا 16 ژوئیه 2017. [ Google Scholar ]
- بارتلت، آر. ذخیره و پرس و جو اطلاعات جغرافیایی محلی با استفاده از elasticsearch. در مجموعه مقالات سیزدهمین کارگاه در مورد بازیابی اطلاعات جغرافیایی، لیون، فرانسه، 28 تا 29 نوامبر 2019. [ Google Scholar ]
- Toepke، SL از جستجوی elastics و botometer برای کشف اطلاعات جغرافیایی داوطلبانه استفاده می کند. در مجموعه مقالات کنفرانس بین المللی ISCRAM، روچستر، نیویورک، ایالات متحده آمریکا، 20 تا 23 مه 2018. [ Google Scholar ]
- Cinquini، L. کرایتون، دی. متمن، سی. هارنی، جی. شیپمن، جی. وانگ، FY; آنانتاکریشنان، ر. میلر، ن. دنویل، اس. مورگان، ام. و همکاران فدراسیون شبکه سیستم زمین: یک زیرساخت باز برای دسترسی به داده های جغرافیایی توزیع شده. ژنرال آینده. محاسبه کنید. سیستم بین المللی J. Grid Comput. علوم 2014 ، 36 ، 400-417 . [ Google Scholar ] [ CrossRef ]
- فلورانس، پی. مک گی، ام. بارنت، سی. مک دونالد، اس. فدراسیون ژئوپورتال باز. J. Map Geogr. Libr 2015 ، 11 ، 376-394. [ Google Scholar ] [ CrossRef ]
- کورتی، پی. کرالیدیس، AT; لوئیس، ب. افزایش کشف در زیرساخت های داده های مکانی با استفاده از موتور جستجو. Peerj Comput. علمی 2018 ، 4 ، e152. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- Celko, J. راهنمای کامل NoSQL، آنچه که هر حرفه ای SQL باید در مورد پایگاه داده های غیر رابطه ای بداند . مورگان کافمن: بوستون، MA، ایالات متحده آمریکا، 2014; صص 103-117. [ Google Scholar ]
- شارما، م. شارما، وی دی. Bundele، MM تجزیه و تحلیل عملکرد پایگاه های داده RDBMS و بدون SQL: PostgreSQL، MongoDB و Neo4j. در مجموعه مقالات سومین کنفرانس بینالمللی و کارگاههای آموزشی در مورد پیشرفتها و نوآوریهای اخیر در مهندسی، ICRAIE 2018، جیپور، هند، 22 تا 25 نوامبر 2018. [ Google Scholar ]
- وانگ، ال. چن، بی. Liu، YH ذخیرهسازی توزیعشده و فهرست دادههای فضایی برداری بر اساس HBase. در مجموعه مقالات بیست و یکمین کنفرانس بین المللی ژئوانفورماتیک 2013، کایفنگ، چین، 20 تا 22 ژوئن 2013. [ Google Scholar ]
- جیانگ، اچ. کانگ، جی اف. Du، ZH; ژانگ، اف. هوانگ، XZ; لیو، RY؛ Zhang، XT ذخیرهسازی کلان دادههای فضایی بردار و پرسوجو بهینهشده بر اساس شاخص شبکه چند سطحی هیلبرت در HBase. اطلاعات 2018 ، 9 ، 116. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
- ژانگ، HC; لو، اف. Chen, J. یک روش پرسوجو دامنه پیوسته مبتنی بر نمودار خطی برای حرکت اجسام در شبکهها. ISPRS Int. J. Geo Inf. 2016 ، 5 ، 246. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
- Ahn، JS; سئو، سی. مایورام، آر. یاسین، ر. کیم، جی اس؛ Maeng، S. ForestDB: یک سیستم ذخیره سازی سریع کلید-مقدار برای کلیدهای رشته ای با طول متغیر. IEEE Trans. محاسبه کنید. 2016 ، 65 ، 902-915. [ Google Scholar ] [ CrossRef ]
بدون دیدگاه