خلاصه

چندین کاربرد در دنیای واقعی شامل تجمیع ویژگی های فیزیکی مربوط به پدیده های مختلف جغرافیایی و توپوگرافی است. این اطلاعات نقش مهمی در تحلیل و پیش‌بینی چندین رویداد دارد. مناطق کاربردی، که اغلب به تجزیه و تحلیل بلادرنگ نیاز دارند، شامل جریان ترافیک، پوشش جنگلی، پایش بیماری و غیره است. بنابراین، اکثر سیستم های موجود محدودیت هایی را در سطوح مختلف پردازش و پیاده سازی به تصویر می کشند. برخی از متداول ترین عوامل مشاهده شده شامل فقدان قابلیت اطمینان، مقیاس پذیری و بیش از حد هزینه های محاسباتی است. در این مقاله، ما به چارچوب‌های مختلف بدون سرور مقیاس‌پذیر معروف، مانند خدمات وب آمازون (AWS) Lambda، Google Cloud Functions و Microsoft Azure Functions برای مدیریت داده‌های بزرگ جغرافیایی می‌پردازیم. ما برخی از رویکردهای موجود را که به طور رایج در تجزیه و تحلیل داده‌های بزرگ جغرافیایی استفاده می‌شوند مورد بحث قرار می‌دهیم و محدودیت‌های آنها را نشان می‌دهیم. ما کاربرد چارچوب پیشنهادی خود را در بستر سیستم اطلاعات جغرافیایی ابری (GIS) گزارش می‌کنیم. گزارشی از برخی فناوری‌ها و ابزارهای پیشرفته مرتبط با حوزه مشکل ما مورد بحث قرار می‌گیرد. ما همچنین عملکرد چارچوب پیشنهادی را از نظر قابلیت اطمینان، مقیاس‌پذیری، سرعت و پارامترهای امنیتی تجسم می‌کنیم. علاوه بر این، ما تحلیل همپوشانی نقشه، تجزیه و تحلیل نقطه-خوشه، نقشه حرارتی تولید شده و تجزیه و تحلیل خوشه‌بندی را ارائه می‌کنیم. برخی از نمودارهای آماری مربوطه نیز تجسم می شوند. در این مقاله، دو مطالعه موردی کاربردی را در نظر می گیریم. اولین مطالعه موردی با استفاده از مجموعه داده سیستم داده منابع معدنی (MRDS) مورد بررسی قرار گرفت. که به تراکم جهانی منابع معدنی به صورت کشوری اشاره دارد. مطالعه موردی دوم با استفاده از مجموعه داده Fairfax Forecast Households انجام شد که نشان‌دهنده پیش‌بینی خانواده در سطح بسته برای 30 سال متوالی است. مدل پیشنهادی یک چارچوب بدون سرور را برای کاهش محدودیت‌های زمانی ادغام می‌کند و همچنین عملکرد مرتبط با پردازش داده‌های مکانی را برای داده‌های ابرطیفی با ابعاد بالا بهبود می‌بخشد.

کلید واژه ها:

رایانش ابری ؛ چارچوب بدون سرور Cloud GIS ; ژئوپورتال ; مقیاس پذیری ؛ تاخیر

1. معرفی

سال‌های اخیر شاهد رشد عظیمی در تولید داده‌های دیجیتال عظیم بوده‌ایم که درک و شناخت چندین ویژگی از دنیای فیزیکی را تسهیل کرده است. تلاقی هوش مکانی با این ویژگی‌های فیزیکی منجر به درک و مدیریت فعالیت‌های ارجاع‌شده جغرافیایی شده است [ 1 , 2 ]]. با تکامل فنی پلتفرم‌ها و ابزارهای مدرن، ادراک و نمایش داده‌ها به طور قابل توجهی تغییر کرده است. استخراج اطلاعات مکانی کمک زیادی به بخش های اجتماعی، صنعتی و بهداشتی کرده است. اطلاعات به‌دست‌آمده با کمک این مدل‌ها معمولا نیازمند محاسبات و ذخیره‌سازی فشرده است. بنابراین، فناوری‌های امیدوارکننده‌تری مانند محاسبات ابری، محاسبات لبه، محاسبات مه و غیره به سرعت برای مدیریت و نظارت بر چنین اطلاعات عظیمی در حال ظهور هستند. زیرساخت محاسبات ابری قابلیت‌های شهودی بیشتری را ارائه کرده است و شیوه نمایش داده‌های مکانی-زمانی را به‌طور قابل‌توجهی تغییر داده است. در این راستا، ژئوپورتال‌ها نقش مرتبطی در ساخت پلتفرم‌های سیستم اطلاعات جغرافیایی ابری (GIS) دارند.3 ، 4 ، 5 ]. پیاده‌سازی ژئوپورتال‌ها بستری مبتنی بر وب را برای کانال‌گذاری داده‌های جغرافیایی فراهم می‌کند. پورتال های جغرافیایی در همگرایی با چارچوب Cloud GIS به عنوان یک ویژگی کلیدی برای تسهیل تبادل داده های مکانی به دست آمده از بسیاری از مکان ها از طریق اینترنت عمل می کنند.
الگوی محاسبات ابری چندین برنامه پیچیده را ارائه می دهد و هزینه های ذخیره سازی و محاسباتی را تا حد زیادی کاهش داده است. مفهوم محاسبات بدون سرور به عنوان پیش‌بینی برای مدیریت جمع‌آوری داده‌ها در مقیاس فزاینده به وجود آمد. رشد فناورانه در قابلیت‌های رویکردهای بدون سرور، آنها را در رسیدگی به مسائل تأخیر و ارائه خدمات بدون وقفه به کاربران تطبیق‌پذیرتر کرده است [ 6 ، 7 ]]. بنابراین، نیاز به رسیدگی به نیازهای متنوع سیستم را می توان به طور موثر و قابل اعتماد مدیریت کرد. پلت فرم بدون سرور به طور قابل ملاحظه ای قابلیت های مبتنی بر ابر را گسترش می دهد و زیرساخت های برون سپاری را که برای انجام چندین محاسبات پیچیده حیاتی هستند، فراهم می کند. بر اساس مفاهیم تکاملی ارائه شده توسط پلت فرم بدون سرور، دو دسته بندی اساسی را می توان انجام داد:
  • Back-end-as-a-Service (BaaS): از نظر مفهومی مشابه نرم افزار به عنوان سرویس (SaaS) است. این شامل قرار دادن راه حل های خارج از قفسه در سمت سرور با افزودن ماژولاریت بیشتر به سیستم است [ 8 ]. سرویس‌های BaaS مؤلفه‌های عمومی دامنه را نشان می‌دهند که می‌توانند در چندین برنامه کاربردی خارجی تعریف‌شده توسط کاربر گنجانده شوند. Firebase یکی از پلت فرم های تحلیلی مبتنی بر وب گوگل است که از چارچوب BaaS برای مدیریت اجزای داده کاربران استفاده می کند.
  • Functions-as-a-service (FaaS): یک دامنه جامع برای توسعه و پیاده سازی برنامه های کاربردی سمت سرور فراهم می کند [ 8 ، 9 ]. FaaS بیشتر بر عملیات درگیر در توسعه یک برنامه کاربردی، به جای نمونه های میزبان و برنامه به عنوان یک کل، تأکید می کند. بنابراین، FaaS آن را به یک چارچوب مبتنی بر رویداد برای تجزیه و تحلیل داده های پیشرفته تبدیل می کند. یک مثال محبوب از این چارچوب، خدمات وب آمازون (AWS) Lambda است که قادر است میلیاردها رویداد را در بازه‌های زمانی کوتاه‌تر پردازش کند.
شکل 1 تصویری از مبادله بین رویکرد سنتی و مبتنی بر FaaS برای استقرار نرم افزار است. FaaS را می توان از استقرار سمت سرور سنتی متمایز کرد زیرا عملیات های مختلفی را برای توسعه برنامه ها بدون دخالت نمونه های میزبان در نظر می گیرد.
در این مقاله، به کاربرد چارچوب بدون سرور برای استفاده از مدل‌های Cloud GIS روی یک پلت فرم توزیع‌شده می‌پردازیم. پلتفرم‌هایی مانند Amazon AWS Lambda، Microsoft Azure Functions، Google Cloud Functions و سایرین، یک رابط برنامه‌نویسی کاربردی (API) برای اجرای نرم‌تر قطعه‌های کد که در بسیاری از زبان‌های برنامه‌نویسی مختلف پشتیبانی می‌شوند، ارائه می‌کنند. زبان برنامه نویسی پایتون در میان حداکثر چارچوب های بدون سرور رایج است. بنابراین، تکه‌های کد پایتون که برای پیاده‌سازی GIS روی نوت‌بوک‌های Jupyter نوشته شده‌اند، می‌توانند به عنوان پایه چارچوب پیشنهادی ما عمل کنند. کتابخانه های زیادی وجود دارد، اما API های مناسب بر روی الگوی محاسباتی بدون سرور نیاز به تحقیق و توسعه بیشتری دارد. مدل ما چنین راهی را برای اعمال پیاده‌سازی GIS در چارچوب بدون سرور پیشنهاد می‌کند. مجموعه داده ها به طور کلی روز به روز بزرگتر می شوند و به همین دلیل، نیاز به فناوری GIS افزایش می یابد. پردازش مجموعه داده‌های با ابعاد بالا در موتورهای پردازش محلی دشوار است و چنین داده‌هایی را داده‌های بزرگ فضایی (SBD) می‌نامند.10]. چارچوب های بدون سرور می توانند به پردازش چنین SBD به روشی کارآمد و قابل اعتماد کمک کنند. وجود محدودیت‌های متمایز در مدل‌های موجود برای مدیریت داده‌های مکانی در مقیاس بزرگ، ما را بر آن داشت تا یک چارچوب نسبتاً جدید ایجاد کنیم. این چارچوب برای خدمت به جمع آوری، پردازش و نمایش داده های عظیم جغرافیایی توسعه داده شد. مدل پیشنهادی شامل تمام قابلیت‌های سرویس‌های ابری به همراه راه‌حل‌های BaaS و FaaS می‌شود. برخی از مهم‌ترین مسائل مرتبط با مدیریت داده‌های مکانی مانند جمع‌آوری، ذخیره‌سازی و انتشار در پلتفرم‌های متعدد مورد بررسی قرار گرفت. سیستم پیشنهادی تا حد زیادی زمان انتظار را در مقایسه با مدل ابری سنتی کاهش می‌دهد. زمان اجرا یکی از اشکالات بیشتر پلتفرم های مبتنی بر سرور برای انجام تجزیه و تحلیل داده های جغرافیایی عظیم با ارائه یک پلت فرم مقیاس پذیر و خودکار برای پردازش آنها است. یافته‌های این مقاله سهولت توسعه برنامه‌های کاربر محور بیشتر برای مدیریت و نقشه‌برداری ویژگی‌های مرجع جغرافیایی با قابلیت حمل و استفاده بالا را نشان می‌دهد.

اهداف

اهداف این مقاله به شرح زیر است:
  • در مورد مبادله بین رویکرد مبتنی بر سرور و رویکرد بدون سرور پیشنهادی برای داده‌های مکانی توضیح دهید.
  • برخی از مسائل مهم مانند تأخیر، مقیاس پذیری، مسائل مبتنی بر هزینه و امنیت برای پلتفرم های محاسباتی در همگرایی با چارچوب پیشنهادی مورد بحث قرار می گیرند.
  • برخی از چارچوب های برجسته ای که اجرای رویکردهای بدون سرور را تسهیل کرده اند ارائه شده است.
  • طبقه‌بندی برخی از فن‌آوری‌های پیشرفته و برخی از کارهای مرتبط مرتبط با پیاده‌سازی مدل‌های Cloud GIS مورد بحث قرار می‌گیرد.
  • چارچوب پیشنهادی و انطباق آن با برخی ابزارهای موجود برای انتزاع و شبیه‌سازی داده‌های مکانی مورد بررسی قرار می‌گیرد.
  • تجزیه و تحلیل همپوشانی همراه با تولید نقشه حرارتی و تجزیه و تحلیل خوشه‌ای برای نشان دادن پیچیدگی پردازش داده‌های مکانی با استفاده از دو مطالعه موردی کاربردی، یعنی مجموعه داده‌های سیستم داده منابع معدنی (MRDS) و مجموعه داده‌های خانواده پیش‌بینی Fairfax مشاهده شد.
  • محدودیت‌های معماری و سطح خدمات، دامنه آینده و نکات پایانی ارائه شده است.

2. روش تحقیق

شکل 2جریان کار پشت کار تحقیقاتی انجام شده را ارائه می دهد. مرحله اول مطالعه پارادایم محاسباتی بدون سرور از منابع مختلف اینترنتی برای ایجاد یک پایگاه دانش را نشان می دهد. مرحله دوم نشان‌دهنده بررسی ادبیات انجام شده بر روی مقالات است که در واقع چارچوب‌های بدون سرور و کاربرد آن‌ها را در حوزه‌های مختلف مهم نشان می‌دهد. مرحله سوم جدول بندی نظرسنجی انجام شده به منظور ارائه آثار اجرا شده به خواننده است. علاوه بر این، مراحل چهارم و پنجم، فرآیند ساخت چارچوب پیشنهادی را با ادغام کتابخانه‌های پایتون با GIS برای استقرار راحت‌تر قطعه کدهای Python GIS تجسم می‌کنند. در نهایت، مرحله ششم کاوش چالش‌های آینده و جهت‌گیری‌های تحقیقاتی را در زمینه اجرای وظایف GIS در یک محیط بدون سرور ارائه می‌کند.

3. کارهای مرتبط

بالدینی و همکاران [ 7 ] یک نظرسنجی بر روی پلتفرم‌های مربوطه به منظور انجام محاسبات بدون سرور انجام داد. این مطالعه بر روی مشکلات آینده نگرانه ای متمرکز بود که باید در حوزه محاسبات بدون سرور مورد توجه قرار گیرند. نویسندگان یک “سکوی بدون سرور” ارائه کردند. معماری پیشنهاد می‌کند که سرورها اجباری هستند، اما توسعه‌دهنده اصلاً نگران مدیریت سرورها نیست. این مقاله بیان کرد که معماری یک فرآیند خودکار است که برای تعیین تعداد سرورها و ظرفیت مورد نیاز برای محاسبه استفاده می شود. جهت‌های تحقیقاتی آینده برای محاسبات بدون سرور با ارائه مشکلات تحقیق باز به عنوان یک پرسشنامه مورد بررسی قرار گرفت.
کرسپو و همکاران [ 11] چالش‌هایی را که در هنگام اجرای برنامه‌های بیو انفورماتیک با استفاده از یک پلتفرم بدون سرور با آن مواجه می‌شوند، ارائه کرد. آنها مفهوم CloudDmetMiner را بررسی کردند، که چارچوبی است که با استفاده از الگوریتم متابولیسم دارو و آنزیم‌ها و انتقال‌دهنده‌ها (Dmet)-Miner طراحی شده است. علاوه بر این، پلت فرم آمازون AWS Lambda برای اجرا بر روی مجموعه داده‌های پلی‌مورفیسم تک نوکلئوتیدی (SNP) استفاده شد، که بسیار مرتبط با برنامه‌های بیو انفورماتیک هستند. کار پیشنهادی از طریق نمونه‌هایی که با موفقیت روی مجموعه داده‌های SNP در نظر گرفته شده برای آزمایش‌های اولیه اجرا می‌شوند، تأیید و اعتبارسنجی شد. مقایسه مزایای ارائه شده توسط چارچوب CloudDmetMiner نسبت به یک اکوسیستم بدون سرور و یک محیط ابری خالص ارائه شد. مشاهده شد که زیرساخت در مورد محاسبات بدون سرور موضوعی نگران کننده نیست.
نیو و همکاران [ 12 ] یک مطالعه موردی اثبات مفهوم برای تحقیقات زیست پزشکی ارائه کرد. این مقاله بر روی هم ترازی حدود 20000 توالی پروتئین با استفاده از الگوی محاسباتی بدون سرور متمرکز شده است. محدودیت‌های منبعی که واقعاً در هنگام استفاده از یک الگوی بدون سرور وجود داشت شامل فضای دیسک، مدت زمان اجرا، فضای حافظه اولیه و تعداد واحدهای پردازش مجازی است. آنها از یک رویکرد توزیع شده برای مقابله با محدودیت های منابع به روشی هوشمندانه استفاده کردند. ابزارهای مقایسه شده برای پردازش داده های بیو-انفورماتیک عظیم با زمان اجرای کمتر در پلت فرم بدون سرور، AWS Lambda و Google Cloud Functions بودند. مشاهده شد که AWS Lambda در مقایسه با توابع ابری گوگل کارایی بسیار بالاتری دارد.
کیم و همکاران [ 13 ] چارچوبی به نام Flint برای تجسم مفهوم تجزیه و تحلیل داده های بزرگ با استفاده از محاسبات بدون سرور پیشنهاد کرد. از نقطه نظر توسعه دهنده، استفاده از PySpark با Flint ارائه شد. پیاده سازی کامل، چالش های مرتبط و تجزیه و تحلیل عملکرد مورد بررسی قرار گرفت. استنباط شد که تجزیه و تحلیل داده های بزرگ در یک پلت فرم بدون سرور کاملاً امکان پذیر است و پرس و جوهای تحلیلی را می توان به خوبی مدیریت کرد. استنباط شد که معماری فلینت یک انتخاب عالی برای تجزیه و تحلیل داده های بزرگ، غلبه بر چالش های پیش فرض های Spark برای تجزیه و تحلیل ad-hoc و بسیاری از وظایف تجزیه و تحلیل داده های دیگر است.
اساکیان و همکاران [ 14] نشان می دهد که تامین کنندگان ابر و شرکت های سازمانی در حال پیاده سازی هوش مصنوعی (AI) هستند تا خود را منزوی کنند یا خدمات ارزشمندی را به مشتریان ارائه دهند. نویسندگان کمال یک محیط محاسباتی بدون سرور را با حدس و گمان بر روی نمونه های اولیه شبکه عصبی عظیم ارزیابی کردند. محاسبات تجربی بر روی یک محیط AWS Lambda با استفاده از چارچوب یادگیری عمیق MxNet اجرا شد که تأخیر حدس‌زنی را در محدوده رضایت‌بخشی نشان داد. نتایج تأخیر درخواست‌های گرم را در یک محدوده عملی در مقایسه با تأخیر درخواست‌های سرد، که در محدوده بسیار بالایی هستند، برجسته کرد. از این رو، نویسندگان اعلام کردند که در صورت ادغام برنامه‌های هوش مصنوعی و قراردادهای سطح خدمات سفارشی، این مشکل باید حل شود.
آناند و همکاران [ 15] جنبه های کلیدی ساخت مکانیزم ردیابی GPS برای وسایل نقلیه با استفاده از الگوی محاسباتی بدون سرور را مورد بحث قرار داد. این شامل سیستم کم مصرف، ردیابی بلادرنگ، اعلان سرقت خودکار توسط شیوه‌های geofences برای افزایش مهارت در ذخیره‌سازی و تجزیه و تحلیل داده‌ها بود. این ویژگی ها را افزایش داد و خدمات ایمن و بهبود یافته را در زمینه سیستم های ردیابی خودرو تضمین کرد. نویسندگان یک ردیاب GPS فعال را پیشنهاد کردند که مجهز به یک برنامه کاربردی موبایل/وب مناسب برای مشاهده نتایج بلادرنگ بود که آن را کاربرپسندتر کرد. می توان آن را در وب سایتی مشاهده کرد که به طور انحصاری برای راه حل ردیابی خودرو مربوطه ساخته شده است. برای غلبه بر جنبه‌های امنیتی، اگر کاربری خارج از مرز جغرافیایی شناسایی می‌شد، اعلان‌ها برای کاربر پست می‌شد.
هلرستین و همکاران [ 9] بر شکاف های قابل توجه بین محاسبات بدون سرور نسل اول و محاسبات مدرن متمرکز شده است. در این مقاله آمده است که AWS، یک ابر عمومی، یک پلت فرم محاسباتی اساسی و جدید ارائه می دهد: بزرگترین مجموعه توانایی داده و محاسبات توزیع شده، با توانی که دائماً در دسترس عموم مردم است و به عنوان یک سرویس مدیریت می شود. این مقاله همچنین توضیح داد که محاسبات بدون سرور مفهوم چشمگیر یک پلتفرم در فضای ابری را ارائه می دهد که در آن توسعه دهندگان صرفاً کد خود را آپلود می کنند و پلت فرم کدها را از طرف آنها در صورت لزوم اجرا می کند. مشاهده شد که توسعه دهندگان نباید خود را نگران سرورهای عملیاتی کنند و فقط برای منابعی که استفاده می کنند هزینه می پردازند. این مقاله بدون سرور را به‌عنوان FaaS که توسط یک کتابخانه استاندارد پشتیبانی می‌شود، خدمات مختلف مقیاس‌بندی خودکار چند مستاجر ارائه شده توسط فروشنده ارائه می‌کند. محدودیت‌های ارائه‌شده این بود که فروشندگان به اهمیت پردازش داده‌های کارآمد توجهی نمی‌کنند و مانع از گسترش سیستم‌های توزیع‌شده می‌شوند، که مرکز بیشتر نوآوری‌های محاسبات مدرن است. این مقاله بر روی کاستی‌های زیر در FaaS تمرکز دارد: طول عمر محدود، ارتباط از طریق ذخیره‌سازی کند و موارد دیگر.
مالاوسکی و همکاران [ 16 ] مطالعه ای بر روی زیرساخت های بدون سرور به منظور پردازش پس زمینه مورد نیاز در برنامه های کاربردی وب و اینترنت اشیا (IoT) انجام داد. این ویژگی های اصلی زیرساخت محاسباتی بدون سرور را ارائه کرد و با مدل ابری Infrastructure-as-a-Service (IaaS) مقایسه شد. نمونه اولیه ای که شامل سه پلتفرم مجزا بود: AWS Lambda، موتور گردش کار Hyperflow و Google Cloud Functions در زمینه گردش کار علمی ارائه شد. نویسندگان رویکرد پیشنهادی را با استفاده از گردش کار مونتاژ تأیید کردند، که به معنای یک برنامه نجومی در یک محیط بلادرنگ است. این کار راه‌های مؤثری برای مدیریت منابع ارائه می‌کند، زیرا منابع برای گردش‌های کاری علمی مورد توجه است.
Varghese et al. [ 17 ] پیشرفت‌های زیرساخت‌های رایانش ابری را به سمت رویکرد غیرمتمرکز محاسباتی که مراکز داده در مرکز قرار ندارند، مورد بحث قرار داد. به منظور پیاده‌سازی زیرساخت‌های نسل بعدی برای محاسبات ابری، بر چالش‌هایی تمرکز کرد که باید با آن مقابله کرد. تمرکز اصلی این مقاله روی بحث در مورد مدل‌های رایانش ابری بود که به علاقه همتایان برای شکل‌دهی به نسل آینده رایانش ابری نیاز داشتند.
لی و همکاران [ 18]، مدعی رفتار پویا محاسبات بدون سرور برای اجرای موازی وظایف پارتیشن بندی شده بر روی نمونه های عملکرد کوچک است. نتایج مربوط به عملکرد CPU، حافظه و استفاده از دیسک برای انجام وظایف محاسباتی فشرده در محیط‌های بدون سرور ارائه شد. چهار محیط محاسباتی بدون سرور قابل توجه ارزیابی شدند: توابع بدون سرور Google Cloud، آمازون AWS Lambda، Apache OpenWhisk و توابع بدون سرور Microsoft Azure. مجموعه‌ای از توابع برای پردازش همزمان داده‌ها به کار گرفته شد تا مبادلات عملکرد بین ماشین‌های مجازی و محیط‌های محاسباتی بدون سرور را نشان دهد. از آزمایش استنباط شد که پلتفرم‌های بدون سرور پردازش صریح داده‌ها را ارائه می‌دهند. ویژگی‌های مقیاس‌پذیری بالقوه پلتفرم‌های بدون سرور در زمینه استفاده از منابع و اثربخشی هزینه مورد تجزیه و تحلیل قرار گرفت. می توان استنباط کرد که پلتفرم های محاسباتی بدون سرور در شکل فعلی خود معمولاً با کار بر روی بارهای کاری زودگذر همراه هستند که در آینده ممکن است فضای بیشتری با تنظیمات پیشرفته برای مدیریت بارهای کاری پیچیده پیدا کنند.
جدول 1 مطالعه جامعی را برای کارهای مختلف مورد بحث همراه با سهم قابل توجهی که در هر کدام در جهت ارزیابی قابلیت های پلتفرم های بدون سرور ارائه شده است، ارائه می دهد.

4. پس زمینه

4.1. محاسبات توزیع شده برای به اشتراک گذاری اطلاعات مکانی

پیشرفت‌ها در سیستم‌های مدرن GIS و چارچوب‌های متنوع جمع‌آوری داده‌ها به طور قابل‌توجهی به تولید داده‌های جغرافیایی انبوه منجر شده است. منابع محاسباتی و جمع آوری داده های مرتبط با این سیستم ها معمولاً در یک منطقه جغرافیایی بزرگ توزیع می شوند. 19 ]]. پردازش داده‌های جغرافیایی انبوه تولید شده از دستگاه‌های ناهمگن، چالش‌هایی را بر پایگاه‌های داده مرسوم و منابع محاسباتی برای انجام پرس و جوی پیشرفته و پردازش داده‌های مکانی پیچیده تحمیل می‌کند. از این رو، نیاز به یک پلت فرم محاسباتی توزیع شده برای مدیریت نیازهای مشتریان مختلف از راه دور برای پردازش داده های مکانی اجتناب ناپذیر می شود. یک پلت فرم محاسباتی توزیع شده به اشتراک گذاری اطلاعات مکانی را روی چندین مشتری و پلت فرم های محاسباتی متنوع تسهیل می کند. چندین مطالعه بر کارایی به دست آمده از طریق پیاده سازی پلتفرم های محاسباتی توزیع شده برای پرس و جو، پردازش و به اشتراک گذاری اطلاعات مکانی تمرکز کرده اند [ 20 ، 21 ، 22]. این چارچوب برای غلبه بر بیشتر چالش‌های مرتبط با منابع محاسباتی محلی و پایگاه‌های داده با تسهیل جمع‌آوری و توزیع داده‌های مکانی ناهمگن مشاهده شد. چارچوب محاسباتی توزیع شده از زیرساخت ابری برای ادغام منابع محاسباتی توزیع شده محلی استفاده می کند. این می تواند به ارائه یک چارچوب محاسباتی پویا برای به اشتراک گذاری منطقی منابع محاسباتی در مقیاس جهانی کمک کند. این اساسا چالش های پیچیده پردازش داده های مکانی را حل می کند. پلتفرم‌های محاسباتی توزیع‌شده سنتی با افزایش تقاضاهای محاسباتی به شدت تکامل یافته‌اند. به منظور تسهیل در ارائه خدمات بهبود یافته، کلاس‌های متمایز متفاوتی از جمله، محاسبات سیار، محاسبات مه و چارچوب‌های محاسبات لبه به وجود آمدند.22 ، 23 ، 24 ، 25 ].

4.2. محاسبات لبه برای تجزیه و تحلیل جغرافیایی

محاسبات لبه اقتباس نسبتاً جدیدتری از پارادایم محاسباتی توزیع شده برای ارائه استفاده کارآمد از توان محاسباتی با تسهیل خدمات محاسباتی در لبه است. این منابع محاسباتی را برای دستگاه‌های ناهمگن مرتبط با شبکه در مجاورت منابع داده‌های مکانی، یا دستگاه‌های محاسباتی فراهم می‌کند [ 22 ، 23 ، 24 ]]. محاسبات لبه بر برخی از چالش‌های مهم مرتبط با پارادایم‌های محاسبات توزیع‌شده مرسوم غلبه می‌کند. مدیریت مشکلات تاخیر در شبکه های بزرگ، تامین امنیت حریم خصوصی کاربران و به اشتراک گذاری ایمن داده ها، ایجاد ارتباط بهبود یافته، مصرف انرژی پایین و غیره از جمله مواردی است که می توان با محاسبات لبه به طور موثر مدیریت کرد. این قابلیت‌ها برای سیستم‌های فضایی توزیع‌شده در مقیاس بزرگ برای دستیابی به یک چارچوب امن، قابل اعتماد و کارآمد انرژی بسیار مفید هستند. مزیت اصلی استفاده از محاسبات لبه برای به اشتراک گذاری و پردازش اطلاعات مکانی این است که با ارائه خدمات محاسباتی در لبه، قابلیت کشف و در دسترس بودن خدمات را تسهیل می کند. از این رو، دستگاه های محاسباتی متصل برای بهره مندی از خدمات نیازی به مدت طولانی تری ندارند.25 ].

4.3. رویکرد مبتنی بر سرور

پردازش اطلاعات مکانی غنی بر روی سرورهای مبتنی بر ابر برای استخراج و ارائه الگوهای مفید مکانی-زمانی، پردازش مبتنی بر سرور نامیده می‌شود [ 7 ]. در یک رویکرد مبتنی بر سرور، سرور اغلب از راه دور از مشتری قرار دارد و مسئول مدیریت و اجرای برنامه های کاربردی در سمت مشتری است. محاسبات Thin Client یک نمونه محبوب از پردازش مبتنی بر سرور است که شامل دستگاه‌های محاسباتی سبک وزن (که به تین کلاینت‌ها گفته می‌شود) که قادر به نمایش برنامه‌های از راه دور هستند، می‌باشد. این کلاینت‌ها معمولاً با سرور ارتباط برقرار می‌کنند و می‌توانند حسابی از برنامه‌های مختلف در حال اجرا روی سرور ارائه دهند. برخی از برنامه های کاربردی برجسته دنیای واقعی که از SBA استفاده می کنند عبارتند از Citrix، Tarantella، GraphOn و بسیاری دیگر.

4.4. رویکرد بدون سرور

رویکرد بدون سرور (SLA) پردازش داده ها را در غیاب سرور نشان نمی دهد، اما از قابلیت های عملیاتی بیشتری بهره می برد. مقیاس پذیری، نگهداری، تحمل خطا و مدیریت منابع مواردی هستند که باید به آنها اشاره کرد [ 6 ، 16 ]. SLA راحتی بسیار بیشتری را از نظر هزینه برای مدیریت دستگاه‌های محاسباتی فیزیکی بالا ارائه می‌دهد. به طور خودکار منابع مناسب را با افزایش تقاضاهای محاسباتی فراهم می کند و از این رو قابلیت های یکپارچه را برای مشتریان میزبان ارائه می کند. از این رو، SLA یک جایگزین برتر برای SBA خواهد بود. برخی از نمونه های محبوب SLA عبارتند از AWS lambda، OpenLambda، عملکرد Google Cloud و بسیاری از این قبیل.
شکل 3 مقایسه داده‌های Google Trends را برای کلیدواژه‌های محاسباتی «مبتنی بر سرور» و «بدون سرور» بر اساس کارهای تحقیقاتی انجام‌شده طی پنج سال گذشته به صورت جهانی نشان می‌دهد. خط آبی نشان دهنده رشد دامنه محاسباتی بدون سرور است در حالی که خط قرمز نشان دهنده سقوط رویکرد مبتنی بر سرور است.

4.5. املاک مبتنی بر دولت

مدیریت حالت ها در یک پلت فرم بدون سرور به دلیل عدم تداوم در بین توابع بسیار چالش برانگیز است. بنابراین، در زمینه SLA، ما بیشتر نگران مقیاس پذیری منابع هستیم، بنابراین ویژگی های ویژگی بی تابعیتی در ارائه همزمانی اجرا [ 6 ]. این ویژگی کمک زیادی به گسترش قابلیت های سیستم برای پردازش داده های مکانی می کند. با این حال، به منظور حفظ هر گونه اطلاعات فراتر از یک دوره زمانی خاص، برنامه های کاربردی باید اطلاعات را به برخی از اجزای حالت دار هدایت کنند. تابع AWS Lambda یکی از این نمونه‌ها از یک پلت فرم بدون حالت است که اجرای همزمان نمونه‌های هر مؤلفه را بدون نیاز به تأمین منابع بیشتر برای هر نمونه تسهیل می‌کند ( شکل 4).).

4.6. مدیریت تاخیر

همانطور که منابع در محیط های بدون سرور به شدت افزایش می یابند، تعامل بین اجزای موجود در سیستم افزایش می یابد و تاخیر بیشتری ایجاد می کند. این امر پیچیدگی کلی سیستم را افزایش می دهد. در یک برنامه SBA، تأخیر ایجاد شده در بین مؤلفه ها را می توان با مکان یابی مشترک مؤلفه ها، یا با وارد کردن آنها به همان فرآیند کاهش داد. در اینجا هم‌مکانی مؤلفه‌ها شامل قرار دادن مؤلفه‌ها در همان نمونه‌های میزبان است. این تکنیک‌ها به بهینه‌سازی عملکرد سیستم کمک می‌کنند و می‌توانند به صورت همزمان یا جداگانه برای اجزای آن اعمال شوند. علاوه بر این، بهینه سازی را می توان با افزایش عملکرد کانال ارتباطی، با استفاده از برخی پروتکل های تخصصی و فرمت های داده مناسب به دست آورد.

4.7. آمازون AWS Lambda

این پلتفرم محاسبات بدون سرور در بین تمامی پلتفرم های موجود محبوب ترین است. دلیل آن تطبیق پذیری این پلتفرم در پشتیبانی از کدهای Node.js، Python، Java و C# است. این یک مفهوم کانتینری است که در آن هر نمونه به عنوان یک محفظه تولید شده توسط آمازون لینوکس AMI با مقدار مورد نیاز مشخصات سرور اختصاص داده شده برای قطعه کد برای اجرا در محیط عمل می کند. کد خام را نمی توان مستقیماً در بستر بدون سرور اجرا کرد و بنابراین از یک سطل S3 برای بسته بندی تمام محتویات مورد نیاز برای اجرای قطعه کد استفاده می شود. این چارچوب کاملاً بدون دولت است. کارایی این چارچوب قابل ستایش است. حداکثر زمان اجرا برای هر درخواست 900 ثانیه در این پلتفرم است [ 26]. در زمینه ما، اجرای برنامه‌های جغرافیایی کدگذاری شده در پایتون با استفاده از GeoPandas یا ArcPy یک راه دشوار و در عین حال کارآمد با اهمیت آینده‌نگر برای تجسم نقشه‌ها در بازه زمانی کوتاه‌تر است. بهینه سازی هزینه در زمینه محاسبات بدون سرور جغرافیایی یک مسئله حیاتی است و به تحقیقات بیشتری نیاز دارد.

4.8. پلتفرم بدون سرور Google Cloud

این پلتفرم بدون سرور به دلیل اعتماد گوگل به آن بسیار مورد استفاده قرار می گیرد. علاوه بر این، با رفتن عمیق به جنبه‌های فنی، این پلتفرم از قطعه‌های کد نوشته شده با استفاده از Python و Node.js در حال حاضر پشتیبانی می‌کند. محیط اجرا که Knative با کمک Kubernetes ساخته شده است، امکان استفاده از این چارچوب بدون سرور را برای اهداف متعدد فراهم می کند. این پارادایم با سهولت کدنویسی ارائه می شود و نسبتاً برای این قابلیت های بدون سرور جدید است. حداکثر زمان اجرا برای هر درخواست به طور پیش‌فرض 60 ثانیه است و می‌توان آن را تا 540 ثانیه افزایش داد که نسبتاً بسیار کم است و کارایی آن را ثابت می‌کند [ 26 ]. نقطه ضعف این است که حداکثر تعداد توابع مجاز در هر پروژه به طور پیش فرض 1000 است.

4.9. پلتفرم بدون سرور Microsoft Azure

پلتفرم Azure Serverless از قطعه کدهای نوشته شده در C#، Python، Java، F#، PHP و Node.js پشتیبانی می کند. ویژگی منحصر به فرد آن این است که اجرای همزمان آن کاملاً به محرک ها و اتصالات بدون محدودیت خاصی وابسته است. مقیاس بندی از نوع متری یا دستی است. این پلتفرم می تواند یک قطعه کد با حافظه بالا را در عرض چند دقیقه اجرا کند. علاوه بر این، مقیاس بندی به قدری عالی است که کاربر مجبور نیست روی حجم کار تمرکز کند. این پلتفرم دارای یک ویرایشگر کد جذاب است که پایگاه کاربری آن را بهبود می بخشد. دو ویژگی اصلی آن عبارتند از یکپارچگی مداوم (CI) و تحویل مداوم (CD). نظارت بر قطعه کد ارسالی به خوبی واسط است. حداکثر زمان اجرای هر درخواست به طور پیش فرض 300 ثانیه است که در این پلتفرم تا 600 ثانیه قابل ارتقا است [ 26 ]]. این چارچوب در زمینه برنامه‌های کاربردی بدون سرور جغرافیایی می‌تواند خود را به بهترین شکل ثابت کند، زیرا در برخورد با مشکلات پیچیده ارکستراسیون کمک می‌کند و بر اساس محرک‌ها و اتصالات است. فرآیند ساخت و به دنبال آن اشکال زدایی و سپس استقرار و در نهایت نظارت در این پلتفرم ساده و آسان شده است.

4.10. اصطلاحات استفاده شده

4.10.1. تحلیل پوششی

اصطلاح آنالیز همپوشانی در GIS برای نشان دادن روی هم قرار گرفتن ویژگی های چندگانه به عنوان نقشه های برداری استفاده می شود [ 27 ]. در زمینه ما، تحلیل همپوشانی به نقاط داده ای اشاره دارد که روی نقشه خیابان باز همپوشانی دارند. تحلیل همپوشانی وزنی شامل طبقه‌بندی مجدد لایه‌های فضایی بسته به تأثیر هر لایه تعریف‌شده توسط وزن‌ها است. این تجزیه و تحلیل برای انجام تجسم های بیشتر بسیار مهم است. نمادهای مختلفی را می توان برای رسم نقاط داده بر روی نقشه بر اساس مقادیر طول و عرض جغرافیایی استفاده کرد. عملیات همپوشانی می تواند برای سیستم های محاسباتی سنتی برای مدیریت SBD [ 27 ] محاسباتی فشرده باشد. از این رو، چارچوب بدون سرور می تواند انتخاب خوبی برای رسیدگی به نیازهای بلادرنگ اکثر برنامه های GIS باشد.
4.10.2. تجزیه و تحلیل نقطه ای-خوشه ای
تحلیل خوشه‌ای نقطه‌ای یک نمایش نمادین است که برای کاهش و دقت تعداد زیادی از نقاط داده استفاده می‌شود. تجزیه و تحلیل الگوهای جغرافیایی یک کار ضروری است و می توان آن را از طریق تجزیه و تحلیل نقطه-خوشه انجام داد. یافتن مناطق با غلظت کم یا زیاد از طریق تجزیه و تحلیل نقطه-خوشه امکان پذیر است. یک الگوی نقطه ای ممکن است به عنوان مجموعه ای از مختصات جغرافیایی در یک منطقه تعریف شده در نظر گرفته شود که در آن رویدادهای مورد علاقه ثبت می شوند [ 28 ]. در مورد SBD، نقاط داده به طور متراکم بسته بندی شده اند و تجزیه و تحلیل الگوهای جغرافیایی و مسیرها یک کار پیچیده است. بنابراین، تجزیه و تحلیل نقطه-خوشه فرآیند شناسایی الگوها را با خوشه بندی نقاط متراکم در خوشه های منفرد آسان تر می کند.
4.10.3. تجزیه و تحلیل نقشه حرارتی
برای یافتن مناطق بسیار متراکم روی نقشه، در برخی موارد لازم است تحلیل خود را به یک منطقه خاص که در آن تراکم نقاط بسیار زیاد است محدود کنیم. نقشه حرارتی نقش مهمی در تعیین مناطق بر اساس تراکم و تمایز بر اساس عمق رنگ ایفا می کند. نقشه حرارتی باید به درستی تجزیه و تحلیل شود و پارامتر برای توزیع وزن باید مشخص شود.
4.10.4. آنالیز خوشه ای
پارتیشن بندی فضایی اصطلاحی است که برای تقسیم بندی نقاط داده های مکانی بر اساس مجاورت استفاده می شود که اغلب به آن خوشه بندی فضایی می گویند [ 29 ]. خوشه‌بندی فضایی روشی برای خوشه‌بندی نقاط داده مشابه است که در آن شباهت بر اساس ویژگی‌ها است و نقاط یک خوشه با نقاط دیگر خوشه‌ها متفاوت هستند [ 30 ].]. تجزیه و تحلیل خوشه ای را می توان با استفاده از دو تکنیک خوشه بندی شناخته شده مورد استفاده در یادگیری ماشین انجام داد، یعنی خوشه بندی فضایی مبتنی بر چگالی برنامه های کاربردی با نویز (DBSCAN) و خوشه بندی K-means. هر دوی این تکنیک‌ها را می‌توان روی نقشه حرارتی یا روکش برای تخصیص شناسه‌های خوشه‌ای خاص به نقاط داده مختلف بر اساس ویژگی‌ها استفاده کرد. علاوه بر این، ما باید تعداد خوشه‌هایی را که می‌خواهیم تجسم کنیم مشخص کنیم تا بتوانیم تعداد زیادی شناسه خوشه و همچنین نقاط خوشه‌بندی را تولید کنیم. در DBSCAN، باید نقاط مرزی را مشخص کنیم که به عنوان نویز در نظر گرفته شوند. چگالی خوشه توسط دو پارامتر eps تعیین می شود که نشان دهنده شعاع دایره و minpts است که حداقل تعداد نقاط را در آن دایره مشخص می کند [ 31 ]].

4.11. پردازش داده های بزرگ جغرافیایی

داده های مکانی را می توان به عنوان سه مدل اولیه نشان داد، یعنی داده های شطرنجی که نشان دهنده شبکه های پیکسل، داده های برداری نشان دهنده خطوط یا چند ضلعی پیکسل ها و داده های نموداری است که شبکه های فضایی را نشان می دهد [ 32 ]. داده‌های مکانی در سناریوی امروزی در جنبه‌هایی مانند حجم، تنوع و پیچیدگی پردازش در حال افزایش است، که باعث می‌شود ابزارهای پردازش فضایی موجود قادر به پردازش و تجزیه و تحلیل داده‌ها نباشند که منجر به SBD می‌شود [ 10 ]. داده کاوی مکانی نقش محوری در فرآیند تجزیه و تحلیل SBD ایفا می کند. برخی از الگوریتم‌هایی که می‌توانند به پردازش چنین داده‌هایی کمک کنند عبارتند از: مدل خودکار رگرسیون فضایی (SAR)، طبقه‌بندی‌کننده‌های میدان تصادفی مارکوف، یادگیری فرآیند گاوسی یا هیبریداسیون این الگوریتم‌ها. 33 ].]. عصر محاسبات بلادرنگ نیازمند پردازش داده‌های مکانی برای محیط‌های بلادرنگ است و بنابراین نیازمند روش‌هایی برای مدیریت SBD است. Spatial Hadoop، GIS on Hadoop، Declustering و Space Partitioning برخی از پارادایم‌های محاسباتی برای مدیریت SBD هستند [ 34 ].

5. چارچوب پیشنهادی

انگیزه های اساسی در پشت ادغام پلت فرم بدون سرور برای تجزیه و تحلیل جغرافیایی در دستیابی به قابلیت های عملیاتی بالا و پردازش تقریباً بلادرنگ داده های بزرگ جغرافیایی نهفته است. همانطور که در بخش قبل بحث شد که SLA مقیاس پذیری و نگهداری بیشتری را در یک محیط محاسباتی بسیار ناهمگن اضافه می کند، در نتیجه یک جایگزین کم هزینه برای پردازش داده های عظیم مکانی فراهم می کند. همچنین به کاربران یا مشتریان امکان می دهد تا با مجازی سازی منابع محاسباتی، داده های خود را بر روی پلتفرم های محاسباتی پیشرفته پردازش کنند. این معماری نیاز به استقرار فیزیکی دستگاه‌ها را حذف می‌کند و با پیاده‌سازی مدل پرداخت به‌موقع به برآورده کردن نیازهای پویای مشتریان کمک می‌کند. از این رو در راستای این هدف، ما کاربرد چارچوب بدون سرور را برای تجزیه و تحلیل داده های بزرگ جغرافیایی پیشنهاد می کنیم. شکل زیر چارچوب پیشنهادی بدون سرور برای تجزیه و تحلیل داده های مکانی را نشان می دهد. در اینجا ژئوپورتال‌های مبتنی بر وب مسئول کشف و دسترسی به داده‌های مکانی هستند که می‌توانند از دستگاه‌های محاسباتی پراکنده ناهمگن مختلف گرفته شوند. داده‌های مکانی به‌دست‌آمده از منابع ناهمگن مختلف ممکن است از طریق دروازه‌های اینترنتی به مشتری/سرور مربوطه برای پردازش داده‌ها هدایت شوند. پورتال های جغرافیایی ممکن است با استفاده بهینه از پلت فرم های GIS به ایجاد و تجسم اطلاعات مکانی برای داده های جغرافیایی به دست آمده از راه دور کمک کنند. اطلاعات به دست آمده از این چارچوب نقش مهمی در توسعه زیرساخت های داده های مکانی (SDI) ایفا می کند. سرورهای برنامه، مشتریان را با یک سرور تسهیل می کنند تا درخواست های خود را در یک محیط چند مشتری اجرا کنند. کلاینت های مرتبط با این چارچوب از تین کلاینت ها، کلاینت های ضخیم و کلاینت های موبایل تشکیل شده اند. تین کلاینت ها ممکن است کاربران مرتبط با سرورهای وب برای دسترسی به شی مکانی باشند (یعنی مجموعه ای از ویژگی ها و نمونه هایی که یک پایگاه داده جغرافیایی را تشکیل می دهند.19 ]). این مشتریان ممکن است بخواهند اشیاء مکانی را مطابق با نیاز خود با استفاده از برخی ابزارهای GIS یا نرم افزارهای کاربردی که به عنوان کلاینت های ضخیم نامیده می شوند، نمایش داده و دستکاری کنند. مشتریان تلفن همراه قادر به انجام عملیات بر روی داده های مکانی به صورت محلی از طریق دستگاه های محاسباتی سیار مانند تبلت ها، رایانه های شخصی (PC)، تلفن های همراه و غیره هستند.
به منظور ذخیره سازی اشیاء مکانی به دست آمده از سرویس ذخیره سازی ساده آمازون (S3)، می توان از سطل ها به طور موثر استفاده کرد. در رابطه با پلت فرم به اشتراک گذاری اطلاعات مکانی، سطل S3 می تواند قابلیت کشف بالایی از منابع را فراهم کند. بارگذاری‌ها از سطل S3، دروازه‌های اینترنتی، سرورهای برنامه و پورتال‌های جغرافیایی، عملکرد AWS lambda (یا، به سادگی به نام تابع lambda شناخته می‌شود) را فعال می‌کند تا کارها را برای پردازش به ارائه‌دهندگان خدمات ابری ارسال کند. این امر با استفاده از چارچوب بدون سرور، مفهوم FaaS را به وجود می آورد. توابع لامبدا را می‌توان توسط کلاینت‌ها یا کاربران فراخوانی کرد، بسته به الزامات برنامه‌ای که به نظر می‌رسد در خدمت آن است. پلت فرم بدون سرور از میکروسرویس ها برای پردازش نیازمندی های برنامه کاربردی پیچیده تولید شده توسط ماژول سرور برنامه استفاده می کند. معماری میکروسرویس ماژول های کاربردی پیچیده بزرگ را به ماژول های فرعی ساده تر تجزیه می کند که می توانند به سرعت اجرا شوند. علاوه بر این، این به مشتریان انعطاف‌پذیری بیشتری را برای افزودن ماژول‌های جدید یا ایجاد اصلاحات در ماژول‌های موجود بر اساس الزامات برنامه‌های مکانی خاص ارائه می‌دهد. چارچوب بدون سرور یک راه کارآمد و راحت برای پردازش اطلاعات مکانی به دست آمده از دستگاه های محاسباتی ناهمگن و همچنین برای رسیدگی به نیازهای محاسباتی فزاینده در یک محیط چند مشتری فراهم می کند. علاوه بر این، این به مشتریان انعطاف‌پذیری بیشتری را برای افزودن ماژول‌های جدید یا ایجاد اصلاحات در ماژول‌های موجود بر اساس الزامات برنامه‌های مکانی خاص ارائه می‌دهد. چارچوب بدون سرور یک راه کارآمد و راحت برای پردازش اطلاعات مکانی به دست آمده از دستگاه های محاسباتی ناهمگن و همچنین برای رسیدگی به نیازهای محاسباتی فزاینده در یک محیط چند مشتری فراهم می کند. علاوه بر این، این به مشتریان انعطاف‌پذیری بیشتری را برای افزودن ماژول‌های جدید یا ایجاد اصلاحات در ماژول‌های موجود بر اساس الزامات برنامه‌های مکانی خاص ارائه می‌دهد. چارچوب بدون سرور یک راه کارآمد و راحت برای پردازش اطلاعات مکانی به دست آمده از دستگاه های محاسباتی ناهمگن و همچنین برای رسیدگی به نیازهای محاسباتی فزاینده در یک محیط چند مشتری فراهم می کند.
چارچوب پیشنهادی مبتنی بر استراتژی پیاده‌سازی مورد نیاز برای ادغام سرویس‌های مکانی با الگوی محاسباتی بدون سرور است. چارچوب های موجود برای محاسبات بدون سرور از ورودی ها به عنوان قطعه کد نوشته شده در Node.js، C#، Java و Python پشتیبانی می کند. بنابراین، به منظور پیاده سازی خدمات مکانی در یک اکوسیستم بدون سرور، به یک معماری جدید و قابل اجرا نیاز داریم. همانطور که می دانیم، فرمت های داده های جغرافیایی شامل فرمت شطرنجی و فرمت برداری است که می تواند با استفاده از ابزارهایی مانند QGIS، ArcGIS و بسیاری دیگر پردازش شود. کاربردهای جغرافیایی نیاز به پردازش سطح بالایی دارند اما یک مفهوم کاملا متمرکز است. تازگی ما در این حوزه انجام پردازش در یک پلت فرم غیرمتمرکز و توزیع شده است. بسیاری از پلتفرم‌ها و کتابخانه‌های پایتون در پردازش داده‌های مکانی مهم هستند. بدین ترتیب، هدف معماری پیشنهادی ما استفاده از کدهای پایتون است که برای پیاده سازی GIS نوشته شده است تا در یک چارچوب محاسباتی بدون سرور استفاده شود. معماری پیشنهادی می‌تواند منجر به استفاده گسترده از فناوری GIS در یک پلتفرم بدون سرور شود که توسعه‌دهندگان را از سطح بالای پیش‌پردازش که در حال حاضر در همه برنامه‌های مکانی مورد نیاز است، معاف می‌کند.
شکل 5 یک معماری سه لایه سطح بالا از چارچوب پیشنهادی را نشان می دهد که نشان دهنده پردازش داده ها در لایه اول است. لایه دوم با تبدیل خروجی پردازش شده به قطعه کد پایتون می پردازد، که عملاً امکان پذیر است زیرا بسیاری از ابزارهای GIS که در حال حاضر کار می کنند از پایتون در انتهای خود استفاده می کنند. لایه سوم نشان دهنده استفاده از چارچوب های بدون سرور است که از کدهای پایتون برای کار روی چارچوب پشتیبانی می کند.شکل 6نشان دهنده یک مدل تعمیم یافته برای ارائه تعامل محاسباتی مشتری و بدون سرور است. می توان آن را از طریق مکانیسم های مختلف دسترسی به داده های مکانی و تولید تحقق بخشید. این شامل ژئوپورتال ها، دروازه های اینترنتی، سرورهای برنامه و سطل آمازون S3 مربوط به مدل های مختلف کلاینت است که بر روی پلتفرم های مختلف کار می کنند و جوهر پارادایم محاسباتی بدون سرور است.

6. ارزیابی عملکرد

در جدول 2 ، مقایسه برخی از معیارهای عملکرد برای فناوری‌های نوظهور مختلف که معمولاً برای مدل‌سازی داده‌های مکانی استفاده می‌شوند، ارائه شده است. در اینجا، ما چهار پارادایم محاسباتی یعنی رویکرد مبتنی بر سرور (SBA)، محاسبات لبه، محاسبات توزیع شده و SLA را مقایسه کردیم [ 35 ، 36 ، 37]. یک SBA سنتی معمولا مقیاس پذیری و قابلیت اطمینان بسیار کم را به دلیل ماهیت ایستا سیستم به تصویر می کشد. اگر فرد مجبور باشد به طور مداوم با سیستم موجود و افزایش مقیاس منابع داده کار کند، هزینه های زیادی برای پیاده سازی و نگهداری وجود دارد و در نتیجه بار بیشتری بر مراکز داده وارد می شود. معماری بسیار توزیع شده پلت فرم محاسبات لبه، شانس تهدیدات امنیتی را بیشتر افزایش می دهد، زیرا از یک پلت فرم مبتنی بر وب استفاده می شود. رویکرد محاسباتی توزیع شده ممکن است همیشه داده های عظیم مکانی را در زمان واقعی پردازش نکند [ 38 ، 39 ، 40]. این به دلیل پیچیدگی در معماری پلتفرم های توزیع شده است که شامل تعداد بیشتری از سرورها و سایت های عملیاتی می شود که اغلب منجر به مدیریت پیچیده و هزینه های بالای نگهداری می شود.22 ، 41 ]. در مقابل این محدودیت‌ها، SLA چارچوبی بسیار مقیاس‌پذیر، قابل اعتماد و نسبتاً کم هزینه با حداقل نیازها برای مدیریت سرورها ارائه می‌کند. همچنین حداقل تأخیر را برای پردازش داده های مکانی در مقیاس بزرگ فراهم می کند. بنابراین، می‌توان استنباط کرد که SLA پیشنهادی از نظر قابلیت اطمینان، مقیاس‌پذیری، سرعت پردازش و هزینه عملکرد بهتری از بیشتر پارادایم‌های محاسباتی دارد ( شکل 7 ).
معیارهای عملکرد مربوط به هر یک از فناوری‌های مورد بحث را می‌توان با اختصاص مقادیر عددی از 1 تا 3 برای معیارهایی که بر اساس آن عملکرد هر فناوری ارزیابی شد، ارزیابی کرد. در اینجا، مقدار 1 نشان دهنده عملکرد کم یا ناکافی، 2 نشان دهنده سطح عملکرد متوسط ​​یا متوسط ​​و 3 نشان دهنده سطح عملکرد بالا است. همه این معیارها با تجزیه و تحلیل کیفی مستندات بخش استانداردسازی مخابرات مربوطه اتحادیه بین‌المللی ارتباطات از راه دور (ITU-T) و از مطالعات بالا [ 22 ، 35 ، 36 ، 37 ، 38 ، 39 ، 40 ، 41 ] استنباط شدند.

7. راه اندازی آزمایشی

تجسم داده های بزرگ جغرافیایی یک کار پیچیده بود و پیاده سازی با استفاده از موتورهای محلی زمان زیادی می برد. بنابراین، ما یک چارچوب بدون سرور برای تجسم داده های بزرگ در یک زمینه جغرافیایی پیشنهاد کردیم. بسته ها و کتابخانه های فعلی به اندازه کافی برای انجام تجسم کافی نبودند. پایتون یک زبان مشترک برای اکثر معماری های بدون سرور است. انتظار می رود معماری بدون سرور، قطعه کدهای پایتون را اجرا کند. ما تجسم‌ها را بر روی یک موتور محلی ارائه کردیم تا ضرورت پارادایم محاسباتی بدون سرور را با فناوری GIS ادغام کنیم. از آنجایی که مجموعه داده های در نظر گرفته شده پیچیده و از نظر اندازه بزرگ بودند، برچسب گذاری نقاط داده روی نقشه با استفاده از موتورهای محلی از نظر محاسباتی سخت است. کتابخانه ها و بسته های پایتون که می توانند برای پارادایم محاسباتی بدون سرور استفاده شوند به شرح زیر هستند:
کتابخانه GeoPandas در پایتون از بسته های زیر تشکیل شده است:
  • CartoPy: این بسته به تجسم نقشه ها کمک می کند و یک ابزار نقشه کش است. این یک رویکرد شی گرا به سمت تجزیه و تحلیل مکانی است و برای پردازش فرمت های شطرنجی و برداری شناخته شده است [ 42 ].
  • Shapely: گاهی اوقات ما با داده های دو بعدی برای برخی کاربردهای مکانی سروکار داریم و این بسته برای دستکاری چنین داده های هندسی در یک صفحه دکارتی کاملاً عمل می کند [ 43 ].
  • فیونا: این بسته دارای یک API واضح است که کاربران را به خواندن و همچنین نوشتن داده های مکانی مختلف و همچنین محتویات فشرده جذب می کند. داده های مکانی را می توان به صورت تک لایه در قالب فایل های چند لایه جمع آوری کرد [ 44 ].
  • PyProj: همانطور که از نام آن پیداست PROJ به پیش بینی ها و تغییرات مربوط به داده های مکانی اشاره دارد. این بسته فقط برای تبدیل مختصات و به خوبی طرح ریزی آن استفاده می شود [ 45 ].
  • RTree: برای نمایه سازی داده های مکانی، از این بسته استفاده می شود و بسیاری از ویژگی های نمایه سازی فضایی مانند بارگذاری چند بعدی، بارگذاری انبوه، سریال سازی دیسک، جستجوی نزدیکترین همسایه و بسیاری موارد دیگر را پشتیبانی می کند [ 46 ].
  • دکارت: مانند کتابخانه رسم پرطرفدار matplotlib عمل می کند و بر روی داده های هندسی برای ترسیم مسیرهای ضروری مختلف که برای توسعه برنامه های مکانی مورد علاقه هستند [ 47 ] کار می کند.
  • Rasterio: برای استفاده از داده ها در فرمت های شطرنجی جغرافیایی، وارد کردن فرمت های فایل از نوع GeoTIFF و موارد دیگر ضروری است. این بسته چنین داده‌های شطرنجی را می‌خواند و می‌نویسد و یک API بر اساس آرایه‌های N بعدی [ 48 ] تولید می‌کند.
از ماژول های زیر نیز می توان برای تولید قطعه کد پایتون استفاده کرد:
ArcPy : این ماژول برای دستکاری ابزار ArcGIS به منظور دستیابی مستقیم به کارایی پایتون در وظایف GIS استفاده می شود.
PyGRASS : این بسته پایتون بر روی GRASS GIS 7 که معروف است برای کار با داده‌های مکانی کار می‌کند. بنابراین، کتابخانه PyGRASS کارایی ابزار GRASS را در محیط پایتون نشان می دهد. همانطور که مطالعه کردیم، ماژول های پایتون مختلفی برای کار بر روی داده های مکانی وجود دارد. بنابراین، معماری پیشنهادی ما با هدف استفاده از کدهای پایتون نوشته شده برای پیاده سازی GIS برای استفاده در یک چارچوب محاسباتی بدون سرور است. چارچوب پیشنهادی می‌تواند منجر به استفاده گسترده از فناوری GIS در یک پلتفرم بدون سرور شود، که توسعه‌دهندگان را از سطح بالای پیش‌پردازش که در حال حاضر در همه برنامه‌های مکانی مورد نیاز است، معاف می‌کند.

ابزارهای کمکی

ابزار مورد استفاده برای مصورسازی بسته نرم افزاری QGIS بود که در آن از ما می خواست مجموعه داده ها را با مقادیر طول و عرض جغرافیایی وارد کنیم تا آن را بر روی نقشه خیابان باز ترسیم کنیم. تجزیه و تحلیل همپوشانی برای تجسم نقاط داده عاقلانه مکان برای هر دو مجموعه داده انجام شد. تجزیه و تحلیل همپوشانی توسط نسل نقطه-خوشه دنبال شد که در آن نقاط را بر اساس فاصله نشان دادیم، که با مثلث های قرمز نشان داده شد. تجزیه و تحلیل نقشه حرارتی در کنار نشان دادن نقاط داده پرجمعیت که به مناطق مورد نظر اشاره دارد، انجام شد. سپس تجزیه و تحلیل نقشه حرارتی توسط خوشه‌بندی DBSCAN و خوشه‌بندی K-means، یکی در هر مجموعه داده با 50 شناسه خوشه دنبال شد. نمودارهای آماری مربوطه با استفاده از جعبه ابزار پردازش QGIS برای اعتبارسنجی نتایج تجسم تولید شد.

8. نتایج و بحث

در این بخش، داده‌های بزرگ جغرافیایی پس از پردازش با قابلیت‌های متعدد به تصویر کشیده شد. مجموعه داده در نظر گرفته شده ممکن است به عنوان یک داده بزرگ مکانی عمل کند. چارچوب پیشنهادی استفاده از الگوی محاسباتی بدون سرور را پیشنهاد می‌کند. در حال حاضر، پردازش داده های مکانی از طریق معماری بدون سرور یک کار دشوار است. ما خروجی‌ها را روی بسته نرم‌افزاری QGIS، که از Python در انتهای خود استفاده می‌کند، تجسم کردیم. ابزار در نظر گرفته شده برای پیاده سازی بر روی یک چارچوب بدون سرور مناسب بود.

8.1. مطالعه موردی 1: نقشه برداری و تجزیه و تحلیل منابع معدنی جهان

8.1.1. مشخصات مجموعه داده

مجموعه داده سیستم داده منابع معدنی (MRDS) اطلاعاتی را در مورد منابع معدنی در سراسر جهان ارائه می دهد که شامل منابع فلزی و غیرفلزی می شود. ویژگی های مختلفی مانند موقعیت جغرافیایی، انواع کانی ها و نام آنها و سایر ویژگی های فیزیکی و جغرافیایی را تشکیل می دهد. در این مطالعه، پتانسیل منابع معدنی در سراسر جهان در مناطق مختلف مورد تجزیه و تحلیل قرار گرفت و نقشه‌های جغرافیایی مربوطه ارائه شد. پتانسیل کالاهای معدنی مربوط به یک منطقه جغرافیایی خاص نشان دهنده احتمال وقوع برای منابع معدنی در سراسر یک منطقه خاص است [ 49 ، 50 ]]. اطلاعات مربوط به ذخایر معدنی را می توان در یک حوزه فضایی عظیم به دست آورد و می تواند در توسعه پایگاه داده های جغرافیایی برای انجام برخی وظایف تخصصی استفاده شود. اینها عبارتند از پرس و جو، تجسم، تجزیه و تحلیل و به روز رسانی اطلاعات مکانی. نقشه های همپوشانی سفارشی برای کالاهای معدنی مختلف با استفاده از ابزار QGIS برای مجموعه داده MRDS تولید شد. این امر مطالعه توزیع منابع معدنی مختلف در حوزه فضایی گسترده را تسهیل کرد. شناسایی مرزهای جغرافیایی مختلف بر اساس در دسترس بودن منابع معدنی قابل انجام است. در این مقاله، DBSCAN [ 51] الگوریتم، یک تکنیک خوشه‌بندی مبتنی بر چگالی که به طور رایج برای شناسایی اطلاعات متراکم از یک فضای ویژگی مشخص استفاده می‌شود، پیاده‌سازی شد. در اینجا، تکنیک DBSCAN برای شناسایی مناطق جغرافیایی با منابع معدنی متراکم در مقایسه با مناطق با تراکم وقوع کمتر استفاده شد. این تکنیک برای کشف ویژگی های پراکنده متراکم در حوزه های فضایی بزرگ بسیار محبوب است [ 52 , 53 ]] زیرا می تواند به صورت تطبیقی ​​نویزهای مرتبط با داده ها را بدون تأثیر بر عملکرد الگوریتم کنترل کند. این چارچوب می‌تواند منجر به پیش‌بینی تولیدات معدنی آینده و تجزیه و تحلیل فضایی آن‌ها با ادغام داده‌های مکانی در دسترس محلی با مجموعه داده‌های جغرافیایی از راه دور شود. ادغام این خدمات با پلتفرم بدون سرور می‌تواند منجر به پیچیدگی‌های محاسباتی کمتر و همچنین کاهش زمان انتظار شود که معمولاً برای پردازش داده‌های مکانی عظیم در برنامه‌های تقریباً بلادرنگ مطلوب است. کل داده‌های موجود در مجموعه داده 304633 ردیف است که نشان می‌دهد داده‌ای با ابعاد بالا است.
8.1.2. تجسم مجموعه داده MRDS
همپوشانی وزنی که نقاط داده تولید شده برای نمونه های مجموعه داده MRDS روی نقشه خیابان باز را مشخص می کند در شکل 8 نشان داده شده است. تولید همپوشانی وزنی وظیفه اصلی برای تجسم بیشتر نقاط داده با استراتژی های تجسم متعدد است. شکل 9 تجزیه و تحلیل خوشه نقطه ای را برای مجموعه داده MRDS نشان می دهد. دایره های کوچک قهوه ای و مثلث های قرمز به ترتیب نشان دهنده نقاط و خوشه ها هستند. تجزیه و تحلیل نقطه-خوشه با تولید نقشه حرارتی دنبال شد که در شکل 10 نشان داده شده است.. نقشه حرارتی مناطق بسیار متراکم را شناسایی می کند که حداکثر نقاط داده در آن قرار دارند. نقشه حرارتی به ما این امکان را می دهد که مناطق مورد نظر را که می توانند بر اساس شدت رنگ متمایز شوند، مشخص کنیم. مکانیسم خوشه‌بندی مورد استفاده روی این مجموعه داده، خوشه‌بندی DBSCAN بود که با استفاده از سه پارامتر eps ، minpts و تعداد خوشه‌ها پیاده‌سازی شد. در اینجا، تعداد خوشه ها روی 50 تنظیم شد. نتایج برای خوشه بندی DBSCAN در شکل 11 نشان داده شده است و منطقه بسیار متراکم مربوطه با شناسه خوشه اختصاص داده شده 1 در شکل 12 نشان داده شده است . برای اعتبار سنجی مکانیسم خوشه بندی، نمودار نوار آماری برای ویژگی های Country و Cluster ID برای تجسم 50 خوشه مربوط به کشورهای نشان داده شده در تولید شد.شکل 13 . نمودار میانگین و انحراف استاندارد در شکل 14، که بین ویژگی های Region و MRDS-ID رسم می شود. این نشان دهنده منابع معدنی موجود در مناطق مختلف در سراسر جهان است. حداکثر مقدار متناظر، مقدار میانگین و مقدار حداقل مشاهده می شود. برچسب ها را نمی توان در نقشه ها ارائه کرد زیرا مجموعه داده ها به عنوان یک SBD عمل می کنند و تجزیه و تحلیل چنین داده هایی بر روی موتورهای محلی عملاً کار دشواری است.

8.2. مطالعه موردی 2: پیش بینی خانوار برای شهرستان فیرفکس

8.2.1. مشخصات مجموعه داده

ما مجموعه داده پیش‌بینی خانوار منتشر شده توسط GIS شهرستان فیرفکس را در نظر گرفتیم که پیش‌بینی 30 ساله خانوارها را در منطقه فیرفکس ارائه می‌دهد. مجموعه داده متشکل از مقادیر طول و عرض جغرافیایی به منظور پیش بینی مکانی [ 54 ] است. واحدهای مسکونی در سطح بسته ردیابی شدند. مجموعه داده شامل شناسه‌های بسته، تخمین‌های حداکثر احتمال (MLE) خانوارهای اخیراً توسعه‌یافته، کد کاربری زمین (LUC)، نوع واحد مسکونی (یعنی تک خانواده، واحد چندگانه، واحد خانه شهری، واحد دوبلکس و غیره)، مساحت است. در هکتار و سالهای مربوط به تأسیس واحدهای مسکونی. کل داده های موجود در مجموعه داده 342308 ردیف است. که بیانگر این است که داده ای با ابعاد بالا است.
8.2.2. تجسم مجموعه داده های خانواده پیش بینی Fairfax
تحلیل همپوشانی وزنی برای پیش‌بینی خانوارهای 30 ساله شهرستان فیرفکس در نقشه خیابان باز ایجاد شد. نقاط داده روی نقشه در جایی که هر نقطه داده به هر ردیف یا به طور متناوب یک ویژگی از مجموعه داده اشاره دارد، تجسم شدند. پوشش وزنی در شکل 15 نشان داده شده است . تجزیه و تحلیل نقطه-خوشه برای مجموعه داده در نظر گرفته شده در شکل 16 نشان داده شده است که در آن دایره های قهوه ای کوچک و مربع های قرمز به ترتیب نشان دهنده نقاط و خوشه ها هستند. نقشه حرارتی تولید شده با شدت رنگ های مختلف برای تعیین منطقه بسیار متراکم در شکل 17 نشان داده شده است . روش خوشه‌بندی K-means که با 50 خوشه استفاده می‌شود، زودتر از مطالعه موردی 1 پردازش شد و می‌توان آن را در شکل 18 قابل مشاهده است.. نمودار بین شناسه شی و خانوارهای پیش‌بینی‌شده برای سال 30 یک قطعه نوار بود که در شکل 19 مشاهده می‌شود . علاوه بر این، نمودار میانگین آماری و انحراف معیار برای شناسه خوشه در مقابل خانوارهای پیش بینی شده برای سال 30 که 50 شناسه خوشه را در رنگ های متنوع نشان می دهد در شکل 20 ارائه شده است . این مجموعه داده همچنین به عنوان SBD عمل می کند.
اجرای این تجسم‌ها زمان زیادی را می‌طلبد و بنابراین چارچوب پیشنهادی راه‌حلی برای مقابله با محدودیت زمانی با استفاده از الگوی محاسباتی بدون سرور برای کاهش زمان مربوط به تجزیه و تحلیل چنین داده‌های بزرگ و تولید همزمان نتایج سریع‌تر ارائه می‌دهد. ما دو مجموعه داده بزرگ جغرافیایی را با استفاده از بسته منبع باز QGIS با یک جهت تحقیقاتی آینده به سمت همگرایی ابزار تجسم با یک محیط محاسباتی بدون سرور تجزیه و تحلیل کردیم.

9. اجرا در سطح اجرای مطالعه تجربی

مشخصات سخت افزاری موتور محلی که آزمایش بر روی آن انجام شده است شامل یک CPU Intel Core i5-8265U، 8.00 گیگابایت رم، سیستم عامل 64 بیتی Windows 10 Home Single Language 2019، یک درایو حالت جامد 256 گیگابایتی و یک هارد دیسک 1 ترابایتی است. . در این بخش، عملکرد سطح اجرا را برای هر عملیات انجام شده با استفاده از ابزار QGIS مقایسه می کنیم. برای دو مطالعه موردی کاربردی، ما عملیات های مختلفی مانند تجزیه و تحلیل همپوشانی وزنی، تجزیه و تحلیل خوشه نقطه ای، تولید نقشه حرارتی و تجزیه و تحلیل خوشه فضایی را انجام دادیم. زمان اجرا برای انجام عملیات فوق مقایسه شد.شکل 21مقایسه بین زمان اجرا (در نظر گرفته شده بر حسب ثانیه) برای انجام تجزیه و تحلیل همپوشانی وزنی، تجزیه و تحلیل خوشه نقطه و تولید نقشه حرارتی مربوط به دو مطالعه موردی را فراهم می کند. با توجه به واریانس قابل توجه در مقیاس، زمان های اجرا برای انجام تجزیه و تحلیل خوشه ای به طور جداگانه در شکل 22 نشان داده شده است.. در اینجا، زمان اجرا مربوط به دو مطالعه موردی برای دو تکنیک مختلف خوشه‌بندی، یعنی خوشه‌بندی K-means و الگوریتم DBSCAN ارائه شده است. شایان ذکر است که داده‌های MRDS در نظر گرفته شده در مطالعه موردی 1 از نظر محاسباتی برای انجام عملیات مکانی با استفاده از موتورهای محلی بسیار فشرده است زیرا زمان صرف شده برای تشکیل خوشه‌های فضایی با استفاده از تکنیک DBSCAN 23 دقیقه و 10 ثانیه (≈1390 ثانیه) است. از این رو، پلت فرم محاسباتی بدون سرور برای انجام چنین محاسبات پیچیده ای اجتناب ناپذیر است.

10. چالش های معماری و سطح خدمات

در این مقاله، ما بینشی نسبت به ادغام پلت فرم بدون سرور با چارچوب GIS برای پردازش پیشرفته داده‌های بزرگ جغرافیایی ارائه کردیم. اگرچه شرکت های مختلف جهانی مانند آمازون، گوگل و مایکروسافت مدل کار بدون سرور را برای برآورده کردن نیازهای محاسباتی پیشرفته کاربران خود اتخاذ کرده اند. با این حال، هنوز چالش‌های معماری و همچنین سطح خدمات متعددی وجود دارد که قبل از اتخاذ کامل این پلتفرم‌ها نیاز به بررسی دارد [ 8 ]. در زیر برخی از مسائل و چالش های مهم برای ادغام پارادایم های محاسباتی بدون سرور در ارتباط با تجزیه و تحلیل داده های مکانی را مورد بحث قرار می دهیم:
  • پیچیدگی مرتبط با پردازش داده های عظیم مکانی برای ایجاد برنامه کاربردی خاص مشتری، چالش های معماری را در موتورهای محلی ایجاد می کند. ما به دنبال استفاده از پلتفرم های بدون سرور برای اجرای آنها هستیم. همانطور که در بخش 5 مورد بحث قرار گرفت ، معماری میکروسرویس می تواند به طور موثر در این سناریو برای پیاده سازی برنامه های کاربردی پیچیده با تقسیم آنها به زیر ماژول های ساده تر مورد استفاده قرار گیرد و در نتیجه انعطاف پذیری بیشتر و نتایج سریعتر برای کاربران فراهم شود. با این حال، این معماری در سناریوی بدون سرور هنوز یک موضوع بسیار مورد بحث است زیرا هیچ استاندارد خاصی برای یکپارچه‌سازی این نتایج برای دستیابی به برنامه‌های کاربردی مکانی کاملاً قابل استفاده ارائه نشده است.
  • ابزار GIS در حال حاضر برای ایجاد پایگاه های اطلاعاتی مکانی استفاده می شود. با این حال، تجسم آنها فاقد بسته های قطعی مناسب برای پشتیبانی از معماری بدون سرور است.
  • همانطور که نیازهای محاسباتی با افزایش داده های مکانی به دست آمده افزایش می یابد، توابع بیشتری برای انجام عملیات مورد نظر مورد نیاز است. اکثر پلتفرم‌های محاسباتی بدون سرور موجود، فاقد تعداد کافی توابع برای اجرای تعداد فزاینده درخواست‌های دریافتی هستند. به عنوان مثال، پلتفرم بدون سرور Google Cloud تنها 1000 عملکرد را در هر 297 پروژه ارائه می کند.
  • از آنجایی که داده‌های مکانی لزوماً ممکن است شامل اطلاعات جغرافیایی باشد که ممکن است اطلاعات مکان واقعی را در بر بگیرد، بنابراین امنیت و حریم خصوصی این اطلاعات باید حفظ شود. معماری بدون سرور به دلیل ماهیت غیرمتمرکز خود، فاقد کنترل متمرکز بر فعالیت‌های شبکه است. بنابراین داده ها در معرض نقض امنیت قرار می گیرند.

11. جهت گیری تحقیقات آینده

حوزه محاسبات بدون سرور ثابت کرده است که یک راه حل FaaS بسیار کارآمد است. مدیریت داده های پیچیده ممکن است یکی از محدودیت های یک الگوی محاسباتی بدون سرور باشد. محاسبات بدون سرور نشان دهنده یک مدل Pay-as-you-Go است. با این حال، پیچیدگی زمانی مرتبط با استقرار بلوک‌های پیچیده کد به بهینه‌سازی‌های بیشتری نیاز دارد تا نیازهای مشتری را برآورده کند. SBD به پردازش پیچیده نیاز دارد و برای اینکه توسعه‌دهنده را از پردازش قطعه کد معاف کنیم، به صلاحیت بیشتر چارچوب‌های بدون سرور نیاز داریم. جهت گیری های تحقیقاتی آتی را می توان به صورت زیر خلاصه کرد:
  • بهینه سازی داده های مکانی یک نگرانی اصلی در زمینه استقرار داده های GIS در یک پلت فرم بدون سرور است. دلیل آن هزینه ای است که فرد برای پردازش و استقرار قطعه کد بهینه نشده روی هر چارچوب بدون سرور می پردازد.
  • تکنیک‌های استفاده از منابع به تحقیقات بیشتری نیاز دارند تا اندازه کدهایی را که می‌توان در یک شکاف زمانی واحد در یک پلتفرم بدون سرور اجرا کرد، بهبود بخشید.
  • برنامه‌های افزودنی کدهایی که در حال حاضر پشتیبانی می‌شوند باید برای پیاده‌سازی قطعه‌های کد حداقل آن دسته از برنامه‌های افزودنی که در جامعه محاسباتی امروزی محبوب هستند، ارتقا یابند.
  • کاربرد جغرافیایی در زمینه‌های کشاورزی، تجزیه و تحلیل جرم، تصاویر ماهواره‌ای و بسیاری از این قبیل نیازمند تحقیقات بیشتر برای ارائه یک پلتفرم انحصاری مبتنی بر پایتون برای پیاده‌سازی آسان‌تر در هر پارادایم محاسباتی بدون سرور است.
  • بهینه‌سازی کد یک چالش بزرگ است که باید به گونه‌ای با آن برخورد شود که پیاده‌سازی برنامه‌های GIS در یک پلتفرم بدون سرور ارزشمند باشد.

12. نتیجه گیری

محاسبات بدون سرور در سال های آینده یک پلت فرم غالب خواهد بود. در این مقاله، ما چارچوبی را برای برنامه‌های فضایی برای اجرای یک الگوی محاسباتی بدون سرور پیشنهاد کردیم. محاسبات کاربردی جغرافیایی مورد نیاز پیچیده هستند. بسیاری از پلتفرم‌های بدون سرور موجود می‌توانند قطعه‌های کد نوشته شده در Node.js، جاوا، سی شارپ و پایتون را بسازند، اشکال‌زدایی کنند، مستقر کنند و اجرا کنند. مشکل برنامه های مکانی این است که از ابزارهای خاصی برای اجرا مانند QGIS، ArcGIS و غیره استفاده می کند. چارچوب پیشنهادی استفاده از کتابخانه‌های پایتون را برای پردازش داده‌های مکانی پیشنهاد می‌کند. از آنجایی که قطعه کد در پایتون برای AWS Lambda، Google Cloud Functions و Microsoft Azure Functions قابل قبول است، چارچوب پیشنهادی یک جهت تحقیقاتی آینده را به سمت پیاده‌سازی قطعه‌های کد جغرافیایی کدگذاری‌شده در پایتون برای ساخت موفقیت‌آمیز در یک محیط بدون سرور ارائه می‌دهد. نتایج ارائه‌شده بر تجزیه و تحلیل داده‌های مکانی با کمک ابزاری متمرکز است که پایتون در انتهای آن کار می‌کند. این ابزار را می‌توان برای ادغام چارچوب‌های محاسباتی بدون سرور برای کاهش محدودیت‌های زمان‌بندی مرتبط، بداهه ساخت. شایستگی پلتفرم‌های بدون سرور در نظر گرفته شده برای بسیاری از محققان شناخته شده است، ما سعی کردیم با تعبیه آن در یک الگوی محاسباتی بدون سرور، رویکرد جدیدی را برای کاهش پیچیدگی پردازش و محدودیت‌های زمان‌بندی مرتبط با برنامه‌های مکانی ارائه کنیم. در این مقاله، چالش های معماری و سطح خدمات ارائه شده است تا خواننده را از محدودیت های ناشی از چارچوب پیشنهادی آگاه کند.

اختصارات

در این نسخه از اختصارات زیر استفاده شده است:

GIS سیستم های اطلاعات جغرافیایی
MRDS سیستم داده منابع معدنی
BaaS Back-end به عنوان یک سرویس.
فاس عملکرد به عنوان یک سرویس
DMET آنزیم ها و ناقلین متابولیسم دارو
AWS خدمات وب آمازون
SNP پلی مورفیسم های تک نوکلئوتیدی
جی پی اس سیستم موقعیت یاب جهانی.
IaaS زیرساخت به عنوان یک سرویس
CPU واحد پردازش مرکزی.
SBA رویکرد مبتنی بر سرور
SLA رویکرد بدون سرور
CI یکپارچه سازی مداوم
سی دی تحویل مستمر.
SDI زیرساخت داده های مکانی
آمازون S3 سرویس ذخیره سازی ساده آمازون.
DBSCAN خوشه بندی فضایی مبتنی بر چگالی برنامه های کاربردی با نویز.
SBD داده های بزرگ فضایی
SAR مدل خودرگرسیون فضایی.
QGIS سیستم های اطلاعات جغرافیایی کوانتومی
API رابط برنامه نویسی کاربردی
ITU-T بخش استانداردسازی مخابرات اتحادیه بین المللی مخابرات.
QoS ارزش خدمات.
MLE برآورد حداکثر احتمال.
LUC کد کاربری زمین

منابع

  1. دلد، جی. گروپمن، جی. آینده هوش مکانی. ژئو اسپات. Inf. علمی 2017 ، 20 ، 151-162. [ Google Scholar ] [ CrossRef ]
  2. سوئیل، پ. برگر، ا. دی مارکی، دی. کمپینرز، پی. رودریگز، دی. سیریس، وی. Vasilev, V. یک پلت فرم محاسباتی همه کاره با داده فشرده برای بازیابی اطلاعات از داده های بزرگ جغرافیایی. ژنرال آینده. محاسبه کنید. سیستم 2018 ، 81 ، 30-40. [ Google Scholar ] [ CrossRef ]
  3. Iosifescu-Enescu، I.; ماتیس، سی. گکونوس، سی. ایوسیفسکو-انسکو، سی. Hurni، L. معماری‌های مبتنی بر ابر برای ژئوپورتال‌های وب مقیاس‌پذیر خودکار به سمت Cloudification GeoVITe Geoportal دانشگاهی سوئیس. ISPRS Int. J. Geo-Inf. 2017 ، 6 ، 192. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  4. باریک، RK; کندپال، م. دوبی، اچ. کومار، وی. Das, H. Geocloud4GI: Cloud SDI Model for Geographical Indications Information Infrastructure Network. که در رایانش ابری برای تجزیه و تحلیل داده های بزرگ جغرافیایی ؛ Springer: برلین/هایدلبرگ، آلمان، 2019؛ صص 215-224. [ Google Scholar ]
  5. باریک، RK; دوبی، اچ. مانکودیا، ک. ساسان، SA; Misra, C. GeoFog4Health: یک چارچوب SDI مبتنی بر مه برای تجزیه و تحلیل داده های بزرگ سلامت جغرافیایی. J. هوش محیطی. اومانیز. محاسبه کنید. 2019 ، 10 ، 551-567. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  6. رابرتز، ام. چاپین، جی. بدون سرور چیست؟ O’Reilly Media Incorporated: Sebastopol, CA, USA, 2017. [ Google Scholar ]
  7. بالدینی، آی. کاسترو، پی. چانگ، ک. چنگ، پی. فینک، اس. اساکیان، وی. میچل، ن. موثامی، وی. رباح، ر. اسلومینسکی، آ. و همکاران محاسبات بدون سرور: روندهای فعلی و مشکلات باز که در پیشرفت های تحقیقاتی در رایانش ابری ؛ Springer: برلین/هایدلبرگ، آلمان، 2017; ص 1-20. [ Google Scholar ]
  8. طیبی، د. ال یوینی، ن. پهل، سی. Niederkofler، JRS Patterns for Serverless Functions (Function-as-a-Service): A Multivocal Literature Review. در مجموعه مقالات دهمین کنفرانس بین‌المللی علوم رایانش ابری و خدمات، CLOSER 2020، پراگ، جمهوری چک، 7 تا 9 مه 2020. [ Google Scholar ]
  9. Hellerstein, JM; فالیرو، جی. گونزالس، جی. شلایر اسمیت، جی. سریکانتی، وی. تومانوف، آ. Wu, C. محاسبات بدون سرور: یک قدم به جلو، دو قدم به عقب. arXiv 2018 , arXiv:1812.03651. [ Google Scholar ]
  10. شکر، س. گونتوری، وی. ایوانز، ام آر. یانگ، ک. چالش‌های داده‌های بزرگ فضایی متقاطع تحرک و محاسبات ابری. در مجموعه مقالات یازدهمین کارگاه بین المللی ACM در مورد مهندسی داده برای دسترسی بی سیم و موبایل، اسکاتسدیل، AZ، ​​ایالات متحده آمریکا، 20 مه 2012. صص 1-6. [ Google Scholar ]
  11. Crespo-Cepeda، R. آگاپیتو، جی. وازکز پولتی، جی.ال. Cannataro، M. چالش ها و فرصت های خدمات لامبدا بدون سرور آمازون در بیوانفورماتیک. در مجموعه مقالات دهمین کنفرانس بین المللی ACM در بیوانفورماتیک، زیست شناسی محاسباتی و انفورماتیک سلامت، آبشار نیاگارا، نیویورک، ایالات متحده آمریکا، 7 تا 10 سپتامبر 2019؛ صص 663-668. [ Google Scholar ]
  12. نیو، ایکس. کومانوف، دی. آویزان، LH; لوید، دبلیو. Yeung، KY استفاده از محاسبات بدون سرور برای بهبود عملکرد برای مقایسه توالی. در مجموعه مقالات دهمین کنفرانس بین المللی ACM در بیوانفورماتیک، زیست شناسی محاسباتی و انفورماتیک سلامت، آبشار نیاگارا، نیویورک، ایالات متحده آمریکا، 7 تا 10 سپتامبر 2019؛ صص 683-687. [ Google Scholar ]
  13. کیم، ی. Lin, J. تجزیه و تحلیل داده های بدون سرور با سنگ چخماق. در مجموعه مقالات یازدهمین کنفرانس بین المللی IEEE 2018 در محاسبات ابری (CLOUD)، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، 2 تا 7 ژوئیه 2018؛ ص 451-455. [ Google Scholar ]
  14. اساکیان، وی. موثامی، وی. Slominski، A. ارائه مدل های یادگیری عمیق در یک پلت فرم بدون سرور. در مجموعه مقالات کنفرانس بین المللی IEEE 2018 در مهندسی ابر (IC2E)، اورلاندو، FL، ایالات متحده آمریکا، 17 تا 20 آوریل 2018؛ صص 257-262. [ Google Scholar ]
  15. آناند، اس. جانسون، ا. ماتیکشارا، پ. Karthik, R. ردیابی GPS بلادرنگ با استفاده از معماری بدون سرور و پردازنده ARM. در مجموعه مقالات یازدهمین کنفرانس بین‌المللی سیستم‌ها و شبکه‌های ارتباطی 2019 (COMSNETS)، بنگلور، هند، 7 تا 11 ژانویه 2019؛ صص 541-543. [ Google Scholar ]
  16. مالاوسکی، م. گاجک، ع. زیما، ع. بالیس، بی. Figiela، K. اجرای بدون سرور جریان‌های کاری علمی: آزمایش‌هایی با hyperflow، AWS lambda و توابع ابری Google. ژنرال آینده. محاسبه کنید. سیستم 2017 . [ Google Scholar ] [ CrossRef ]
  17. Varghese, B. Buyya, R. محاسبات ابری نسل بعدی: روندهای جدید و جهت گیری های تحقیقاتی. ژنرال آینده. محاسبه کنید. سیستم 2018 ، 79 ، 849-861. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  18. لی، اچ. ساتیام، ک. فاکس، جی. ارزیابی محیط‌های محاسباتی بدون سرور تولید. در مجموعه مقالات یازدهمین کنفرانس بین المللی IEEE 2018 در محاسبات ابری (CLOUD)، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، 2 تا 7 ژوئیه 2018؛ صص 442-450. [ Google Scholar ]
  19. Goodchild، MF; فو، پی. Rich, P. به اشتراک گذاری اطلاعات جغرافیایی: ارزیابی یک مرحله ای جغرافیایی. ان دانشیار صبح. Geogr. 2007 ، 97 ، 250-266. [ Google Scholar ] [ CrossRef ]
  20. ششی، س. پایگاه داده های فضایی ; آموزش پیرسون: بنگالورو، هند، 2007. [ Google Scholar ]
  21. یانگ، سی. لی، دبلیو. زی، جی. Zhou، B. پردازش اطلاعات مکانی توزیع شده: به اشتراک گذاری منابع جغرافیایی توزیع شده برای پشتیبانی از زمین دیجیتال. بین المللی جی دیجیت. زمین 2008 ، 1 ، 259-278. [ Google Scholar ] [ CrossRef ]
  22. اسکامیلا-آمبروسیو، پی. رودریگز-موتا، آ. آگویر-آنایا، ای. آکوستا برمجو، آر. Salinas-Rosales، M. توزیع محاسبات در اینترنت اشیا: مروری بر محاسبات ابر، مه و لبه. در NEO 2016 ؛ Springer: برلین/هایدلبرگ، آلمان، 2018; صص 87-115. [ Google Scholar ]
  23. باریک، RK; دوبی، اچ. Mankodiya، K. SOA-FOG: معماری محاسبات لبه ای خدمات محور برای تجزیه و تحلیل داده های بزرگ سلامت هوشمند. در مجموعه مقالات کنفرانس جهانی IEEE 2017 در مورد پردازش سیگنال و اطلاعات (GlobalSIP)، مونترال، QC، کانادا، 14 تا 16 نوامبر 2017؛ ص 477-481. [ Google Scholar ]
  24. محاسبات هیگاشینو، تی. اج برای کنترل‌های هم‌زمان مشارکتی با استفاده از داده‌های بزرگ جغرافیایی. در سنسورها و سیستم های هوشمند ؛ Springer: برلین/هایدلبرگ، آلمان، 2017; صص 441-466. [ Google Scholar ]
  25. کائو، ایکس. Madria، S. جمع آوری داده های مکانی کارآمد در شبکه های IoT برای محاسبات لبه موبایل. در مجموعه مقالات 2019 IEEE هجدهمین سمپوزیوم بین المللی محاسبات شبکه و برنامه های کاربردی (NCA)، کمبریج، MA، ایالات متحده آمریکا، 26-28 سپتامبر 2019؛ صص 1-10. [ Google Scholar ]
  26. سیمفرم. توابع AWS Lambda در مقابل Azure Functions در مقابل Google Cloud Functions: مقایسه ارائه دهندگان بدون سرور. 2018. در دسترس آنلاین: www.simform.com/aws-lambda-vs-azure-functions-vs-google-functions (در 1 مه 2020 قابل دسترسی است).
  27. وانگ، ی. لیو، ز. لیائو، اچ. لی، سی. بهبود عملکرد محاسبات همپوشانی چند ضلعی GIS با MapReduce برای پردازش داده های بزرگ فضایی. خوشه. محاسبه کنید. 2015 ، 18 ، 507-516. [ Google Scholar ] [ CrossRef ]
  28. گترل، AC؛ بیلی، تی سی؛ دیگل، پی جی؛ رولینگسون، BS تحلیل الگوی نقطه‌ای فضایی و کاربرد آن در اپیدمیولوژی جغرافیایی. ترانس. Inst. برادر Geogr. 1996 ، 21 ، 256-274. [ Google Scholar ] [ CrossRef ]
  29. جیانگ، ز. Shekhar, S. علم داده های بزرگ فضایی و مکانی-زمانی. در علم داده های بزرگ فضایی ; Springer: برلین/هایدلبرگ، آلمان، 2017; صص 15-44. [ Google Scholar ]
  30. شکر، س. ایوانز، ام آر. کانگ، جی.ام. Mohan, P. شناسایی الگوها در اطلاعات مکانی: بررسی روشها. در بررسی های میان رشته ای وایلی: داده کاوی و کشف دانش ; وایلی: هوبوکن، نیوجرسی، ایالات متحده آمریکا، 2011; جلد 1، ص 193-214. [ Google Scholar ]
  31. ژو، سی. فرانکوفسکی، دی. لودفورد، پی. شکر، س. تروین، ال. کشف مکان‌های معنادار شخصی: رویکرد خوشه‌بندی تعاملی. ACM Trans. Inf. سیستم (TOIS) 2007 ، 25 ، 12-es. [ Google Scholar ] [ CrossRef ]
  32. کاگلر، دی سی; الیور، دی. ایوانز، ام آر. شکر، س. Medeiros، CB Spatial Big Data: Platforms، Analytics و Science. در دسترس آنلاین: https://pdfs.semanticscholar.org/c64e/b7f733cf78573e962c6b5df24860eed3aabe.pdf (دسترسی در 1 مه 2020).
  33. وتساوایی، ر.ر. گانگولی، ا. چاندولا، وی. استفانیدیس، ا. کلاسکی، اس. Shekhar, S. داده کاوی فضایی و زمانی در عصر داده های مکانی بزرگ: الگوریتم ها و کاربردها. در مجموعه مقالات اولین کارگاه بین المللی ACM SIGSPATIAL در مورد تجزیه و تحلیل برای داده های مکانی بزرگ، ردوندو بیچ، کالیفرنیا، ایالات متحده آمریکا، 6 نوامبر 2012. صص 1-10. [ Google Scholar ]
  34. ایوانز، ام آر. الیور، دی. یانگ، ک. ژو، ایکس. علی، RY; Shekhar, S. فعال کردن داده های بزرگ فضایی از طریق CyberGIS: چالش ها و فرصت ها. در CyberGIS برای کشف و نوآوری جغرافیایی ؛ Springer: برلین/هایدلبرگ، آلمان، 2019؛ صص 143-170. [ Google Scholar ]
  35. باریک، RK; دوبی، اچ. صمددار، ع.ب. گوپتا، RD; Ray, PK FogGIS: محاسبات مه برای تجزیه و تحلیل داده های بزرگ جغرافیایی. در مجموعه مقالات کنفرانس بین المللی IEEE Uttar Pradesh Section 2016 در مورد مهندسی برق، کامپیوتر و الکترونیک (UPCON)، بنارس، هند، 9 تا 11 دسامبر 2016؛ صص 613-618. [ Google Scholar ]
  36. باریک، RK; تریپاتی، ا. دوبی، اچ. لنکا، RK; پراتیک، تی. شارما، اس. مانکودیا، ک. کومار، وی. Das، H. Mistgis: بهینه سازی تجزیه و تحلیل داده های مکانی با استفاده از محاسبات مه. در حال پیشرفت در محاسبات، تجزیه و تحلیل و شبکه ؛ Springer: برلین/هایدلبرگ، آلمان، 2018; صص 733-742. [ Google Scholar ]
  37. Blower، JD GIS در ابر: پیاده‌سازی یک سرویس نقشه وب در موتور برنامه Google. در مجموعه مقالات اولین کنفرانس بین المللی و نمایشگاه محاسبات برای تحقیقات و کاربردهای زمین فضایی، واشنگتن، دی سی، ایالات متحده آمریکا، 21 تا 23 ژوئن 2010. پ. 34. [ Google Scholar ]
  38. آپوستو، ا. پویکان، اف. اولارو، جی. سوسیو، جی. تودوران، جی. مطالعه مزایا و معایب رایانش ابری – مزایای کاربردهای تله متری در فضای ابری. Recent Adv. Appl. محاسبه کنید. علمی رقم. خدمت 2013 ، 2103 ، 118-123. [ Google Scholar ]
  39. یانگ، سی. Huang، Q. محاسبات ابری فضایی: یک رویکرد عملی . CRC Press: Boca Raton، FL، USA، 2013. [ Google Scholar ]
  40. سیکورا، پ. اشنابل، او. Enescu، II; Hurni، L. رابط های نقشه برداری توسعه یافته برای پردازش باز توزیع شده. کارتوگر. بین المللی جی. جئوگر. Inf. جئوویس. 2007 ، 42 ، 209-218. [ Google Scholar ] [ CrossRef ]
  41. کاظمی تبار، SJ; بنایی کاشانی، ف. McLeod, D. Geostreaming در ابر. در مجموعه مقالات دومین کارگاه بین المللی ACM SIGSPATIAL درباره ژئواستریمینگ، شیکاگو، IL، ایالات متحده آمریکا، 1 نوامبر 2011. صص 3-9. [ Google Scholar ]
  42. PyPI. کتابخانه نقشه نگاری پایتون با پشتیبانی از Matplotlib برای تجسم. 2018. موجود آنلاین: pypi.org/project/Cartopy (در 1 مه 2020 قابل دسترسی است).
  43. PyPI. اجسام هندسی، محمولات و عملیات. 2018. در دسترس آنلاین: pypi.org/project/Shapely (در 1 مه 2020 قابل دسترسی است).
  44. PyPI. فیونا فایل های داده های مکانی را می خواند و می نویسد. 2019. در دسترس آنلاین: pypi.org/project/Fiona (در 1 مه 2020 قابل دسترسی است).
  45. PyPI. رابط پایتون به PROJ (کتابخانه پیش بینی های نقشه برداری و تبدیل مختصات). 2019. در دسترس آنلاین: pypi.org/project/pyproj (در 1 مه 2020 قابل دسترسی است).
  46. PyPI. R-Tree Spatial Index برای Python GIS. 2016. در دسترس آنلاین: pypi.org/project/Rtree (در 1 مه 2020 قابل دسترسی است).
  47. PyPI. از اشیاء هندسی به عنوان مسیرها و وصله های Matplotlib استفاده کنید. 2017. در دسترس آنلاین: pypi.org/project/descartes (در 1 مه 2020 قابل دسترسی است).
  48. PyPI. I/O سریع و مستقیم Raster برای استفاده با Numpy و SciPy. 2019. در دسترس آنلاین: pypi.org/project/rasterio (در 1 مه 2020 قابل دسترسی است).
  49. مک لمور، پتانسیل منابع معدنی VT منطقه وحشی سابینوسو و بنای یادبود ملی ریو گراند دل نورته در شمال شرقی نیومکزیکو. 2018. در دسترس آنلاین: https://geoinfo.nmt.edu/publications/openfile/details.cfml?Volume=599 (در 1 مه 2020 قابل دسترسی است).
  50. ژو، دبلیو. چن، جی. لی، اچ. لو، اچ. هوانگ، کاربرد SL GIS در تجزیه و تحلیل منابع معدنی – مطالعه موردی طلای پلاسر دریایی دریایی در نوم، آلاسکا. محاسبه کنید. Geosci. 2007 ، 33 ، 773-788. [ Google Scholar ] [ CrossRef ]
  51. استر، ام. کریگل، اچ پی؛ ساندر، جی. Xu, X. یک الگوریتم مبتنی بر چگالی برای کشف خوشه ها در پایگاه داده های فضایی بزرگ با نویز. Kdd 1996 ، 96 ، 226-231. [ Google Scholar ]
  52. برایانت، آ. Cios، K. RNN-DBSCAN: یک الگوریتم خوشه بندی مبتنی بر چگالی با استفاده از تخمین تراکم نزدیکترین همسایه معکوس. IEEE Trans. بدانید. مهندسی داده 2018 ، 30 ، 1109–1121. [ Google Scholar ] [ CrossRef ]
  53. زنگ، ی. ژانگ، اچ. نیش، ز. لیو، ایکس. کروچیانی، ال. Vizzari، G. تشکیل خط در جریان مخالف بر اساس DBSCAN. در مجموعه مقالات چهارمین کارگاه بین المللی ACM SIGSPATIAL در مورد ایمنی و انعطاف پذیری، سیاتل، WA، ایالات متحده آمریکا، 6 نوامبر 2018؛ صص 1-6. [ Google Scholar ]
  54. GIS، FC پیش بینی خانوارها. 2017. در دسترس آنلاین: https://catalog.data.gov/dataset/forecast-households-371f2 (در تاریخ 1 مه 2020 قابل دسترسی است).
شکل 1. ( A ) رویکرد سنتی برای استقرار نرم افزار در سمت سرور را نشان می دهد. ( B ) رویکرد مبتنی بر توابع به عنوان یک سرویس (FaaS) را برای استقرار نرم افزار مربوط به عملیات های مختلف نشان می دهد.
شکل 2. نمایش بصری روش تحقیق در پشت کار تحقیقاتی ما.
شکل 3. مبادله بین رویکرد بدون سرور و مبتنی بر سرور به دست آمده از Google Trends.
شکل 4. معماری تعمیم یافته برای چارچوب های محاسباتی بدون سرور موجود.
شکل 5. چارچوب پیشنهادی برای استقرار محاسبات بدون سرور جغرافیایی.
شکل 6. چارچوب بدون سرور برای تجزیه و تحلیل داده های مکانی با خدمات وب آمازون (AWS) Lambda تعبیه شده برای انجام عملکردهای فعال سازی تجزیه و تحلیل داده های مکانی خاص.
شکل 7. تجزیه و تحلیل کیفی پارامترهای مختلف Ouality of Service (QoS) برای فناوری های مورد مطالعه با چارچوب پیشنهادی رویکرد بدون سرور (SLA).
شکل 8. تحلیل همپوشانی وزنی مجموعه داده سیستم داده منابع معدنی (MRDS) روی نقشه خیابان باز بدون برچسب.
شکل 9. تجزیه و تحلیل خوشه نقطه با خوشه در مثلث قرمز و نقاط در دایره های کوچک قهوه ای.
شکل 10. تجزیه و تحلیل نقشه حرارتی برای تعیین منطقه بسیار متراکم با استفاده از رنگ های مختلف بر اساس ویژگی ها.
شکل 11. تجزیه و تحلیل خوشه ای با کمک خوشه بندی فضایی برنامه های کاربردی با نویز مبتنی بر چگالی (DBSCAN) روی نقشه تولید شده.
شکل 12. تجسم یک خوشه منفرد با شناسه خوشه 1، که منطقه بسیار متراکم ایالات متحده طبق مجموعه داده MRDS است.
شکل 13. نمودار میله ای بین ویژگی های “country” و “Cluster ID” ایجاد می شود تا مشخص شود کدام کشور متعلق به خوشه DBSCAN است.
شکل 14. نمودار میانگین و انحراف استاندارد بین ویژگی های “region” و MRDS-ID.
شکل 15. تجزیه و تحلیل همپوشانی وزنی برای نقاط داده ترسیم شده بر روی نقشه خیابان باز.
شکل 16. تجزیه و تحلیل نقطه ای-خوشه ای که در آن نقاط با دایره های قهوه ای و خوشه ها با مربع های قرمز نشان دهنده خانوارهای منطقه است.
شکل 17. تجزیه و تحلیل نقشه حرارتی برای تعیین مناطق با تراکم بالای خانوارها انجام شد.
شکل 18. تجزیه و تحلیل خوشه ای با کمک K-means خوشه بندی بر روی نقشه تولید شده با 50 شناسه خوشه.
شکل 19. نمودار نواری برای نشان دادن خانوارهای پیش بینی شده برای سال 30 بر اساس شناسه شی.
شکل 20. نمودار میانگین و انحراف معیار برای نشان دادن شناسه های خوشه ای K-means مرتبط با خانوارهای پیش بینی شده برای سال 30.
شکل 21. زمان اجرا برای عملیات مختلف انجام شده در مطالعات موردی 1 و 2.
شکل 22. زمان اجرا برای خوشه بندی K-means و الگوریتم های DBSCAN.

بدون دیدگاه

دیدگاهتان را بنویسید