خلاصه
همگرایی داده های بزرگ و محاسبات مکانی چالش ها و فرصت هایی را برای علم GIS با توجه به مدیریت داده های مکانی، پردازش، تجزیه و تحلیل، مدل سازی و تجسم به ارمغان آورده است. این شماره ویژه پیشرفتهای اخیر را در یکپارچهسازی رویکردهای محاسباتی جدید، روشهای فضایی و استراتژیهای مدیریت داده برای مقابله با چالشهای دادههای بزرگ جغرافیایی برجسته میکند و در عین حال فرصتهایی را برای استفاده از دادههای بزرگ برای کاربردهای جغرافیایی نشان میدهد. برای پیشرفت هایی که در اینجا برجسته شده است، ادغام تفکر محاسباتی و تفکر فضایی و تبدیل ایده ها و مدل های انتزاعی به ساختارها و الگوریتم های داده عینی بسیار مهم است. این سرمقاله ابتدا به معرفی پیشینه و انگیزه این ویژه نامه می پردازد و سپس مروری بر ده مقاله ارائه شده دارد.
کلید واژه ها:
داده های بزرگ جغرافیایی ؛ محاسبات جغرافیایی ; cyberGIS ; GeoAI ; تفکر فضایی
1. معرفی
سیستمهای رصد زمین و شبیهسازیهای مدل، حجم عظیمی از دادههای جغرافیایی متفاوت، پویا و توزیعشده جغرافیایی را با وضوحهای مکانی-زمانی فزایندهتر تولید میکنند [ 1] ]. در همین حال، فراگیر بودن دستگاههای هوشمند، حسگرهای مبتنی بر مکان و پلتفرمهای رسانههای اجتماعی، اطلاعات جغرافیایی گستردهای را در مورد فعالیتهای زندگی روزمره ارائه میکنند. تجزیه و تحلیل کارآمد آن جریانهای دادههای بزرگ جغرافیایی ما را قادر میسازد الگوهای پیچیده را بررسی کرده و سیستمهای پشتیبانی تصمیمگیری جدید را توسعه دهیم، بنابراین ارزشهای بیسابقهای را برای علوم، مهندسی و تجارت ارائه میکنیم. با این حال، مدیریت پنج «Vs» (حجم، تنوع، سرعت، صحت و ارزش) دادههای بزرگ جغرافیایی یک کار چالش برانگیز است زیرا اغلب نیاز به پردازش، تجزیه و تحلیل و تجسم در زمینه فضا و زمان پویا دارند.2 ].
به دنبال مجموعه ای از جلسات موفق سازماندهی شده در نشست سالانه انجمن جغرافیدانان آمریکا (AAG) از سال 2015، این شماره ویژه در مورد “محاسبات کلان داده برای کاربردهای جغرافیایی” توسط مجله بین المللی اطلاعات جغرافیایی ISPRS با هدف به تصویر کشیدن آخرین تلاش ها برای استفاده از انطباق و توسعه رویکردهای محاسباتی جدید، روشهای فضایی و استراتژیهای مدیریت داده برای مقابله با چالشهای دادههای بزرگ جغرافیایی برای پشتیبانی از برنامههای کاربردی در حوزههای مختلف، مانند تغییرات آب و هوا، مدیریت بلایا، پویایی انسانی، بهداشت عمومی، و محیط زیست و مهندسی.
به طور خاص، هدف این شماره ویژه پرداختن به موضوعات مهم زیر است: (1) زیرساخت های جغرافیایی سایبری که اصول مکانی-زمانی و فناوری های محاسباتی پیشرفته را یکپارچه می کند (به عنوان مثال، GPU (محاسبات واحد پردازش گرافیک)، محاسبات چند هسته ای، محاسبات با کارایی بالا، و رایانش ابری). (2) نوآوریها در توسعه چارچوبها و معماری محاسباتی و برنامهنویسی (مثلاً MapReduce، Spark) یا الگوریتمهای محاسباتی موازی برای کاربردهای مکانی. (3) استراتژیهای جدید مدیریت دادههای مکانی و مدلهای ذخیرهسازی همراه با محاسبات با کارایی بالا برای پرس و جو، بازیابی و پردازش دادهها (به عنوان مثال، مکانیسمهای نمایهسازی مکانی-زمانی جدید). (4) روشهای محاسباتی جدید با در نظر گرفتن مکانیابی مکانی و زمانی (موقعیتها و روابط) کاربران، دادهها و منابع محاسباتی. (5) روشهای پردازش دادههای بزرگ، استخراج و تجسم مکانی با استفاده از محاسبات با کارایی بالا و هوش مصنوعی. (6) ادغام جریانهای کاری علمی در رایانش ابری و/یا یک محیط محاسباتی با عملکرد بالا. و (7) سایر تحقیقات، توسعه، آموزش، و چشم انداز مربوط به محاسبات داده های بزرگ جغرافیایی. این سرمقاله خلاصهای از ده مقاله موجود در این شماره را ارائه میکند و بر اساس مشاهدات جمعی ما، جهتهای تحقیقاتی آینده در این زمینه را پیشنهاد میکند.
2. مروری بر مقالات
مقالات موجود در این شماره کمک قابل توجهی به استفاده از محاسبات کلان داده برای مقابله با مشکلات مختلف جغرافیایی (از تحرک انسان گرفته تا مدیریت بلایا تا کشف دانش) با ترکیب متدولوژیهای جدید، ساختار دادهها و الگوریتمها با چارچوبهای محاسباتی پیشرفته (از geo- تجزیه و تحلیل بصری، یادگیری عمیق برای محاسبات ابری، و MapReduce/Spark). با استفاده از ده منبع مختلف داده بزرگ (به عنوان مثال، رسانه های اجتماعی، سنجش از راه دور و اینترنت اشیا)، این موضوع ارزش و اهمیت یکپارچه سازی رویکردهای محاسباتی و روش های مکانی را در پیشبرد اکتشافات علمی و کاربردهای دامنه نشان می دهد (جدول 1 ) .
2.1. روشهای محاسباتی کلان داده
پردازش و تجزیه و تحلیل داده های جغرافیایی، مانند تبدیل در هندسه، تبدیل سیستم های مرجع هماهنگی، و ارزیابی روابط مکانی، اغلب شامل تعداد زیادی محاسبات حسابی ممیز شناور است. به همین ترتیب، چارچوب ها و سیستم های مبتنی بر MapReduce و Spark، مانند SpatialHadoop [ 13 ] و GeoSpark [ 14]]، برای سرعت بخشیدن به این محاسبات توسعه داده شدند. علاوه بر این، پلتفرمهای محاسباتی مبتنی بر ابر، مانند موتور Google Earth (GEE) برای دادههای رصد زمین بزرگ، به طور فزایندهای در مطالعات و برنامههای کاربردی جغرافیایی مورد استفاده قرار گرفتهاند. برای بهینهسازی عملکرد یک الگوریتم موازی برای پردازش، تحلیل یا مدلسازی مکانی در هنگام استفاده از چنین چارچوبهای همه منظوره، ویژگیهای فضایی دادهها و الگوریتم باید برای طراحی الگوریتمی در نظر گرفته شود [15 ، 16 ] . چهار مقاله توسط جو و همکاران. [ 3 ]، ژائو و همکاران. [ 4 ]، کانگ و همکاران. [ 5 ] و Safanelli و همکاران. [ 6] روی محاسبات موازی تمرکز کرده و انطباق چارچوبهای محاسباتی موجود برای پیشپردازش دادههای مکانی، طراحی الگوریتم موازی، مدلسازی شبیهسازی و تجزیه و تحلیل دادهها را برجسته میکند.
اغلب زمان زیادی طول می کشد تا مجموعه داده های مکانی برای این سیستم های محاسباتی داده ها آماده شوند، که به طور کلی شامل استخراج، تبدیل، و بارگذاری فرآیندها (یعنی ETL) می شود. برای مقابله با کلان داده ها در فرآیند ETL، جو و لی روش جدیدی به نام D_ELT (تاخیر استخراج-بارگذاری- تبدیل)، برای کاهش زمان مورد نیاز برای تبدیل داده ها در پلت فرم Hadoop با استفاده از موازی سازی مبتنی بر MapReduce پیشنهاد کردند. .]. با استفاده از دادههای حسگر بزرگ در اندازههای مختلف و تجزیه و تحلیل مکانی با سطوح پیچیدگی مختلف، چندین آزمایش برای اندازهگیری عملکرد کلی سیستمهای D_ELT، ETL سنتی و استخراج-بارگذاری-تبدیل (ELT) انجام میشود. نتایج آنها نشان می دهد که D_ELT از هر دو ETL و ELT بهتر عمل می کند. علاوه بر این، هرچه مقدار داده بیشتر باشد یا پیچیدگی تجزیه و تحلیل بیشتر باشد، عملکرد D_ELT نسبت به رویکردهای سنتی ETL و ELT بهتر است.
ژائو و همکاران یک الگوریتم موازی برای تجزیه و تحلیل همپوشانی طراحی کرد که از اندازه گیری پیچیدگی شکل چند ضلعی به عنوان عامل کلیدی برای پارتیشن بندی داده ها در ترکیب با یک شاخص فضایی توزیع شده و یک فیلتر مستطیلی حداقل مرزی استفاده می کند [4 ] . الگوریتم موازی بر اساس Spark، یک چارچوب محاسباتی توزیع شده پرکاربرد برای کاربردهای در مقیاس بزرگ پیادهسازی شد. 17]]. نتایج آزمایش نشان می دهد که پارتیشن بندی داده ها بر اساس پیچیدگی شکل به طور موثر تعادل بار را در میان گره های محاسباتی متعدد بهبود می بخشد، بنابراین کارایی محاسباتی الگوریتم موازی را بهبود می بخشد. این کار نشان میدهد که تعاریف و اندازهگیریهای مناسب از ویژگیهای دادهها و/یا الگوریتمها (مهم نیست چقدر ساده باشند) برای انعکاس شدتهای محاسباتی برای بهبود عملکرد الگوریتمهای موازی اهمیت اساسی دارند.
مدل CA-Markov یکی از پرکاربردترین مدلهای اتوماتای سلولی توسعهیافته (CA) است و در پیشبینی و شبیهسازی تغییرات کاربری زمین استفاده شده است [ 5] .]. از آنجایی که شبیهسازی و پیشبینی تغییر کاربری زمین شامل مقادیر زیادی داده و محاسبات است، بسیاری از الگوریتمهای CA موازی برای شبیهسازی رشد شهری بر اساس مدلهای محاسباتی مختلف، از جمله واحدهای پردازش مرکزی (CPU) و GPU طراحی شدهاند. در حالی که روش CA موازی روابط فضایی بین سلولها را در بر میگیرد، نمیتواند اتصالات بین پارتیشنها را پس از تقسیم یک منطقه مورد مطالعه به چند قطعه حفظ کند، که منجر به نتایج پیشبینی متفاوت میشود. در همین حال، روش سنتی مارکوف میتواند یکپارچگی را برای کل منطقه مورد مطالعه حفظ کند، اما فاقد توانایی ترکیب روابط فضایی بین سلولها است. متناوبا، چارچوب MapReduce قادر به پردازش موازی کارآمد است که با مدل CA-Markov همراه شود. مشکل کلیدی تقسیم بندی و حفظ ارتباطات فضایی حل نشده باقی مانده است. به این ترتیب، کانگ و همکاران. یک راه حل مبتنی بر MapReduce را برای بهبود مدل موازی CA-Markov برای پیش بینی تغییر کاربری اراضی معرفی کرد.5 ]. نتایج نشان میدهد که مدل موازی CA-Markov نه تنها این پارادوکس را حل میکند که مدل سنتی CA-Markov نمیتواند به طور همزمان به یکپارچگی و تقسیمبندی برای شبیهسازی و پیشبینی تغییر کاربری زمین دست یابد، بلکه به کارایی و دقت نیز دست مییابد.
سافانلی و همکاران رویکرد متفاوتی برای رسیدگی به چالش های داده های بزرگ جغرافیایی [ 6]. آنها یک الگوریتم تجزیه و تحلیل زمین بر اساس GEE (به نام TAGEE) برای محاسبه انواع ویژگی های زمین، به عنوان مثال، شیب، جنبه، و انحنا، برای وضوح و گستره جغرافیایی مختلف توسعه دادند. با استفاده از هندسههای کروی اندازهگیری شده با فاصله دایره بزرگ، TAGEE نیازی به نمایش دادههای DEM ورودی بر روی صفحه مسطح ندارد. آزمایشها نشان میدهند که TAGEE میتواند نتایج مشابهی را در مقایسه با بستههای نرمافزاری GIS معمولی ایجاد کند. با بهرهگیری از ظرفیت محاسباتی با کارایی بالا GEE، TAGEE قادر است مجموعهای از محصولات ویژگیهای زمین را در هر وضوح مکانی در مقیاس جهانی به طور کارآمد تولید کند. این کار نشان دهنده یک الگوی نوظهور از محاسبات جغرافیایی در عصر داده های بزرگ است. وقتی پلتفرمهای رایانش ابری مانند GEE بالغ میشوند، محاسبات جغرافیایی دیگر توسط منابع محاسباتی و مجموعه داده های موجود محلی محدود نمی شود. کاربرد الگوریتمها/مدلهای پیچیده جغرافیایی در وضوح فضایی بالا و مقیاس جهانی در چند سال اخیر دیده شده است و به زودی به یک هنجار تبدیل خواهد شد.
2.2. کلان داده کاوی
حس اجتماعی، که در آن انسان ها یک شبکه حسگر بزرگ را نشان می دهند، به عنوان یک رویکرد جدید جمع آوری داده ها در عصر کلان داده ظاهر شده است [ 18 ]. سه مقاله زیر توسط ژانگ و همکاران. [ 7 ]، یانگ و همکاران. [ 8 ]، و وو و همکاران. [ 9 ] قدرت یکپارچهسازی دادههای سنجش اجتماعی (حمل و نقل عمومی، رسانههای اجتماعی و تلفن همراه) و تکنیکهای محاسباتی کلان داده را برای پشتیبانی از برنامههای مکانی از جمله تحرک انسانی، مدیریت بلایا و حملونقل نشان میدهد.
ژانگ و همکاران یک رویکرد جدید برای استخراج و تجسم الگوهای تحرک انسانی از داده های حمل و نقل عمومی چندمنبعی ایجاد کرد، با هدف حمایت از برنامه ریزی و مدیریت حمل و نقل با ارائه درک بهتری از الگوهای حرکت انسان در فضا و زمان [ ]]. برای استخراج موثر الگوهای سفر از منابع دادههای ناهمگن عظیم، این کار یک الگوریتم خوشهبندی برای استخراج راهروهای ترانزیت ایجاد کرد که نشاندهنده اتصالات بین مناطق مختلف و یک الگوریتم جاسازی گراف برای آشکار کردن ساختارهای جامعه تحرک سلسله مراتبی است. فراتر از الگوریتمهای جدید یادگیری ماشینی، این کار همچنین یک سیستم تحلیلی جغرافیایی بصری مبتنی بر وب مقیاسپذیر از جمله تکنیکهای تجسم را فراهم میکند تا به کاربران اجازه دهد تا الگوهای استخراجشده را به صورت تعاملی کشف کنند. این سیستم توسط 23 کاربر با پیشینههای مختلف ارزیابی شد و نتایج، قابلیت استفاده و کارایی رویکرد تحلیلی ژئو بصری یکپارچه را برای کشف الگوی حرکت انسان از دادههای بزرگ حملونقل عمومی تایید میکند. این کار قدرت یکپارچهسازی دادههای بزرگ جغرافیایی، الگوریتمهای یادگیری ماشینی را نشان میدهد.
یانگ و همکاران یک روش یادگیری عمیق را برای انجام کارآمد تجزیه و تحلیل احساسات داده های بزرگ رسانه های اجتماعی برای کمک به کاهش فاجعه معرفی کرد. 8]]. این کار یک چارچوب پنج مرحلهای برای استخراج خودکار احساسات عمومی از دادههای میکروبلاگ سینا با برچسب جغرافیایی شامل جمعآوری و پردازش دادهها، طبقهبندی احساسات و تجزیه و تحلیل فضایی-زمانی ابداع میکند. برای طبقه بندی احساسات (ترس، مضطرب، غمگین، عصبانی، خنثی و مثبت)، یک مدل شبکه عصبی کانولوشن (CNN) طراحی و با تبدیل متن خام به بردار کلمه، آموزش داده شده است. برای نشان دادن کارایی این رویکرد، یک زلزله در Ya’an، چین، در سال 2013 به عنوان مطالعه موردی استفاده شد. بر اساس مدل آموزش دیده، احساسات عمومی در محدوده مورد مطالعه در دوره های زمانی مختلف درست پس از زلزله طبقه بندی می شوند. سپس تحلیلهای مکانی-زمانی برای بررسی پویایی احساسات مردم نسبت به زلزله در مکان و زمان انجام شد.
وو و همکاران یک رویکرد سه مرحلهای برای شناسایی بخشهای گمشده جاده از دادههای ناوبری مبتنی بر تلفن همراه در محیطهای شهری پیشنهاد کرد [ 9 ]. اولین قدم آنها اعمال فیلتر برای داده های ناوبری برای حذف موارد مربوط به حرکت عابر پیاده و بخش های جاده موجود است. سپس، به عنوان گام دوم، خطوط مرکزی جادههای گمشده با استفاده از یک الگوریتم خوشهبندی ساخته میشوند. ساخت توپولوژی جاده های گمشده و اتصال این جاده های شناسایی شده با شبکه های جاده ای موجود، گام سوم است. وو و همکاران [ 9] این رویکرد را در منطقه مورد مطالعه (حدود 6 کیلومتر مربع) در شانگهای، چین اعمال کرد. این کار بر اساس 10 میلیون نقطه GPS جمعآوریشده از ناوبری تلفن همراه در سال 2017، توانایی رویکرد سه مرحلهای آنها را در تشخیص جادههای گمشده ارزیابی کرد. نتایج عملکرد این رویکرد سه مرحلهای را بر اساس دادههای تلفن همراه نشان میدهد و چالش محاسباتی رویکرد آنها را هنگام برخورد با مجموعه دادههای بزرگتر تشخیص میدهد.
2.3. بازنمایی دانش
ژوانگ و همکاران [ 10] به یک مشکل مورد مطالعه پرداخته است، یعنی نمایش و به اشتراک گذاری دانش مربوط به حل مشکلات جغرافیایی. این کار از طریق فرآیند انتزاع و تجزیه، مشکلات جغرافیایی را به وظایفی که در سه دانه بندی مختلف عمل می کنند، تجزیه می کند. فراتر از یک توصیف سطح بالا، این کار با ایجاد مجموعه ای از هستی شناسی ها برای وظایف، فرآیندها و عملیات GIS، فرآیند حل مسئله جغرافیایی را به یک پایگاه دانش رسمی می کند. با استفاده از تجزیه و تحلیل هشدار اولیه هواشناسی به عنوان یک مطالعه موردی، این کار با موفقیت نشان میدهد که چگونه میتوان دانش انتزاعی حل مسئله جغرافیایی را در یک پایگاه دانش وظیفهمحور رسمی و قابل اشتراکگذاری نشان داد. نشان داده شده توسط یک سیستم نمونه اولیه، نتایج آنها یک نگاه اجمالی امیدوارکننده از اینکه کاربران چگونه میتوانند شروع به ساخت مدلهای حل مسئله جغرافیایی و گردش کار مشابه مدلهای فضایی و گردش کار کنند، ارائه میدهد. چنین مدلها و جریانهای کاری میتوانند مجدداً مورد استفاده قرار گیرند و برای مشکلات مشابه سازگار شوند یا به عنوان بلوک ساختمانی برای مقابله با مشکلات پیچیدهتر جغرافیایی در آینده، مانند اثرات جهانی ناشی از تغییرات آب و هوا، استفاده شوند.
وانگ و همکاران [ 11 ] یک نمودار دانش مشابه ژوانگ و همکاران ساخت. [ 16] اما در عوض بر گرفتن اشیاء جغرافیایی و زمینه های مکانی و زمانی آنها متمرکز شد. این کار یک نمودار دانش جغرافیایی (GeoKG) متشکل از شش عنصر برای پاسخ به سؤالات اساسی در جغرافیا از جمله: کجاست ایجاد می کند؟ چرا آنجاست؟ چه زمانی و چگونه اتفاق افتاد؟ از طریق فرآیند ساخت و رسمی سازی مدل، این کار اشیاء جغرافیایی، روابط آنها و پویایی های مداوم را در یک GeoKG به تصویر می کشد. برای نشان دادن اثربخشی GeoKG، این کار تکامل بخشهای اداری نانجینگ، چین، در امتداد رودخانه یانگزی را به تفصیل شرح داد و سپس آن را با یک هستیشناسی ساده و توسعهپذیر معروف به نام YAGO (اگر هستیشناسی بزرگ دیگری) مقایسه کرد. نتایج نشان می دهد که GeoKG دقت و کامل بودن را از طریق تجزیه و تحلیل و ارزیابی کاربر بهبود بخشیده است.
2.4. جستجوی کلان داده
در نهایت، گیگالاس و همکاران. [ 12] یک رویکرد فهرستنویسی مبتنی بر زیرساخت سایبری ارائه کرد که خدمات وب و فناوریهای خزنده را برای پشتیبانی از جستجوی کارآمد دادههای آب و هوایی بزرگ ترکیب میکند. رویکرد فهرست نویسی از چهار مرحله اصلی شامل انتخاب و تجزیه و تحلیل یک مخزن ابرداده، خزیدن فراداده با استفاده از خزنده ها، ایجاد نمایه سازی مکانی-زمانی فراداده، و جستجو بر اساس جستجوی مجموعه (از طریق خدمات کاتالوگ) و جستجوی گرانول (از طریق REST API) تشکیل شده است. این رویکرد فهرستنویسی برای پشتیبانی از EarthCube CyberConnector پیادهسازی شد. برای نشان دادن امکانسنجی و کارایی روش پیشنهادی، این زیرساخت سایبری با دادههای ESOM (مشاهده و مدلسازی سیستم زمین) سطح پتابایت ارائهشده توسط UCAR THREDDS Data Server (TDS) آزمایش شد. نتایج نشان میدهد که رویکرد فهرستنویسی پیشنهادی نه تنها سرعت خزیدن را 10 برابر افزایش میدهد، بلکه به طور چشمگیری ابرداده اضافی را از 1.85 گیگابایت به 2.2 مگابایت کاهش میدهد. این کار به جای تمرکز بر تجزیه و تحلیل داده های بزرگ، اهمیت و تکنیک های پیشرفته جستجوی داده های بزرگ آب و هوا را برای حمایت از همکاری بین رشته ای در تجزیه و تحلیل آب و هوا نشان می دهد.
3. نتیجه گیری و جهت گیری های تحقیقاتی آینده
این موضوع ویژه، تنوع مدلها و تحلیلهای مکانی، دادههای مکانی، تفکر جغرافیایی و تفکر محاسباتی را که برای رسیدگی به مشکلات مکانی بیشمار از تحرک انسانی [7] تا مدیریت بلایا [ 8 ] مورد استفاده قرار میگیرد، برجسته میکند. دستنوشتهها شامل حل مسئله و دانش جغرافیایی (به عنوان مثال، [ 10 ، 11 ])، مدیریت دادههای جغرافیایی عظیم (مثلا، [ 3 ، 12 ])، و تجزیه و تحلیل و تجسم دادههای مکانی (مثلا، [ 7 ، 9 ]) هستند.
برای پیشرفتهای برجستهشده در این شماره ویژه، ادغام تفکر محاسباتی و تفکر فضایی و ترجمه ایدهها و مدلهای انتزاعی به ساختارها و الگوریتمهای داده عینی بسیار مهم است. یک جهت پژوهشی امیدوارکننده در آینده، ایجاد این ادغام دانش و مهارتها در رشتههای علوم GIS و علوم محاسباتی است که به عنوان سواد سایبری برای علم GIS نامیده میشود. 19] .]. به این ترتیب، دانش یکپارچه از الگوهای مکانی واقعی و فرآیندهای محاسباتی را می توان دریافت و به اشتراک گذاشت، و داده های بزرگ و چارچوب های تحلیل بصری مکانی را می توان برای ارائه پلت فرم های محاسباتی محاسباتی قوی تر برای رسیدگی به مشکلات جغرافیایی بی شمار ادغام کرد. یک چالش کلیدی در این جهت تحقیق، بافت یکپارچه خواهد بود که می تواند به طور یکپارچه تفکر علمی را با زیرساخت های محاسباتی، عناصر داده های جغرافیایی با قابلیت های کلان داده، و روش های جغرافیایی القا شده با موازی سازی ترکیب کند.
موازی سازی را می توان با استفاده نوآورانه از چارچوب های محاسباتی پیشرفته، مانند MapReduce و Spark، برای برنامه هایی که شامل مرتب سازی عظیم داده ها، محاسبات، یادگیری ماشین و پردازش گراف [20] به دست آورد . در حالی که این موضوع ویژه پیشرفتها را در پیشپردازش دادههای بزرگ جغرافیایی [ 3 ]، پیشبینی تغییر کاربری زمین [ 5 ] و تجزیه و تحلیل همپوشانی [ 4] را برجسته کرد.] برجسته میکند، تلاشهای بیشتری باید به شناسایی کاربردهای مکانی با تأثیر زیاد و بهرهمندی از ادغام روشهای مکانی اختصاص داده شود. و موازی سازی در عصر داده های بزرگ. علاوه بر این، بسیاری از برنامههای کاربردی دادههای بزرگ جغرافیایی موجود به سادگی انواع دادههای فضایی یا توابع را در سیستمهای کلان داده موجود (مانند Hadoop) بدون بهینهسازی زیاد تزریق میکنند.3 ]. بنابراین، جهتهای تحقیقاتی بیشتر باید بر بهبود و بهینهسازی عملکرد چارچوبهای کلان داده از جنبههای مختلف، مانند ETL داده، زمانبندی شغل، تخصیص منابع، تجزیه و تحلیل پرس و جو، مسائل حافظه و تنگناهای ورودی/خروجی، با در نظر گرفتن اصول فضایی و محدودیت ها [ 21 ].
منابع
- لی، ز. یانگ، سی. جین، بی. یو، م. لیو، ک. سان، م. Zhan, M. فعال کردن تجزیه و تحلیل داده های علوم زمین با یک چارچوب گردش کار مبتنی بر ابر، MapReduce فعال و سرویس گرا. PLoS ONE 2015 ، 10 ، e0116781. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- Li, Z. مدیریت داده های بزرگ جغرافیایی با محاسبات با کارایی بالا: رویکردهای فعلی و جهت گیری های آینده. در محاسبات با کارایی بالا برای کاربردهای جغرافیایی ; Tang, W., Wang, S., Eds. Springer: نیویورک، نیویورک، ایالات متحده آمریکا، 2020؛ شابک 978-3-030-47997-8. [ Google Scholar ]
- جو، جی. لی، K.-W. چارچوب D_ELT مبتنی بر کاهش نقشه برای مقابله با چالش های داده های بزرگ جغرافیایی. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 475. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
- ژائو، ک. جین، بی. فن، اچ. آهنگ، دبلیو. ژو، اس. Jiang, Y. تحلیل پوششی با عملکرد بالا چند ضلعی های جغرافیایی عظیم که پیچیدگی شکل را در یک محیط ابری در نظر می گیرد. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 290. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
- کانگ، جی. نیش، ال. لی، اس. وانگ، X. مدل مارکوف اتوماتای سلولی موازی برای پیشبینی تغییر کاربری زمین در چارچوب MapReduce. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 454. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
- Safanelli، JL; Poppiel، RR; رویز، LFC؛ Bonfatti، BR; Mello، FAdo; ریزو، آر. Demattê، تجزیه و تحلیل زمین JAM در موتور Google Earth: روشی اقتباس شده برای تجزیه و تحلیل در مقیاس جهانی با کارایی بالا. ISPRS Int. J. Geo-Inf. 2020 ، 9 ، 400. [ Google Scholar ] [ CrossRef ]
- ژانگ، تی. وانگ، جی. کوی، سی. لی، ی. او، دبلیو. لو، ی. Qiao, Q. ادغام تجزیه و تحلیل Geovisual با یادگیری ماشین برای کشف الگوی تحرک انسان. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 434. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
- یانگ، تی. زی، جی. لی، جی. مو، ن. لی، ز. تیان، سی. ژائو، جی. داده کاوی کلان رسانه های اجتماعی و تجزیه و تحلیل مکانی-زمانی در مورد احساسات عمومی برای کاهش بلایا. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 29. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
- وو، اچ. خو، ز. وو، جی. یک روش جدید برای تولید جاده گمشده در بلوکهای شهر بر اساس دادههای مسیر ناوبری موبایل بزرگ. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 142. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
- ژوانگ، سی. زی، ز. ما، ک. گو، ام. وو، ال. یک پایگاه دانش وظیفهمحور برای حل مسائل جغرافیایی. ISPRS Int. J. Geo-Inf. 2018 ، 7 ، 423. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
- وانگ، اس. ژانگ، ایکس. بله، پی. دو، م. لو، ی. Xue, H. نمودار دانش جغرافیایی (GeoKG): یک نمایش رسمی دانش جغرافیایی. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 184. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
- گیگالاس، جی. دی، ال. Sun، Z. زیرساخت سایبری پیشرفته برای فعال کردن جستجوی مجموعه داده های آب و هوایی بزرگ در THREDDS. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 494. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
- Eldawy، A. SpatialHadoop: به سمت پردازش فضایی انعطاف پذیر و مقیاس پذیر با استفاده از MapReduce. در مجموعه مقالات SIGMOD Ph.D. Symposium 2014, Snowbird, UT, USA, 22 ژوئن 2014; صص 46-50. [ Google Scholar ]
- یو، جی. وو، جی. Sarwat، M. Geospark: یک چارچوب محاسباتی خوشه ای برای پردازش داده های فضایی در مقیاس بزرگ. در مجموعه مقالات بیست و سومین کنفرانس بین المللی SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی، Bellevue، WA، ایالات متحده، 3-6 نوامبر 2015. پ. 70. [ Google Scholar ]
- گوان، کیو. زنگ، دبلیو. گونگ، جی. Yun, S. pRPL 2.0: بهبود کتابخانه پردازش شطرنجی موازی. ترانس. GIS 2014 ، 18 ، 25-52. [ Google Scholar ] [ CrossRef ]
- لی، ز. هاجسون، من؛ Li, W. یک چارچوب همه منظوره برای پردازش موازی داده های LiDAR در مقیاس بزرگ. بین المللی جی دیجیت. زمین 2018 ، 11 ، 26-47. [ Google Scholar ] [ CrossRef ]
- زهاریا، م. Xin، RS; وندل، پی. داس، تی. آرمبراست، ام. دیو، ا. قدسی، ا. آپاچی اسپارک: موتور یکپارچه برای پردازش داده های بزرگ. اشتراک. ACM 2016 ، 59 ، 56-65. [ Google Scholar ] [ CrossRef ]
- لی، ز. هوانگ، Q. Emrich, C. مقدمه ای بر حس اجتماعی و محاسبات کلان داده برای مدیریت بلایا. بین المللی جی دیجیت. زمین 2019 ، 12 ، 1198–1204. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- شوک، ای. Bowlick، FJ; کمپ، KK; اهلکویست، او. Carbajeles-Dale، P. دی بیاس، دی. راش، جی. سواد سایبری برای علم GIS: به سوی رسمی کردن آموزش محاسبات جغرافیایی. پروفسور جئوگر. 2019 ، 71 ، 221-238. [ Google Scholar ] [ CrossRef ]
- لی، ز. هو، اف. Schnase، JL; دافی، دی کیو؛ لی، تی. بوون، MK; یانگ، سی. یک رویکرد نمایه سازی مکانی-زمانی برای پردازش کارآمد داده های آب و هوایی مبتنی بر آرایه بزرگ با MapReduce. بین المللی جی. جئوگر. Inf. علمی 2017 ، 31 ، 17-35. [ Google Scholar ] [ CrossRef ]
- یانگ، سی. وو، اچ. هوانگ، Q. لی، ز. لی، جی. استفاده از اصول فضایی برای بهینه سازی محاسبات توزیع شده برای فعال کردن اکتشافات علوم فیزیکی. Proc. Natl. آکادمی علمی ایالات متحده آمریکا 2011 ، 108 ، 5498-5503. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
بدون دیدگاه