خلاصه

همگرایی داده های بزرگ و محاسبات مکانی چالش ها و فرصت هایی را برای علم GIS با توجه به مدیریت داده های مکانی، پردازش، تجزیه و تحلیل، مدل سازی و تجسم به ارمغان آورده است. این شماره ویژه پیشرفت‌های اخیر را در یکپارچه‌سازی رویکردهای محاسباتی جدید، روش‌های فضایی و استراتژی‌های مدیریت داده برای مقابله با چالش‌های داده‌های بزرگ جغرافیایی برجسته می‌کند و در عین حال فرصت‌هایی را برای استفاده از داده‌های بزرگ برای کاربردهای جغرافیایی نشان می‌دهد. برای پیشرفت هایی که در اینجا برجسته شده است، ادغام تفکر محاسباتی و تفکر فضایی و تبدیل ایده ها و مدل های انتزاعی به ساختارها و الگوریتم های داده عینی بسیار مهم است. این سرمقاله ابتدا به معرفی پیشینه و انگیزه این ویژه نامه می پردازد و سپس مروری بر ده مقاله ارائه شده دارد.

کلید واژه ها:

داده های بزرگ جغرافیایی ؛ محاسبات جغرافیایی ; cyberGIS ; GeoAI ; تفکر فضایی

1. معرفی

سیستم‌های رصد زمین و شبیه‌سازی‌های مدل، حجم عظیمی از داده‌های جغرافیایی متفاوت، پویا و توزیع‌شده جغرافیایی را با وضوح‌های مکانی-زمانی فزاینده‌تر تولید می‌کنند [ 1] ]. در همین حال، فراگیر بودن دستگاه‌های هوشمند، حسگرهای مبتنی بر مکان و پلت‌فرم‌های رسانه‌های اجتماعی، اطلاعات جغرافیایی گسترده‌ای را در مورد فعالیت‌های زندگی روزمره ارائه می‌کنند. تجزیه و تحلیل کارآمد آن جریان‌های داده‌های بزرگ جغرافیایی ما را قادر می‌سازد الگوهای پیچیده را بررسی کرده و سیستم‌های پشتیبانی تصمیم‌گیری جدید را توسعه دهیم، بنابراین ارزش‌های بی‌سابقه‌ای را برای علوم، مهندسی و تجارت ارائه می‌کنیم. با این حال، مدیریت پنج «Vs» (حجم، تنوع، سرعت، صحت و ارزش) داده‌های بزرگ جغرافیایی یک کار چالش برانگیز است زیرا اغلب نیاز به پردازش، تجزیه و تحلیل و تجسم در زمینه فضا و زمان پویا دارند.2 ].
به دنبال مجموعه ای از جلسات موفق سازماندهی شده در نشست سالانه انجمن جغرافیدانان آمریکا (AAG) از سال 2015، این شماره ویژه در مورد “محاسبات کلان داده برای کاربردهای جغرافیایی” توسط مجله بین المللی اطلاعات جغرافیایی ISPRS با هدف به تصویر کشیدن آخرین تلاش ها برای استفاده از انطباق و توسعه رویکردهای محاسباتی جدید، روش‌های فضایی و استراتژی‌های مدیریت داده برای مقابله با چالش‌های داده‌های بزرگ جغرافیایی برای پشتیبانی از برنامه‌های کاربردی در حوزه‌های مختلف، مانند تغییرات آب و هوا، مدیریت بلایا، پویایی انسانی، بهداشت عمومی، و محیط زیست و مهندسی.
به طور خاص، هدف این شماره ویژه پرداختن به موضوعات مهم زیر است: (1) زیرساخت های جغرافیایی سایبری که اصول مکانی-زمانی و فناوری های محاسباتی پیشرفته را یکپارچه می کند (به عنوان مثال، GPU (محاسبات واحد پردازش گرافیک)، محاسبات چند هسته ای، محاسبات با کارایی بالا، و رایانش ابری). (2) نوآوری‌ها در توسعه چارچوب‌ها و معماری محاسباتی و برنامه‌نویسی (مثلاً MapReduce، Spark) یا الگوریتم‌های محاسباتی موازی برای کاربردهای مکانی. (3) استراتژی‌های جدید مدیریت داده‌های مکانی و مدل‌های ذخیره‌سازی همراه با محاسبات با کارایی بالا برای پرس و جو، بازیابی و پردازش داده‌ها (به عنوان مثال، مکانیسم‌های نمایه‌سازی مکانی-زمانی جدید). (4) روش‌های محاسباتی جدید با در نظر گرفتن مکان‌یابی مکانی و زمانی (موقعیت‌ها و روابط) کاربران، داده‌ها و منابع محاسباتی. (5) روش‌های پردازش داده‌های بزرگ، استخراج و تجسم مکانی با استفاده از محاسبات با کارایی بالا و هوش مصنوعی. (6) ادغام جریانهای کاری علمی در رایانش ابری و/یا یک محیط محاسباتی با عملکرد بالا. و (7) سایر تحقیقات، توسعه، آموزش، و چشم انداز مربوط به محاسبات داده های بزرگ جغرافیایی. این سرمقاله خلاصه‌ای از ده مقاله موجود در این شماره را ارائه می‌کند و بر اساس مشاهدات جمعی ما، جهت‌های تحقیقاتی آینده در این زمینه را پیشنهاد می‌کند.

2. مروری بر مقالات

مقالات موجود در این شماره کمک قابل توجهی به استفاده از محاسبات کلان داده برای مقابله با مشکلات مختلف جغرافیایی (از تحرک انسان گرفته تا مدیریت بلایا تا کشف دانش) با ترکیب متدولوژی‌های جدید، ساختار داده‌ها و الگوریتم‌ها با چارچوب‌های محاسباتی پیشرفته (از geo- تجزیه و تحلیل بصری، یادگیری عمیق برای محاسبات ابری، و MapReduce/Spark). با استفاده از ده منبع مختلف داده بزرگ (به عنوان مثال، رسانه های اجتماعی، سنجش از راه دور و اینترنت اشیا)، این موضوع ارزش و اهمیت یکپارچه سازی رویکردهای محاسباتی و روش های مکانی را در پیشبرد اکتشافات علمی و کاربردهای دامنه نشان می دهد (جدول 1 ) .

2.1. روشهای محاسباتی کلان داده

پردازش و تجزیه و تحلیل داده های جغرافیایی، مانند تبدیل در هندسه، تبدیل سیستم های مرجع هماهنگی، و ارزیابی روابط مکانی، اغلب شامل تعداد زیادی محاسبات حسابی ممیز شناور است. به همین ترتیب، چارچوب ها و سیستم های مبتنی بر MapReduce و Spark، مانند SpatialHadoop [ 13 ] و GeoSpark [ 14]]، برای سرعت بخشیدن به این محاسبات توسعه داده شدند. علاوه بر این، پلتفرم‌های محاسباتی مبتنی بر ابر، مانند موتور Google Earth (GEE) برای داده‌های رصد زمین بزرگ، به طور فزاینده‌ای در مطالعات و برنامه‌های کاربردی جغرافیایی مورد استفاده قرار گرفته‌اند. برای بهینه‌سازی عملکرد یک الگوریتم موازی برای پردازش، تحلیل یا مدل‌سازی مکانی در هنگام استفاده از چنین چارچوب‌های همه منظوره، ویژگی‌های فضایی داده‌ها و الگوریتم باید برای طراحی الگوریتمی در نظر گرفته شود [15 ، 16 ] . چهار مقاله توسط جو و همکاران. [ 3 ]، ژائو و همکاران. [ 4 ]، کانگ و همکاران. [ 5 ] و Safanelli و همکاران. [ 6] روی محاسبات موازی تمرکز کرده و انطباق چارچوب‌های محاسباتی موجود برای پیش‌پردازش داده‌های مکانی، طراحی الگوریتم موازی، مدل‌سازی شبیه‌سازی و تجزیه و تحلیل داده‌ها را برجسته می‌کند.
اغلب زمان زیادی طول می کشد تا مجموعه داده های مکانی برای این سیستم های محاسباتی داده ها آماده شوند، که به طور کلی شامل استخراج، تبدیل، و بارگذاری فرآیندها (یعنی ETL) می شود. برای مقابله با کلان داده ها در فرآیند ETL، جو و لی روش جدیدی به نام D_ELT (تاخیر استخراج-بارگذاری- تبدیل)، برای کاهش زمان مورد نیاز برای تبدیل داده ها در پلت فرم Hadoop با استفاده از موازی سازی مبتنی بر MapReduce پیشنهاد کردند. .]. با استفاده از داده‌های حسگر بزرگ در اندازه‌های مختلف و تجزیه و تحلیل مکانی با سطوح پیچیدگی مختلف، چندین آزمایش برای اندازه‌گیری عملکرد کلی سیستم‌های D_ELT، ETL سنتی و استخراج-بارگذاری-تبدیل (ELT) انجام می‌شود. نتایج آنها نشان می دهد که D_ELT از هر دو ETL و ELT بهتر عمل می کند. علاوه بر این، هرچه مقدار داده بیشتر باشد یا پیچیدگی تجزیه و تحلیل بیشتر باشد، عملکرد D_ELT نسبت به رویکردهای سنتی ETL و ELT بهتر است.
ژائو و همکاران یک الگوریتم موازی برای تجزیه و تحلیل همپوشانی طراحی کرد که از اندازه گیری پیچیدگی شکل چند ضلعی به عنوان عامل کلیدی برای پارتیشن بندی داده ها در ترکیب با یک شاخص فضایی توزیع شده و یک فیلتر مستطیلی حداقل مرزی استفاده می کند [4 ] . الگوریتم موازی بر اساس Spark، یک چارچوب محاسباتی توزیع شده پرکاربرد برای کاربردهای در مقیاس بزرگ پیاده‌سازی شد. 17]]. نتایج آزمایش نشان می دهد که پارتیشن بندی داده ها بر اساس پیچیدگی شکل به طور موثر تعادل بار را در میان گره های محاسباتی متعدد بهبود می بخشد، بنابراین کارایی محاسباتی الگوریتم موازی را بهبود می بخشد. این کار نشان می‌دهد که تعاریف و اندازه‌گیری‌های مناسب از ویژگی‌های داده‌ها و/یا الگوریتم‌ها (مهم نیست چقدر ساده باشند) برای انعکاس شدت‌های محاسباتی برای بهبود عملکرد الگوریتم‌های موازی اهمیت اساسی دارند.
مدل CA-Markov یکی از پرکاربردترین مدل‌های اتوماتای ​​سلولی توسعه‌یافته (CA) است و در پیش‌بینی و شبیه‌سازی تغییرات کاربری زمین استفاده شده است [ 5] .]. از آنجایی که شبیه‌سازی و پیش‌بینی تغییر کاربری زمین شامل مقادیر زیادی داده و محاسبات است، بسیاری از الگوریتم‌های CA موازی برای شبیه‌سازی رشد شهری بر اساس مدل‌های محاسباتی مختلف، از جمله واحدهای پردازش مرکزی (CPU) و GPU طراحی شده‌اند. در حالی که روش CA موازی روابط فضایی بین سلول‌ها را در بر می‌گیرد، نمی‌تواند اتصالات بین پارتیشن‌ها را پس از تقسیم یک منطقه مورد مطالعه به چند قطعه حفظ کند، که منجر به نتایج پیش‌بینی متفاوت می‌شود. در همین حال، روش سنتی مارکوف می‌تواند یکپارچگی را برای کل منطقه مورد مطالعه حفظ کند، اما فاقد توانایی ترکیب روابط فضایی بین سلول‌ها است. متناوبا، چارچوب MapReduce قادر به پردازش موازی کارآمد است که با مدل CA-Markov همراه شود. مشکل کلیدی تقسیم بندی و حفظ ارتباطات فضایی حل نشده باقی مانده است. به این ترتیب، کانگ و همکاران. یک راه حل مبتنی بر MapReduce را برای بهبود مدل موازی CA-Markov برای پیش بینی تغییر کاربری اراضی معرفی کرد.5 ]. نتایج نشان می‌دهد که مدل موازی CA-Markov نه تنها این پارادوکس را حل می‌کند که مدل سنتی CA-Markov نمی‌تواند به طور همزمان به یکپارچگی و تقسیم‌بندی برای شبیه‌سازی و پیش‌بینی تغییر کاربری زمین دست یابد، بلکه به کارایی و دقت نیز دست می‌یابد.
سافانلی و همکاران رویکرد متفاوتی برای رسیدگی به چالش های داده های بزرگ جغرافیایی [ 6]. آنها یک الگوریتم تجزیه و تحلیل زمین بر اساس GEE (به نام TAGEE) برای محاسبه انواع ویژگی های زمین، به عنوان مثال، شیب، جنبه، و انحنا، برای وضوح و گستره جغرافیایی مختلف توسعه دادند. با استفاده از هندسه‌های کروی اندازه‌گیری شده با فاصله دایره بزرگ، TAGEE نیازی به نمایش داده‌های DEM ورودی بر روی صفحه مسطح ندارد. آزمایش‌ها نشان می‌دهند که TAGEE می‌تواند نتایج مشابهی را در مقایسه با بسته‌های نرم‌افزاری GIS معمولی ایجاد کند. با بهره‌گیری از ظرفیت محاسباتی با کارایی بالا GEE، TAGEE قادر است مجموعه‌ای از محصولات ویژگی‌های زمین را در هر وضوح مکانی در مقیاس جهانی به طور کارآمد تولید کند. این کار نشان دهنده یک الگوی نوظهور از محاسبات جغرافیایی در عصر داده های بزرگ است. وقتی پلتفرم‌های رایانش ابری مانند GEE بالغ می‌شوند، محاسبات جغرافیایی دیگر توسط منابع محاسباتی و مجموعه داده های موجود محلی محدود نمی شود. کاربرد الگوریتم‌ها/مدل‌های پیچیده جغرافیایی در وضوح فضایی بالا و مقیاس جهانی در چند سال اخیر دیده شده است و به زودی به یک هنجار تبدیل خواهد شد.

2.2. کلان داده کاوی

حس اجتماعی، که در آن انسان ها یک شبکه حسگر بزرگ را نشان می دهند، به عنوان یک رویکرد جدید جمع آوری داده ها در عصر کلان داده ظاهر شده است [ 18 ]. سه مقاله زیر توسط ژانگ و همکاران. [ 7 ]، یانگ و همکاران. [ 8 ]، و وو و همکاران. [ 9 ] قدرت یکپارچه‌سازی داده‌های سنجش اجتماعی (حمل و نقل عمومی، رسانه‌های اجتماعی و تلفن همراه) و تکنیک‌های محاسباتی کلان داده را برای پشتیبانی از برنامه‌های مکانی از جمله تحرک انسانی، مدیریت بلایا و حمل‌ونقل نشان می‌دهد.
ژانگ و همکاران یک رویکرد جدید برای استخراج و تجسم الگوهای تحرک انسانی از داده های حمل و نقل عمومی چندمنبعی ایجاد کرد، با هدف حمایت از برنامه ریزی و مدیریت حمل و نقل با ارائه درک بهتری از الگوهای حرکت انسان در فضا و زمان [ ]]. برای استخراج موثر الگوهای سفر از منابع داده‌های ناهمگن عظیم، این کار یک الگوریتم خوشه‌بندی برای استخراج راهروهای ترانزیت ایجاد کرد که نشان‌دهنده اتصالات بین مناطق مختلف و یک الگوریتم جاسازی گراف برای آشکار کردن ساختارهای جامعه تحرک سلسله مراتبی است. فراتر از الگوریتم‌های جدید یادگیری ماشینی، این کار همچنین یک سیستم تحلیلی جغرافیایی بصری مبتنی بر وب مقیاس‌پذیر از جمله تکنیک‌های تجسم را فراهم می‌کند تا به کاربران اجازه دهد تا الگوهای استخراج‌شده را به صورت تعاملی کشف کنند. این سیستم توسط 23 کاربر با پیشینه‌های مختلف ارزیابی شد و نتایج، قابلیت استفاده و کارایی رویکرد تحلیلی ژئو بصری یکپارچه را برای کشف الگوی حرکت انسان از داده‌های بزرگ حمل‌ونقل عمومی تایید می‌کند. این کار قدرت یکپارچه‌سازی داده‌های بزرگ جغرافیایی، الگوریتم‌های یادگیری ماشینی را نشان می‌دهد.
یانگ و همکاران یک روش یادگیری عمیق را برای انجام کارآمد تجزیه و تحلیل احساسات داده های بزرگ رسانه های اجتماعی برای کمک به کاهش فاجعه معرفی کرد. 8]]. این کار یک چارچوب پنج مرحله‌ای برای استخراج خودکار احساسات عمومی از داده‌های میکروبلاگ سینا با برچسب جغرافیایی شامل جمع‌آوری و پردازش داده‌ها، طبقه‌بندی احساسات و تجزیه و تحلیل فضایی-زمانی ابداع می‌کند. برای طبقه بندی احساسات (ترس، مضطرب، غمگین، عصبانی، خنثی و مثبت)، یک مدل شبکه عصبی کانولوشن (CNN) طراحی و با تبدیل متن خام به بردار کلمه، آموزش داده شده است. برای نشان دادن کارایی این رویکرد، یک زلزله در Ya’an، چین، در سال 2013 به عنوان مطالعه موردی استفاده شد. بر اساس مدل آموزش دیده، احساسات عمومی در محدوده مورد مطالعه در دوره های زمانی مختلف درست پس از زلزله طبقه بندی می شوند. سپس تحلیل‌های مکانی-زمانی برای بررسی پویایی احساسات مردم نسبت به زلزله در مکان و زمان انجام شد.
وو و همکاران یک رویکرد سه مرحله‌ای برای شناسایی بخش‌های گمشده جاده از داده‌های ناوبری مبتنی بر تلفن همراه در محیط‌های شهری پیشنهاد کرد [ 9 ]. اولین قدم آنها اعمال فیلتر برای داده های ناوبری برای حذف موارد مربوط به حرکت عابر پیاده و بخش های جاده موجود است. سپس، به عنوان گام دوم، خطوط مرکزی جاده‌های گمشده با استفاده از یک الگوریتم خوشه‌بندی ساخته می‌شوند. ساخت توپولوژی جاده های گمشده و اتصال این جاده های شناسایی شده با شبکه های جاده ای موجود، گام سوم است. وو و همکاران [ 9] این رویکرد را در منطقه مورد مطالعه (حدود 6 کیلومتر مربع) در شانگهای، چین اعمال کرد. این کار بر اساس 10 میلیون نقطه GPS جمع‌آوری‌شده از ناوبری تلفن همراه در سال 2017، توانایی رویکرد سه مرحله‌ای آن‌ها را در تشخیص جاده‌های گمشده ارزیابی کرد. نتایج عملکرد این رویکرد سه مرحله‌ای را بر اساس داده‌های تلفن همراه نشان می‌دهد و چالش محاسباتی رویکرد آنها را هنگام برخورد با مجموعه داده‌های بزرگتر تشخیص می‌دهد.

2.3. بازنمایی دانش

ژوانگ و همکاران [ 10] به یک مشکل مورد مطالعه پرداخته است، یعنی نمایش و به اشتراک گذاری دانش مربوط به حل مشکلات جغرافیایی. این کار از طریق فرآیند انتزاع و تجزیه، مشکلات جغرافیایی را به وظایفی که در سه دانه بندی مختلف عمل می کنند، تجزیه می کند. فراتر از یک توصیف سطح بالا، این کار با ایجاد مجموعه ای از هستی شناسی ها برای وظایف، فرآیندها و عملیات GIS، فرآیند حل مسئله جغرافیایی را به یک پایگاه دانش رسمی می کند. با استفاده از تجزیه و تحلیل هشدار اولیه هواشناسی به عنوان یک مطالعه موردی، این کار با موفقیت نشان می‌دهد که چگونه می‌توان دانش انتزاعی حل مسئله جغرافیایی را در یک پایگاه دانش وظیفه‌محور رسمی و قابل اشتراک‌گذاری نشان داد. نشان داده شده توسط یک سیستم نمونه اولیه، نتایج آنها یک نگاه اجمالی امیدوارکننده از اینکه کاربران چگونه می‌توانند شروع به ساخت مدل‌های حل مسئله جغرافیایی و گردش کار مشابه مدل‌های فضایی و گردش کار کنند، ارائه می‌دهد. چنین مدل‌ها و جریان‌های کاری می‌توانند مجدداً مورد استفاده قرار گیرند و برای مشکلات مشابه سازگار شوند یا به عنوان بلوک ساختمانی برای مقابله با مشکلات پیچیده‌تر جغرافیایی در آینده، مانند اثرات جهانی ناشی از تغییرات آب و هوا، استفاده شوند.
وانگ و همکاران [ 11 ] یک نمودار دانش مشابه ژوانگ و همکاران ساخت. [ 16] اما در عوض بر گرفتن اشیاء جغرافیایی و زمینه های مکانی و زمانی آنها متمرکز شد. این کار یک نمودار دانش جغرافیایی (GeoKG) متشکل از شش عنصر برای پاسخ به سؤالات اساسی در جغرافیا از جمله: کجاست ایجاد می کند؟ چرا آنجاست؟ چه زمانی و چگونه اتفاق افتاد؟ از طریق فرآیند ساخت و رسمی سازی مدل، این کار اشیاء جغرافیایی، روابط آنها و پویایی های مداوم را در یک GeoKG به تصویر می کشد. برای نشان دادن اثربخشی GeoKG، این کار تکامل بخش‌های اداری نانجینگ، چین، در امتداد رودخانه یانگزی را به تفصیل شرح داد و سپس آن را با یک هستی‌شناسی ساده و توسعه‌پذیر معروف به نام YAGO (اگر هستی‌شناسی بزرگ دیگری) مقایسه کرد. نتایج نشان می دهد که GeoKG دقت و کامل بودن را از طریق تجزیه و تحلیل و ارزیابی کاربر بهبود بخشیده است.

2.4. جستجوی کلان داده

در نهایت، گیگالاس و همکاران. [ 12] یک رویکرد فهرست‌نویسی مبتنی بر زیرساخت سایبری ارائه کرد که خدمات وب و فناوری‌های خزنده را برای پشتیبانی از جستجوی کارآمد داده‌های آب و هوایی بزرگ ترکیب می‌کند. رویکرد فهرست نویسی از چهار مرحله اصلی شامل انتخاب و تجزیه و تحلیل یک مخزن ابرداده، خزیدن فراداده با استفاده از خزنده ها، ایجاد نمایه سازی مکانی-زمانی فراداده، و جستجو بر اساس جستجوی مجموعه (از طریق خدمات کاتالوگ) و جستجوی گرانول (از طریق REST API) تشکیل شده است. این رویکرد فهرست‌نویسی برای پشتیبانی از EarthCube CyberConnector پیاده‌سازی شد. برای نشان دادن امکان‌سنجی و کارایی روش پیشنهادی، این زیرساخت سایبری با داده‌های ESOM (مشاهده و مدل‌سازی سیستم زمین) سطح پتابایت ارائه‌شده توسط UCAR THREDDS Data Server (TDS) آزمایش شد. نتایج نشان می‌دهد که رویکرد فهرست‌نویسی پیشنهادی نه تنها سرعت خزیدن را 10 برابر افزایش می‌دهد، بلکه به طور چشمگیری ابرداده اضافی را از 1.85 گیگابایت به 2.2 مگابایت کاهش می‌دهد. این کار به جای تمرکز بر تجزیه و تحلیل داده های بزرگ، اهمیت و تکنیک های پیشرفته جستجوی داده های بزرگ آب و هوا را برای حمایت از همکاری بین رشته ای در تجزیه و تحلیل آب و هوا نشان می دهد.

3. نتیجه گیری و جهت گیری های تحقیقاتی آینده

این موضوع ویژه، تنوع مدل‌ها و تحلیل‌های مکانی، داده‌های مکانی، تفکر جغرافیایی و تفکر محاسباتی را که برای رسیدگی به مشکلات مکانی بی‌شمار از تحرک انسانی [7] تا مدیریت بلایا [ 8 ] مورد استفاده قرار می‌گیرد، برجسته می‌کند. دست‌نوشته‌ها شامل حل مسئله و دانش جغرافیایی (به عنوان مثال، [ 10 ، 11 ])، مدیریت داده‌های جغرافیایی عظیم (مثلا، [ 3 ، 12 ])، و تجزیه و تحلیل و تجسم داده‌های مکانی (مثلا، [ 7 ، 9 ]) هستند.
برای پیشرفت‌های برجسته‌شده در این شماره ویژه، ادغام تفکر محاسباتی و تفکر فضایی و ترجمه ایده‌ها و مدل‌های انتزاعی به ساختارها و الگوریتم‌های داده عینی بسیار مهم است. یک جهت پژوهشی امیدوارکننده در آینده، ایجاد این ادغام دانش و مهارت‌ها در رشته‌های علوم GIS و علوم محاسباتی است که به عنوان سواد سایبری برای علم GIS نامیده می‌شود. 19] .]. به این ترتیب، دانش یکپارچه از الگوهای مکانی واقعی و فرآیندهای محاسباتی را می توان دریافت و به اشتراک گذاشت، و داده های بزرگ و چارچوب های تحلیل بصری مکانی را می توان برای ارائه پلت فرم های محاسباتی محاسباتی قوی تر برای رسیدگی به مشکلات جغرافیایی بی شمار ادغام کرد. یک چالش کلیدی در این جهت تحقیق، بافت یکپارچه خواهد بود که می تواند به طور یکپارچه تفکر علمی را با زیرساخت های محاسباتی، عناصر داده های جغرافیایی با قابلیت های کلان داده، و روش های جغرافیایی القا شده با موازی سازی ترکیب کند.
موازی سازی را می توان با استفاده نوآورانه از چارچوب های محاسباتی پیشرفته، مانند MapReduce و Spark، برای برنامه هایی که شامل مرتب سازی عظیم داده ها، محاسبات، یادگیری ماشین و پردازش گراف [20] به دست آورد . در حالی که این موضوع ویژه پیشرفت‌ها را در پیش‌پردازش داده‌های بزرگ جغرافیایی [ 3 ]، پیش‌بینی تغییر کاربری زمین [ 5 ] و تجزیه و تحلیل همپوشانی [ 4] را برجسته کرد.] برجسته می‌کند، تلاش‌های بیشتری باید به شناسایی کاربردهای مکانی با تأثیر زیاد و بهره‌مندی از ادغام روش‌های مکانی اختصاص داده شود. و موازی سازی در عصر داده های بزرگ. علاوه بر این، بسیاری از برنامه‌های کاربردی داده‌های بزرگ جغرافیایی موجود به سادگی انواع داده‌های فضایی یا توابع را در سیستم‌های کلان داده موجود (مانند Hadoop) بدون بهینه‌سازی زیاد تزریق می‌کنند.3 ]. بنابراین، جهت‌های تحقیقاتی بیشتر باید بر بهبود و بهینه‌سازی عملکرد چارچوب‌های کلان داده از جنبه‌های مختلف، مانند ETL داده، زمان‌بندی شغل، تخصیص منابع، تجزیه و تحلیل پرس و جو، مسائل حافظه و تنگناهای ورودی/خروجی، با در نظر گرفتن اصول فضایی و محدودیت ها [ 21 ].

منابع

  1. لی، ز. یانگ، سی. جین، بی. یو، م. لیو، ک. سان، م. Zhan, M. فعال کردن تجزیه و تحلیل داده های علوم زمین با یک چارچوب گردش کار مبتنی بر ابر، MapReduce فعال و سرویس گرا. PLoS ONE 2015 ، 10 ، e0116781. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  2. Li, Z. مدیریت داده های بزرگ جغرافیایی با محاسبات با کارایی بالا: رویکردهای فعلی و جهت گیری های آینده. در محاسبات با کارایی بالا برای کاربردهای جغرافیایی ; Tang, W., Wang, S., Eds. Springer: نیویورک، نیویورک، ایالات متحده آمریکا، 2020؛ شابک 978-3-030-47997-8. [ Google Scholar ]
  3. جو، جی. لی، K.-W. چارچوب D_ELT مبتنی بر کاهش نقشه برای مقابله با چالش های داده های بزرگ جغرافیایی. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 475. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  4. ژائو، ک. جین، بی. فن، اچ. آهنگ، دبلیو. ژو، اس. Jiang, Y. تحلیل پوششی با عملکرد بالا چند ضلعی های جغرافیایی عظیم که پیچیدگی شکل را در یک محیط ابری در نظر می گیرد. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 290. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  5. کانگ، جی. نیش، ال. لی، اس. وانگ، X. مدل مارکوف اتوماتای ​​سلولی موازی برای پیش‌بینی تغییر کاربری زمین در چارچوب MapReduce. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 454. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  6. Safanelli، JL; Poppiel، RR; رویز، LFC؛ Bonfatti، BR; Mello، FAdo; ریزو، آر. Demattê، تجزیه و تحلیل زمین JAM در موتور Google Earth: روشی اقتباس شده برای تجزیه و تحلیل در مقیاس جهانی با کارایی بالا. ISPRS Int. J. Geo-Inf. 2020 ، 9 ، 400. [ Google Scholar ] [ CrossRef ]
  7. ژانگ، تی. وانگ، جی. کوی، سی. لی، ی. او، دبلیو. لو، ی. Qiao, Q. ادغام تجزیه و تحلیل Geovisual با یادگیری ماشین برای کشف الگوی تحرک انسان. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 434. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  8. یانگ، تی. زی، جی. لی، جی. مو، ن. لی، ز. تیان، سی. ژائو، جی. داده کاوی کلان رسانه های اجتماعی و تجزیه و تحلیل مکانی-زمانی در مورد احساسات عمومی برای کاهش بلایا. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 29. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  9. وو، اچ. خو، ز. وو، جی. یک روش جدید برای تولید جاده گمشده در بلوک‌های شهر بر اساس داده‌های مسیر ناوبری موبایل بزرگ. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 142. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  10. ژوانگ، سی. زی، ز. ما، ک. گو، ام. وو، ال. یک پایگاه دانش وظیفه‌محور برای حل مسائل جغرافیایی. ISPRS Int. J. Geo-Inf. 2018 ، 7 ، 423. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  11. وانگ، اس. ژانگ، ایکس. بله، پی. دو، م. لو، ی. Xue, H. نمودار دانش جغرافیایی (GeoKG): یک نمایش رسمی دانش جغرافیایی. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 184. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  12. گیگالاس، جی. دی، ال. Sun، Z. زیرساخت سایبری پیشرفته برای فعال کردن جستجوی مجموعه داده های آب و هوایی بزرگ در THREDDS. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 494. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  13. Eldawy، A. SpatialHadoop: به سمت پردازش فضایی انعطاف پذیر و مقیاس پذیر با استفاده از MapReduce. در مجموعه مقالات SIGMOD Ph.D. Symposium 2014, Snowbird, UT, USA, 22 ژوئن 2014; صص 46-50. [ Google Scholar ]
  14. یو، جی. وو، جی. Sarwat، M. Geospark: یک چارچوب محاسباتی خوشه ای برای پردازش داده های فضایی در مقیاس بزرگ. در مجموعه مقالات بیست و سومین کنفرانس بین المللی SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی، Bellevue، WA، ایالات متحده، 3-6 نوامبر 2015. پ. 70. [ Google Scholar ]
  15. گوان، کیو. زنگ، دبلیو. گونگ، جی. Yun, S. pRPL 2.0: بهبود کتابخانه پردازش شطرنجی موازی. ترانس. GIS 2014 ، 18 ، 25-52. [ Google Scholar ] [ CrossRef ]
  16. لی، ز. هاجسون، من؛ Li, W. یک چارچوب همه منظوره برای پردازش موازی داده های LiDAR در مقیاس بزرگ. بین المللی جی دیجیت. زمین 2018 ، 11 ، 26-47. [ Google Scholar ] [ CrossRef ]
  17. زهاریا، م. Xin، RS; وندل، پی. داس، تی. آرمبراست، ام. دیو، ا. قدسی، ا. آپاچی اسپارک: موتور یکپارچه برای پردازش داده های بزرگ. اشتراک. ACM 2016 ، 59 ، 56-65. [ Google Scholar ] [ CrossRef ]
  18. لی، ز. هوانگ، Q. Emrich, C. مقدمه ای بر حس اجتماعی و محاسبات کلان داده برای مدیریت بلایا. بین المللی جی دیجیت. زمین 2019 ، 12 ، 1198–1204. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  19. شوک، ای. Bowlick، FJ; کمپ، KK; اهلکویست، او. Carbajeles-Dale، P. دی بیاس، دی. راش، جی. سواد سایبری برای علم GIS: به سوی رسمی کردن آموزش محاسبات جغرافیایی. پروفسور جئوگر. 2019 ، 71 ، 221-238. [ Google Scholar ] [ CrossRef ]
  20. لی، ز. هو، اف. Schnase، JL; دافی، دی کیو؛ لی، تی. بوون، MK; یانگ، سی. یک رویکرد نمایه سازی مکانی-زمانی برای پردازش کارآمد داده های آب و هوایی مبتنی بر آرایه بزرگ با MapReduce. بین المللی جی. جئوگر. Inf. علمی 2017 ، 31 ، 17-35. [ Google Scholar ] [ CrossRef ]
  21. یانگ، سی. وو، اچ. هوانگ، Q. لی، ز. لی، جی. استفاده از اصول فضایی برای بهینه سازی محاسبات توزیع شده برای فعال کردن اکتشافات علوم فیزیکی. Proc. Natl. آکادمی علمی ایالات متحده آمریکا 2011 ، 108 ، 5498-5503. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]

بدون دیدگاه

دیدگاهتان را بنویسید