پایگاه داده مکانی – فضایی چیست؟چالش ها و فرصت های پیش رو

برنامه ریزی کاربری منطقه ای کارآمد عملی با استفاده از بهینه سازی الگوریتم ژنتیک چندهدفه و سیستم اطلاعات جغرافیایی

پایگاه داده مکانی – فضایی چیست؟چالش ها و فرصت های پیش رو:پایگاه داده های فضایی بزرگ که اغلب به عنوان داده های بزرگ جغرافیایی برچسب گذاری می شوند، به دلیل حجم، تنوع، سرعت و صحت داده ها، از ظرفیت سیستم های محاسباتی معمول استفاده می شود. مشکلات اضافی نیز با برچسب V ذکر شده‌اند، اما چهار مورد اصلی مشکل‌سازترین و تمرکز این فصل هستند (Li et al., 2016, Panimalar et al., 2017). منابع شامل ماهواره ها، سکوهای هواپیما و هواپیماهای بدون سرنشین، وسایل نقلیه، خدمات شبکه های جغرافیایی اجتماعی، دستگاه های تلفن همراه و دوربین ها هستند. مشکلات در پردازش این داده ها برای استخراج اطلاعات مفید شامل پرس و جو، تجزیه و تحلیل و تجسم است. تکنیک‌های داده کاوی و الگوریتم‌های یادگیری ماشین، مانند شبکه‌های عصبی کانولوشنال عمیق، اغلب با داده‌های بزرگ جغرافیایی استفاده می‌شوند. مشکل آشکار مدیریت حجم داده های بزرگ، به ویژه برای عملیات ورودی و خروجی است. نیاز به خواندن و نوشتن موازی داده ها، و همچنین رایانه های با سرعت بالا، خدمات دیسک، و سرعت انتقال شبکه. مشکلات اضافی پایگاه‌های داده فضایی بزرگ شامل تنوع و ناهمگونی داده‌ها است که به الگوریتم‌های پیشرفته برای مدیریت انواع داده‌ها و ویژگی‌های مختلف و ادغام با داده‌های دیگر نیاز دارد. سرعت جمع‌آوری داده‌ها یک چالش است، به‌ویژه استفاده از حسگرهای پیشرفته امروزی و اینترنت اشیا که شامل میلیون‌ها دستگاه است که داده‌ها را در مقیاس‌های زمانی کوتاه از میکرو ثانیه تا دقیقه ایجاد می‌کنند. در نهایت، صحت یا درستی پایگاه‌های اطلاعاتی فضایی بزرگ، به‌ویژه برای همه عناصر داده در پایگاه داده، به سختی ایجاد و اعتبار سنجی می‌شود. مشکلات اضافی پایگاه‌های داده فضایی بزرگ شامل تنوع و ناهمگونی داده‌ها است که به الگوریتم‌های پیشرفته برای مدیریت انواع داده‌ها و ویژگی‌های مختلف و ادغام با داده‌های دیگر نیاز دارد. سرعت جمع‌آوری داده‌ها یک چالش است، به‌ویژه استفاده از حسگرهای پیشرفته امروزی و اینترنت اشیا که شامل میلیون‌ها دستگاه است که داده‌ها را در مقیاس‌های زمانی کوتاه از میکرو ثانیه تا دقیقه ایجاد می‌کنند. در نهایت، صحت یا درستی پایگاه‌های داده فضایی بزرگ به سختی ایجاد و تأیید می‌شود، به‌ویژه برای همه عناصر داده در پایگاه داده. مشکلات اضافی پایگاه‌های داده فضایی بزرگ شامل تنوع و ناهمگونی داده‌ها است که به الگوریتم‌های پیشرفته برای مدیریت انواع داده‌ها و ویژگی‌های مختلف و ادغام با داده‌های دیگر نیاز دارد. سرعت جمع‌آوری داده‌ها یک چالش است، به‌ویژه استفاده از حسگرهای پیشرفته امروزی و اینترنت اشیا که شامل میلیون‌ها دستگاه است که داده‌ها را در مقیاس‌های زمانی کوتاه از میکرو ثانیه تا دقیقه ایجاد می‌کنند. در نهایت، صحت یا درستی پایگاه‌های اطلاعاتی فضایی بزرگ، به‌ویژه برای همه عناصر داده در پایگاه داده، به سختی ایجاد و اعتبار سنجی می‌شود. به ویژه با استفاده از حسگرهای پیشرفته امروزی و اینترنت اشیا که شامل میلیون‌ها دستگاه است که داده‌هایی را در مقیاس‌های زمانی کوتاه از میکرو ثانیه تا دقیقه ایجاد می‌کنند. در نهایت، صحت یا درستی پایگاه‌های داده فضایی بزرگ به سختی ایجاد و تأیید می‌شود، به‌ویژه برای همه عناصر داده در پایگاه داده. به خصوص با استفاده از حسگرهای پیشرفته امروزی و اینترنت اشیا که شامل میلیون‌ها دستگاه است که داده‌هایی را در مقیاس‌های زمانی کوتاه از میکرو ثانیه تا دقیقه ایجاد می‌کنند. در نهایت، صحت یا درستی پایگاه‌های اطلاعاتی فضایی بزرگ، به‌ویژه برای همه عناصر داده در پایگاه داده، به سختی ایجاد و اعتبار سنجی می‌شود.

 

توضیحات موضوع:
  1. تعاریف
  2. معرفی
  3. طبقه بندی
  4. چالش های داده های بزرگ
  5. مدیریت و پردازش داده های بزرگ جغرافیایی
  6. خلاصه و نتیجه گیری

1. تعاریف

داده های بزرگ جغرافیایی : مجموعه داده هایی با شناسه های مکانی که از ظرفیت سیستم های محاسباتی فعلی برای مدیریت، پردازش یا تجزیه و تحلیل داده ها با تلاش معقول فراتر می رود.

 

2. مقدمه

پایگاه‌های اطلاعاتی فضایی بزرگ شامل داده‌های مکانی برای تصاویر، نقشه‌ها و سایر داده‌های مورد استفاده در سیستم اطلاعات جغرافیایی و برنامه‌های مبتنی بر مکان اغلب در حال حاضر (2019) به عنوان داده‌های بزرگ جغرافیایی نامیده می‌شوند.. طبق تعریف، داده های بزرگ جغرافیایی مجموعه داده هایی با شناسه های مکانی هستند که از ظرفیت سیستم های محاسباتی فعلی برای مدیریت، پردازش یا تجزیه و تحلیل داده ها با تلاش معقول فراتر می روند. این زیاده‌روی‌ها ناشی از حجم، تنوع، سرعت، صحت و سایر مقادیر داده‌های مکانی است (Firican، 2017؛ Panimalar و همکاران، 2017). اشکال سنتی پایگاه‌های داده فضایی بزرگ، نقاط با فرمت برداری و تصاویر خطی و شطرنجی، از جمله تصاویر ماهواره‌ای و عکس‌های هوایی هستند. اشکال اضافی از پایگاه‌های داده بزرگ که اکنون با اجزای مکانی ظاهر می‌شوند شامل تعداد زیادی حسگر جدید، مانند حسگرهای لیدار و سایر حسگرهای الکترونیکی، سیستم‌های ویدئویی، حسگرهای انسانی با تلفن‌های همراه و سایر مجموعه‌های داده می‌شوند. جمع آوری داده ها توسط این حسگرها منجر به اطلاعات جغرافیایی داوطلبانه (VGI) و تعداد زیادی از داده های رسانه های اجتماعی با مکان ها می شود. از جمله فیدهای توییتر و آرشیوهای عکاسی. اگرچه این منابع کلان داده اغلب شامل اطلاعات مکان هستند، اما از ظرفیت های فعلی برای پردازش فراتر می روند، بسیار کمتر از تحلیل فضایی. داده های بزرگ جغرافیایی منبع اصلی برای نوآوری، رقابت و بهره وری هستند، اما به طور همزمان برای پردازش، پردازش، ذخیره سازی، بازیابی و استفاده از داده ها مشکل ساز هستند. چالش‌های پیش روی مدیریت و کاربرد داده‌های بزرگ جغرافیایی، توسعه ابزارها و تکنیک‌های نرم‌افزاری جدید و همچنین معماری‌های سخت‌افزار محاسباتی موازی را برای برآوردن الزامات مدیریت داده‌ها ضروری کرده است (رایت و وانگ، 2011؛ ​​وانگ و گودچایلد، 2019). تحلیل فضایی بسیار کمتر داده های بزرگ جغرافیایی منبع اصلی برای نوآوری، رقابت و بهره وری هستند، اما به طور همزمان برای پردازش، پردازش، ذخیره سازی، بازیابی و استفاده از داده ها مشکل ساز هستند. چالش‌های پیش روی مدیریت و کاربرد داده‌های بزرگ جغرافیایی، توسعه ابزارها و تکنیک‌های نرم‌افزاری جدید و همچنین معماری‌های سخت‌افزار محاسباتی موازی را برای برآوردن الزامات مدیریت داده‌ها ضروری کرده است (رایت و وانگ، 2011؛ ​​وانگ و گودچایلد، 2019). تحلیل فضایی بسیار کمتر داده های بزرگ جغرافیایی منبع اصلی برای نوآوری، رقابت و بهره وری هستند، اما به طور همزمان برای پردازش، پردازش، ذخیره سازی، بازیابی و استفاده از داده ها مشکل ساز هستند. چالش‌های پیش روی مدیریت و کاربرد داده‌های بزرگ جغرافیایی، توسعه ابزارها و تکنیک‌های نرم‌افزاری جدید و همچنین معماری‌های سخت‌افزار محاسباتی موازی را برای برآوردن الزامات مدیریت داده‌ها ضروری کرده است (رایت و وانگ، 2011؛ ​​وانگ و گودچایلد، 2019).

 

3. طبقه بندی

داده های بزرگ جغرافیایی ممکن است به گروه هایی با ویژگی های داده مشابه طبقه بندی شوند. یک طبقه بندی اساسی، پس از یائو و لی (2018)، با استفاده از انواع داده ها برای سازمان، به شرح زیر است.

3.1 سنجش از دور

به طور سنتی، از راه اندازی اولیه سیستم های ماهواره ای، مانند Landsat 1، تا وضوح مکانی و زمانی بالا تا طراحی های جدید حسگرهای امروزی، داده های سنجش از دور دسته ای از داده های بزرگ جغرافیایی را تشکیل می دهند. سیستم‌های کنونی تصاویر چند طیفی و فراطیفی را در وضوح‌های چندگانه و تاریخ‌های اکتساب زمانی متعدد از سیستم‌های حسگر متعدد به دست می‌آورند، که در نتیجه حجم داده‌های بزرگ علاوه بر موانع دیگری برای مدیریت و استفاده از آنها ایجاد می‌شود (چی و همکاران، 2016). جمع آوری و بایگانی شده در قالب های شطرنجی سنتی، این تصاویر معمولی با آهنگ پیوسته معمولاً از قابلیت های پردازش رایانه فعلی فراتر می روند که به راه حل های جدیدی مانند محاسبات موازی و زیرساخت سایبری توزیع شده پیشرفته نیاز دارند (Ma et al., 2015).

3.2 نقشه برداری و نقشه برداری داده ها

داده‌های جغرافیایی، که اغلب به سیستم‌های ماهواره‌ای ناوبری جهانی (GNSS) ارجاع می‌شوند، شامل گرافیک زیرساخت‌های صنعتی، نقشه‌های موضوعی، نقشه‌های دیجیتالی و محصولات تصویری، مانند نمودارهای خطی دیجیتال، مدل‌های ارتفاعی دیجیتال، گرافیک‌های شطرنجی دیجیتال و عکس‌های ارتوفوگرافی دیجیتال، داده‌های بیشتر کشوری است. سازمان های نقشه برداری، مانند نقشه ملی سازمان زمین شناسی ایالات متحده، کاربری زمین، و سایر داده های نقشه برداری و نقشه برداری اساسی. در سال‌های اخیر، داده‌های لیدار با وضوح بالا به شکل غالب داده‌های نقشه‌برداری تبدیل شده‌اند و حجم داده‌ها (ترابایت تا پتابایت) منجر به داده‌های بزرگ جغرافیایی می‌شود (Sugarbaker et al., 2014). نقشه برداری موبایل با حسگرهای متحرک و میدان های حسگر نیز بر مشکل کلان داده در صنعت نقشه برداری تأثیر گذاشته است.

3.3 داده های مبتنی بر مکان برای خدمات مکان

داده‌های مبتنی بر مکان معمولاً شامل داده‌های اطلاعات اجتماعی جغرافیایی و انسانی با مکان‌های مکانی و زمانی است. این داده‌ها عمدتاً با ورودی‌های GNSS تولید شده با تلفن‌های هوشمند، داده‌های جمع‌آوری‌شده میدانی، و مسیرهای انسانی و ترافیکی به دست می‌آیند. به عنوان مثال می توان به مکان ها و رتبه بندی رستوران ها، نمایش بزرگراه ها و خیابان ها، ردیابی مسیرهای شخصی، مکان های عکس و موارد دیگر اشاره کرد. این داده‌های بزرگ جغرافیایی به یک منبع حیاتی در صنایع خدمات مبتنی بر اجتماعی، مسیریابی وسایل نقلیه و سایر فعالیت‌هایی تبدیل شده‌اند که فعالیت‌های گروه‌های انسانی را حس می‌کنند (لیو و همکاران، 2015).

3.4 پلتفرم های رسانه های اجتماعی

این داده ها مبتنی بر اینترنت و مبتنی بر وب هستند و شامل موقعیت جغرافیایی می باشند. این مکان‌ها ممکن است در داده‌های صفحه وب یا در پلتفرم‌های رسانه‌های اجتماعی مانند توییتر، فیس‌بوک، گوگل پلاس و سایر پلت‌فرم‌های اجتماعی مشخص شوند. مشخصات مکان ممکن است به اندازه مجموعه ای از مختصات موقعیت یابی جهانی خاص باشد یا به اندازه یک نام مکان ابهام نشده ساده مبهم باشد. داده‌های بزرگ جغرافیایی از رسانه‌های اجتماعی مجموعه‌ای از مشکلات را برای مدیریت داده‌ها به همراه دارند، مانند عدم ارجاع مکان، عدم برآورده کردن فرضیات آماری اولیه نمونه‌های مستقل و بی‌طرف، و موارد دیگر (گودچایلد، 2013؛ کیچین، 2013؛ تسو، 2015).

3.5 اینترنت اشیا (IoT)

اینترنت اشیا شامل حسگرهایی است که داده‌ها را از جمله اندازه‌گیری‌های محیطی و جوی، کیفیت آب، حجم و جریان، دستگاه‌های هوشمند در خانه، مجموعه‌ای میدانی برای علم و مدیریت، دستگاه‌های پوشیدنی، و مجموعه‌ای از حسگرهایی که در زمان واقعی کمک می‌کنند، نظارت و جمع‌آوری می‌کند. داده ها در میکروثانیه تا چند دقیقه به سرورهای داده بزرگ. بیشتر این داده‌های به‌دست‌آمده توسط حسگرهای جدید، جریان‌های داده‌ای با چگالی بالا دلخواه هستند. شامل اندازه گیری های ابعادی مختلف مانند نوری، صوتی و مکانیکی. و دارای دقت و دقت موقعیتی متفاوتی هستند. در مقایسه با داده‌های سنتی در اینترنت، داده‌های اینترنت اشیا به طور کلی تنوع بسیار بیشتری دارند و فرکانس بسیار بیشتری دارند که منجر به یک مشکل داده‌های بزرگ مکانی واقعی می‌شود (Alelaiwi، 2017).

 

4. چالش های داده های بزرگ

اینها شامل معماری‌هایی برای پردازش حجم داده‌های بزرگ و همچنین مشکلات ذاتی در داده‌ها مانند ناهمگونی، مبهم بودن تعاریف و مرزهای ویژگی‌های جغرافیایی، و عدم قطعیت موقعیت یا انتساب است. از جمله مشکلات پردازش شناسایی‌شده، ارزیابی کیفیت، مدل‌سازی و ساختار داده‌ها، برنامه‌ریزی عملکردی برای جریان‌های داده‌های بزرگ جغرافیایی، تجزیه و تحلیل داده‌های بزرگ مکانی، داده‌کاوی و کشف دانش، و تجسم داده‌های بزرگ مکانی و تجزیه و تحلیل بصری است (لی و همکاران، 2016).

4.1 مشکلات داده های بزرگ مکانی ذاتی

همه انواع داده‌های بزرگ جغرافیایی که در بالا ذکر شد از مشکلات مشترک در همه داده‌های مکانی رنج می‌برند که شامل ابهام و مرزهای نامشخص برای ویژگی‌های جغرافیایی است (Usery, 1995). برای مثال، استفاده از داده‌های لیدار برای استخراج ویژگی‌های زمین، بلافاصله نیاز به تعریف و مفهوم‌سازی خود ویژگی‌های زمین دارد. یعنی مرزهای ویژگی جغرافیایی طبیعی که می توان برای استخراج موجودیت از داده ها استفاده کرد، کجاست. همراه کردن این عدم قطعیت با مشکل کلان داده و ابهام طبیعی ویژگی ها با حجم داده های بزرگ و داده های ناهمگن مشکل سازتر می شود. مشکل ذاتی دیگر عدم قطعیت داده های بزرگ جغرافیایی و فقدان روش ها و مشخصات برای اندازه گیری و کمی سازی چنین عدم قطعیت هایی است.

4.2 ارزیابی کیفیت

داده‌های بزرگ جغرافیایی اغلب اندازه‌گیری‌های پیوسته هستند، مانند مقادیر پیکسل در تصاویر ماهواره‌ای یا بازده لیدار، و به‌عنوان انتزاعی از متغیرهای زمان واقعی، نامشخص هستند. حجم انبوه داده ها عدم قطعیت را افزایش می دهد و نیاز به ارزیابی کیفیت برای اطمینان از انتزاع، پردازش، استخراج ویژگی، تجزیه و تحلیل و پردازش تجسم مناسب دارد. استانداردها و رویه های دقیق برای نظارت بر کیفیت برای بسیاری از مجموعه داده های جغرافیایی ساخت یافته سنتی ایجاد شده است. به عنوان مثال، استاندارد بین المللی ISO 19157 به طور خاص به کیفیت داده های مکانی می پردازد. استاندارد مشابهی برای جمع‌آوری داده‌های لیدار وجود دارد: مشخصات پایگاه لیدار سازمان زمین‌شناسی ایالات متحده 1.3 (Heidemann، 2018). این و سایر چارچوب‌های استاندارد مشابه، معیارهای کمی کیفیت داده‌ها، از جمله فضایی، دقت زمانی و موضوعی، تفکیک مکانی، زمانی و موضوعی، سازگاری و کامل بودن (لی و همکاران، 2016). بنابراین، ارزیابی کیفیت داده‌ها برای فرآیندهای جمع‌آوری و ایجاد ابرداده‌ها که کیفیت آن فرآیندها را منعکس می‌کند، تعریف می‌شود. استانداردهای مشابهی برای اکثر داده های بزرگ جغرافیایی وجود ندارد. به عنوان مثال، ارزیابی کیفیت داده‌های رسانه‌های اجتماعی بسیار دشوار است، زیرا بسیاری از این داده‌ها مفروضات آماری اولیه را نقض می‌کنند و اغلب از طریق نمونه‌گیری مغرضانه و محدود به‌دست می‌آیند، برای مثال، کسانی که تلفن همراه دارند و کسانی که در فرآیند جمع‌آوری داده‌ها شرکت می‌کنند. برای نوع خاصی از داده های بزرگ کیفیت مکان‌ها در داده‌های بزرگ جغرافیایی نیز مشکل‌ساز است و اغلب جزء مکان‌یابی است، مانند فیدهای توییتر،

4.3 جریان های داده های بزرگ جغرافیایی

توییتر، فیس بوک و دیگر پلتفرم های رسانه های اجتماعی جریان های پیوسته ای از داده های بزرگ جغرافیایی را ارائه می دهند. این جریان ها نیاز به پردازش و تحلیل مستمر دارند. اجزای جغرافیایی این جریان ها اغلب پنهان، مبهم هستند و تنها بر اساس متن پیام یا صحنه های یک عکس مشخص می شوند. بنابراین، مؤلفه فضایی ذاتاً نامشخص است و باید در هر گونه تجزیه و تحلیل یا تجسم مربوط به این نوع داده ها حل شود. جریان‌های کلان داده مشابه از میدان‌های حسگر و اشیاء در اینترنت اشیا جمع‌آوری می‌شوند. با این میدان‌های حسگر، جریان‌های داده با حجم بالا نسبت به مکان مکانی مشکل‌سازتر هستند، زیرا اکثر این دستگاه‌ها مکان‌های ثابتی برای حسگرها دارند و می‌توان از آن در تجزیه و تحلیل و تجسم استفاده کرد.

5.  مدیریت و پردازش داده های بزرگ جغرافیایی

حجم و ویژگی‌های داده‌های مکانی و سرعت جمع‌آوری برخی داده‌ها مانعی برای مدیریت و پردازش آنها ایجاد می‌کند. از جمله راه حل‌های پردازش داده‌های بزرگ جغرافیایی، روش‌های سازماندهی داده‌ها مانند نمایه‌سازی بر اساس مکان مکانی، شناسه‌های ویژگی یا انتساب موضوعی یا زمانی است.

5.1 مدل سازی و ساختار داده ها

یک رویکرد رایج برای پردازش و پردازش داده‌های بزرگ جغرافیایی به مدل و ساختار داده‌ها، به‌ویژه در قالب‌های برداری سنتی و شطرنجی، وابسته است. به عنوان مثال، داده های برداری از نقاط، خطوط و چندضلعی ها و گاهی اوقات شکل های حجمی تشکیل شده است. مدل‌های استاندارد مبتنی بر گره قوس با درجات بالایی از نمایه‌سازی توسعه داده شده‌اند که امکان دسترسی مستقیم به ویژگی‌ها و روابط هندسی، توپولوژیکی، موضوعی و زمانی این ویژگی‌های مکانی را فراهم می‌کند. داده های شطرنجی را می توان با انواع روش های نمایه سازی مانند رمزگذاری با استفاده از ساختارهای فضا محور مانند درختان خطی، چهار درخت و درختان KD یا ساختارهای درایو داده مانند درخت R پشتیبانی کرد (سامت، 2006). استفاده از هستی شناسی ها و معناشناسی برای ساختار و نمایه سازی داده های بزرگ جغرافیایی اکنون پتانسیل پشتیبانی از مدل سازی، تجزیه و تحلیل،

5.2 تجزیه و تحلیل داده های بزرگ جغرافیایی

تجزیه و تحلیل اغلب شامل سیستم های محاسباتی توزیع شده و با کارایی بالا با الگوریتم هایی است که برای محاسبات، پردازش و تجسم موازی اقتباس شده اند (وانگ و گودچایلد، 2019). اغلب رویکردها شامل داده کاوی و کشف دانش هستند. روش‌های رویکرد شامل آمار پارامتریک است که به فرضیات تابع توزیع احتمال و اغلب تصادفی بودن و استقلال نمونه‌ها نیاز دارد. آمارهای ناپارامتریک که به سادگی یکنواختی محلی را فرض می کنند. و تجزیه و تحلیل عملکردی شامل موجک ها و تعمیم داده های مکانی، خوشه بندی داده های مکانی، و قوانین تداعی فضایی استخراج. یادگیری ماشینی و استفاده از شبکه‌های عصبی کانولوشنال عمیق برای داده‌کاوی بزرگ مکانی و کشف دانش اغلب در محیط‌های محاسباتی با کارایی بالا پیاده‌سازی می‌شوند.

 

5. خلاصه و نتیجه گیری

داده های بزرگ جغرافیایی بیش از ظرفیت سیستم های محاسباتی رایج است که در نتیجه حجم، تنوع، سرعت و صحت داده ها است. بسیاری از انواع داده ها، از جمله تصاویر سنجش از راه دور از ماهواره، هواپیما، و سیستم عامل های دستی. انواع داده های نقشه برداری از جمله لیدار، ارتفاع، هیدروگرافی، طبقه بندی پوشش زمین و غیره. داده های مبتنی بر مکان برای خدمات مکان یابی بسیار وابسته به مختصات GNSS است. فیدهای رسانه های اجتماعی مانند توییتر و تصاویر از فیس بوک؛ و جریان‌های حسگر از میدان‌های حسگر و اینترنت اشیا، نمونه‌هایی از داده‌های بزرگ جغرافیایی با حجم و ناهمگنی گسترده هستند. چالش ها و مشکلات داده های بزرگ جغرافیایی شامل معماری های پردازش کامپیوتری، الزامات سیستم های محاسباتی موازی و توزیع شده، محاسبات با کارایی بالا، عدم قطعیت اساسی اجزای مکانی و غیر مکانی داده ها، ارزیابی کیفیت، پردازش تحلیلی و فرضیات و تخلفات آماری، و تجزیه و تحلیل و تجسم مجموعه داده های بزرگ با خوشه هایی با زمینه قابل توجه. آینده داده‌های بزرگ جغرافیایی شاهد رشد بیشتری در حجم و تنوع داده‌ها و استفاده از روش‌های محاسباتی برای تبدیل کلان داده‌های مکانی به نتایج علمی و برنامه‌های کاربردی برای جامعه خواهد بود.

هر گونه استفاده از نام تجاری، شرکت یا محصول فقط برای اهداف توصیفی است و به معنای تایید دولت ایالات متحده نیست.

منابع:

آدلایوی، ا. (2017). یک ابزار مدیریت منابع مشارکتی برای پردازش داده های بزرگ اینترنت اشیا در فضای ابری. Cluster-Computing: The Journal of Networks, Software, Tools and Applications, 20 (2), 1791-1799, DOI: 10.1007/s10586-017-0839-y

چی، ام.، پلازا، آ.، بندیکتسون، جی، سان، ز.، شن، آی.، و ژو، ی. (2016). داده های بزرگ برای سنجش از دور: چالش ها و فرصت ها مجموعه مقالات مؤسسه مهندسین برق و الکترونیک، 104 (11)، ص. 2207-2219، DOI: 10.1109/Jproc.2016.2598228

فیریکان، جی (2017). 10 در مقابل داده های بزرگ.  بازیابی شده در 11 سپتامبر 2018 از  https://tdwi.org/articles/2017/02/08/10-vs-of-big-data.aspx

Goodchild، MF (2013). کیفیت داده های بزرگ (جغرافیایی). Dialogues in Human Geography, 3 (3), 280-284, DOI: 10.1177/2043820613513392

Heidemann, HK (2018)، مشخصات پایه لیدار (نسخه 1.3، فوریه 2018): تکنیک ها و روش های زمین شناسی ایالات متحده، کتاب 11، فصل. B4، 101. DOI:  10.3133/tm11b4

کیچین، آر (2013). داده های بزرگ و فرصت ها، چالش ها و خطرات جغرافیای انسانی. Dialogues in Human Geography, 3 (3), 262-267, DOI: 10.1177/2043820613513388

لی، جی. جی، و کانگ، ام (2015). داده های بزرگ جغرافیایی: چالش ها و فرصت ها. تحقیقات کلان داده 2 (2)، 74-81. DOI:  10.1016/j.bdr.2015.01.003

لی، اس.، دراگیسویچ، اس.، آنتون، اف.، سستر، ام.، وینتر، اس.، کولتکین، آ.، پتیت، سی، جیانگ، بی.، هاورث، جی.، استین، ا.، و چنگ، تی (2015). نظریه و روش‌های مدیریت داده‌های بزرگ جغرافیایی: بررسی و چالش‌های پژوهشی ، ص 2-19.

لیو، ی.، لیو، ایکس.، گائو، اس.، گونگ، ال.، کانگ، سی.، ژی، ی.، و شی، ال. (2015). حس اجتماعی: رویکردی جدید برای درک محیط‌های اجتماعی و اقتصادی Annals of Association of American Geargraphers, 105 (3), p. 512-530، DOI: 10.1080/00045608.2015.1018773

Ma, Y., Wu, H., Wang, L., Huang, B., Ranjan, R., Zomaya, A., & Jie, W. (2015). محاسبات کلان داده سنجش از دور: چالش‌ها و فرصت‌ها،  سیستم‌های رایانه‌ای نسل آینده ، 51 ، 47-60، DOI: 10.1016/j.future.2014.10.029

Panimalar، A.، Varnekha، S.، & Veneshia، K. (2017). 17 در مقابل داده های بزرگ. مجله تحقیقاتی بین المللی مهندسی و فناوری (IRJET) , 4 (9). بازبینی شده در 11 سپتامبر 2018 از https://www.irjet.net/archives/V4/i9/IRJET-V4I957.pdf

سامت، ح. (1385). مبانی ساختارهای داده چند بعدی و متریک.  ناشران مورگان کافمن، 1024.

Sugarbaker, LJ, Constance, EW, Heidemann, HK, Jason, AL, Lukas, V., Saghy, DL, & Stoker, JM (2014). ابتکار برنامه ارتفاع سه بعدی – فراخوانی برای اقدام. بخشنامه سازمان زمین شناسی ایالات متحده 1399 , 35. DOI:  10.3133/cir1399

تسو، M.-H. (2015). چالش ها و فرصت های تحقیق در نقشه برداری رسانه های اجتماعی و داده های بزرگ. نقشه کشی و علم اطلاعات جغرافیایی، 42 (1)، 70-74. DOI: 10.1080/15230406.2015.1059251

یوزری، EL (1996). چارچوب مفهومی و اجرای مجموعه فازی برای ویژگی‌های جغرافیایی، در PA Burrough و AU Frank (Eds.)،  اشیاء جغرافیایی با مرزهای نامشخص.  تیلور و فرانسیس: لندن، صص 71-85.

Vatsavai, RR, Ganguly, A., Chandola, V., Stefanidis, A., Klasky, S., & Shekhar, S. (2012). داده کاوی فضایی و زمانی در عصر داده های بزرگ زمین مکانی: الگوریتم ها و کاربردها. BigSpatial ’12 مجموعه مقالات اولین کارگاه بین المللی ACM SIGSPATIAL در مورد تجزیه و تحلیل برای داده های بزرگ جغرافیایی.  ردوندو بیچ، کالیفرنیا، 1-10. DOI:  10.1145/2447481.2447482

Yao, X., & Li, G. (2018). مدیریت داده های برداری بزرگ فضایی: یک بررسی. داده های بزرگ زمین، 2 (1)، 108-129، DOI: 10.1080/20964471.2018.1432115

رایت، دی، و وانگ، اس. (2011). ظهور زیرساخت سایبری فضایی.  مجموعه مقالات آکادمی ملی علوم، 108 (14)، 5488-5491. بازیابی شده در 11 سپتامبر 2018 از  http://www.pnas.org/content/108/14/5488

Zhang, C., Zhao, T., & Li, W. (2017). داده های بزرگ جغرافیایی و وب معنایی جغرافیایی: وضعیت فعلی و فرصت های آینده. در Y. Wu، F. Hu، G. Min، و A. Zomaya (ویراستار)، Big Data and Computational Intelligence in Networking . Taylor & Francis LLC، CRC Press. ص 43-64.

اهداف یادگیری:
  • انواع اساسی داده های بزرگ جغرافیایی را شرح دهید.
  • تکنیک های نوظهور ژئومحاسبات برای داده های بزرگ جغرافیایی را شرح دهید.
  • نحوه تشخیص داده های آلوده در مجموعه داده های بزرگ را توضیح دهید.
  • روش‌های اولیه برای ساختاردهی و مدل‌سازی داده‌های بزرگ جغرافیایی را شناسایی و توضیح دهید.
  • محدودیت های آماری پایگاه های داده فضایی بزرگ را شرح دهید.
  • مشکلات در برخورد با پایگاه داده های فضایی بزرگ، به ویژه آنهایی که از ناهمگونی فضایی ناشی می شوند را شرح دهید. برخی از مشکلات مجموعه داده های فضایی بزرگ را از رسانه های اجتماعی شرح دهید.
سوالات ارزشیابی آموزشی:
  1. یک تعریف اساسی از داده های بزرگ جغرافیایی ارائه دهید.
  2. شناسایی مشکلات عمده پایگاه های داده فضایی بزرگ، با نام مستعار، داده های بزرگ جغرافیایی.
  3. چندین روش برای نمایه سازی مجموعه داده های شطرنجی بزرگ تعریف کنید. مزایای هر کدام چیست؟
  4. استانداردها برای برخی از پایگاه های داده فضایی بزرگ کار می کنند و نه برای برخی دیگر. چرا؟
  5. برخی از روش‌های تجزیه و تحلیل و استخراج داده‌های بزرگ جغرافیایی را تعریف کنید.
  6. چرا اینترنت اشیا یک مشکل داده های بزرگ جغرافیایی ایجاد می کند؟

10 نظرات

دیدگاهتان را بنویسید