پایگاه داده مکانی – فضایی چیست؟چالش ها و فرصت های پیش رو:پایگاه داده های فضایی بزرگ که اغلب به عنوان داده های بزرگ جغرافیایی برچسب گذاری می شوند، به دلیل حجم، تنوع، سرعت و صحت داده ها، از ظرفیت سیستم های محاسباتی معمول استفاده می شود. مشکلات اضافی نیز با برچسب V ذکر شدهاند، اما چهار مورد اصلی مشکلسازترین و تمرکز این فصل هستند (Li et al., 2016, Panimalar et al., 2017). منابع شامل ماهواره ها، سکوهای هواپیما و هواپیماهای بدون سرنشین، وسایل نقلیه، خدمات شبکه های جغرافیایی اجتماعی، دستگاه های تلفن همراه و دوربین ها هستند. مشکلات در پردازش این داده ها برای استخراج اطلاعات مفید شامل پرس و جو، تجزیه و تحلیل و تجسم است. تکنیکهای داده کاوی و الگوریتمهای یادگیری ماشین، مانند شبکههای عصبی کانولوشنال عمیق، اغلب با دادههای بزرگ جغرافیایی استفاده میشوند. مشکل آشکار مدیریت حجم داده های بزرگ، به ویژه برای عملیات ورودی و خروجی است. نیاز به خواندن و نوشتن موازی داده ها، و همچنین رایانه های با سرعت بالا، خدمات دیسک، و سرعت انتقال شبکه. مشکلات اضافی پایگاههای داده فضایی بزرگ شامل تنوع و ناهمگونی دادهها است که به الگوریتمهای پیشرفته برای مدیریت انواع دادهها و ویژگیهای مختلف و ادغام با دادههای دیگر نیاز دارد. سرعت جمعآوری دادهها یک چالش است، بهویژه استفاده از حسگرهای پیشرفته امروزی و اینترنت اشیا که شامل میلیونها دستگاه است که دادهها را در مقیاسهای زمانی کوتاه از میکرو ثانیه تا دقیقه ایجاد میکنند. در نهایت، صحت یا درستی پایگاههای اطلاعاتی فضایی بزرگ، بهویژه برای همه عناصر داده در پایگاه داده، به سختی ایجاد و اعتبار سنجی میشود. مشکلات اضافی پایگاههای داده فضایی بزرگ شامل تنوع و ناهمگونی دادهها است که به الگوریتمهای پیشرفته برای مدیریت انواع دادهها و ویژگیهای مختلف و ادغام با دادههای دیگر نیاز دارد. سرعت جمعآوری دادهها یک چالش است، بهویژه استفاده از حسگرهای پیشرفته امروزی و اینترنت اشیا که شامل میلیونها دستگاه است که دادهها را در مقیاسهای زمانی کوتاه از میکرو ثانیه تا دقیقه ایجاد میکنند. در نهایت، صحت یا درستی پایگاههای داده فضایی بزرگ به سختی ایجاد و تأیید میشود، بهویژه برای همه عناصر داده در پایگاه داده. مشکلات اضافی پایگاههای داده فضایی بزرگ شامل تنوع و ناهمگونی دادهها است که به الگوریتمهای پیشرفته برای مدیریت انواع دادهها و ویژگیهای مختلف و ادغام با دادههای دیگر نیاز دارد. سرعت جمعآوری دادهها یک چالش است، بهویژه استفاده از حسگرهای پیشرفته امروزی و اینترنت اشیا که شامل میلیونها دستگاه است که دادهها را در مقیاسهای زمانی کوتاه از میکرو ثانیه تا دقیقه ایجاد میکنند. در نهایت، صحت یا درستی پایگاههای اطلاعاتی فضایی بزرگ، بهویژه برای همه عناصر داده در پایگاه داده، به سختی ایجاد و اعتبار سنجی میشود. به ویژه با استفاده از حسگرهای پیشرفته امروزی و اینترنت اشیا که شامل میلیونها دستگاه است که دادههایی را در مقیاسهای زمانی کوتاه از میکرو ثانیه تا دقیقه ایجاد میکنند. در نهایت، صحت یا درستی پایگاههای داده فضایی بزرگ به سختی ایجاد و تأیید میشود، بهویژه برای همه عناصر داده در پایگاه داده. به خصوص با استفاده از حسگرهای پیشرفته امروزی و اینترنت اشیا که شامل میلیونها دستگاه است که دادههایی را در مقیاسهای زمانی کوتاه از میکرو ثانیه تا دقیقه ایجاد میکنند. در نهایت، صحت یا درستی پایگاههای اطلاعاتی فضایی بزرگ، بهویژه برای همه عناصر داده در پایگاه داده، به سختی ایجاد و اعتبار سنجی میشود.
- تعاریف
- معرفی
- طبقه بندی
- چالش های داده های بزرگ
- مدیریت و پردازش داده های بزرگ جغرافیایی
- خلاصه و نتیجه گیری
داده های بزرگ جغرافیایی : مجموعه داده هایی با شناسه های مکانی که از ظرفیت سیستم های محاسباتی فعلی برای مدیریت، پردازش یا تجزیه و تحلیل داده ها با تلاش معقول فراتر می رود.
پایگاههای اطلاعاتی فضایی بزرگ شامل دادههای مکانی برای تصاویر، نقشهها و سایر دادههای مورد استفاده در سیستم اطلاعات جغرافیایی و برنامههای مبتنی بر مکان اغلب در حال حاضر (2019) به عنوان دادههای بزرگ جغرافیایی نامیده میشوند.. طبق تعریف، داده های بزرگ جغرافیایی مجموعه داده هایی با شناسه های مکانی هستند که از ظرفیت سیستم های محاسباتی فعلی برای مدیریت، پردازش یا تجزیه و تحلیل داده ها با تلاش معقول فراتر می روند. این زیادهرویها ناشی از حجم، تنوع، سرعت، صحت و سایر مقادیر دادههای مکانی است (Firican، 2017؛ Panimalar و همکاران، 2017). اشکال سنتی پایگاههای داده فضایی بزرگ، نقاط با فرمت برداری و تصاویر خطی و شطرنجی، از جمله تصاویر ماهوارهای و عکسهای هوایی هستند. اشکال اضافی از پایگاههای داده بزرگ که اکنون با اجزای مکانی ظاهر میشوند شامل تعداد زیادی حسگر جدید، مانند حسگرهای لیدار و سایر حسگرهای الکترونیکی، سیستمهای ویدئویی، حسگرهای انسانی با تلفنهای همراه و سایر مجموعههای داده میشوند. جمع آوری داده ها توسط این حسگرها منجر به اطلاعات جغرافیایی داوطلبانه (VGI) و تعداد زیادی از داده های رسانه های اجتماعی با مکان ها می شود. از جمله فیدهای توییتر و آرشیوهای عکاسی. اگرچه این منابع کلان داده اغلب شامل اطلاعات مکان هستند، اما از ظرفیت های فعلی برای پردازش فراتر می روند، بسیار کمتر از تحلیل فضایی. داده های بزرگ جغرافیایی منبع اصلی برای نوآوری، رقابت و بهره وری هستند، اما به طور همزمان برای پردازش، پردازش، ذخیره سازی، بازیابی و استفاده از داده ها مشکل ساز هستند. چالشهای پیش روی مدیریت و کاربرد دادههای بزرگ جغرافیایی، توسعه ابزارها و تکنیکهای نرمافزاری جدید و همچنین معماریهای سختافزار محاسباتی موازی را برای برآوردن الزامات مدیریت دادهها ضروری کرده است (رایت و وانگ، 2011؛ وانگ و گودچایلد، 2019). تحلیل فضایی بسیار کمتر داده های بزرگ جغرافیایی منبع اصلی برای نوآوری، رقابت و بهره وری هستند، اما به طور همزمان برای پردازش، پردازش، ذخیره سازی، بازیابی و استفاده از داده ها مشکل ساز هستند. چالشهای پیش روی مدیریت و کاربرد دادههای بزرگ جغرافیایی، توسعه ابزارها و تکنیکهای نرمافزاری جدید و همچنین معماریهای سختافزار محاسباتی موازی را برای برآوردن الزامات مدیریت دادهها ضروری کرده است (رایت و وانگ، 2011؛ وانگ و گودچایلد، 2019). تحلیل فضایی بسیار کمتر داده های بزرگ جغرافیایی منبع اصلی برای نوآوری، رقابت و بهره وری هستند، اما به طور همزمان برای پردازش، پردازش، ذخیره سازی، بازیابی و استفاده از داده ها مشکل ساز هستند. چالشهای پیش روی مدیریت و کاربرد دادههای بزرگ جغرافیایی، توسعه ابزارها و تکنیکهای نرمافزاری جدید و همچنین معماریهای سختافزار محاسباتی موازی را برای برآوردن الزامات مدیریت دادهها ضروری کرده است (رایت و وانگ، 2011؛ وانگ و گودچایلد، 2019).
داده های بزرگ جغرافیایی ممکن است به گروه هایی با ویژگی های داده مشابه طبقه بندی شوند. یک طبقه بندی اساسی، پس از یائو و لی (2018)، با استفاده از انواع داده ها برای سازمان، به شرح زیر است.
3.1 سنجش از دور
به طور سنتی، از راه اندازی اولیه سیستم های ماهواره ای، مانند Landsat 1، تا وضوح مکانی و زمانی بالا تا طراحی های جدید حسگرهای امروزی، داده های سنجش از دور دسته ای از داده های بزرگ جغرافیایی را تشکیل می دهند. سیستمهای کنونی تصاویر چند طیفی و فراطیفی را در وضوحهای چندگانه و تاریخهای اکتساب زمانی متعدد از سیستمهای حسگر متعدد به دست میآورند، که در نتیجه حجم دادههای بزرگ علاوه بر موانع دیگری برای مدیریت و استفاده از آنها ایجاد میشود (چی و همکاران، 2016). جمع آوری و بایگانی شده در قالب های شطرنجی سنتی، این تصاویر معمولی با آهنگ پیوسته معمولاً از قابلیت های پردازش رایانه فعلی فراتر می روند که به راه حل های جدیدی مانند محاسبات موازی و زیرساخت سایبری توزیع شده پیشرفته نیاز دارند (Ma et al., 2015).
3.2 نقشه برداری و نقشه برداری داده ها
دادههای جغرافیایی، که اغلب به سیستمهای ماهوارهای ناوبری جهانی (GNSS) ارجاع میشوند، شامل گرافیک زیرساختهای صنعتی، نقشههای موضوعی، نقشههای دیجیتالی و محصولات تصویری، مانند نمودارهای خطی دیجیتال، مدلهای ارتفاعی دیجیتال، گرافیکهای شطرنجی دیجیتال و عکسهای ارتوفوگرافی دیجیتال، دادههای بیشتر کشوری است. سازمان های نقشه برداری، مانند نقشه ملی سازمان زمین شناسی ایالات متحده، کاربری زمین، و سایر داده های نقشه برداری و نقشه برداری اساسی. در سالهای اخیر، دادههای لیدار با وضوح بالا به شکل غالب دادههای نقشهبرداری تبدیل شدهاند و حجم دادهها (ترابایت تا پتابایت) منجر به دادههای بزرگ جغرافیایی میشود (Sugarbaker et al., 2014). نقشه برداری موبایل با حسگرهای متحرک و میدان های حسگر نیز بر مشکل کلان داده در صنعت نقشه برداری تأثیر گذاشته است.
3.3 داده های مبتنی بر مکان برای خدمات مکان
دادههای مبتنی بر مکان معمولاً شامل دادههای اطلاعات اجتماعی جغرافیایی و انسانی با مکانهای مکانی و زمانی است. این دادهها عمدتاً با ورودیهای GNSS تولید شده با تلفنهای هوشمند، دادههای جمعآوریشده میدانی، و مسیرهای انسانی و ترافیکی به دست میآیند. به عنوان مثال می توان به مکان ها و رتبه بندی رستوران ها، نمایش بزرگراه ها و خیابان ها، ردیابی مسیرهای شخصی، مکان های عکس و موارد دیگر اشاره کرد. این دادههای بزرگ جغرافیایی به یک منبع حیاتی در صنایع خدمات مبتنی بر اجتماعی، مسیریابی وسایل نقلیه و سایر فعالیتهایی تبدیل شدهاند که فعالیتهای گروههای انسانی را حس میکنند (لیو و همکاران، 2015).
3.4 پلتفرم های رسانه های اجتماعی
این داده ها مبتنی بر اینترنت و مبتنی بر وب هستند و شامل موقعیت جغرافیایی می باشند. این مکانها ممکن است در دادههای صفحه وب یا در پلتفرمهای رسانههای اجتماعی مانند توییتر، فیسبوک، گوگل پلاس و سایر پلتفرمهای اجتماعی مشخص شوند. مشخصات مکان ممکن است به اندازه مجموعه ای از مختصات موقعیت یابی جهانی خاص باشد یا به اندازه یک نام مکان ابهام نشده ساده مبهم باشد. دادههای بزرگ جغرافیایی از رسانههای اجتماعی مجموعهای از مشکلات را برای مدیریت دادهها به همراه دارند، مانند عدم ارجاع مکان، عدم برآورده کردن فرضیات آماری اولیه نمونههای مستقل و بیطرف، و موارد دیگر (گودچایلد، 2013؛ کیچین، 2013؛ تسو، 2015).
3.5 اینترنت اشیا (IoT)
اینترنت اشیا شامل حسگرهایی است که دادهها را از جمله اندازهگیریهای محیطی و جوی، کیفیت آب، حجم و جریان، دستگاههای هوشمند در خانه، مجموعهای میدانی برای علم و مدیریت، دستگاههای پوشیدنی، و مجموعهای از حسگرهایی که در زمان واقعی کمک میکنند، نظارت و جمعآوری میکند. داده ها در میکروثانیه تا چند دقیقه به سرورهای داده بزرگ. بیشتر این دادههای بهدستآمده توسط حسگرهای جدید، جریانهای دادهای با چگالی بالا دلخواه هستند. شامل اندازه گیری های ابعادی مختلف مانند نوری، صوتی و مکانیکی. و دارای دقت و دقت موقعیتی متفاوتی هستند. در مقایسه با دادههای سنتی در اینترنت، دادههای اینترنت اشیا به طور کلی تنوع بسیار بیشتری دارند و فرکانس بسیار بیشتری دارند که منجر به یک مشکل دادههای بزرگ مکانی واقعی میشود (Alelaiwi، 2017).
اینها شامل معماریهایی برای پردازش حجم دادههای بزرگ و همچنین مشکلات ذاتی در دادهها مانند ناهمگونی، مبهم بودن تعاریف و مرزهای ویژگیهای جغرافیایی، و عدم قطعیت موقعیت یا انتساب است. از جمله مشکلات پردازش شناساییشده، ارزیابی کیفیت، مدلسازی و ساختار دادهها، برنامهریزی عملکردی برای جریانهای دادههای بزرگ جغرافیایی، تجزیه و تحلیل دادههای بزرگ مکانی، دادهکاوی و کشف دانش، و تجسم دادههای بزرگ مکانی و تجزیه و تحلیل بصری است (لی و همکاران، 2016).
4.1 مشکلات داده های بزرگ مکانی ذاتی
همه انواع دادههای بزرگ جغرافیایی که در بالا ذکر شد از مشکلات مشترک در همه دادههای مکانی رنج میبرند که شامل ابهام و مرزهای نامشخص برای ویژگیهای جغرافیایی است (Usery, 1995). برای مثال، استفاده از دادههای لیدار برای استخراج ویژگیهای زمین، بلافاصله نیاز به تعریف و مفهومسازی خود ویژگیهای زمین دارد. یعنی مرزهای ویژگی جغرافیایی طبیعی که می توان برای استخراج موجودیت از داده ها استفاده کرد، کجاست. همراه کردن این عدم قطعیت با مشکل کلان داده و ابهام طبیعی ویژگی ها با حجم داده های بزرگ و داده های ناهمگن مشکل سازتر می شود. مشکل ذاتی دیگر عدم قطعیت داده های بزرگ جغرافیایی و فقدان روش ها و مشخصات برای اندازه گیری و کمی سازی چنین عدم قطعیت هایی است.
4.2 ارزیابی کیفیت
دادههای بزرگ جغرافیایی اغلب اندازهگیریهای پیوسته هستند، مانند مقادیر پیکسل در تصاویر ماهوارهای یا بازده لیدار، و بهعنوان انتزاعی از متغیرهای زمان واقعی، نامشخص هستند. حجم انبوه داده ها عدم قطعیت را افزایش می دهد و نیاز به ارزیابی کیفیت برای اطمینان از انتزاع، پردازش، استخراج ویژگی، تجزیه و تحلیل و پردازش تجسم مناسب دارد. استانداردها و رویه های دقیق برای نظارت بر کیفیت برای بسیاری از مجموعه داده های جغرافیایی ساخت یافته سنتی ایجاد شده است. به عنوان مثال، استاندارد بین المللی ISO 19157 به طور خاص به کیفیت داده های مکانی می پردازد. استاندارد مشابهی برای جمعآوری دادههای لیدار وجود دارد: مشخصات پایگاه لیدار سازمان زمینشناسی ایالات متحده 1.3 (Heidemann، 2018). این و سایر چارچوبهای استاندارد مشابه، معیارهای کمی کیفیت دادهها، از جمله فضایی، دقت زمانی و موضوعی، تفکیک مکانی، زمانی و موضوعی، سازگاری و کامل بودن (لی و همکاران، 2016). بنابراین، ارزیابی کیفیت دادهها برای فرآیندهای جمعآوری و ایجاد ابردادهها که کیفیت آن فرآیندها را منعکس میکند، تعریف میشود. استانداردهای مشابهی برای اکثر داده های بزرگ جغرافیایی وجود ندارد. به عنوان مثال، ارزیابی کیفیت دادههای رسانههای اجتماعی بسیار دشوار است، زیرا بسیاری از این دادهها مفروضات آماری اولیه را نقض میکنند و اغلب از طریق نمونهگیری مغرضانه و محدود بهدست میآیند، برای مثال، کسانی که تلفن همراه دارند و کسانی که در فرآیند جمعآوری دادهها شرکت میکنند. برای نوع خاصی از داده های بزرگ کیفیت مکانها در دادههای بزرگ جغرافیایی نیز مشکلساز است و اغلب جزء مکانیابی است، مانند فیدهای توییتر،
4.3 جریان های داده های بزرگ جغرافیایی
توییتر، فیس بوک و دیگر پلتفرم های رسانه های اجتماعی جریان های پیوسته ای از داده های بزرگ جغرافیایی را ارائه می دهند. این جریان ها نیاز به پردازش و تحلیل مستمر دارند. اجزای جغرافیایی این جریان ها اغلب پنهان، مبهم هستند و تنها بر اساس متن پیام یا صحنه های یک عکس مشخص می شوند. بنابراین، مؤلفه فضایی ذاتاً نامشخص است و باید در هر گونه تجزیه و تحلیل یا تجسم مربوط به این نوع داده ها حل شود. جریانهای کلان داده مشابه از میدانهای حسگر و اشیاء در اینترنت اشیا جمعآوری میشوند. با این میدانهای حسگر، جریانهای داده با حجم بالا نسبت به مکان مکانی مشکلسازتر هستند، زیرا اکثر این دستگاهها مکانهای ثابتی برای حسگرها دارند و میتوان از آن در تجزیه و تحلیل و تجسم استفاده کرد.
5. مدیریت و پردازش داده های بزرگ جغرافیایی
حجم و ویژگیهای دادههای مکانی و سرعت جمعآوری برخی دادهها مانعی برای مدیریت و پردازش آنها ایجاد میکند. از جمله راه حلهای پردازش دادههای بزرگ جغرافیایی، روشهای سازماندهی دادهها مانند نمایهسازی بر اساس مکان مکانی، شناسههای ویژگی یا انتساب موضوعی یا زمانی است.
5.1 مدل سازی و ساختار داده ها
یک رویکرد رایج برای پردازش و پردازش دادههای بزرگ جغرافیایی به مدل و ساختار دادهها، بهویژه در قالبهای برداری سنتی و شطرنجی، وابسته است. به عنوان مثال، داده های برداری از نقاط، خطوط و چندضلعی ها و گاهی اوقات شکل های حجمی تشکیل شده است. مدلهای استاندارد مبتنی بر گره قوس با درجات بالایی از نمایهسازی توسعه داده شدهاند که امکان دسترسی مستقیم به ویژگیها و روابط هندسی، توپولوژیکی، موضوعی و زمانی این ویژگیهای مکانی را فراهم میکند. داده های شطرنجی را می توان با انواع روش های نمایه سازی مانند رمزگذاری با استفاده از ساختارهای فضا محور مانند درختان خطی، چهار درخت و درختان KD یا ساختارهای درایو داده مانند درخت R پشتیبانی کرد (سامت، 2006). استفاده از هستی شناسی ها و معناشناسی برای ساختار و نمایه سازی داده های بزرگ جغرافیایی اکنون پتانسیل پشتیبانی از مدل سازی، تجزیه و تحلیل،
5.2 تجزیه و تحلیل داده های بزرگ جغرافیایی
تجزیه و تحلیل اغلب شامل سیستم های محاسباتی توزیع شده و با کارایی بالا با الگوریتم هایی است که برای محاسبات، پردازش و تجسم موازی اقتباس شده اند (وانگ و گودچایلد، 2019). اغلب رویکردها شامل داده کاوی و کشف دانش هستند. روشهای رویکرد شامل آمار پارامتریک است که به فرضیات تابع توزیع احتمال و اغلب تصادفی بودن و استقلال نمونهها نیاز دارد. آمارهای ناپارامتریک که به سادگی یکنواختی محلی را فرض می کنند. و تجزیه و تحلیل عملکردی شامل موجک ها و تعمیم داده های مکانی، خوشه بندی داده های مکانی، و قوانین تداعی فضایی استخراج. یادگیری ماشینی و استفاده از شبکههای عصبی کانولوشنال عمیق برای دادهکاوی بزرگ مکانی و کشف دانش اغلب در محیطهای محاسباتی با کارایی بالا پیادهسازی میشوند.
داده های بزرگ جغرافیایی بیش از ظرفیت سیستم های محاسباتی رایج است که در نتیجه حجم، تنوع، سرعت و صحت داده ها است. بسیاری از انواع داده ها، از جمله تصاویر سنجش از راه دور از ماهواره، هواپیما، و سیستم عامل های دستی. انواع داده های نقشه برداری از جمله لیدار، ارتفاع، هیدروگرافی، طبقه بندی پوشش زمین و غیره. داده های مبتنی بر مکان برای خدمات مکان یابی بسیار وابسته به مختصات GNSS است. فیدهای رسانه های اجتماعی مانند توییتر و تصاویر از فیس بوک؛ و جریانهای حسگر از میدانهای حسگر و اینترنت اشیا، نمونههایی از دادههای بزرگ جغرافیایی با حجم و ناهمگنی گسترده هستند. چالش ها و مشکلات داده های بزرگ جغرافیایی شامل معماری های پردازش کامپیوتری، الزامات سیستم های محاسباتی موازی و توزیع شده، محاسبات با کارایی بالا، عدم قطعیت اساسی اجزای مکانی و غیر مکانی داده ها، ارزیابی کیفیت، پردازش تحلیلی و فرضیات و تخلفات آماری، و تجزیه و تحلیل و تجسم مجموعه داده های بزرگ با خوشه هایی با زمینه قابل توجه. آینده دادههای بزرگ جغرافیایی شاهد رشد بیشتری در حجم و تنوع دادهها و استفاده از روشهای محاسباتی برای تبدیل کلان دادههای مکانی به نتایج علمی و برنامههای کاربردی برای جامعه خواهد بود.
هر گونه استفاده از نام تجاری، شرکت یا محصول فقط برای اهداف توصیفی است و به معنای تایید دولت ایالات متحده نیست.
آدلایوی، ا. (2017). یک ابزار مدیریت منابع مشارکتی برای پردازش داده های بزرگ اینترنت اشیا در فضای ابری. Cluster-Computing: The Journal of Networks, Software, Tools and Applications, 20 (2), 1791-1799, DOI: 10.1007/s10586-017-0839-y
چی، ام.، پلازا، آ.، بندیکتسون، جی، سان، ز.، شن، آی.، و ژو، ی. (2016). داده های بزرگ برای سنجش از دور: چالش ها و فرصت ها مجموعه مقالات مؤسسه مهندسین برق و الکترونیک، 104 (11)، ص. 2207-2219، DOI: 10.1109/Jproc.2016.2598228
فیریکان، جی (2017). 10 در مقابل داده های بزرگ. بازیابی شده در 11 سپتامبر 2018 از https://tdwi.org/articles/2017/02/08/10-vs-of-big-data.aspx
Goodchild، MF (2013). کیفیت داده های بزرگ (جغرافیایی). Dialogues in Human Geography, 3 (3), 280-284, DOI: 10.1177/2043820613513392
Heidemann, HK (2018)، مشخصات پایه لیدار (نسخه 1.3، فوریه 2018): تکنیک ها و روش های زمین شناسی ایالات متحده، کتاب 11، فصل. B4، 101. DOI: 10.3133/tm11b4
کیچین، آر (2013). داده های بزرگ و فرصت ها، چالش ها و خطرات جغرافیای انسانی. Dialogues in Human Geography, 3 (3), 262-267, DOI: 10.1177/2043820613513388
لی، جی. جی، و کانگ، ام (2015). داده های بزرگ جغرافیایی: چالش ها و فرصت ها. تحقیقات کلان داده 2 (2)، 74-81. DOI: 10.1016/j.bdr.2015.01.003
لی، اس.، دراگیسویچ، اس.، آنتون، اف.، سستر، ام.، وینتر، اس.، کولتکین، آ.، پتیت، سی، جیانگ، بی.، هاورث، جی.، استین، ا.، و چنگ، تی (2015). نظریه و روشهای مدیریت دادههای بزرگ جغرافیایی: بررسی و چالشهای پژوهشی ، ص 2-19.
لیو، ی.، لیو، ایکس.، گائو، اس.، گونگ، ال.، کانگ، سی.، ژی، ی.، و شی، ال. (2015). حس اجتماعی: رویکردی جدید برای درک محیطهای اجتماعی و اقتصادی Annals of Association of American Geargraphers, 105 (3), p. 512-530، DOI: 10.1080/00045608.2015.1018773
Ma, Y., Wu, H., Wang, L., Huang, B., Ranjan, R., Zomaya, A., & Jie, W. (2015). محاسبات کلان داده سنجش از دور: چالشها و فرصتها، سیستمهای رایانهای نسل آینده ، 51 ، 47-60، DOI: 10.1016/j.future.2014.10.029
Panimalar، A.، Varnekha، S.، & Veneshia، K. (2017). 17 در مقابل داده های بزرگ. مجله تحقیقاتی بین المللی مهندسی و فناوری (IRJET) , 4 (9). بازبینی شده در 11 سپتامبر 2018 از https://www.irjet.net/archives/V4/i9/IRJET-V4I957.pdf
سامت، ح. (1385). مبانی ساختارهای داده چند بعدی و متریک. ناشران مورگان کافمن، 1024.
Sugarbaker, LJ, Constance, EW, Heidemann, HK, Jason, AL, Lukas, V., Saghy, DL, & Stoker, JM (2014). ابتکار برنامه ارتفاع سه بعدی – فراخوانی برای اقدام. بخشنامه سازمان زمین شناسی ایالات متحده 1399 , 35. DOI: 10.3133/cir1399
تسو، M.-H. (2015). چالش ها و فرصت های تحقیق در نقشه برداری رسانه های اجتماعی و داده های بزرگ. نقشه کشی و علم اطلاعات جغرافیایی، 42 (1)، 70-74. DOI: 10.1080/15230406.2015.1059251
یوزری، EL (1996). چارچوب مفهومی و اجرای مجموعه فازی برای ویژگیهای جغرافیایی، در PA Burrough و AU Frank (Eds.)، اشیاء جغرافیایی با مرزهای نامشخص. تیلور و فرانسیس: لندن، صص 71-85.
Vatsavai, RR, Ganguly, A., Chandola, V., Stefanidis, A., Klasky, S., & Shekhar, S. (2012). داده کاوی فضایی و زمانی در عصر داده های بزرگ زمین مکانی: الگوریتم ها و کاربردها. BigSpatial ’12 مجموعه مقالات اولین کارگاه بین المللی ACM SIGSPATIAL در مورد تجزیه و تحلیل برای داده های بزرگ جغرافیایی. ردوندو بیچ، کالیفرنیا، 1-10. DOI: 10.1145/2447481.2447482
Yao, X., & Li, G. (2018). مدیریت داده های برداری بزرگ فضایی: یک بررسی. داده های بزرگ زمین، 2 (1)، 108-129، DOI: 10.1080/20964471.2018.1432115
رایت، دی، و وانگ، اس. (2011). ظهور زیرساخت سایبری فضایی. مجموعه مقالات آکادمی ملی علوم، 108 (14)، 5488-5491. بازیابی شده در 11 سپتامبر 2018 از http://www.pnas.org/content/108/14/5488
Zhang, C., Zhao, T., & Li, W. (2017). داده های بزرگ جغرافیایی و وب معنایی جغرافیایی: وضعیت فعلی و فرصت های آینده. در Y. Wu، F. Hu، G. Min، و A. Zomaya (ویراستار)، Big Data and Computational Intelligence in Networking . Taylor & Francis LLC، CRC Press. ص 43-64.
- انواع اساسی داده های بزرگ جغرافیایی را شرح دهید.
- تکنیک های نوظهور ژئومحاسبات برای داده های بزرگ جغرافیایی را شرح دهید.
- نحوه تشخیص داده های آلوده در مجموعه داده های بزرگ را توضیح دهید.
- روشهای اولیه برای ساختاردهی و مدلسازی دادههای بزرگ جغرافیایی را شناسایی و توضیح دهید.
- محدودیت های آماری پایگاه های داده فضایی بزرگ را شرح دهید.
- مشکلات در برخورد با پایگاه داده های فضایی بزرگ، به ویژه آنهایی که از ناهمگونی فضایی ناشی می شوند را شرح دهید. برخی از مشکلات مجموعه داده های فضایی بزرگ را از رسانه های اجتماعی شرح دهید.
- یک تعریف اساسی از داده های بزرگ جغرافیایی ارائه دهید.
- شناسایی مشکلات عمده پایگاه های داده فضایی بزرگ، با نام مستعار، داده های بزرگ جغرافیایی.
- چندین روش برای نمایه سازی مجموعه داده های شطرنجی بزرگ تعریف کنید. مزایای هر کدام چیست؟
- استانداردها برای برخی از پایگاه های داده فضایی بزرگ کار می کنند و نه برای برخی دیگر. چرا؟
- برخی از روشهای تجزیه و تحلیل و استخراج دادههای بزرگ جغرافیایی را تعریف کنید.
- چرا اینترنت اشیا یک مشکل داده های بزرگ جغرافیایی ایجاد می کند؟
10 نظرات