هدف یادگیری
- هدف از این بخش معرفی انواع داده ها، مقیاس های اندازه گیری و روش های جمع آوری داده ها می باشد.
کسب داده های جغرافیایی یک عامل مهم در هر تلاش سیستم اطلاعات جغرافیایی (GIS) است. تخمین زده شده است که جمعآوری دادهها معمولاً 60 تا 80 درصد از زمان و هزینهای را که صرف هر پروژه میشود مصرف میکند. بنابراین، باید دقت شود که پروژه های GIS به اهداف اعلام شده خود توجه داشته باشند تا جمع آوری داده های مکانی به شیوه ای کارآمد و موثر پیش برود. این فصل به تشریح بسیاری از اشکال و منابع داده های مکانی موجود برای استفاده در GIS می پردازد.
انواع داده ها
نوع داده ای که ما برای کمک به درک یک موجودیت خاص به کار می بریم با (1) آنچه در حال بررسی هستیم، (2) آنچه می خواهیم در مورد آن موجودیت بدانیم، و (3) توانایی ما برای اندازه گیری آن موجودیت در مورد دلخواه تعیین می شود. مقیاس رایج ترین انواع داده های موجود برای استفاده در GIS رشته های الفبایی، اعداد، مقادیر بولی، تاریخ ها و باینری ها هستند.
یک رشته الفبایی ، یا متن، نوع داده هر ترکیب ساده ای از حروف و اعداد است که ممکن است کلمات منسجمی را تشکیل دهند یا نباشند. نوع داده اعداد را می توان به صورت ممیز شناور یا عدد صحیح طبقه بندی کرد. ممیز شناور هر مقدار داده ای است که شامل اعداد اعشاری و یک عدد صحیح استهر مقدار داده ای است که شامل ارقام اعشاری نباشد. اعداد صحیح بسته به تعداد ارقام مهم در آن عدد می توانند کوتاه یا بلند باشند. همچنین، آنها بر اساس مفهوم “بیت” در یک کامپیوتر هستند. همانطور که ممکن است به خاطر داشته باشید، یک بیت اساسی ترین واحد اطلاعات در یک کامپیوتر است و مقادیر را در یکی از دو حالت ذخیره می کند: 1 یا 0. بنابراین، یک ویژگی 8 بیتی از هشت 1 یا 0 در هر ترکیبی تشکیل می شود (به عنوان مثال، 10010011, 00011011, 11100111).
اعداد صحیح کوتاه مقادیر 16 بیتی هستند و بنابراین میتوانند برای مشخص کردن اعداد از 32768- تا 32767 یا از 0 تا 65535 بسته به اینکه عدد علامت داشته باشد یا بدون علامت (یعنی دارای علامت + یا – باشد) استفاده شود. اعداد صحیح طولانی ، به طور متناوب، مقادیر 32 بیتی هستند و بنابراین می توانند اعدادی را از 2,147,483,648- تا 2,147,483,647 یا از 0 تا 4,294,967,295 مشخص کنند.
یک مقدار دقیق ممیز شناور ، مانند عدد صحیح طولانی، 32 بیت را اشغال می کند. با این حال، این نوع داده مقدار حداکثر 7 بیت را در سمت چپ اعشار (حداکثر مقدار 128 یا 127 در صورت امضا) و حداکثر مقادیر 23 بیتی را در سمت راست اعشار (تقریباً 7 اعشاری) ارائه میکند. ارقام). یک مقدار ممیز شناور با دقت دوگانه اساساً دو مقدار 32 بیتی را به عنوان یک مقدار واحد ذخیره می کند. بنابراین، شناورهای با دقت دوگانه، میتوانند مقداری را با حداکثر 11 بیت در سمت چپ اعشار و مقادیری با حداکثر 52 بیت در سمت راست اعشار (تقریباً 16 رقم اعشاری) نشان دهند ( شکل 5.1 “نقطه شناور با دقت دوگانه” (مقدار 64 بیتی)، همانطور که در یک کامپیوتر ذخیره شده است” ).
شکل 5.1 ممیز شناور دقیق دوگانه (مقدار 64 بیتی)، همانطور که در یک کامپیوتر ذخیره می شود
مقادیر بولی، تاریخ و باینری پیچیدگی کمتری دارند. مقادیر بولی صرفاً آن دسته از مقادیری هستند که بر اساس اعمال یک عملگر بولی مانند AND، OR، و NOT درست یا نادرست در نظر گرفته می شوند. نوع داده تاریخ احتمالاً خود توضیحی است، در حالی که نوع داده باینری ویژگی هایی را نشان می دهد که مقادیر آنها 1 یا 0 است.
مقیاس اندازه گیری
علاوه بر تعریف داده ها بر اساس نوع، یک مقیاس اندازه گیری برای گروه بندی داده ها بر اساس سطح پیچیدگی عمل می کند (استیونز 1946). استیونز، SS 1946. “در نظریه مقیاس های اندازه گیری.” علم 103 (2684): 677-80. برای اهداف تجزیه و تحلیل GIS، مقیاس های اندازه گیری را می توان به دو دسته کلی دسته بندی کرد. داده های اسمی و ترتیبی نشان دهنده داده های طبقه بندی هستند. داده های بازه و نسبت نشان دهنده داده های عددی است .
ساده ترین مقیاس اندازه گیری داده ها، مقیاس اسمی یا نامی است. مقیاس اسمی بیان می کند که چه چیزی را باید نقاط داده نامید، اما اجازه مقایسه اسکالر بین یک شی و شی دیگر را نمی دهد. به عنوان مثال، نسبت دادن اطلاعات اسمی به مجموعهای از نقاط که شهرها را نشان میدهند، توضیح میدهد که منطقه دادهشده «لس آنجلس» یا «نیویورک» است. با این حال، هیچ نشانه دیگری، مانند جمعیت یا تاریخچه رایگیری، نمیتوان در مورد آن مناطق بیان کرد. نمونه های دیگر داده های اسمی شامل نام خانوادگی، رنگ چشم، نوع کاربری زمین، قومیت و جنسیت است.
دادههای ترتیبی اطلاعات ویژگیها را در رتبهبندی قرار میدهند و بنابراین اطلاعات دقیقتری نسبت به دادههای اسمی به دست میدهند. داده های ترتیبی موقعیتی را توصیف می کنند که داده ها در آن رخ می دهند، مانند اول، دوم، سوم و غیره. این مقیاسها ممکن است نامهایی مانند «بسیار ناراضی»، «ناراضی»، «راضی» و «بسیار راضی» به خود بگیرند. اگرچه این مقیاس اندازه گیری رتبه بندی هر نقطه داده را نسبت به سایر نقاط داده نشان می دهد، اما مقیاس ترتیبی به صراحت تفاوت کمی دقیق بین این رتبه بندی ها را نشان نمی دهد. به عنوان مثال، اگر یک ویژگی ترتیبی نشان دهد که کدام دونده در جایگاه اول، دوم یا سوم قرار گرفته است، نشان نمی دهد که دونده برنده با چه مدت زمان دونده مقام دوم را شکست داده است. بنابراین، نمی توان عملیات حسابی را با داده های ترتیبی انجام داد. فقط دنباله صریح است.
مقیاس اندازه گیری که اجازه می دهد گزاره های کمی دقیق در مورد ویژگی ها ارائه شود، داده های بازه ای است . دادههای بازهای در امتداد مقیاسی اندازهگیری میشوند که در آن هر موقعیت با یکدیگر فاصله دارد. خوانش ارتفاع و دما نمایش های رایج داده های بازه ای هستند. برای مثال، از طریق این مقیاس می توان تعیین کرد که 30 درجه فارنهایت، 5 درجه فارنهایت گرمتر از 25 درجه فارنهایت است. ویژگی قابل توجه مقیاس فاصله این است که صفر یک مقدار معنادار نیست به این معنا که صفر نشان دهنده نیستی یا عدم وجود یک مقدار نیست. در واقع، 0 درجه فارنهایت نشان نمی دهد که دما وجود ندارد. به طور مشابه، ارتفاع 0 فوت نشان دهنده کمبود ارتفاع نیست. بلکه میانگین سطح دریا را نشان می دهد.
داده های نسبت مشابه مقیاس اندازه گیری فاصله است. با این حال، حول یک مقدار صفر معنادار است. تراکم جمعیت نمونه ای از داده های نسبت است که به موجب آن تراکم جمعیت 0 نشان می دهد که هیچ فردی در منطقه مورد علاقه زندگی نمی کند. به طور مشابه، مقیاس دمای کلوین یک مقیاس نسبت است زیرا 0 K نشان می دهد که هیچ گرمایی (دما) در ویژگی داده شده قابل اندازه گیری نیست.
برای مجموعه داده های عددی، مقادیر داده نیز می توانند گسسته یا پیوسته در نظر گرفته شوند. داده های گسسته آنهایی هستند که تعداد محدودی از مقادیر ممکن را حفظ می کنند، در حالی که داده های پیوسته را می توان با تعداد نامحدودی از مقادیر نشان داد. به عنوان مثال، تعداد درختان بالغ در یک ملک کوچک لزوماً بین یک تا صد (به خاطر استدلال) خواهد بود. با این حال، ارتفاع آن درختان نشان دهنده یک مقدار داده پیوسته است زیرا تعداد نامتناهی از مقادیر بالقوه وجود دارد (به عنوان مثال، یک درخت ممکن است 20 فوت قد، 20.1 فوت، یا 20.15 فوت، 20.157 فوت، و غیره باشد).
جمع آوری داده های اولیه
اکنون که ما از انواع مختلف دادهها و مقیاسهای اندازهگیری موجود برای استفاده در GIS آگاهی داریم، باید افکار خود را به این موضوع هدایت کنیم که چگونه میتوان این دادهها را به دست آورد. جمع آوری داده های اولیه یک روش اکتساب مستقیم داده است که معمولاً با نوعی تلاش در زمینه مرتبط است. در مورد داده های برداری، داده های مستقیم گرفته شده معمولاً از یک سیستم موقعیت یابی جهانی (GPS) یا انواع دیگر تجهیزات نقشه برداری مانند یک ایستگاه کل می آیند ( شکل 5.2 “واحد GPS (چپ) و ایستگاه کل (راست)””). ایستگاههای توتال ابزارهای تخصصی و اولیه جمعآوری دادهها هستند که یک تئودولیت (یا ترانزیت)، که زوایای افقی و عمودی را اندازهگیری میکند، با ابزاری برای اندازهگیری فاصله شیب از واحد تا یک نقطه مشاهدهشده ترکیب میکنند. استفاده از ایستگاه توتال به خدمه میدانی اجازه میدهد تا توپوگرافی یک منظره خاص را به سرعت و با دقت استخراج کنند.
شکل 5.2 واحد GPS (چپ) و توتال استیشن (راست)
در مورد GPS، واحدهای دستی به داده های موقعیتی از ماهواره ها دسترسی دارند و اطلاعات را برای بازیابی بعدی ثبت می کنند. شبکه ای متشکل از بیست و چهار ماهواره ناوبری در سرتاسر کره زمین قرار دارد و اطلاعات مختصات دقیقی را برای هر نقطه از سطح زمین ارائه می دهد ( شکل 5.3 “تصویربرداری زمین از ماهواره با گرفتن داده های اولیه”). حفظ خط دید چهار یا بیشتر از این ماهواره ها اطلاعات موقعیت مکانی نسبتاً دقیقی را در اختیار کاربر قرار می دهد. این مکانها را میتوان بهعنوان نقاط مجزا جمعآوری کرد یا بسته به ترجیح کاربر، میتوان آنها را به یکدیگر پیوند داد تا خطوط یا چندضلعیها را تشکیل دهند. داده های ویژگی مانند نوع کاربری زمین، شماره قطب تلفن و نام رودخانه می توانند به طور همزمان توسط کاربر وارد شوند. سپس این داده های مکان و ویژگی را می توان برای تجسم در GIS بارگذاری کرد. بسته به نوع و مدل GPS، این آپلود اغلب به نوعی تبدیل فایل میانی از طریق نرم افزار ارائه شده توسط سازنده واحد GPS نیاز دارد. با این حال، برخی منابع آنلاین رایگان وجود دارد که می تواند داده های GPS را از یک فرمت به فرمت دیگر تبدیل کند. GPSBabel نمونه ای از چنین منبع آنلاینی است ( https://www.gpsvisualizer.com/gpsbabel).
علاوه بر واحد GPS معمولی نشان داده شده در شکل 5.2 “واحد GPS (سمت چپ) و ایستگاه توتال (راست)” ، GPS به طور فزاینده ای در دیگر فناوری های جدید گنجانده می شود. به عنوان مثال، تلفن های هوشمند اکنون قابلیت های GPS را به عنوان یک جزء تکنولوژیکی استاندارد تعبیه کرده اند. این واحدهای تلفن/GPS دقت قابل مقایسه با واحدهای GPS مستقل با قیمت مشابه دارند و تا حد زیادی مسئول تجدید حیات در تسهیل جمعآوری و اشتراکگذاری دادههای قابل حمل و بلادرنگ با تودهها هستند. فراگیر شدن این فناوری منجر به گسترش جایگزین های جمع آوری داده های جمع سپاری شده است. جمع سپارییک روش جمعآوری داده است که به موجب آن کاربران آزادانه در ساخت پایگاههای اطلاعاتی فضایی مشارکت میکنند. این روش به سرعت در حال گسترش در برنامه هایی مانند برنامه MapShare TomTom، Google Earth، Bing Maps و ArcGIS استفاده می شود.
دادههای شطرنجی بهدستآمده از طریق ضبط مستقیم معمولاً از منابع سنجش از راه دور به دست میآیند ( شکل 5.3 “تصویربرداری از زمین ماهوارهای ثبت دادههای اولیه” ). داده های سنجش از راه دور این مزیت را ارائه می دهد که نیاز به دسترسی فیزیکی به منطقه ای که تصویربرداری می شود را حذف می کند. علاوه بر این، بخشهای عظیم زمین را میتوان با صرف زمان و کار اضافی توسط محقق مشخص کرد. از سوی دیگر، اعتبارسنجی برای داده های سنجش از راه دور مورد نیاز است تا اطمینان حاصل شود که حسگر نه تنها به درستی کار می کند، بلکه برای جمع آوری اطلاعات مورد نظر به درستی کالیبره شده است. ماهوارهها و دوربینهای هوایی فراگیرترین منابع دادههای شطرنجی را فراهم میکنند ( فصل 4 «مدلهای داده برای GIS» ، بخش 4.3.1 «تصاویر ماهوارهای» ).
شکل 5.3 تصویربرداری زمین از ماهواره که داده های اولیه را می گیرد
جمع آوری داده های ثانویه
جمع آوری داده های ثانویهیک روش غیرمستقیم است که از حجم وسیعی از دادههای مکانی موجود در هر دو فرمت دیجیتال و نسخه چاپی استفاده میکند. قبل از شروع هر تلاش GIS، همیشه عاقلانه است که منابع آنلاین برای داده های GIS موجود استخراج کنید که ممکن است نیازهای نقشه برداری شما را بدون گام بالقوه فشرده ایجاد داده از ابتدا برآورده کند. چنین داده های دیجیتال GIS از منابع مختلف از جمله آژانس های بین المللی (CGIAR، CIESIN، سازمان ملل، بانک جهانی و غیره) در دسترس هستند. دولت های فدرال (USGS، USDA، NOAA، USFWS، NASA، EPA، سرشماری ایالات متحده و غیره)؛ دولت های ایالتی (CDFG، Teale Data Center، INGIS، MARIS، NH GIS Resources، و غیره)؛ دولت های محلی (SANDAG، RCLIS، و غیره)؛ وب سایت های دانشگاه (UCLA، دوک، استنفورد، دانشگاه شیکاگو، پورتال داده های فضایی ایندیانا، و غیره)؛ و وب سایت های تجاری (ESRI، GeoEye، Geocomm، و غیره). این دادههای ثانویه در طیف گستردهای از انواع فایلها، گسترهها و اندازهها در دسترس هستند، اما برای استفاده در اکثر بستههای نرمافزار GIS آماده هستند. اغلب این داده ها رایگان هستند، اما بسیاری از سایت ها برای دسترسی به اطلاعات اختصاصی که توسعه داده اند، هزینه ای دریافت می کنند.
اگرچه این منابع داده همه مواردی هستند که اطلاعات به فرمت دیجیتال تبدیل شده و به درستی برای استفاده در یک GIS پیش بینی شده است، اطلاعات مکانی زیادی نیز وجود دارد که می توان از منابع موجود و غیر دیجیتالی به دست آورد. به عنوان مثال، نقشه های کاغذی ممکن است حاوی اطلاعات فعلی یا تاریخی در یک منطقه باشد که در قالب دیجیتال یافت نمی شود. در این حالت می توان از فرآیند دیجیتالی سازی برای ایجاد فایل های دیجیتال از نسخه اصلی کاغذ استفاده کرد. سه روش اصلی برای دیجیتالی کردن اطلاعات مکانی وجود دارد: دو روش دستی و یکی خودکار.
دیجیتالی کردن تبلت یک روش جمعآوری دستی داده است که به موجب آن کاربر اطلاعات مختصات را از طریق استفاده از تبلت دیجیتالی و یک عدد دیجیتالی وارد رایانه میکند. برای شروع، یک نقشه کاغذی روی یک تبلت دیجیتالی با نور پس زمینه ایمن می شود. نور پس زمینه اجازه می دهد تا تمام ویژگی های روی نقشه را به راحتی مشاهده کنید که باعث کاهش خستگی چشم می شود. سپس مختصات ویژگیهای نقطه، خط و/یا چند ضلعی روی نقشه کاغذی در یک فایل دیجیتالی وارد میشود، زیرا کاربر با استفاده از یک پوک، که شبیه به یک موش چند دکمهای است، برای “کلیک” کردن در مسیر خود در اطراف آن استفاده میکند. رئوس هر ویژگی مورد نظر پس از تکمیل کار دیجیتالی کردن، فایل دیجیتالی حاصل باید به درستی ارجاع جغرافیایی داده شود تا اطمینان حاصل شود که این اطلاعات به درستی با مجموعه دادههای موجود هماهنگ میشوند.
هدآپ دیجیتالی کردن، دومین روش جمعآوری دستی دادهها، به عنوان دیجیتالسازی «روی صفحه» نامیده میشود. دیجیتالی سازی Heads-up را می توان بر روی نقشه های کاغذی یا فایل های دیجیتال موجود استفاده کرد. در مورد نقشه کاغذی، ابتدا باید نقشه را با وضوح کافی در رایانه اسکن کرد که امکان حل همه ویژگی های مربوطه را فراهم کند. دوم، تصویر اکنون دیجیتال باید ثبت شود تا نقشه با یک سیستم مختصات موجود مطابقت داشته باشد. برای انجام این کار، کاربر می تواند نقاط کنترل را روی صفحه وارد کرده و تصویر اسکن شده را به مختصات دنیای واقعی تبدیل کند. در نهایت، کاربر به سادگی به مناطق خاصی روی نقشه زوم می کند و نقاط، خطوط و/یا چند ضلعی ها را شبیه به مثال دیجیتالی کردن تبلت ردیابی می کند. زمانی که فایلهای GIS، تصاویر ماهوارهای یا عکسهای هوایی موجود بهعنوان خط مبنا استفاده میشوند، دیجیتالیسازی هدآپ بسیار ساده است.
سومین روش خودکار جمعآوری دادههای ثانویه، کاربر را ملزم میکند تا نقشه کاغذی را اسکن کرده و اطلاعات موجود در آن را بردارید. این برداریروش معمولاً به یک بسته نرم افزاری خاص نیاز دارد که بتواند اسکن شطرنجی را به خطوط برداری تبدیل کند. این به یک اسکن با وضوح بسیار بالا و تمیز نیاز دارد. اگر تصویر تمیز نباشد، تمام عیوب روی نقشه احتمالاً در نسخه دیجیتال به نقاط/خطوط/چند ضلعی های نادرست تبدیل می شوند. اگر اسکن تمیز در دسترس نباشد، اغلب سریعتر از روش دیجیتالی سازی دستی استفاده می شود. صرف نظر از این، این روش بسیار سریعتر از روش های دستی فوق الذکر است و اگر نقشه های متعدد باید دیجیتالی شوند و/یا اگر زمان یک عامل محدود کننده باشد، ممکن است بهترین گزینه باشد. اغلب، یک رویکرد نیمه خودکار استفاده میشود که به موجب آن یک نقشه اسکن و بردار میشود، و به دنبال آن یک جلسه دیجیتالی سازی سرآمیز برای ویرایش و تعمیر هر گونه خطای رخ داده در حین اتوماسیون انجام میشود.
آخرین روش جمعآوری دادههای ثانویه که شایان ذکر است، استفاده از اطلاعات گزارشها و اسناد است. از طریق این روش، فرد اطلاعات گزارش ها و اسناد را در جدول ویژگی های یک فایل GIS دیجیتالی موجود که شامل تمام نقاط، خطوط و چند ضلعی های مربوطه است، وارد می کند. به عنوان مثال، اطلاعات جدید مختص به سرشماری ممکن است پس از یک مطالعه علمی در دسترس قرار گیرد. کاربر GIS به سادگی نیاز دارد فایل GIS موجود سرشماری را دانلود کند و شروع به وارد کردن گزارش/اطلاعات سند مطالعه به طور مستقیم در جدول ویژگی ها کند. اگر جداول داده به صورت دیجیتالی در دسترس باشند، استفاده از توابع “پیوستن” و “ارتباط” در یک GIS ( بخش 5.2.2 “پیوستن و ارتباط” ) اغلب بسیار مفید است، زیرا آنها بسیاری از تلاش های ورود داده را خودکار می کنند.
خوراکی های کلیدی
- رایج ترین انواع داده های موجود برای استفاده در GIS رشته های الفبایی، اعداد، مقادیر بولی، تاریخ ها و باینری ها هستند.
- داده های اسمی و ترتیبی نشان دهنده داده های طبقه بندی هستند، در حالی که داده های فاصله و نسبت داده های عددی را نشان می دهند.
- روشهای جمعآوری دادهها از منابع اولیه یا ثانویه مشتق شدهاند.
تمرینات
-
داده های زیر از کدام مقیاس اندازه گیری به دست آمده است؟
- نمره شادی من در مقیاس 1 تا 10 = 7
- وزن من = 192 پوند.
- شهری که من در آن زندگی می کنم = شهر کالور
- دمای فعلی بدن من = 99.8 درجه فارنهایت
- تعداد چیزبرگرهایی که می توانم قبل از بیهوشی بخورم = 12 عدد
- شماره پلاک من = 1LUVG1S
- حداقل دو روش مختلف برای افزودن اطلاعات از نقشه توپوگرافی USGS به مجموعه داده های GIS خود شرح دهید.
10 نظرات