هدف یادگیری

  1. هدف از این بخش معرفی انواع داده ها، مقیاس های اندازه گیری و روش های جمع آوری داده ها می باشد.

کسب داده های جغرافیایی یک عامل مهم در هر تلاش سیستم اطلاعات جغرافیایی (GIS) است. تخمین زده شده است که جمع‌آوری داده‌ها معمولاً 60 تا 80 درصد از زمان و هزینه‌ای را که صرف هر پروژه می‌شود مصرف می‌کند. بنابراین، باید دقت شود که پروژه های GIS به اهداف اعلام شده خود توجه داشته باشند تا جمع آوری داده های مکانی به شیوه ای کارآمد و موثر پیش برود. این فصل به تشریح بسیاری از اشکال و منابع داده های مکانی موجود برای استفاده در GIS می پردازد.

انواع داده ها

نوع داده ای که ما برای کمک به درک یک موجودیت خاص به کار می بریم با (1) آنچه در حال بررسی هستیم، (2) آنچه می خواهیم در مورد آن موجودیت بدانیم، و (3) توانایی ما برای اندازه گیری آن موجودیت در مورد دلخواه تعیین می شود. مقیاس رایج ترین انواع داده های موجود برای استفاده در GIS رشته های الفبایی، اعداد، مقادیر بولی، تاریخ ها و باینری ها هستند.

یک رشته الفبایی ، یا متن، نوع داده هر ترکیب ساده ای از حروف و اعداد است که ممکن است کلمات منسجمی را تشکیل دهند یا نباشند. نوع داده اعداد را می توان به صورت ممیز شناور یا عدد صحیح طبقه بندی کرد. ممیز شناور هر مقدار داده ای است که شامل اعداد اعشاری و یک عدد صحیح استهر مقدار داده ای است که شامل ارقام اعشاری نباشد. اعداد صحیح بسته به تعداد ارقام مهم در آن عدد می توانند کوتاه یا بلند باشند. همچنین، آنها بر اساس مفهوم “بیت” در یک کامپیوتر هستند. همانطور که ممکن است به خاطر داشته باشید، یک بیت اساسی ترین واحد اطلاعات در یک کامپیوتر است و مقادیر را در یکی از دو حالت ذخیره می کند: 1 یا 0. بنابراین، یک ویژگی 8 بیتی از هشت 1 یا 0 در هر ترکیبی تشکیل می شود (به عنوان مثال، 10010011, 00011011, 11100111).

اعداد صحیح کوتاه مقادیر 16 بیتی هستند و بنابراین می‌توانند برای مشخص کردن اعداد از 32768- تا 32767 یا از 0 تا 65535 بسته به اینکه عدد علامت داشته باشد یا بدون علامت (یعنی دارای علامت + یا – باشد) استفاده شود. اعداد صحیح طولانی ، به طور متناوب، مقادیر 32 بیتی هستند و بنابراین می توانند اعدادی را از 2,147,483,648- تا 2,147,483,647 یا از 0 تا 4,294,967,295 مشخص کنند.

یک مقدار دقیق ممیز شناور ، مانند عدد صحیح طولانی، 32 بیت را اشغال می کند. با این حال، این نوع داده مقدار حداکثر 7 بیت را در سمت چپ اعشار (حداکثر مقدار 128 یا 127 در صورت امضا) و حداکثر مقادیر 23 بیتی را در سمت راست اعشار (تقریباً 7 اعشاری) ارائه می‌کند. ارقام). یک مقدار ممیز شناور با دقت دوگانه اساساً دو مقدار 32 بیتی را به عنوان یک مقدار واحد ذخیره می کند. بنابراین، شناورهای با دقت دوگانه، می‌توانند مقداری را با حداکثر 11 بیت در سمت چپ اعشار و مقادیری با حداکثر 52 بیت در سمت راست اعشار (تقریباً 16 رقم اعشاری) نشان دهند ( شکل 5.1 “نقطه شناور با دقت دوگانه” (مقدار 64 بیتی)، همانطور که در یک کامپیوتر ذخیره شده است” ).

شکل 5.1 ممیز شناور دقیق دوگانه (مقدار 64 بیتی)، همانطور که در یک کامپیوتر ذخیره می شود

مقادیر بولی، تاریخ و باینری پیچیدگی کمتری دارند. مقادیر بولی صرفاً آن دسته از مقادیری هستند که بر اساس اعمال یک عملگر بولی مانند AND، OR، و NOT درست یا نادرست در نظر گرفته می شوند. نوع داده تاریخ احتمالاً خود توضیحی است، در حالی که نوع داده باینری ویژگی هایی را نشان می دهد که مقادیر آنها 1 یا 0 است.

مقیاس اندازه گیری

علاوه بر تعریف داده ها بر اساس نوع، یک مقیاس اندازه گیری برای گروه بندی داده ها بر اساس سطح پیچیدگی عمل می کند (استیونز 1946). استیونز، SS 1946. “در نظریه مقیاس های اندازه گیری.” علم 103 (2684): 677-80. برای اهداف تجزیه و تحلیل GIS، مقیاس های اندازه گیری را می توان به دو دسته کلی دسته بندی کرد. داده های اسمی و ترتیبی نشان دهنده داده های طبقه بندی هستند. داده های بازه و نسبت نشان دهنده داده های عددی است .

ساده ترین مقیاس اندازه گیری داده ها، مقیاس اسمی یا نامی است. مقیاس اسمی بیان می کند که چه چیزی را باید نقاط داده نامید، اما اجازه مقایسه اسکالر بین یک شی و شی دیگر را نمی دهد. به عنوان مثال، نسبت دادن اطلاعات اسمی به مجموعه‌ای از نقاط که شهرها را نشان می‌دهند، توضیح می‌دهد که منطقه داده‌شده «لس آنجلس» یا «نیویورک» است. با این حال، هیچ نشانه دیگری، مانند جمعیت یا تاریخچه رای‌گیری، نمی‌توان در مورد آن مناطق بیان کرد. نمونه های دیگر داده های اسمی شامل نام خانوادگی، رنگ چشم، نوع کاربری زمین، قومیت و جنسیت است.

داده‌های ترتیبی اطلاعات ویژگی‌ها را در رتبه‌بندی قرار می‌دهند و بنابراین اطلاعات دقیق‌تری نسبت به داده‌های اسمی به دست می‌دهند. داده های ترتیبی موقعیتی را توصیف می کنند که داده ها در آن رخ می دهند، مانند اول، دوم، سوم و غیره. این مقیاس‌ها ممکن است نام‌هایی مانند «بسیار ناراضی»، «ناراضی»، «راضی» و «بسیار راضی» به خود بگیرند. اگرچه این مقیاس اندازه گیری رتبه بندی هر نقطه داده را نسبت به سایر نقاط داده نشان می دهد، اما مقیاس ترتیبی به صراحت تفاوت کمی دقیق بین این رتبه بندی ها را نشان نمی دهد. به عنوان مثال، اگر یک ویژگی ترتیبی نشان دهد که کدام دونده در جایگاه اول، دوم یا سوم قرار گرفته است، نشان نمی دهد که دونده برنده با چه مدت زمان دونده مقام دوم را شکست داده است. بنابراین، نمی توان عملیات حسابی را با داده های ترتیبی انجام داد. فقط دنباله صریح است.

مقیاس اندازه گیری که اجازه می دهد گزاره های کمی دقیق در مورد ویژگی ها ارائه شود، داده های بازه ای است . داده‌های بازه‌ای در امتداد مقیاسی اندازه‌گیری می‌شوند که در آن هر موقعیت با یکدیگر فاصله دارد. خوانش ارتفاع و دما نمایش های رایج داده های بازه ای هستند. برای مثال، از طریق این مقیاس می توان تعیین کرد که 30 درجه فارنهایت، 5 درجه فارنهایت گرمتر از 25 درجه فارنهایت است. ویژگی قابل توجه مقیاس فاصله این است که صفر یک مقدار معنادار نیست به این معنا که صفر نشان دهنده نیستی یا عدم وجود یک مقدار نیست. در واقع، 0 درجه فارنهایت نشان نمی دهد که دما وجود ندارد. به طور مشابه، ارتفاع 0 فوت نشان دهنده کمبود ارتفاع نیست. بلکه میانگین سطح دریا را نشان می دهد.

داده های نسبت مشابه مقیاس اندازه گیری فاصله است. با این حال، حول یک مقدار صفر معنادار است. تراکم جمعیت نمونه ای از داده های نسبت است که به موجب آن تراکم جمعیت 0 نشان می دهد که هیچ فردی در منطقه مورد علاقه زندگی نمی کند. به طور مشابه، مقیاس دمای کلوین یک مقیاس نسبت است زیرا 0 K نشان می دهد که هیچ گرمایی (دما) در ویژگی داده شده قابل اندازه گیری نیست.

برای مجموعه داده های عددی، مقادیر داده نیز می توانند گسسته یا پیوسته در نظر گرفته شوند. داده های گسسته آنهایی هستند که تعداد محدودی از مقادیر ممکن را حفظ می کنند، در حالی که داده های پیوسته را می توان با تعداد نامحدودی از مقادیر نشان داد. به عنوان مثال، تعداد درختان بالغ در یک ملک کوچک لزوماً بین یک تا صد (به خاطر استدلال) خواهد بود. با این حال، ارتفاع آن درختان نشان دهنده یک مقدار داده پیوسته است زیرا تعداد نامتناهی از مقادیر بالقوه وجود دارد (به عنوان مثال، یک درخت ممکن است 20 فوت قد، 20.1 فوت، یا 20.15 فوت، 20.157 فوت، و غیره باشد).

جمع آوری داده های اولیه

اکنون که ما از انواع مختلف داده‌ها و مقیاس‌های اندازه‌گیری موجود برای استفاده در GIS آگاهی داریم، باید افکار خود را به این موضوع هدایت کنیم که چگونه می‌توان این داده‌ها را به دست آورد. جمع آوری داده های اولیه یک روش اکتساب مستقیم داده است که معمولاً با نوعی تلاش در زمینه مرتبط است. در مورد داده های برداری، داده های مستقیم گرفته شده معمولاً از یک سیستم موقعیت یابی جهانی (GPS) یا انواع دیگر تجهیزات نقشه برداری مانند یک ایستگاه کل می آیند ( شکل 5.2 “واحد GPS (چپ) و ایستگاه کل (راست)””). ایستگاه‌های توتال ابزارهای تخصصی و اولیه جمع‌آوری داده‌ها هستند که یک تئودولیت (یا ترانزیت)، که زوایای افقی و عمودی را اندازه‌گیری می‌کند، با ابزاری برای اندازه‌گیری فاصله شیب از واحد تا یک نقطه مشاهده‌شده ترکیب می‌کنند. استفاده از ایستگاه توتال به خدمه میدانی اجازه می‌دهد تا توپوگرافی یک منظره خاص را به سرعت و با دقت استخراج کنند.

شکل 5.2 واحد GPS (چپ) و توتال استیشن (راست)

در مورد GPS، واحدهای دستی به داده های موقعیتی از ماهواره ها دسترسی دارند و اطلاعات را برای بازیابی بعدی ثبت می کنند. شبکه ای متشکل از بیست و چهار ماهواره ناوبری در سرتاسر کره زمین قرار دارد و اطلاعات مختصات دقیقی را برای هر نقطه از سطح زمین ارائه می دهد ( شکل 5.3 “تصویربرداری زمین از ماهواره با گرفتن داده های اولیه”). حفظ خط دید چهار یا بیشتر از این ماهواره ها اطلاعات موقعیت مکانی نسبتاً دقیقی را در اختیار کاربر قرار می دهد. این مکان‌ها را می‌توان به‌عنوان نقاط مجزا جمع‌آوری کرد یا بسته به ترجیح کاربر، می‌توان آنها را به یکدیگر پیوند داد تا خطوط یا چندضلعی‌ها را تشکیل دهند. داده های ویژگی مانند نوع کاربری زمین، شماره قطب تلفن و نام رودخانه می توانند به طور همزمان توسط کاربر وارد شوند. سپس این داده های مکان و ویژگی را می توان برای تجسم در GIS بارگذاری کرد. بسته به نوع و مدل GPS، این آپلود اغلب به نوعی تبدیل فایل میانی از طریق نرم افزار ارائه شده توسط سازنده واحد GPS نیاز دارد. با این حال، برخی منابع آنلاین رایگان وجود دارد که می تواند داده های GPS را از یک فرمت به فرمت دیگر تبدیل کند. GPSBabel نمونه ای از چنین منبع آنلاینی است ( https://www.gpsvisualizer.com/gpsbabel).

علاوه بر واحد GPS معمولی نشان داده شده در شکل 5.2 “واحد GPS (سمت چپ) و ایستگاه توتال (راست)” ، GPS به طور فزاینده ای در دیگر فناوری های جدید گنجانده می شود. به عنوان مثال، تلفن های هوشمند اکنون قابلیت های GPS را به عنوان یک جزء تکنولوژیکی استاندارد تعبیه کرده اند. این واحدهای تلفن/GPS دقت قابل مقایسه با واحدهای GPS مستقل با قیمت مشابه دارند و تا حد زیادی مسئول تجدید حیات در تسهیل جمع‌آوری و اشتراک‌گذاری داده‌های قابل حمل و بلادرنگ با توده‌ها هستند. فراگیر شدن این فناوری منجر به گسترش جایگزین های جمع آوری داده های جمع سپاری شده است. جمع سپارییک روش جمع‌آوری داده است که به موجب آن کاربران آزادانه در ساخت پایگاه‌های اطلاعاتی فضایی مشارکت می‌کنند. این روش به سرعت در حال گسترش در برنامه هایی مانند برنامه MapShare TomTom، Google Earth، Bing Maps و ArcGIS استفاده می شود.

داده‌های شطرنجی به‌دست‌آمده از طریق ضبط مستقیم معمولاً از منابع سنجش از راه دور به دست می‌آیند ( شکل 5.3 “تصویربرداری از زمین ماهواره‌ای ثبت داده‌های اولیه” ). داده های سنجش از راه دور این مزیت را ارائه می دهد که نیاز به دسترسی فیزیکی به منطقه ای که تصویربرداری می شود را حذف می کند. علاوه بر این، بخش‌های عظیم زمین را می‌توان با صرف زمان و کار اضافی توسط محقق مشخص کرد. از سوی دیگر، اعتبارسنجی برای داده های سنجش از راه دور مورد نیاز است تا اطمینان حاصل شود که حسگر نه تنها به درستی کار می کند، بلکه برای جمع آوری اطلاعات مورد نظر به درستی کالیبره شده است. ماهواره‌ها و دوربین‌های هوایی فراگیرترین منابع داده‌های شطرنجی را فراهم می‌کنند ( فصل 4 «مدل‌های داده برای GIS» ، بخش 4.3.1 «تصاویر ماهواره‌ای» ).

شکل 5.3 تصویربرداری زمین از ماهواره که داده های اولیه را می گیرد

جمع آوری داده های ثانویه

جمع آوری داده های ثانویهیک روش غیرمستقیم است که از حجم وسیعی از داده‌های مکانی موجود در هر دو فرمت دیجیتال و نسخه چاپی استفاده می‌کند. قبل از شروع هر تلاش GIS، همیشه عاقلانه است که منابع آنلاین برای داده های GIS موجود استخراج کنید که ممکن است نیازهای نقشه برداری شما را بدون گام بالقوه فشرده ایجاد داده از ابتدا برآورده کند. چنین داده های دیجیتال GIS از منابع مختلف از جمله آژانس های بین المللی (CGIAR، CIESIN، سازمان ملل، بانک جهانی و غیره) در دسترس هستند. دولت های فدرال (USGS، USDA، NOAA، USFWS، NASA، EPA، سرشماری ایالات متحده و غیره)؛ دولت های ایالتی (CDFG، Teale Data Center، INGIS، MARIS، NH GIS Resources، و غیره)؛ دولت های محلی (SANDAG، RCLIS، و غیره)؛ وب سایت های دانشگاه (UCLA، دوک، استنفورد، دانشگاه شیکاگو، پورتال داده های فضایی ایندیانا، و غیره)؛ و وب سایت های تجاری (ESRI، GeoEye، Geocomm، و غیره). این داده‌های ثانویه در طیف گسترده‌ای از انواع فایل‌ها، گستره‌ها و اندازه‌ها در دسترس هستند، اما برای استفاده در اکثر بسته‌های نرم‌افزار GIS آماده هستند. اغلب این داده ها رایگان هستند، اما بسیاری از سایت ها برای دسترسی به اطلاعات اختصاصی که توسعه داده اند، هزینه ای دریافت می کنند.

اگرچه این منابع داده همه مواردی هستند که اطلاعات به فرمت دیجیتال تبدیل شده و به درستی برای استفاده در یک GIS پیش بینی شده است، اطلاعات مکانی زیادی نیز وجود دارد که می توان از منابع موجود و غیر دیجیتالی به دست آورد. به عنوان مثال، نقشه های کاغذی ممکن است حاوی اطلاعات فعلی یا تاریخی در یک منطقه باشد که در قالب دیجیتال یافت نمی شود. در این حالت می توان از فرآیند دیجیتالی سازی برای ایجاد فایل های دیجیتال از نسخه اصلی کاغذ استفاده کرد. سه روش اصلی برای دیجیتالی کردن اطلاعات مکانی وجود دارد: دو روش دستی و یکی خودکار.

دیجیتالی کردن تبلت یک روش جمع‌آوری دستی داده است که به موجب آن کاربر اطلاعات مختصات را از طریق استفاده از تبلت دیجیتالی و یک عدد دیجیتالی وارد رایانه می‌کند. برای شروع، یک نقشه کاغذی روی یک تبلت دیجیتالی با نور پس زمینه ایمن می شود. نور پس زمینه اجازه می دهد تا تمام ویژگی های روی نقشه را به راحتی مشاهده کنید که باعث کاهش خستگی چشم می شود. سپس مختصات ویژگی‌های نقطه، خط و/یا چند ضلعی روی نقشه کاغذی در یک فایل دیجیتالی وارد می‌شود، زیرا کاربر با استفاده از یک پوک، که شبیه به یک موش چند دکمه‌ای است، برای “کلیک” کردن در مسیر خود در اطراف آن استفاده می‌کند. رئوس هر ویژگی مورد نظر پس از تکمیل کار دیجیتالی کردن، فایل دیجیتالی حاصل باید به درستی ارجاع جغرافیایی داده شود تا اطمینان حاصل شود که این اطلاعات به درستی با مجموعه داده‌های موجود هماهنگ می‌شوند.

هدآپ دیجیتالی کردن، دومین روش جمع‌آوری دستی داده‌ها، به عنوان دیجیتال‌سازی «روی صفحه» نامیده می‌شود. دیجیتالی سازی Heads-up را می توان بر روی نقشه های کاغذی یا فایل های دیجیتال موجود استفاده کرد. در مورد نقشه کاغذی، ابتدا باید نقشه را با وضوح کافی در رایانه اسکن کرد که امکان حل همه ویژگی های مربوطه را فراهم کند. دوم، تصویر اکنون دیجیتال باید ثبت شود تا نقشه با یک سیستم مختصات موجود مطابقت داشته باشد. برای انجام این کار، کاربر می تواند نقاط کنترل را روی صفحه وارد کرده و تصویر اسکن شده را به مختصات دنیای واقعی تبدیل کند. در نهایت، کاربر به سادگی به مناطق خاصی روی نقشه زوم می کند و نقاط، خطوط و/یا چند ضلعی ها را شبیه به مثال دیجیتالی کردن تبلت ردیابی می کند. زمانی که فایل‌های GIS، تصاویر ماهواره‌ای یا عکس‌های هوایی موجود به‌عنوان خط مبنا استفاده می‌شوند، دیجیتالی‌سازی هدآپ بسیار ساده است.

سومین روش خودکار جمع‌آوری داده‌های ثانویه، کاربر را ملزم می‌کند تا نقشه کاغذی را اسکن کرده و اطلاعات موجود در آن را بردارید. این برداریروش معمولاً به یک بسته نرم افزاری خاص نیاز دارد که بتواند اسکن شطرنجی را به خطوط برداری تبدیل کند. این به یک اسکن با وضوح بسیار بالا و تمیز نیاز دارد. اگر تصویر تمیز نباشد، تمام عیوب روی نقشه احتمالاً در نسخه دیجیتال به نقاط/خطوط/چند ضلعی های نادرست تبدیل می شوند. اگر اسکن تمیز در دسترس نباشد، اغلب سریعتر از روش دیجیتالی سازی دستی استفاده می شود. صرف نظر از این، این روش بسیار سریعتر از روش های دستی فوق الذکر است و اگر نقشه های متعدد باید دیجیتالی شوند و/یا اگر زمان یک عامل محدود کننده باشد، ممکن است بهترین گزینه باشد. اغلب، یک رویکرد نیمه خودکار استفاده می‌شود که به موجب آن یک نقشه اسکن و بردار می‌شود، و به دنبال آن یک جلسه دیجیتالی سازی سرآمیز برای ویرایش و تعمیر هر گونه خطای رخ داده در حین اتوماسیون انجام می‌شود.

آخرین روش جمع‌آوری داده‌های ثانویه که شایان ذکر است، استفاده از اطلاعات گزارش‌ها و اسناد است. از طریق این روش، فرد اطلاعات گزارش ها و اسناد را در جدول ویژگی های یک فایل GIS دیجیتالی موجود که شامل تمام نقاط، خطوط و چند ضلعی های مربوطه است، وارد می کند. به عنوان مثال، اطلاعات جدید مختص به سرشماری ممکن است پس از یک مطالعه علمی در دسترس قرار گیرد. کاربر GIS به سادگی نیاز دارد فایل GIS موجود سرشماری را دانلود کند و شروع به وارد کردن گزارش/اطلاعات سند مطالعه به طور مستقیم در جدول ویژگی ها کند. اگر جداول داده به صورت دیجیتالی در دسترس باشند، استفاده از توابع “پیوستن” و “ارتباط” در یک GIS ( بخش 5.2.2 “پیوستن و ارتباط” ) اغلب بسیار مفید است، زیرا آنها بسیاری از تلاش های ورود داده را خودکار می کنند.

خوراکی های کلیدی

  • رایج ترین انواع داده های موجود برای استفاده در GIS رشته های الفبایی، اعداد، مقادیر بولی، تاریخ ها و باینری ها هستند.
  • داده های اسمی و ترتیبی نشان دهنده داده های طبقه بندی هستند، در حالی که داده های فاصله و نسبت داده های عددی را نشان می دهند.
  • روش‌های جمع‌آوری داده‌ها از منابع اولیه یا ثانویه مشتق شده‌اند.

تمرینات

  1. داده های زیر از کدام مقیاس اندازه گیری به دست آمده است؟

    1. نمره شادی من در مقیاس 1 تا 10 = 7
    2. وزن من = 192 پوند.
    3. شهری که من در آن زندگی می کنم = شهر کالور
    4. دمای فعلی بدن من = 99.8 درجه فارنهایت
    5. تعداد چیزبرگرهایی که می توانم قبل از بیهوشی بخورم = 12 عدد
    6. شماره پلاک من = 1LUVG1S
  2. حداقل دو روش مختلف برای افزودن اطلاعات از نقشه توپوگرافی USGS به مجموعه داده های GIS خود شرح دهید.

10 نظرات

دیدگاهتان را بنویسید