داده ها و اطلاعات

هدف یادگیری

  1. هدف این بخش، تعریف و تشریح داده ها و اطلاعات و نحوه سازماندهی آن ها در فایل ها برای استفاده در یک محیط محاسباتی و سیستم اطلاعات جغرافیایی (GIS) است.

برای درک اینکه چگونه از نقشه های آنالوگ به دیجیتال می رسیم، اجازه دهید با بلوک های ساختمانی و پایه های سیستم اطلاعات جغرافیایی (GIS) شروع کنیم – یعنی داده ها و اطلاعات . همانطور که قبلاً در موارد متعدد ذکر شد، GIS داده ها و اطلاعات را ذخیره، ویرایش، پردازش و ارائه می کند. اما داده دقیقا چیست؟ و اطلاعات دقیقا چیست؟ برای بسیاری، اصطلاحات “داده” و “اطلاعات” به یک چیز اشاره دارند. برای اهداف ما، ایجاد تمایز بین این دو مفید است. به طور کلی داده هابه حقایق، اندازه‌گیری‌ها، ویژگی‌ها یا ویژگی‌های یک شی مورد علاقه اشاره می‌کند. برای شما عزیزان دستور زبان، توجه داشته باشید که “داده” شکل جمع “datum” است. به عنوان مثال، ما می‌توانیم انواع داده‌ها را در مورد انواع چیزها جمع‌آوری کنیم، مانند طول ماهی قزل‌آلای رنگین کمان در جریان کلرادو، تعداد گیاه‌خواران در آلاسکا، قطر تنه‌های درخت ماهون در جنگل‌های بارانی برزیل، نمرات دانش‌آموزان در آخرین امتیاز. میان ترم GIS، ارتفاع قله های کوه در نپال، عمق برف در کوه های آلپ اتریش، یا تعداد افرادی که از وسایل حمل و نقل عمومی برای رسیدن به محل کار در لندن استفاده می کنند.

هنگامی که داده ها در زمینه قرار می گیرند، برای پاسخ به سؤالات استفاده می شوند، در چارچوب های تحلیلی قرار می گیرند یا برای به دست آوردن بینش استفاده می شوند، به اطلاعات تبدیل می شوند . برای اهداف ما، اطلاعاتصرفاً به دانش ارزشی اشاره دارد که از طریق جمع آوری، تفسیر و/یا تجزیه و تحلیل داده ها به دست می آید. اگرچه رایانه برای جمع آوری، ضبط، دستکاری، پردازش یا تجسم داده ها یا پردازش آنها به اطلاعات ضروری نیست، فناوری اطلاعات می تواند کمک بزرگی باشد. برای مثال، رایانه‌ها می‌توانند کارهای تکراری را خودکار کنند، داده‌ها را به طور کارآمد از نظر فضا و هزینه ذخیره کنند، و البته طیف وسیعی از ابزارها را برای تجزیه و تحلیل داده‌ها از صفحات گسترده تا GIS فراهم کنند. علاوه بر این، این واقعیت است که حجم باورنکردنی داده‌ای که هر روز توسط ماهواره‌ها، اسکنرهای محصولات فروشگاه‌های مواد غذایی، سنسورهای ترافیک، دماسنج‌ها و شرکت مخابراتی تلفن همراه شما جمع‌آوری می‌شود، بدون کمک و امکان‌پذیر نخواهد بود. نوآوری فناوری اطلاعات

از آنجایی که این متنی در مورد GIS است، تعریف داده های جغرافیایی نیز مفید است . مانند داده‌های عمومی، داده‌های جغرافیایی یا مکانی به حقایق جغرافیایی، اندازه‌گیری‌ها یا ویژگی‌های یک شی اطلاق می‌شود که به ما امکان می‌دهد مکان آن را بر روی سطح زمین تعریف کنیم. چنین داده‌هایی شامل مختصات طول و عرض جغرافیایی نقاط دیدنی، آدرس خیابان‌ها، کد پستی، مرزهای سیاسی و حتی نام مکان‌های دیدنی است. همچنین مهم است که تفاوت بین داده های جغرافیایی و داده های ویژگی را که در فصل 2 “آناتومی نقشه” مورد بحث قرار گرفت، مورد توجه و تاکید مجدد قرار گیرد.. در جایی که داده های جغرافیایی مربوط به تعیین مکان یک شی مورد علاقه است، داده های ویژگی به ویژگی ها و ویژگی های غیرجغرافیایی آن مربوط می شود.

برای نشان دادن تمایز بین داده های جغرافیایی و ویژگی، به خانه خود فکر کنید که در آن بزرگ شده اید یا جایی که در حال حاضر در آن زندگی می کنید. در چارچوب این بحث، می‌توانیم هم داده‌های جغرافیایی را مرتبط کنیم و هم داده‌ها را به آن نسبت دهیم. به عنوان مثال، ما می‌توانیم مکان خانه شما را به روش‌های مختلف تعریف کنیم، مانند آدرس خیابان، نام خیابان‌های نزدیک‌ترین تقاطع، کد پستی جایی که خانه شما در آن قرار دارد، یا می‌توانیم از یک دستگاه مجهز به سیستم موقعیت‌یابی جهانی استفاده کنیم. مختصات طول و عرض جغرافیایی را بدست آورید. آنچه مهم است این است که داده های جغرافیایی به ما اجازه می دهند مکان یک شی (یعنی خانه شما) را در سطح زمین تعریف کنیم.

علاوه بر داده های جغرافیایی که موقعیت خانه شما را مشخص می کند، داده های ویژگی هایی هستند که کیفیت های مختلف خانه شما را توصیف می کنند. چنین داده‌هایی شامل تعداد اتاق‌خواب‌ها و حمام‌های خانه‌تان، اینکه خانه‌تان گرمای مرکزی دارد یا نه، سالی که خانه‌تان ساخته شده است، تعداد ساکنان، و اینکه آیا استخر وجود دارد یا خیر، محدود نمی‌شود. این داده‌های ویژگی‌ها چیزهای زیادی در مورد خانه شما به ما می‌گویند، اما نسبتاً کمی در مورد مکان آن به ما می‌گویند.

نه تنها تشخیص و درک اینکه چگونه داده‌های جغرافیایی و ویژگی‌ها متفاوت هستند و یکدیگر را تکمیل می‌کنند مفید است، بلکه هنگام یادگیری و استفاده از GIS از اهمیت اساسی برخوردار است. از آنجایی که یک GIS به این دو نوع داده متمایز نیاز دارد و آنها را ادغام می کند، توانایی تمایز بین داده های جغرافیایی و ویژگی اولین گام در سازماندهی GIS شما است. علاوه بر این، توانایی تعیین اینکه به چه نوع داده هایی نیاز دارید، در نهایت به پیاده سازی و استفاده از GIS شما کمک می کند. بیشتر اوقات، و در عصر و زمینه فناوری اطلاعات، داده ها و اطلاعات مورد بحث تا کنون، مواردی از فایل های رایانه ای است که تمرکز بخش بعدی است.

فایل ها و فرمت های …

هنگامی که ما داده‌های مربوط به خانه، جنگل‌های بارانی یا هر چیز دیگری را جمع‌آوری می‌کنیم، معمولاً باید آنها را در جایی قرار دهیم. اگرچه ممکن است اعداد و اندازه‌ها را پشت پاکت خط‌نویسی کنیم یا روی یک صفحه کاغذ یادداشت کنیم، اما اگر بخواهیم در آینده آنها را به روز کنیم، به اشتراک بگذاریم، تجزیه و تحلیل کنیم یا نقشه برداری کنیم، اغلب مفید است که آنها را به شکل دیجیتال ضبط کنیم. تا کامپیوتر بتواند آنها را بخواند. اگرچه ما خود را با بیت ها و بایت های محاسبات خسته نمی کنیم، لازم است برخی از عناصر اساسی محاسبات را مورد بحث قرار دهیم که هم مرتبط و هم هنگام یادگیری و کار با GIS هستند.

یکی از رایج ترین عناصر کار با کامپیوتر و خود محاسبات، فایل است. فایل‌های موجود در رایانه می‌توانند شامل هر تعداد چیز از مجموعه‌ای پیچیده از دستورالعمل‌ها (مثلاً یک برنامه رایانه‌ای) تا فهرستی از اعداد و حروف (مثلاً دفترچه آدرس) باشند. علاوه بر این، فایل های کامپیوتری در اندازه ها و انواع مختلفی هستند. یکی از سرنخ هایی که می توانیم برای تشخیص یک فایل از فایل دیگر استفاده کنیم پسوند فایل است. پسوند فایل به حروفی اطلاق می شود که پس از نام فایل، نقطه (.”) را دنبال می کنند. جدول 3.1 شامل برخی از رایج ترین پسوندهای فایل و انواع فایل هایی است که با آنها مرتبط هستند.

جدول 3.1

نام فایل txt فایل متنی ساده
نام فایل .doc سند مایکروسافت ورد
نام فایل .pdf فرمت سند قابل حمل Adobe
نام فایل .jpg فایل تصویری فشرده
نام فایل .tif فرمت تصویر برچسب گذاری شده
نام فایل .html زبان نشانه گذاری فرامتن (برای ایجاد صفحات وب استفاده می شود)
نام فایل xml زبان نشانه گذاری توسعه پذیر
نام فایل .zip آرشیو فشرده/زیپ شده

برخی از برنامه‌های رایانه‌ای ممکن است قادر به خواندن یا کار با انواع فایل خاص باشند، در حالی که برخی دیگر در خواندن چندین فرمت فایل مهارت بیشتری دارند. چیزی که با شروع کار بیشتر با فناوری اطلاعات و به ویژه GIS ها متوجه خواهید شد این است که آشنایی با انواع فایل های مختلف مهم است. یادگیری نحوه تبدیل یا صادرات یک نوع فایل به دیگری نیز مهارت بسیار مفید و ارزشمندی برای به دست آوردن آن است. در این راستا، شناخت و آگاهی از نحوه شناسایی انواع فایل های مختلف و ناآشنا، بدون شک مهارت شما را با کامپیوتر و GIS افزایش می دهد.

از بین انواع فایل های متعددی که وجود دارد، یکی از رایج ترین و پر دسترسی ترین فایل ها، فایل متنی ساده ، متن ساده یا فقط فایل متنی است. فایل های متنی ساده را می توان به طور گسترده توسط برنامه های پردازش کلمه، برنامه های صفحه گسترده و پایگاه داده و مرورگرهای وب خواند. فایل های متنی که اغلب با پسوند «.txt» (یعنی filename.txt ) ختم می شوند، هیچ قالب بندی خاصی ندارند (مثلاً پررنگ ، ایتالیک ، زیرخط دار ).) و فقط شامل کاراکترهای الفبایی عددی است. به عبارت دیگر، تصاویر یا گرافیک های پیچیده برای فایل های متنی مناسب نیستند. با این حال، فایل های متنی برای ضبط، اشتراک گذاری و تبادل داده ها ایده آل هستند زیرا اکثر رایانه ها و سیستم عامل ها می توانند فایل های متنی ساده را با برنامه هایی به نام ویرایشگر متن شناسایی و بخوانند.

هنگامی که یک فایل متنی حاوی داده هایی است که به روشی سازماندهی یا ساختار یافته هستند، گاهی اوقات به آن یک فایل مسطح می گویند (اما پسوند فایل یکسان باقی می ماند، یعنی txt.). به طور کلی، فایل های مسطح در قالب جدول یا خط به خط سازماندهی می شوند. به عبارت دیگر، هر خط یا ردیف فایل حاوی یک و تنها یک رکورد است. بنابراین اگر اندازه‌گیری‌های قد را روی سه نفر، تیم، جیک، و هری جمع‌آوری کنیم، فایل ممکن است چیزی شبیه به این باشد:

نام ارتفاع
تیم 6’1”
جیک 5’9″
هری 6’2″

هر ردیف مربوط به یک و تنها یک رکورد، مشاهده یا مورد است. دو عنصر مهم دیگر در مورد این فایل وجود دارد. ابتدا توجه داشته باشید که ردیف اول حاوی هیچ داده ای نیست. بلکه توصیفی از داده های موجود در هر ستون را ارائه می دهد. هنگامی که ردیف اول یک فایل حاوی چنین توصیفگرهایی باشد، به آن ردیف سرصفحه یا فقط سرصفحه گفته می شود. به ستون‌های یک فایل مسطح، فیلد، متغیر یا ویژگی نیز گفته می‌شود . “Height” ویژگی، فیلد یا متغیری است که ما به آن علاقه مندیم و مشاهدات یا موارد موجود در مجموعه داده های ما “Tim”، “Jake” و “Harry” هستند. به طور خلاصه، ردیف ها برای رکوردها هستند. ستون ها برای فیلدها هستند.

دومین عنصر نادیده اما حیاتی فایل، فاصله های بین هر ستون یا فیلد است. در مثال، به نظر می رسد که یک فاصله ستون “name” را از ستون “ارتفاع” جدا می کند. با این حال، پس از بررسی دقیق تر، توجه کنید که مقادیر اولیه ستون “ارتفاع” چگونه تراز می شوند. اگر از یک فاصله برای جدا کردن هر ستون استفاده می شد، ستون ارتفاع تراز نمی شد. در این مورد از یک تب برای جداسازی ستون های هر سطر استفاده می شود. کاراکتری که برای جداسازی ستون ها در یک فایل مسطح استفاده می شود، جداکننده یا جداکننده نامیده می شود. اگرچه هر کاراکتری را می توان به عنوان جداکننده استفاده کرد، رایج ترین جداکننده ها عبارتند از تب، کاما و یک فاصله. در زیر نمونه هایی از هر کدام آورده شده است.

Tab-Limited تک فضا-محدود شده با کاما جدا شده
اسم ارتفاع اسم ارتفاع نام، قد
تیم 6.1 تیم 6.1 تیم، 6.1
جیک 5.9 جیک 5.9 جیک، 5.9
هری 6.2 هری 6.2 هری، 6.2

دانستن جداکننده یک فایل مسطح مهم است زیرا ما را قادر می سازد تا ستون ها را به طور موثر و بدون خطا تشخیص داده و جدا کنیم. گاهی اوقات چنین فایل‌هایی با جداکننده‌شان ارجاع می‌شوند، مانند فایل «مقادیر جداشده با کاما» یا فایل «تقسیم‌بندی‌شده با تب».

هنگام ثبت و کار با داده های جغرافیایی، همان قالب کلی اعمال می شود. سطرها برای رکوردها رزرو می شوند یا در مورد داده های جغرافیایی، مکان ها و ستون ها یا فیلدها برای ویژگی ها یا متغیرهای مرتبط با هر مکان استفاده می شوند. به عنوان مثال، فایل مسطح جداشده با برگه زیر حاوی داده‌هایی برای سه مکان (یعنی کشورها) و سه ویژگی یا ویژگی هر کشور (یعنی جمعیت، زبان، قاره) است که در سربرگ ذکر شده است.

کشور جمعیت زبان قاره
فرانسه 65,000,000 فرانسوی اروپا
برزیل 192,000,000 پرتغالی آمریکای جنوبی
استرالیا 22,000,000 انگلیسی استرالیا

فایل‌هایی مانند مواردی که در اینجا ارائه می‌شوند، بلوک‌های سازنده جداول، نمودارها، گزارش‌ها، نمودارها و سایر تجسم‌های مختلف هستند که هر روز به صورت آنلاین، چاپی و تلویزیونی می‌بینیم. آنها همچنین اجزای کلیدی نقشه ها و نمایش های جغرافیایی ایجاد شده توسط GIS هستند. با این حال، به ندرت با یک و تنها یک فایل یا نوع فایل کار می کنید. اغلب اوقات، و به خصوص هنگام کار با GIS، با چندین فایل کار خواهید کرد. به چنین گروه بندی فایل های متعدد پایگاه داده می گویند. از آنجایی که فایل‌های داخل یک پایگاه داده ممکن است اندازه، شکل و حتی فرمت‌های متفاوتی داشته باشند، ما باید نوعی سیستم را ابداع کنیم که به ما امکان کار، به‌روزرسانی، ویرایش، ادغام، اشتراک‌گذاری و نمایش داده‌های مختلف در پایگاه داده را بدهد. چنین سیستمی به طور کلی به عنوان سیستم مدیریت پایگاه داده (DBMS) نامیده می شود. پایگاه های داده و DBMS ها به قدری برای GIS مهم هستند که فصل بعدی به آنها اختصاص داده شده است. در حال حاضر کافی است به یاد داشته باشید که انواع فایل ها مانند بستنی هستند – آنها در طعم های مختلف هستند. در پرتو چنین تنوعی، بخش 3.2 “داده‌های مربوط به داده‌ها” برخی از مسائل کلیدی را که باید در هنگام جمع‌آوری و کار با داده‌ها و اطلاعات برای GIS در نظر گرفته شوند، توضیح می‌دهد.

خوراکی های کلیدی

  • داده ها به حقایق، اندازه گیری ها یا ویژگی های خاص اشیاء و پدیده های مورد علاقه اشاره دارند.
  • اطلاعات به دانش ارزشی اشاره دارد که از تجزیه و تحلیل داده ها به دست می آید.

تمرینات

  1. تفاوت بین داده و اطلاعات چیست؟
  2. تفاوت بین داده های مکانی و ویژگی چیست؟
  3. هر یک از فایل های جدول 3.1 را با توجه به پسوند آنها شناسایی کنید.
  4. سه فایل متنی ساده یا فلت مختلف را جستجو و دانلود کنید. آنها را در یک واژه پرداز و برنامه صفحه گسترده باز کنید. از تابع جستجو و جایگزینی برای تغییر جداکننده ها (به عنوان مثال، از کاما به برگه ها یا برعکس) استفاده کنید.
  5. اداره سرشماری ایالات متحده داده های مکانی را به صورت فایل های TIGER توزیع می کند. آنها چه هستند؟
  6. منابع و وب سایت هایی را در اینترنت شناسایی کنید که می توانند به شما در درک پسوند فایل کمک کنند.

7 نظرات

دیدگاهتان را بنویسید