هدف یادگیری

  1. هدف این بخش شناسایی و ارزیابی ملاحظات کلیدی هنگام جستجوی داده است.

اکنون که درک اولیه ای از داده ها و اطلاعات داریم، کجا می توانیم چنین داده ها و اطلاعاتی را پیدا کنیم؟ اگرچه یک جستجوی اینترنتی مطمئناً با منابع و انواع بی‌شماری داده به دست می‌آید، جستجو برای داده‌های مرتبط و مفید اغلب فرآیندی چالش برانگیز و تکراری است. بنابراین، قبل از پرش آنلاین و دانلود اولین چیزی که از جستجوی وب ظاهر می شود، مفید است که جستجوی خود را برای داده ها با سؤالات و ملاحظات زیر چارچوب بندی کنیم:

  1. دقیقا چیهدف از داده ها است؟ با توجه به این واقعیت که جهان در حجم وسیعی از داده ها شناور است، بیان اینکه چرا به مجموعه ای از داده ها نیاز داریم (یا چرا به آنها نیاز نداریم) جستجو برای داده های مفید و مرتبط را ساده می کند. برای این منظور، هرچه بتوانیم در مورد هدف داده های مورد نیاز دقیق تر باشیم، جستجوی ما برای داده ها کارآمدتر خواهد بود. به عنوان مثال، اگر ما علاقه مند به درک و مطالعه رشد اقتصادی هستیم، تعیین مقیاس های زمانی و جغرافیایی مفید است. به عبارت دیگر، برای چه دوره‌های زمانی (مثلاً 1850-1900) و بازه‌های زمانی (مثلاً فصلی، سالانه) و در چه سطحی از تحلیل (مثلاً ملی، منطقه‌ای، ایالتی) علاقه‌مندیم؟ اغلب اوقات، در دسترس بودن داده ها، یا به طور خاص، فقدان داده های مرتبط، ما را مجبور می کند که هدف یا دامنه سؤال اصلی خود را تغییر دهیم.
  2. سوال دومی که باید از خود بپرسیم این است که چه داده هایی از قبل وجود دارد و ما قبلاً به چه داده هایی دسترسی داریم؟ قبل از جستجوی داده‌های جدید، همیشه ایده خوبی است که فهرستی از داده‌هایی که از قبل در اختیار داریم تهیه کنیم. چنین داده‌هایی ممکن است از پروژه‌ها یا تحلیل‌های قبلی یا از همکاران و همکلاسی‌هایشان باشد، اما نکته کلیدی در اینجا این است که می‌توانیم با استفاده از داده‌هایی که از قبل در اختیار داریم، در زمان و تلاش زیادی صرفه‌جویی کنیم. علاوه بر این، با شناسایی آنچه داریم، درک بهتری از آنچه نیاز داریم به دست می آوریم. به عنوان مثال، اگرچه ممکن است قبلاً داده‌های سرشماری (یعنی داده‌های ویژگی) داشته باشیم، ممکن است به داده‌های جغرافیایی به‌روزشده‌ای نیاز داشته باشیم که شامل مرزهای ایالت‌ها یا شهرستان‌های ایالات متحده باشد.
  3. در مرحله بعد، ما باید هزینه های مربوط به جمع آوری داده ها را ارزیابی و ارزیابی کنیم. هزینه های جمع آوری داده ها فراتر از هزینه های مالی است. به همان اندازه که هزینه‌های مالی داده‌ها مهم هستند، هزینه‌هایی هستند که زمان شما را در بر می‌گیرند. بالاخره زمان پول است. زمان و انرژی که برای جمع آوری، یافتن، تمیز کردن و قالب بندی داده ها صرف می کنید، زمان و انرژی است که از تجزیه و تحلیل داده ها گرفته می شود. بسته به ضرب‌الاجل‌ها، محدودیت‌های زمانی و تحویل‌پذیری‌ها، یادگیری نحوه مدیریت زمان در هنگام جستجوی داده بسیار مهم است.
  4. در نهایت، فرمت داده های مورد نیاز از اهمیت حیاتی برخوردار است. اگرچه بسیاری از برنامه‌ها می‌توانند فرمت‌های زیادی از داده‌ها را بخوانند، برخی از انواع داده‌ها هستند که فقط توسط برخی برنامه‌ها قابل خواندن هستند و برخی برنامه‌ها که به فرمت‌های داده خاصی نیاز دارند. درک اینکه از چه قالب های داده ای می توانید استفاده کنید و آن هایی که نمی توانید به جستجوی داده ها کمک می کند. به عنوان مثال، یکی از رایج ترین اشکال داده های سیستم اطلاعات جغرافیایی (GIS) شکل فایل نامیده می شود .. همه برنامه‌های GIS نمی‌توانند فایل‌های شیپ را بخوانند یا از آن استفاده کنند، اما ممکن است لازم باشد به یا از یک فایل شیپ یا فرمت دیگری تبدیل شود. از این رو، همانطور که قبلاً اشاره شد، هر چه قالب‌های داده‌ای که با آن‌ها بیشتر آشنا باشیم، در جستجوی داده‌ها وضعیت بهتری خواهیم داشت، زیرا نه تنها درک درستی از آنچه می‌توانیم استفاده کنیم، بلکه در مورد تبدیل فرمت‌هایی نیز خواهیم داشت که باید انجام شوند. در صورت لزوم

همه این سؤالات از اهمیت یکسانی برخوردار هستند و توانایی پاسخ به آنها به جستجوی کارآمدتر و مؤثرتر برای داده ها کمک می کند. بدیهی است که چندین ملاحظات دیگر پشت جستجوی داده‌ها و به‌ویژه داده‌های GIS وجود دارد، اما مواردی که در اینجا فهرست شده‌اند یک مسیر اولیه برای جستجوی موفقیت‌آمیز داده‌ها را فراهم می‌کنند.

با تکامل فناوری اطلاعات و با جمع‌آوری و توزیع داده‌های بیشتر، اشکال مختلف داده‌ای که می‌توان با GIS استفاده کرد افزایش می‌یابد. به طور کلی، و همانطور که قبلاً بحث شد، یک GIS از دو نوع داده استفاده می کند و ادغام می کند: داده های جغرافیایی و داده های ویژگی. گاهی اوقات منبع داده‌های جغرافیایی و ویژگی‌ها یکی هستند. به عنوان مثال، اداره سرشماری ایالات متحده ( https://www.census.gov ) فایل های مرزی جغرافیایی (به عنوان مثال، سطح سرشماری، سطح شهرستان، سطح ایالت) و همچنین داده های ویژگی مرتبط (مانند جمعیت، نژاد/) را توزیع می کند. قومیت، درآمد). چه چیزی بیشتر این است که چنین داده هایی به صورت رایگان و بدون هزینه در دسترس هستند. از بسیاری جهات، داده های سرشماری ایالات متحده استثنایی هستند: آنها رایگان و جامع هستند. اگر همه داده ها رایگان و جامع بودند!

بدیهی است که هر جستجو برای داده ها بسته به هدف متفاوت خواهد بود، اما داده های دولت ها معمولاً پوشش خوبی دارند و نقطه مرجعی را ارائه می دهند که از آن می توان داده های دیگر را اضافه، مقایسه و ارزیابی کرد. چه به داده های تصاویر ماهواره ای از سازمان ملی هوانوردی و فضایی ( https://www.nasa.gov ) یا به داده های استفاده از زمین از سازمان زمین شناسی ایالات متحده ( https://www.usgs.gov ) نیاز داشته باشید، چنین منابع دولتی تمایل دارند قابل اعتماد، معتبر و سازگار باشد. یکی دیگر از عناصر کلیدی بیشتر داده های دولتی این است که آنها به صورت آزاد در دسترس عموم هستند. به عبارت دیگر، هیچ هزینه ای برای استفاده یا به دست آوردن داده ها وجود ندارد. داده هایی که برای استفاده رایگان هستند عموماً داده های عمومی نامیده می شوند .

برخلاف داده‌های در دسترس عموم، منابع متعددی از داده‌های خصوصی یا اختصاصی وجود دارد. تفاوت اصلی بین داده های عمومی و خصوصی این است که اولی رایگان است و دومی باید با هزینه به دست آید. علاوه بر این، اغلب محدودیت‌هایی برای توزیع مجدد و انتشار مجموعه داده‌های اختصاصی وجود دارد (یعنی اشتراک‌گذاری داده‌های خریداری‌شده مجاز نیست). باز هم، بسته به موضوع، داده های اختصاصی ممکن است تنها گزینه باشد. یکی دیگر از دلایل استفاده از داده های اختصاصی این است که ممکن است داده ها مطابق با نیاز شما قالب بندی و پاک شوند. معاوضه بین هزینه مالی و زمان صرفه جویی شده یکی از مواردی است که باید در هنگام کار با ضرب الاجل به طور جدی مورد توجه و ارزیابی قرار گیرد.

جستجوی داده ها، و به ویژه داده هایی که شما نیاز دارید، اغلب وقت گیرترین جنبه هر پروژه مرتبط با GIS است. بنابراین، بسیار مهم است که سعی کنید نیازها و نیازهای داده خود را – از مقیاس های زمانی و جغرافیایی داده ها گرفته تا قالب های مورد نیاز – به وضوح و در اسرع وقت تعریف و روشن کنید. چنین تعریف و وضوحی در جستجوی شما برای داده های درست سودمند خواهد بود، که به نوبه خود تحلیل های بهتر و تصمیم گیری های آگاهانه تری را به همراه خواهد داشت.

غذای آماده کلیدی

  • قبل از جستجوی داده، سوالات زیر را از خود بپرسید: چرا به داده ها نیاز دارم؟ در چه مقیاس زمانی به داده ها نیاز دارم؟ داده ها را در چه مقیاس جغرافیایی می خواهم؟ چه داده هایی در حال حاضر وجود دارد؟ چه فرمتی به داده ها نیاز دارم؟

تمرینات

  1. پنج منبع احتمالی برای داده های مربوط به تولید ناخالص داخلی (GDP) برای کشورهای آفریقایی را شناسایی کنید.
  2. دو منبع برای داده های جغرافیایی (فایل های مرزی) آفریقا را شناسایی کنید.
  3. سازمان ملل متحد چه نوع داده های جغرافیایی ارائه می دهد؟

10 نظرات

دیدگاهتان را بنویسید