هدف یادگیری
- هدف این بخش شناسایی و ارزیابی ملاحظات کلیدی هنگام جستجوی داده است.
اکنون که درک اولیه ای از داده ها و اطلاعات داریم، کجا می توانیم چنین داده ها و اطلاعاتی را پیدا کنیم؟ اگرچه یک جستجوی اینترنتی مطمئناً با منابع و انواع بیشماری داده به دست میآید، جستجو برای دادههای مرتبط و مفید اغلب فرآیندی چالش برانگیز و تکراری است. بنابراین، قبل از پرش آنلاین و دانلود اولین چیزی که از جستجوی وب ظاهر می شود، مفید است که جستجوی خود را برای داده ها با سؤالات و ملاحظات زیر چارچوب بندی کنیم:
- دقیقا چیهدف از داده ها است؟ با توجه به این واقعیت که جهان در حجم وسیعی از داده ها شناور است، بیان اینکه چرا به مجموعه ای از داده ها نیاز داریم (یا چرا به آنها نیاز نداریم) جستجو برای داده های مفید و مرتبط را ساده می کند. برای این منظور، هرچه بتوانیم در مورد هدف داده های مورد نیاز دقیق تر باشیم، جستجوی ما برای داده ها کارآمدتر خواهد بود. به عنوان مثال، اگر ما علاقه مند به درک و مطالعه رشد اقتصادی هستیم، تعیین مقیاس های زمانی و جغرافیایی مفید است. به عبارت دیگر، برای چه دورههای زمانی (مثلاً 1850-1900) و بازههای زمانی (مثلاً فصلی، سالانه) و در چه سطحی از تحلیل (مثلاً ملی، منطقهای، ایالتی) علاقهمندیم؟ اغلب اوقات، در دسترس بودن داده ها، یا به طور خاص، فقدان داده های مرتبط، ما را مجبور می کند که هدف یا دامنه سؤال اصلی خود را تغییر دهیم.
- سوال دومی که باید از خود بپرسیم این است که چه داده هایی از قبل وجود دارد و ما قبلاً به چه داده هایی دسترسی داریم؟ قبل از جستجوی دادههای جدید، همیشه ایده خوبی است که فهرستی از دادههایی که از قبل در اختیار داریم تهیه کنیم. چنین دادههایی ممکن است از پروژهها یا تحلیلهای قبلی یا از همکاران و همکلاسیهایشان باشد، اما نکته کلیدی در اینجا این است که میتوانیم با استفاده از دادههایی که از قبل در اختیار داریم، در زمان و تلاش زیادی صرفهجویی کنیم. علاوه بر این، با شناسایی آنچه داریم، درک بهتری از آنچه نیاز داریم به دست می آوریم. به عنوان مثال، اگرچه ممکن است قبلاً دادههای سرشماری (یعنی دادههای ویژگی) داشته باشیم، ممکن است به دادههای جغرافیایی بهروزشدهای نیاز داشته باشیم که شامل مرزهای ایالتها یا شهرستانهای ایالات متحده باشد.
- در مرحله بعد، ما باید هزینه های مربوط به جمع آوری داده ها را ارزیابی و ارزیابی کنیم. هزینه های جمع آوری داده ها فراتر از هزینه های مالی است. به همان اندازه که هزینههای مالی دادهها مهم هستند، هزینههایی هستند که زمان شما را در بر میگیرند. بالاخره زمان پول است. زمان و انرژی که برای جمع آوری، یافتن، تمیز کردن و قالب بندی داده ها صرف می کنید، زمان و انرژی است که از تجزیه و تحلیل داده ها گرفته می شود. بسته به ضربالاجلها، محدودیتهای زمانی و تحویلپذیریها، یادگیری نحوه مدیریت زمان در هنگام جستجوی داده بسیار مهم است.
- در نهایت، فرمت داده های مورد نیاز از اهمیت حیاتی برخوردار است. اگرچه بسیاری از برنامهها میتوانند فرمتهای زیادی از دادهها را بخوانند، برخی از انواع دادهها هستند که فقط توسط برخی برنامهها قابل خواندن هستند و برخی برنامهها که به فرمتهای داده خاصی نیاز دارند. درک اینکه از چه قالب های داده ای می توانید استفاده کنید و آن هایی که نمی توانید به جستجوی داده ها کمک می کند. به عنوان مثال، یکی از رایج ترین اشکال داده های سیستم اطلاعات جغرافیایی (GIS) شکل فایل نامیده می شود .. همه برنامههای GIS نمیتوانند فایلهای شیپ را بخوانند یا از آن استفاده کنند، اما ممکن است لازم باشد به یا از یک فایل شیپ یا فرمت دیگری تبدیل شود. از این رو، همانطور که قبلاً اشاره شد، هر چه قالبهای دادهای که با آنها بیشتر آشنا باشیم، در جستجوی دادهها وضعیت بهتری خواهیم داشت، زیرا نه تنها درک درستی از آنچه میتوانیم استفاده کنیم، بلکه در مورد تبدیل فرمتهایی نیز خواهیم داشت که باید انجام شوند. در صورت لزوم
همه این سؤالات از اهمیت یکسانی برخوردار هستند و توانایی پاسخ به آنها به جستجوی کارآمدتر و مؤثرتر برای داده ها کمک می کند. بدیهی است که چندین ملاحظات دیگر پشت جستجوی دادهها و بهویژه دادههای GIS وجود دارد، اما مواردی که در اینجا فهرست شدهاند یک مسیر اولیه برای جستجوی موفقیتآمیز دادهها را فراهم میکنند.
با تکامل فناوری اطلاعات و با جمعآوری و توزیع دادههای بیشتر، اشکال مختلف دادهای که میتوان با GIS استفاده کرد افزایش مییابد. به طور کلی، و همانطور که قبلاً بحث شد، یک GIS از دو نوع داده استفاده می کند و ادغام می کند: داده های جغرافیایی و داده های ویژگی. گاهی اوقات منبع دادههای جغرافیایی و ویژگیها یکی هستند. به عنوان مثال، اداره سرشماری ایالات متحده ( https://www.census.gov ) فایل های مرزی جغرافیایی (به عنوان مثال، سطح سرشماری، سطح شهرستان، سطح ایالت) و همچنین داده های ویژگی مرتبط (مانند جمعیت، نژاد/) را توزیع می کند. قومیت، درآمد). چه چیزی بیشتر این است که چنین داده هایی به صورت رایگان و بدون هزینه در دسترس هستند. از بسیاری جهات، داده های سرشماری ایالات متحده استثنایی هستند: آنها رایگان و جامع هستند. اگر همه داده ها رایگان و جامع بودند!
بدیهی است که هر جستجو برای داده ها بسته به هدف متفاوت خواهد بود، اما داده های دولت ها معمولاً پوشش خوبی دارند و نقطه مرجعی را ارائه می دهند که از آن می توان داده های دیگر را اضافه، مقایسه و ارزیابی کرد. چه به داده های تصاویر ماهواره ای از سازمان ملی هوانوردی و فضایی ( https://www.nasa.gov ) یا به داده های استفاده از زمین از سازمان زمین شناسی ایالات متحده ( https://www.usgs.gov ) نیاز داشته باشید، چنین منابع دولتی تمایل دارند قابل اعتماد، معتبر و سازگار باشد. یکی دیگر از عناصر کلیدی بیشتر داده های دولتی این است که آنها به صورت آزاد در دسترس عموم هستند. به عبارت دیگر، هیچ هزینه ای برای استفاده یا به دست آوردن داده ها وجود ندارد. داده هایی که برای استفاده رایگان هستند عموماً داده های عمومی نامیده می شوند .
برخلاف دادههای در دسترس عموم، منابع متعددی از دادههای خصوصی یا اختصاصی وجود دارد. تفاوت اصلی بین داده های عمومی و خصوصی این است که اولی رایگان است و دومی باید با هزینه به دست آید. علاوه بر این، اغلب محدودیتهایی برای توزیع مجدد و انتشار مجموعه دادههای اختصاصی وجود دارد (یعنی اشتراکگذاری دادههای خریداریشده مجاز نیست). باز هم، بسته به موضوع، داده های اختصاصی ممکن است تنها گزینه باشد. یکی دیگر از دلایل استفاده از داده های اختصاصی این است که ممکن است داده ها مطابق با نیاز شما قالب بندی و پاک شوند. معاوضه بین هزینه مالی و زمان صرفه جویی شده یکی از مواردی است که باید در هنگام کار با ضرب الاجل به طور جدی مورد توجه و ارزیابی قرار گیرد.
جستجوی داده ها، و به ویژه داده هایی که شما نیاز دارید، اغلب وقت گیرترین جنبه هر پروژه مرتبط با GIS است. بنابراین، بسیار مهم است که سعی کنید نیازها و نیازهای داده خود را – از مقیاس های زمانی و جغرافیایی داده ها گرفته تا قالب های مورد نیاز – به وضوح و در اسرع وقت تعریف و روشن کنید. چنین تعریف و وضوحی در جستجوی شما برای داده های درست سودمند خواهد بود، که به نوبه خود تحلیل های بهتر و تصمیم گیری های آگاهانه تری را به همراه خواهد داشت.
غذای آماده کلیدی
- قبل از جستجوی داده، سوالات زیر را از خود بپرسید: چرا به داده ها نیاز دارم؟ در چه مقیاس زمانی به داده ها نیاز دارم؟ داده ها را در چه مقیاس جغرافیایی می خواهم؟ چه داده هایی در حال حاضر وجود دارد؟ چه فرمتی به داده ها نیاز دارم؟
تمرینات
- پنج منبع احتمالی برای داده های مربوط به تولید ناخالص داخلی (GDP) برای کشورهای آفریقایی را شناسایی کنید.
- دو منبع برای داده های جغرافیایی (فایل های مرزی) آفریقا را شناسایی کنید.
- سازمان ملل متحد چه نوع داده های جغرافیایی ارائه می دهد؟
10 نظرات