سیستم اطلاعات جغرافیایی (GIS)و پایش مخاطرات زیست‌محیطی تحت تغییرات آب و هوا: بررسی گسترده

آموزش GIS :، تکامل علم eScience

GIS یا سامانه اطلاعات مکانی، یکی از ابزارهایی است که به کمک آن می‌توان اطلاعات مکانی از مناطق مختلف جمع‌آوری، تحلیل و به نحوی کاربردی به کار برد. با توجه به پیشرفت فناوری، GIS به عنوان یکی از ابزارهای مهم در حوزه علوم محاسباتی و اطلاعاتی شناخته شده است و تکامل علم eScience را به سمت پیشرفت‌های بیشتر سوق داده است.

eScience یا علم الکترونیکی، به عنوان یکی از حوزه های پیشرفته علوم کامپیوتر، به دنبال بهبود روش‌های محاسباتی و استفاده از داده های بزرگ در حوزه های مختلف علمی است. GIS نیز با استفاده از فناوری‌های مکانی، امکان جمع‌آوری و تحلیل داده‌های مکانی را به صورت اتوماتیک و با سرعت بالا فراهم می‌کند. در این راستا، GIS به عنوان یکی از ابزارهای مهم در علم eScience شناخته شده است.

همچنین، با استفاده از GIS می‌توان داده‌های مکانی را با داده‌های دیگر ادغام کرده و به تحلیل های پیشرفته‌ای از داده‌های بزرگ در حوزه های مختلف علمی مانند زیست‌شناسی، جغرافیا، اقتصاد و… دست یافت. در نتیجه، تکامل علم eScience با استفاده از GIS و فناوری‌های مکانی، به شکلی موثر و پویا در حوزه‌های مختلف علمی مانند محیط زیست، پزشکی، مهندسی و … پیشرفت می‌کند.

به طور خلاصه، آموزش GIS به عنوان یکی از ابزارهای مهم در حوزه علم eScience، می‌تواند در پیشرفت و بهبود روش‌های محاسباتی و استفاده از داده‌های بزرگ در حوزه های مختلف علمی مؤثر باشد. با استفاده از GIS و فناوری‌های مکانی، می‌توان به تحلیل های پیشرفته‌ای از داده‌های بزرگ در حوزه‌های مختلف علمی دست یافت و تکامل علم eScience را به سمت پیشرفت‌های بیشتر هدایت کرد.

دوره آموزش حرفه ای gis

آموزش GIS :، تکامل علم eScience :علم – و تحقیقات به طور گسترده‌تر – با چالش‌های زیادی مواجه است، زیرا پزشکان آن تلاش می‌کنند تا با چالش‌های جدید در مورد تکرارپذیری و باز بودن مقابله کنند. عمل کنونی علم دسترسی به دانش، اطلاعات و زیرساخت را محدود می‌کند که به نوبه خود منجر به ناکارآمدی، ناامیدی و عدم دقت می‌شود. بسیاری از نتایج تحقیقات مفید هرگز مورد استفاده قرار نمی گیرند، زیرا یافتن، دسترسی یا درک آنها بسیار دشوار است.

روش‌ها و زیرساخت‌های محاسباتی جدید فرصت‌هایی را برای بازنگری در نحوه انجام علم، نحوه اشتراک آن، نحوه ارزیابی و نحوه استفاده مجدد از آن فراهم می‌کنند. و منابع داده جدید آنچه را که می توان شناخت، به خوبی و به دفعات تغییر داد. این مقاله برخی از موضوعات اصلی eScience/eResearch را با هدف بهبود فرآیند انجام علم شرح می دهد.

 

توضیحات موضوع:
  1. از طریق معرفی
  2. موضوعات اصلی علوم الکترونیک
    • افزایش علم
    • حفظ آثار تحقیقاتی
    • بسته بندی و به اشتراک گذاری نتایج تحقیقات
    • گردش کار و آزمایشگاه های مجازی
    • توصیف بهتر تحقیق
    • مجلات “زنده”.
  3. نتیجه

 

1. معرفی

اولین مجله دانشگاهی در سال 1665 منتشر شد: معاملات فلسفی انجمن سلطنتی لندن.. اتفاقاً همان سال طاعون بزرگ لندن بود. مجلات جدید در طول زمان اضافه شدند و تعداد عناوین در حال حاضر رشد تصاعدی را تجربه می کند، که منجر به مجموع فعلی بیش از 25000 مجله معتبر (و 50000 مجله علمی دیگر) می شود (Boon 2017). تعداد مقالات منتشر شده روند مشابهی را نشان داده است و طی 25 سال گذشته به رشد تصاعدی دست یافته است و در حدود سال 2015 برخی از دانشگاهیان خوش شانس پنجاه میلیونمین مقاله تحقیقاتی را نوشتند. میزان تولید تحقیقات فوق‌العاده است، اما مکانیسم انتشار دانش ما 350 سال قدمت دارد و صادقانه بگویم، این نشان می‌دهد. در نتیجه، میزان استفاده مجدد از همه این دانش به سختی به دست آمده بسیار ضعیف است. مقالات آکادمیک با نرخ 1.3 در دقیقه منتشر می شوند و در حال افزایش هستند. در علوم اجتماعی، اکثر آنها هرگز ذکر نشده اند (ون نوردن، 2017). بسیاری از ایده‌های عالی، همراه با داده‌ها و روش‌های پشتیبان آن‌ها، کشف نشده باقی می‌مانند، زیرا یافتن آنها بسیار سخت است. و حتی زمانی که آنها پیدا می شوند، اغلب استخراج آنها از متن متراکم مقاله تحقیقاتی بسیار دشوار است. برای مثال، محققان شیمی نیاز به توسعه اپلیکیشنی را یافته‌اند که می‌تواند داده‌ها را از نمودارهای تعبیه‌شده در فایل‌های pdf منتشر شده مقالات مجلات بازیابی کند! استفاده مجدد از نتایج تحقیقات ارزشمند توسعه یافته توسط دیگران در انجام تحقیقات خود همچنان یک چالش تا حد زیادی حل نشده باقی مانده است. محققان شیمی نیاز به توسعه اپلیکیشنی را یافته‌اند که بتواند داده‌ها را از نمودارهای تعبیه‌شده در فایل‌های pdf منتشر شده مقالات مجلات بازیابی کند! استفاده مجدد از نتایج تحقیقات ارزشمند توسعه یافته توسط دیگران در انجام تحقیقات خود همچنان یک چالش تا حد زیادی حل نشده باقی مانده است. محققان شیمی نیاز به توسعه اپلیکیشنی را یافته‌اند که بتواند داده‌ها را از نمودارهای تعبیه‌شده در فایل‌های pdf منتشر شده مقالات مجلات بازیابی کند! استفاده مجدد از نتایج تحقیقات ارزشمند توسعه یافته توسط دیگران در انجام تحقیقات خود همچنان یک چالش تا حد زیادی حل نشده باقی مانده است.

از سال 1665 خیلی چیزها تغییر کرده است: من دیگر برای کار با اسب سفر نمی‌کنم و وقتی تب دارم زالو نمی‌گیرم. پس چرا ما هنوز تحقیقات را از طریق این رسانه منسوخ و ایستا نشریه ارتباط برقرار می کنیم؟ سه رکن علم عبارتند از: قابل انتقال، تکرارپذیری و ابطال پذیری. علم را نمی توان به آسانی از روی متنی در کتابخانه تکرار یا رد کرد، هرچند که شاید بتوان جنبه هایی از آن را گاهی انتقال داد. یکی از سه به سادگی به اندازه کافی خوب نیست.

علوم کامپیوتر سعی کرده است از شرکت های تحقیقاتی پشتیبانی کند، ابزارهایی مانند پایگاه های داده، روش های تجزیه و تحلیل، ایمیل، ویکی ها، هستی شناسی ها، انبارهای داده، کانتینرها و گردش کار، همراه با پردازش سریعتر و ذخیره سازی هر چه بیشتر را توسعه دهد. با این حال، این ابزارها متمایز هستند و اتصال ضعیفی دارند. مطمئناً، آنها به تولید بیشتر محققان کمک کرده‌اند، اما از منظر ارتباط تحقیقاتی، آنها اغلب اوضاع را بدتر می‌کنند، نه بهتر: آنها انجام تحقیقات را در چندین برنامه جداگانه یا بیشتر تقسیم می‌کنند.

اما اگر بخواهید، ظرفی بهتر از کاغذ (یا pdf) برای یک مصنوع تحقیقاتی تصور کنید. تصور کنید که می توانید روش های واقعی، گردش کار و داده های مورد استفاده را بررسی کنید. جایی که می‌توانید داده‌های خودتوصیف را دانلود کنید و تجزیه و تحلیل‌ها را مجدداً برای خود اجرا کنید تا آنها را تأیید کنید. که در آن استفاده از مصنوعات تحقیقاتی می تواند به طور خودکار در جوامع ردیابی شود، و مصنوعات را می توان از طریق یک شبکه پیوندی از اتصالات در میان تمام موارد فوق کشف کرد و به آنها دسترسی داشت. یک آزمایش منتشر شده را تصور کنید که در آن می توانید روی یک نمودار کلیک کنید تا داده ها را بارگیری کنید، روی معادله کلیک کنید تا کد را بررسی کنید، روی کد کلیک کنید و تجزیه و تحلیل را دوباره اجرا کنید. همچنین تصور کنید که همه این اتصالات به هر دو صورت کار می‌کنند، بنابراین می‌توانید تمام روش‌هایی را که در یک مجموعه داده استفاده شده‌اند، یا همه محققانی که یک تحلیل را تأیید کرده‌اند، بیابید.

در حال حاضر، اگر بتوانیم مقالات مرتبط را با استفاده از کلمات کلیدی پیدا کنیم، ممکن است خودمان را خوش شانس بدانیم، اما اگر سعی کرده اید مجموعه داده های مرتبط یا روش های تحلیلی را به همین روش بیابید، متوجه خواهید شد که چقدر خسته کننده است. جستجوی ما به دلیل آشنایی ما با دامنه های خاص، با دانستن کلمات کلیدی مناسب برای استفاده، یا توسط شبکه های اجتماعی ما، یا حتی توسط مجلاتی که کتابخانه دانشگاه ما در آنها مشترک است محدود می شود: همه این محدودیت ها توانایی ما را برای یافتن و استفاده مجدد از آن محدود می کند. تحقیق دیگران

نکته اصلی این است: برای اینکه آن میلیون‌ها مقاله برای ما مفید باشند، باید آنها را مجدداً فاکتورگیری کنیم: به این معنا که محتویات آنها از هم جدا شده و سازماندهی مجدد شوند تا قابلیت استفاده مجدد را به حداکثر برسانند. این امر مستلزم روش‌های جدیدی برای توصیف مصنوعات تحقیقاتی ما است، با تأکید بر امکان کشف و استفاده مجدد توسط سایر محققان – حتی محققان خارج از جامعه مبدأ، و برای کارهای پیش‌بینی نشده توسط سازندگان آنها.

 

2. موضوعات اصلی علوم الکترونیک

تحقیقات متصل، مقیاس پذیر، زنده و قابل استفاده مجدد، هدف اصلی eScience است. جیم گری (که اغلب به عنوان مبتکر علم الکترونیک شناخته می شود) به قول معروفی می گوید: “بسیار چیز در مورد علم به دلیل تاثیر فناوری اطلاعات در حال تغییر است .” eScience با چالش بزرگ‌سازی برنامه‌های علمی با استفاده از محاسبات شبکه‌ای آغاز شد، اما در طول زمان تکامل یافته است تا مترادف با هر و همه تلاش‌هایی برای اعمال اطلاعات جدید و فناوری اطلاعات برای بهبود فرآیند علم و نتایج باشد. به هی و همکاران مراجعه کنید. (2009) برای اطلاعات بیشتر در مورد این رویکرد جدید به علم.

برخی از موضوعات اصلی علم الکترونیک عبارتند از:

  1. علم باز: علم قابل دسترس برای همه بدون هیچ مانعی برای جذب.
  2. افزایش مقیاس علم: دسترسی به زیرساخت های محاسباتی با اندازه مناسب برای همه محققان.
  3. پایدار کردن مصنوعات تحقیقاتی: شناسه‌ها و نسخه‌سازی برای کمک به پیگیری چیزهایی که می‌سازیم و استفاده می‌کنیم.
  4. بسته‌بندی و اشتراک‌گذاری نتایج تحقیق: ذخیره‌سازی و کتابخانه‌های تصاویر نرم‌افزاری از پیش ساخته شده برای وظایف خاص،
  5. گردش کار و آزمایشگاه های مجازی برای گرفتن و به اشتراک گذاری کل آزمایش ها
  6. توصیف بهتر تحقیق: معناشناسی داده ها و روش ها
  7.  زیرساخت تحقیقاتی “زنده” که داده ها، کد و گردش کار را مستقیماً در مقاله تحقیقاتی جاسازی می کند

در زیر معرفی مختصری از هر یک از این موضوعات ارائه شده است.

2.1 علوم باز

هدف آن اولین مجلات دانشگاهی این بود که محققان را قادر سازند تا از کار دیگران بیاموزند بدون اینکه نیازی به حضور فیزیکی در هنگام گزارش یافته‌ها یا انجام آزمایش‌های علمی داشته باشند. مدل‌های کسب‌وکار انتشار برای کسب سود یا شمارش استنادها برای تبلیغ بسیار دیرتر به وجود آمدند. هدف علم باز کاهش هزینه مشارکت در تحقیقات، با در دسترس قرار دادن رایگان نتایج برای همه، و در عین حال افزایش شفافیت پژوهش با به اشتراک گذاری کد و داده است.

اکنون فناوری به ما این امکان را می‌دهد که ظرف‌های بسیار مؤثرتری نسبت به کاغذ برای همه این تحقیقات ارزشمند ایجاد کنیم، بنابراین بیایید ابتدا بررسی کنیم که چه جنبه‌هایی از علم (یا تحقیقات – همان ایده‌ها را می‌توان خارج از علم به کار برد) می‌تواند به طور مؤثر «باز» شود. جنبش علوم باز مؤلفه های بسیاری را برای شرکت تحقیقاتی شناسایی کرده است که برای باز کردن واقعی آنها به استراتژی خاصی نیاز دارد، برای بحث مفید به پورتال FOSTER مراجعه کنید، و گزیده ای در زیر در جدول 1 نشان داده شده است. خلاصه دقیق تر توسط Knoth ارائه شده است. و پونتیکا (2015).

جدول 1. خلاصه ای از جنبه های تحقیقاتی که می توان باز کرد

تنفس مثال
کد منبع باز استفاده از پلتفرم هایی مانند GitHub و Bitbucket به عنوان مخزن کد باز و همچنین برای کنترل نسخه.
داده ها را باز کنید استفاده از زیرساخت داده متمرکز بر جامعه، مانند پورتال داده نئون
بازبینی را باز کنید مجلاتی که باز می شوند، جزئیات بررسی ها و داوران را به اشتراک می گذارند و به بحث آزاد دعوت می کنند، مانند مجله معنایی وب
سیاست های باز شفافیت در مورد تصمیمات و اولویت های تامین مالی، مانند OpenAire
ابزارها، گردش کار، و آزمایشگاه های مجازی را باز کنید محیط‌های نرم‌افزاری که فراتر از اشتراک‌گذاری مصنوعات دیجیتالی با به اشتراک گذاشتن نحوه اتصال همه آن‌ها به یکدیگر در یک توالی تکرار شونده است.

 

در جامعه GIScience ، بنیاد زمین فضایی منبع باز ، که به طور محاوره ای به عنوان OSGeo شناخته می شود ، در چند سال اخیر به عنوان یک جامعه اختصاص یافته به ساختن سیستم های GIS منبع باز، مانند QGIS و OSGeo4W ظهور کرده است. برای تایپ درست، این پایگاه های کد کاملاً باز هستند، همانطور که جامعه ای که آنها را حفظ می کند. بنابراین می توان از کد مورد نظر استفاده، بررسی و گسترش داد و آن را با هرکسی که می خواهد به اشتراک گذاشت. برخی از مجلات GIScience اکنون کدی را برای همراهی با مقالات مجلات منتشر می کنند که گامی کوچک اما مفید در جهت درست است.

 

2.2 گسترش علم

بسیاری از تحقیقات اولیه در eScience بر روش‌های جدید برای در دسترس ساختن قدرت محاسباتی برای همه محققان متمرکز بود (به عنوان مثال فاستر و کسلمن 1999)، نه فقط کسانی که می‌توانستند به امکانات ملی محاسبات با عملکرد بالا (HPC) دسترسی پیدا کنند. این امر منجر به ایجاد شبکه‌های محاسباتی در ابتدا، و در نهایت، ابرهای تحقیقاتی (اعم از عمومی و خصوصی) شد. به طور معمول، این پلتفرم‌ها از سرورهای کالا یا حتی ماشین‌های رومیزی ساخته می‌شوند که در یک کامپیوتر بزرگ و مجازی مونتاژ می‌شوند. اگرچه آنها برای مشکلات بسیار جفت شده ای که در مدل سازی آب و هوا یا دینامیک سیالات می بینیم مناسب نیستند، اما در بسیاری از کاربردهای ژنومیک و تجزیه و تحلیل فضایی بسیار مفید هستند و عملکرد بسیار بیشتری نسبت به دسکتاپ اداری دارند. مهمتر از همه، آنها یک پلت فرم محاسباتی ثابت برای جوامع تحقیقاتی فراهم می کنند تا یکپارچه، نرم افزار و داده های مشترک (به بخش های 4 و 5 مراجعه کنید). وظیفه انتقال الگوریتم های GIScience به پلتفرم های بزرگتر HPC همچنان یک چالش مداوم است (شوک و همکاران، 2016).

 

2.3 شناسه ها و نسخه سازی مداوم

یکی از چالش‌های کلیدی در انجام تحقیقات «متصل»، ایجاد شناسه‌های دیجیتالی پایدار است که به مصنوعات تحقیقاتی اجازه می‌دهد به طور منحصربه‌فرد شناسایی و نسخه‌سازی شوند. ایجاد شناسه هایی که در خارج از یک موسسه یا حوزه واحد باقی می مانند و معنی دارند، یک چالش سازمانی است. راه حل فعلی شامل ایجاد مقامات قابل اعتمادی است که می توانند شناسه های جدید را در صورت لزوم به عنوان یک سرویس «ذکر» کنند و همچنین اعتبار یک شناسه به چه منبعی را ارجاع می دهند. به عنوان مثال، ORCiD یک شناسه دائمی برای محققان است که هر هویت محلی ممکن است یک فرد داشته باشد (به عنوان مثال از وابستگی های نهادی گذشته و حال) را در بر می گیرد. بنابراین راه مفیدتری برای ارجاع به یک فرد است (شکل 1). شناسه‌های ORCiD به یاد می‌آورند که شما چه کسی هستید، حتی اگر نام، وابستگی، حتی کشور خود را تغییر دهید.

شکل 1. یک یادآوری مناسب برای استفاده از شناسه ORCiD. ORCiD ها نمونه ای از یک شناسه پایدار هستند که به افراد اجازه می دهد تا فعالیت های تحقیقاتی را بدون توجه به تحرک حرفه ای خود به آنها متصل کنند. منبع تصویر: نویسنده

 

همچنین برای طیف گسترده ای از مصنوعات تحقیقاتی دیجیتال، از جمله مجموعه داده ها، روش ها (کد)، ابزارها و حتی فعالیت های تحقیقاتی، به شناسه های پایدار نیاز است. برای مثال، Research Activity Identifiers یا RAID را در نظر بگیرید. شناسه‌هایی مانند این مهم هستند زیرا URLها (مشخص‌های یکنواخت منبع) مورد استفاده توسط شبکه جهانی وب به عنوان وسیله‌ای برای شناسایی دائمی مکان یک منبع غیرقابل اعتماد هستند: زیرا منابع حرکت می‌کنند و توپولوژی‌های شبکه تغییر می‌کنند. برای اینکه چیزها قابل کشف و قابل استفاده مجدد باشند، ابتدا به آنها نیاز داریم که تداوم داشته باشند و به روشی تغییرناپذیر. کلمپ و هوبر (2017) را برای خلاصه ای مفید از این موضوع ببینید.

2.4 ظروف
یک گام بیشتر به سمت تکرارپذیری توسط زیرساخت “کانتینری” مانند Docker ارائه می شود. محفظه نرم افزار مکانی برای ذخیره یک تصویر زمان اجرا است – یک بسته نرم افزاری که شامل برنامه های کاربردی و اغلب داده ها نیز می شود. این تصویر با سریال‌سازی یک برنامه کاربردی ایجاد می‌شود، یعنی نوشتن حافظه‌ای که نرم‌افزار کار را در حافظه ذخیره می‌کند. سپس می توان آن را به راحتی به اشتراک گذاشت. پس از دریافت، می توان آن را باز کرد، “تصویر مجدد” کرد و بلافاصله اجرا کرد. دقیقاً مانند نرم‌افزار اصلی عمل می‌کند، بنابراین یک راه بسیار راحت برای “پیوسته کردن” و به اشتراک گذاشتن یک آزمایش یا بخشی از تحقیق با کاربران جدید ارائه می‌کند. کانتینرها به پشتیبانی از تکرارپذیری و تکرارپذیری کمک می‌کنند و اکنون به اندازه‌ای بالغ هستند که به‌عنوان بخشی از فرآیند بررسی همتایان در علم به‌طور قابل اعتماد مورد استفاده قرار گیرند.
نوت‌بوک‌های علمی، مانند نوت‌بوک‌های Jupyter  ، انواع محبوب زیرساخت‌های کانتینری هستند که در کلاس‌ها و آموزش‌های آزمایشگاهی در سراسر جهان استفاده می‌شوند. آنها چندین مزیت دارند: کوچک هستند و به راحتی قابل استقرار هستند. آنها معمولاً برای اجرا به منابع محاسباتی زیادی نیاز ندارند. آنها کد، داده و توضیحات/اسناد را در یک محیط واحد ترکیب می کنند. آنها به کاربر کمک می کنند تا بر مشکلات نصب و ادغام نرم افزار غلبه کند. و آنها را می توان به راحتی در مقیاس در Cloud مستقر کرد، مثلاً برای اهداف آموزشی. همچنین، آنها معمولاً کوچک و مستقل هستند، که استقرار آنها را آسان‌تر و سریع‌تر می‌کند.
کتابخانه های بزرگ و متنوعی از برنامه های کاربردی کانتینری در چندین زمینه از جمله GIScience در دسترس هستند که به محققان اجازه می دهد ابزارهای تحقیقاتی دیگران را بارگیری و استفاده مجدد کنند. به عنوان مثال، این لیست DockerImages  یک کتابخانه سریع در حال رشد از عملکرد GIS منبع باز از جامعه OSGeo را نشان می دهد که می تواند به راحتی مورد استفاده مجدد قرار گیرد.
2.5 گردش کار و آزمایشگاه های مجازی
گردش کار را می توان به عنوان یک توسعه کانتینری در نظر گرفت. و همچنین امکان اشتراک گذاری کل آزمایش ها را فراهم می کند، آنها فراتر می روند و به طور رسمی نحوه اتصال اجزای مختلف نرم افزار به یکدیگر را شرح می دهند. محیط های گردش کار از زنجیره روش های تحلیلی به گونه ای پشتیبانی می کنند که تمام مراحل یک آزمایش را به طور کامل توصیف می کند. در اصل زبانی است برای تعیین یک گراف جهت دار، که در آن گره ها روش های محاسباتی هستند و یال ها پیوندهایی هستند که توسط آن داده ها (یا اطلاعات کنترلی) به داخل و خارج منتقل می شوند. برای مثال شکل 2 را ببینید. اغلب، این نمودار را می توان از طریق یک رابط بصری ایجاد کرد و نیاز به مهارت های برنامه نویسی را از بین می برد. سپس می توان نمودار را سریالی کرد – به عنوان یک منبع نوشت تا تجزیه و تحلیل تکرار شود، به اشتراک گذاشته شود و تغییر کاربری داده شود (پرکل، 2019).
محیط گلکسی w orkflow  شاید شناخته شده ترین موتور گردش کار باشد و به شدت در تحقیقات بیو انفورماتیک استفاده می شود. GeoVISTA Studio (Takatsuka و Gahegan، 2002) یک نمونه اولیه از یک گردش کار و محیط برنامه نویسی بصری برای تجزیه و تحلیل و تجسم جغرافیایی است.
شکل 2. یک گردش کار اجرایی ایجاد شده در محیط Galaxy برای ورودی، ترکیب و انتخاب داده ها، که سپس به صورت نمودار پراکنده ترسیم می شود. برای جزئیات بیشتر به Fouilloux و همکاران (2020) مراجعه کنید. منبع: نویسنده
توسعه طبیعی ایده‌های محاسبات ابری، کانتینری‌سازی و گردش‌های کاری، آزمایشگاه مجازی است که محیطی کاملاً مستقل و ترکیبی از میزبانی برنامه، ماژول‌های نرم‌افزار و گردش‌های کاری و اتصال به مجموعه‌های داده مربوطه را فراهم می‌کند. یک مثال عالی، آزمایشگاه مجازی تنوع زیستی و تغییر اقلیم  است که از مدل‌سازی و تجسم مکانی بسیار پیچیده پشتیبانی می‌کند، اما در یک محیط کنترل‌شده که اساساً همه ابزارها، داده‌ها، روش‌ها و اسکریپت‌های مورد استفاده در تجزیه و تحلیل را در کنار هم قرار می‌دهد و هم به عنوان منابع مشترک و زیرساخت مشترک برای یک جامعه تحقیقاتی
2.6 توضیحات غنی از داده ها و روش ها
نحوه ارتباط در مجلات سنتی البته انسان به انسان است. همانطور که مجلات آنلاین شده اند، معناشناسی به طور فزاینده ای برای توصیف “محفظه” مقاله تحقیقاتی به روش های به تدریج غنی تر، از طریق فراداده، مورد استفاده قرار می گیرد.
مصنوعات تحقیقاتی که می‌توانند به نحوی «منتشر شوند» یا به اشتراک گذاشته شوند، به ابرداده‌های قوی نیاز دارند تا اطمینان حاصل شود که می‌توان آنها را با استفاده از موتور جستجو پیدا کرد. به عنوان مثال، ابرداده‌های خاص مربوط به انتشار اغلب برای توصیف مقالات تحقیقاتی استفاده می‌شود، و البته ما انتظار داریم که از چنین ابرداده‌هایی برای تقویت رابط‌های جستجوی پیچیده استفاده شود که به ما در یافتن محتوای مفید کمک می‌کند. در حال حاضر بسیاری از بسترهای انتشار مجلات دانشگاهی نیز به طور معمول از فراداده های کتابخانه ای برای غنی سازی توضیحات هر مقاله منتشر شده استفاده می کنند. برای مثال، این خلاصه مفید را از Crossref ببینید.
در حال حاضر بسیاری از مجلات و خدمات نمایه سازی مجلات نیز از کلمات کلیدی برای توصیف یک مقاله تحقیقاتی استفاده می کنند و برخی از آنها ممکن است از واژگان کنترل شده یا هستی شناسی منبع باشند. برای مثال GeoRef از سال 1966 واژگان ساختاریافته ای را برای انتشارات علوم زمین ایجاد و حفظ کرده است. این نوع ابرداده از توصیف مقاله به طور کلی فراتر رفته و شروع به توصیف خود مطالب می کند. همین امر در مورد داده ها و کدها نیز صدق می کند، که همه آنها را می توان با توجه به اینکه چه کسی آنها را ایجاد کرده است، تحت چه شرایطی قابل استفاده مجدد است و حتی سؤالات تحقیقی که می توانند به روشن شدن آنها کمک کنند، به طور کامل توصیف شوند. برای گزارش دقیق‌تر و آرزومندتر از نمایش تمام نتایج علم با ابرداده و Beard و همکاران، به Davenhill (2011) مراجعه کنید. (2010) برای یک حساب اولیه با استفاده از هستی شناسی های توصیفی غنی، گردش کار و کد مشترک برای توانمندسازی کل جامعه. پورتال داده نئون مثال خوبی از این است که چگونه ابرداده های غنی می توانند کشف آسان تر داده های بالقوه مفید را فراهم کنند.
2.7 مجلات “زنده”.
شاید جام مقدس تکرارپذیری یک مقاله ژورنالی باشد که همچنین یک آزمایش قابل اجرا است – تحلیلی را در کلمات، فرمول‌ها و کدها توصیف می‌کند، که می‌تواند توسط خواننده تکرار شود، به‌عنوان مثال Chumbe و همکاران. (2015). یک مثال عالی و جدید، مجله Physiome است  که نویسندگان را تشویق می‌کند تا گردش‌های کاری تحلیلی کاملی را که با انتشارات مقالات سنتی‌ترشان همراه است، ارسال کنند. Physiome ارسال‌ها را ارزیابی می‌کند تا تکرارپذیری، قابلیت استفاده مجدد و کشف‌پذیری آنها را تعیین کند“. حداقل، ارسال‌های پذیرفته‌شده در حالت اجرایی تضمین می‌شوند که پیش‌بینی‌های مدل‌سازی را در یک مقاله اولیه همراه بازتولید می‌کند و برای دسترسی دائمی جامعه بایگانی می‌شوند.» این مجله از کتابخانه‌های روش تثبیت‌شده، هستی‌شناسی‌های فرآیند و داده، توصیف‌های رایج گردش کار و داده‌های بسته‌بندی شده برای ارائه ادعاهای بلندپروازانه خود استفاده می‌کند. این نقطه اوج چندین سال تحقیق مشترک در بخشی از جامعه مهندسی زیستی است. آیا نمی‌توانیم همین کار را با استفاده از پایگاه کد یک GIS منبع باز انجام دهیم؟
3. نتیجه گیری

اگر چالش‌های eScience را جدی بگیریم، برای بهبود شیوه نمایش، ارتباط، بایگانی، کشف، استفاده مجدد و ارزش‌گذاری نتایج تحصیلی خود با تغییر رفتار خود تلاش خواهیم کرد. این شامل مضاعف کردن تلاش‌هایمان برای باز کردن تحقیقات خود برای همه، و تا آنجا که می‌توانیم قابل تکرار باشد، شفاف است. همچنین ممکن است مستلزم به چالش کشیدن وضعیت موجود در دانشگاه باشد، که همیشه باعث تشویق مفیدترین و سازنده ترین رفتارها نمی شود. حداقل، ما باید به سمت سیستمی کار کنیم که به رفتار «خوب» پاداش دهد. یک گام کوچک ممکن است این باشد که کد و داده های منتشر شده را با وضعیت مشابه یک مقاله تحقیقاتی، با بررسی همتایان و شمارش استنادها به عنوان معیار کیفیت مورد استفاده قرار دهیم.

اگر با این چالش ها روبرو شویم، علم – و در واقع همه تحقیقات – را قابل کشف تر، تکرارپذیرتر، صادقانه تر و در نهایت مفیدتر خواهیم کرد. اگر این کار را نکنیم، آشفتگی بزرگ‌تری را به نسل بعدی محققان واگذار خواهیم کرد.

منابع:

Beard، DA، Britten، R.، Cooling، MT، Garny، A.، Halstead، MD، Hunter، PJ، Lawson، J.، Lloyd، CM، Marsh، J.، Miller، A. و Nickerson، DP (2009 ). استانداردهای فراداده CellML، ابزارها و مخازن مرتبط. معاملات فلسفی انجمن سلطنتی الف: علوم ریاضی، فیزیک و مهندسی ،  367 : 1895، pp.1845-1867. DOI:  10.1098/rsta.2008.0310 .

چامبه، اس.، کلی، بی.، و مک لئود، آر. (2015). مجلات ترکیبی: اطمینان از قابلیت کشف سیستماتیک و استاندارد جدیدترین مقالات دسترسی آزاد. کتابدار سریال: از صفحه چاپی تا عصر دیجیتال، 68 (1-4)، 143-155. DOI: 10.1080/0361526X.2015.1016856

داونهال، سی (2011). DCC Digital Curation Reference Manual, Installment on Scientific Metadata. انتشار آنلاین در دسترس از:  https://www.dcc.ac.uk/sites/default/files/documents/Scientific%20Metadata_2011_Final.pdf

فاستر، آی، و کسلمن، سی (1999). شبکه: طرح اولیه برای زیرساخت محاسباتی جدید. ناشران مورگان کافمن شابک 978-1-55860-475-9.

Fouilloux, A., Goué, N., Barnett, C., Maroni, M., Nahorna, O., Clements, D., Hiltemann, S. 2020. Galaxy 101 برای همه (Galaxy Training Materials). /training-material/topics/introduction/tutorials/galaxy-intro-101-everyone/tutorial.html . برخط؛ دسترسی به جمعه. 11 سپتامبر 2020.

هی، تی، تانسلی، اس. و تول، ک. ادز. (2009). پارادایم چهارم: کشف علمی فشرده داده، ردموند، VA: تحقیقات مایکروسافت، 2009، ISBN 978-0-9825442-0-4، https://fourthparadigm.org

کلمپ، جی، و هوبر، آر (2017). 20 سال شناسه های پایدار – کدام سیستم ها اینجا هستند؟ مجله Data Science, 16, 9. DOI: 10.5334/dsj-2017-009 .

Knoth، P. و Pontika، N. (2015) طبقه بندی علوم باز. www.fosteropenscience.eu/resources .

پرکل، جی ام (2019). سیستم های گردش کار داده های خام را به دانش علمی تبدیل می کنند. طبیعت، 573، 149-150. DOI: 10.1038/d41586-019-02619-z .

Shook, E., Hodgson, ME, Wang, S., Behzad, B., Soltani, K., Hiscox, A. and Ajayakumar, J. (2016). مدل سازی نقشه برداری موازی: روشی برای موازی سازی پردازش داده های مکانی مجله بین المللی علوم اطلاعات جغرافیایی 30 (12): 2355–2376. DOI:  10.1080/13658816.2016.1172714 .

تاکاتسوکا، م. و گهگان، م. (2002). GeoVISTA Studio : یک محیط برنامه نویسی بصری بدون کد برای تجزیه و تحلیل و تجسم داده های علم زمین. Computers and Geosciences 28(10):1131-1144 2002. DOI:  10.1016/S0098-3004(02)00031-6

ون نوردن، آر (2017). علمی که هرگز ذکر نشده است.  طبیعت ، 552، 162-164. DOI: 10.1038/d41586-017-08404-0

اهداف یادگیری:
  • با مثال‌هایی توضیح دهید که چگونه می‌توان همه انواع نتایج تحقیقات را به طور مؤثرتری به اشتراک گذاشت
  • مجموعه ای از حداقل استانداردها را برای به اشتراک گذاری مؤثرتر کد و داده های GIS پیشنهاد کنید
  • رویکرد تحقیق ارائه شده توسط ایده های eScience را با رویکردی که در حال حاضر در GIScience و جغرافیا می بینید، مقایسه کنید.
سوالات ارزشیابی آموزشی:
  1. وقتی سعی می‌کنید کار دیگران را بفهمید، چه چیزهایی را ناامیدکننده می‌دانید، مثلاً از طریق خواندن مقالات تحقیقاتی، یا تلاش برای استفاده از داده‌ها و کدهایی که خودتان ایجاد نکرده‌اید. چه چیزی را دوست داشتید در مورد این آثار باستانی بدانید، اما نمی دانید؟
  2. چگونه می توانید از آنچه از تمرین بالا یاد گرفتید برای بهبود رفتار تحقیقاتی خود استفاده کنید؟
  3. ممیزی از شیوه های تحقیقاتی خود انجام دهید تا کشف کنید که کجا می توانید تحقیقات خود را بازتر و تکرارپذیرتر کنید. برای شروع، با استفاده از این ابزار یک برنامه مدیریت داده ایجاد کنید: https://dmponline.dcc.ac.uk/ .
  4. فرآیند تحقیق معمولی خود را ترسیم کنید و فناوری های مورد بحث در بالا را بر روی آن ترسیم کنید.
    1. اگر بتوانید از تمام ایده های فوق در فعالیت های تحقیقاتی روزانه خود استفاده کنید، تمرین شما چگونه خواهد بود؟
    2. به چه کمکی نیاز دارید؟
    3. در حال حاضر چه زیرساخت‌ها و فناوری‌هایی در حوزه ما وجود ندارد که به آن‌ها نیاز دارید؟
    4. اگر بتوانیم این ایده ها را بپذیریم، تأثیرات پژوهشی ما چگونه تغییر می کند؟
منابع اضافی:

رویداد سالانه کنفرانس IEEE eScience از سال 2005 در حال اجرا است و تمام مقالات آن به صورت آنلاین در اینجا موجود است: https://escience-conference.org/

برخی از منابع عالی برای یادگیری بیشتر در مورد علوم باز و سپس تمرین آن در برنامه Foster Open Science اتحادیه اروپا در دسترس است: https://www.fosteropenscience.eu/

اصول داده های تحقیق FAIR: قابل یافتن، در دسترس، قابل همکاری و قابل استفاده مجدد: https://www.go-fair.org/fair-principles/

اصول داده های تحقیق CARE برای ارزش گذاری دانش بومی: منفعت جمعی، اختیار کنترل، مسئولیت، اخلاق: https://www.gida-global.org/care

سیستم اطلاعات جغرافیایی

GIS درآموزش arcgisآموزش GISآموزش GIS :، تکامل علم eScienceآموزش GIS از مبتدی تا حرفه ای درآموزش GIS به روش گام به گام درآموزش GISدرآموزش جی آی اس درآموزش رایگان GISآموزش رایگان GIS درآموزش کاربردی GIS درآموزش مجازی GISآموزش محیط نرم افزار GISارزیابی زمین در GISاصفهاناصفهان GISالگوی فضایی در GISامکان سنجی در GISبرگزاری دوره GIS دربهترین استاد جی آی اس دربهترین کتاب GISبهترین کلاس GIS دربهترین کلاس جی آی اس دربهترین موسسه GIS دربهترین موسسه جی آی اس درپتانسیل سنجی در GISپراکنش جغرافیایی در GISپکیج آموزش حرفه ای GISپهنه بندی اقلیمی درGISتحلیل در GISتحلیل فضایی در GISتخصصی نمودن GISتکنولوژی سیستم اطلاعات جغرافیاییتوپولوژی در gisتوسعه GISثبت نام gisثبت نام پیشرفته GISثبت نام پیشرفته درثبت نام مقدماتی GISثبت نام مقدماتی GISدردانلود آموزش GISدانلود کتاب آموزش GIS دردرون یابیدوره آموزش GISدردوره آموزش نرم افزار GISدوره آموزشی جی آی اس دررسترزر ساخت داده مکانی در GISسامانه اطلاعات جغرافیاییسخت افزار در GISسعید جوی زادهسمینار آموزش GIS درسنجش از دورسه بعدی در GISشبیه سازی در GISفیلم آموزشی GIS درکاربرد GISکاربرد جی آی اسکارگاه GIS درکارگاه آموزشی GIS درکارگاه جی آی اس درکلاس آموزش GISکلاس آموزشی GIS درگراف در GISمدرک معتبر GISمدل سازی در GISمدل های وزن دهیمکان یابیموسسه چشم انداز هزاره سوم مللنرم افزار در GISنصب GISنقشه های رقومیوکتورویدئو آموزشی GIS درویژه داوطلبین ارشد در

1 نظر

دیدگاهتان را بنویسید