خلاصه
اطلاعات جغرافیایی داوطلبانه (VGI) پتانسیل زیادی برای آشکار کردن پویایی مکانی و زمانی پدیدههای جغرافیایی دارد. با این حال، انواع سوگیری های بالقوه در VGI شناخته شده است، که بسیاری از آنها از فعالیت های مشارکت داده های داوطلبانه ریشه می گیرند. بررسی الگوها در فعالیت های مشارکت داده داوطلبانه به درک سوگیری ها کمک می کند. با استفاده از eBird به عنوان یک مطالعه موردی، این مطالعه الگوهای مکانی و زمانی را در فعالیتهای مشارکت دادههای مشارکتکنندگان eBird بررسی میکند. تلاشهای نمونهگیری eBird در مکان و زمان مغرضانه است. بیشتر تلاشهای نمونهگیری در مناطقی با جمعیتهای متراکمتر و/یا دسترسی بهتر متمرکز شدهاند، و بیشترین مناطق نمونهبرداری شده در مجاورت شهرهای بزرگ در مناطق توسعهیافته جهان هستند. گونههای پرنده گزارششده نیز از نظر فضایی نسبت به مناطقی که تلاشهای نمونهبرداری بیشتری انجام میشود، تعصب دارند. به طور موقت، تلاشهای نمونهگیری eBird و گونههای پرنده گزارششده در طول سالها افزایش مییابد، با نوسانات ماهانه قابل توجه و بهویژه دادههای بیشتر گزارششده در آخر هفتهها. چنین روندهایی با گسترش eBird و ویژگی های گونه های پرنده و ناظران هدایت می شود. تناسب استفاده از VGI باید در زمینه کاربردها با بررسی سوگیری های مکانی، زمانی و دیگر ارزیابی شود. ممکن است لازم باشد اقداماتی برای در نظر گرفتن سوگیری ها انجام شود تا بتوان استنباط های قوی را از مشاهدات VGI انجام داد. تناسب استفاده از VGI باید در زمینه کاربردها با بررسی سوگیری های مکانی، زمانی و دیگر ارزیابی شود. ممکن است لازم باشد اقداماتی برای در نظر گرفتن سوگیری ها انجام شود تا بتوان استنباط های قوی را از مشاهدات VGI انجام داد. تناسب استفاده از VGI باید در زمینه کاربردها با بررسی سوگیری های مکانی، زمانی و دیگر ارزیابی شود. ممکن است لازم باشد اقداماتی برای در نظر گرفتن سوگیری ها انجام شود تا بتوان استنباط های قوی را از مشاهدات VGI انجام داد.
کلید واژه ها:
اطلاعات جغرافیایی داوطلبانه (VGI) ؛ فعالیت های مشارکت داده ها ; الگوهای مکانی و زمانی تعصبات _ eBird
1. معرفی
بسیاری از شهروندان عادی با قدرت گرفتن از فناوریهای فضایی فراگیر مانند ردیابهای ماهوارهای ناوبری جهانی و تلفنهای هوشمند آگاه از موقعیت مکانی، اکنون به عنوان حسگرهای انسانی عمل میکنند و داوطلبانه در مشاهدات زمینی ارجاعشده زمینی در مورد طیف وسیعی از پدیدههای طبیعی و اجتماعی مشارکت میکنند. چنین داده های جغرافیایی ارائه شده توسط داوطلبان شهروند در مجموع به عنوان اطلاعات جغرافیایی داوطلبانه (VGI) نامیده می شوند [ 1 ]. برجستهترین ابتکار VGI OpenStreetMap (OSM) [ 2 ] است، پلتفرمی که داوطلبان دادههای نقشه (مثلاً خیابانها، جادهها، نقاط مورد علاقه و غیره) را برای بسیاری از نقاط جهان بر روی آن جمعآوری میکنند. eBird، یک پروژه علمی شهروندی محبوب [ 3 ، 4]، یکی دیگر از پلتفرمهای VGI است که در آن پرندهنگاران در سرتاسر جهان به صورت روزانه سوابق پرندگان مرجع جغرافیایی را به اشتراک میگذارند. دادههای چنین پلتفرمهای VGI به طور گسترده مورد استفاده قرار گرفتهاند، به عنوان مثال، برای پشتیبانی از مدیریت زمین، مدلسازی شبکه و مسیریابی [ 5 ]، و حفاظت از تنوع زیستی و تحقیقات [ 3 ، 6 ].
VGI پتانسیل زیادی برای آشکار کردن پویایی های مکانی و زمانی پدیده های جغرافیایی تحت مشاهده دارد [ 7 ، 8 ]. با این حال، مسائل مربوط به کیفیت داده های VGI مدت هاست که تحت بررسی قرار گرفته اند و به ویژه، انواع سوگیری های بالقوه در VGI شناخته شده است [ 3 ، 9 ، 10 ، 11 ، 12 ، 13 ، 14 ، 15 ]. به منظور استنتاج قوی از VGI، چنین سوگیری ها باید درک شوند و به درستی در تجزیه و تحلیل داده های VGI توضیح داده شوند [ 16 ، 17 ، 18]. برخی از سوگیری ها (به عنوان مثال، سوگیری های ناظر و طبقه بندی) را می توان به پیشینه مشارکت کنندگان داوطلب نسبت داد (به عنوان مثال، وضعیت اجتماعی، جمعیتی و اقتصادی، سطح تخصص). دیگران عمیقاً در فعالیت های مشارکت داده خود ریشه دارند [ 3 ، 19 ، 20]. به عنوان مثال، داوطلبان فردی علایق یا انگیزه های خود را دارند و اغلب تعیین می کنند که کجا و چه زمانی مشاهدات را به میل خود انجام دهند، بدون اینکه قصدی برای هماهنگی تلاش های نمونه گیری با یکدیگر و یا پیروی از طرح نمونه گیری طراحی شده (مثلاً نمونه گیری تصادفی طبقه ای) داشته باشند. به این ترتیب، مشارکت دادههای داوطلب اغلب در مکان و زمان مغرضانه است، که منجر به پوشش مکانی و زمانی مغرضانه در مشاهدات VGI میشود. بررسی الگوهای مکانی و زمانی در فعالیتهای مشارکت دادههای داوطلب، درک سوگیریهای مکانی و زمانی تعبیهشده در VGI را بهبود میبخشد. چنین تحقیقاتی به نوبه خود بر ابداع روشهایی برای کاهش سوگیری برای بهبود قابلیت اطمینان استنتاجهای حاصل از VGI [ 17 ، 18 ] روشن می کند.]. همچنین به شناسایی شکافهای مشاهدات مکانی و زمانی در مجموعه دادههای VGI کمک میکند تا تلاشهای نمونهبرداری آینده به سمت آن هدایت شوند.
چند مطالعه الگوها را در فعالیتهای مشارکت دادههای داوطلبانه در پروژههای مختلف بررسی کردهاند، و برخی الگوهای ثابت وجود دارد. با توجه به تنوع مشارکت کنندگان، سهم نسبتاً کمی از داوطلبان اغلب بیشتر داده ها را ارائه می دهند در حالی که بخش بزرگی از مشارکت کنندگان زودگذر هستند [ 19 ، 21 ، 22 ، 23 ]، که پدیده ای از نابرابری مشارکت است که به طور مداوم در جوامع آنلاین مشاهده می شود. با قانون Zipf و قانون 90-10-1 مشخص می شود [ 24 ، 25 ، 26 ]. با توجه به تنوع زمانی، مشارکت دادههای داوطلبانه در طول زمان بسیار ناهموار است [ 21]. به عنوان مثال، بیشتر کمکها به OSM در ساعات بعدازظهر و عصر و مشارکتهای بیشتری در یکشنبهها انجام شد [ 22 ]. کاربران توییتر در طول هفته در حدود ساعت 13:00 تا 1400 و 20:00 تا 21:00 توییت می کنند در حالی که کاربران فلیکر در تعطیلات آخر هفته فعال تر هستند و بیشتر عکس ها در ساعات بعد از ظهر گرفته می شوند [ 23 ]. از نظر تنوع فضایی، بیشتر مناطق جغرافیایی مشارکتکنندگان و مشارکتهای کمی دارند و بیشتر مشارکتها در شهرهای بزرگ با تراکم جمعیت بالا خوشهبندی میشوند [ 23 ، 27 ]. در مورد شناسایی عوامل شکلدهنده الگو، Bittner [ 28 ] سوگیریهای اجتماعی را در مشارکت دادهها به OSM و Wikimapia در اورشلیم، اسرائیل شناسایی کرد. بوکس و همکاران [ 19] نشان داد فراوانی گونهها، سهولت شناسایی و ارتفاع درخت به طور مثبتی با تعداد رکوردهایی که در سه پروژه علمی شهروندی تنوع زیستی در منطقه لندن بزرگ مشارکت داشتند، مرتبط بودند. گلدمن و همکاران بر اساس مطالعه ای با استفاده از داده های چهار پروژه علمی شهروندی در دانمارک. [ 29 ] فاصله پیشنهادی تا جادهها، تراکم جمعیت انسانی و پوشش زمین را میتوان برای توضیح سوگیری فضایی در تلاشهای نمونهگیری داوطلبانه مورد استفاده قرار داد. لی و همکاران [ 23] کشف کرد که افراد تحصیلکرده در مشاغل مدیریت، تجارت، علم و هنر بیشتر در تولید توییت های جغرافیایی در توییتر و عکس ها در فلیکر مشارکت دارند. اگرچه این مطالعات الگوهای مشارکت دادههای داوطلبانه را از طریق آرایهای از عدسیها بررسی کردند، تعداد کمی الگوها را در امتداد ابعاد مکانی و زمانی به طور همزمان بررسی کردهاند (به جز [ 23 ]). تحقیقات بیشتری نیز برای مدلسازی و درک اینکه چگونه عوامل مختلف ممکن است الگوهای مشارکت دادههای داوطلبانه را شکل دهند، نیاز است.
هدف این مطالعه بررسی کامل الگوهای مکانی و زمانی در فعالیتهای مشارکت دادههای داوطلبانه در میان مشارکتکنندگان eBird است. eBird توسط آزمایشگاه پرنده شناسی کورنل و انجمن ملی Audubon در سال 2002 راه اندازی شد و به بزرگترین پروژه علمی شهروندی مرتبط با تنوع زیستی در جهان تبدیل شد [ 3 ، 30 ]. دادههای پرندگان الکترونیکی برای همه آزادانه در دسترس است و برای حمایت از تصمیمهای حفاظتی و کمک به اطلاعرسانی تحقیقات پرندگان در سراسر جهان استفاده شده است. 30 ]]. با استفاده از اپلیکیشن موبایل یا وبسایت eBird، پرندهها میتوانند اطلاعات مربوط به زمان، مکان و نحوه انجام پرنده را آپلود کنند و چک لیستی از پرندگانی که دیده و شنیده شده را پر کنند. تا 31 دسامبر 2019، بیش از نیم میلیون شرکت کننده eBird به طور جمعی بیش از 50 میلیون رویداد نمونه برداری جغرافیایی ارجاع شده (یعنی چک لیست) شامل بیش از 700 میلیون مشاهده پرنده در بیش از 10000 گونه پرنده در 253 کشور و قلمرو در سراسر جهان را مشارکت داده اند. 31 ].
الگوهای مشارکت داده در eBird از طریق پروفایل مکانی یا زمانی مورد بررسی قرار گرفته است. به عنوان مثال، محققان تعداد مشاهدات و چک لیست های ارسال شده را طی سال های 2003-2013 بر اساس ماه مشخص کردند [ 3 ، 6 ، 32 ]. با این حال، پروفایل زمانی در دانه بندی دقیق تر وجود ندارد. در ارزیابی کامل بودن نظرسنجی جهانی از دادههای eBird، La Sorte و Somveille [ 33 ] تعداد چکلیستها، تعداد گونهها، و کامل بودن نظرسنجی (محاسبهشده بر اساس روز، هفته و ماه) را بر اساس دادههای انباشتهشده در طول سالهای 2002-2018 در حد مساوی مشاهده کردند. – مساحت سلول های شش ضلعی که 49811 کیلومتر است استدر منطقه با بهترین وضوح فضایی. این یک وضوح فضایی نسبتاً درشت برای آشکار کردن الگوهای فضایی در مقیاسهای فضایی ظریفتر است. بسیاری از این نتایج (به جز [ 33 ]) با توجه به ظرفیت رشد سریع eBird منسوخ شده اند. به عنوان مثال، از 1 ژانویه 2015 تا 31 دسامبر 2019، بیش از 33 میلیون رویداد نمونه برداری جدید (~ 62٪ از کل) و 450 میلیون مشاهده جدید پرنده (~64٪ از کل) به eBird ارسال شد و تعداد تجمعی مشارکت کنندگان بیش از دو برابر شد [ 31 ]. وبسایت eBird ( ebird.org ) نقشههای شبکهای تعاملی سلولی (حدود 20 کیلومتر) را ارائه میکند که توزیع فضایی تعداد گونههای پرنده مشاهدهشده و فراوانی نسبی گونهها را نشان میدهد [ 34]. چنین تجسمی به درک روند در توزیع گونه ها کمک می کند. با این حال، آنها برای آشکار کردن الگوهای مکانی و زمانی در فعالیتهای مشارکت داده پرنده (یعنی تلاشهای نمونهبرداری) بسیار مفید نیستند. به طور خلاصه، برای درک بهتر وضعیت موجود الگوهای مشارکت داده ها در VGI، یک پروفایل مکانی و زمانی به روز و جامع از داده های eBird در وضوح های مکانی و زمانی دقیق تر، و اثرات مدل سازی عوامل در شکل دادن به تلاش های نمونه گیری بسیار مورد نیاز است. پروژه هایی مانند eBird و فراتر از آن.
این مطالعه یک پروفایل جامع از دادههای eBird را برای کشف الگوهای مکانی و زمانی در فعالیتهای مشارکت دادههای داوطلبانه گزارش میکند. کشف الگوها به درک سوگیری های مکانی و زمانی کمک می کند و بنابراین استفاده بهتر از داده ها را به شما اطلاع می دهد. همچنین میتواند شکافهای مکانی و زمانی را در تلاشهای نمونهگیری موجود نشان دهد. پرندهها ممکن است تلاشهای آینده پرنده را به مناطق و/یا دورههای زمانی کمتر مشاهدهشده هدایت کنند تا پوشش دادههای eBird را بهبود بخشند. علاوه بر این، تأثیر عوامل محیطی و فرهنگی در شکلدهی به الگوی فضایی تلاشهای نمونهگیری داوطلبانه در این مطالعه از طریق مدلسازی صریح فضایی مورد بررسی قرار گرفته است. مدلسازی اطلاعات کمی در مورد تغییرات مکانی تلاشهای نمونهگیری ارائه میکند، که ممکن است در سایر فرآیندهای مدلسازی گنجانده شود (به عنوان مثال،29 ].
2. مواد و روشها
2.1. داده های eBird
دادههای eBird (نسخه: جولای 2020) از وبسایت eBird ( ebird.org ) درخواست و دانلود شدند، و سوابق با تاریخ مشاهده قبل یا در 31 دسامبر 2019 برای تجزیه و تحلیل در این مطالعه استفاده شد. مجموعه داده شامل داده های رویداد نمونه و داده های مشاهده پرنده [ 31]. اساساً، دادههای رویداد نمونهبرداری دارای سوابق مربوط به مکان (طول جغرافیایی، طول جغرافیایی)، زمان (تاریخ مشاهده) و توسط چه کسی (شناسایی شده توسط شناسه ناظر) هر جلسه پرنده (شناسایی شده توسط شناسه رویداد نمونهبرداری) است. این سوابق نشان دهنده تلاش های نمونه برداری پرنده است. دادههای رصد پرندگان حاوی اطلاعاتی درباره گونههای پرنده مشاهدهشده (شناسایی شده با نام علمی گونه) و تخمین تعداد آنها، در میان سایر موارد، در طول هر جلسه پرنده است. یک مشاهده پرنده را می توان به یک پایگاه رویداد نمونه بر روی یک شناسه رویداد نمونه گیری مشترک موجود در هر دو رکورد مرتبط دانست.
دادههای eBird از قبل پردازش شده، تجزیه و در PostgreSQL/PostGIS، یک پایگاهدادهای آزاد و منبع باز ارتباطی شی با قابلیتهای مکانی (postgis.net) بارگذاری شدند. تا 31 دسامبر 2019، مجموعاً 548365 مشارکتکننده (ناظر) eBird در 53837394 رویداد نمونهبرداری شامل 716876356 مشاهده پرنده در 10379 گونه پرنده در 253 کشور و قلمرو جهان مشارکت داشتند. توزیع دادههای eBird در سراسر کشورها و سرزمینها بسیار ناهنجار است ( جدول 1 ). کشورها و سرزمینهایی که دارای 10 بیشترین تعداد رویدادهای نمونهگیری هستند، 9/89 درصد از رویدادهای نمونهگیری و 6/84 درصد از مکانهای نمونهگیری در سراسر جهان را تشکیل میدهند.
2.2. تجسم الگوهای مکانی و زمانی
الگوهای مکانی و زمانی در فعالیت های مشارکت داده های مشارکت کنندگان eBird با تجسم نتایج پرس و جوها و تحلیل های مکانی و زمانی بر روی داده های eBird مورد بررسی قرار گرفت. پرس و جوهای SQL (زبان پرس و جو استاندارد) برای به دست آوردن آمار خلاصه در مورد رویدادهای نمونه برداری، ناظران و گونه های گزارش شده پرندگان استفاده شد. دو آمار اول نشان دهنده تلاش های نمونه برداری از مشارکت کنندگان eBird است، در حالی که آمار سوم نشان دهنده تنوع مشاهده شده گونه های پرنده است.
آمار خلاصه بالا جمعآوری و بر روی شبکهای از سلولهای طول جغرافیایی 0.25 درجه × 0.25 درجه طول جغرافیایی (28 کیلومتر × 28 کیلومتر در استوا) در سراسر جهان برای تجسم الگوهای فضایی نقشهبرداری شد. الگوهای زمانی با جمع آوری و رسم آمار خلاصه در طول دوره های زمانی دانه بندی های مختلف (سال، ماه، روز هفته) تجسم شدند. این تجسمها با هم دیدی کلی از الگوهای مکانی و زمانی در فعالیتهای مشارکت دادههای داوطلبانه مشارکتکنندگان eBird ارائه میکنند.
2.3. مدل سازی تلاش های نمونه گیری
تجسمهای مکانی و زمانی بالا، اگرچه برای کشف الگوهای مکانی و زمانی در فعالیتهای مشارکت دادههای داوطلبانه مفید است، اما بینش کمی در مورد محرکهای اساسی شکلدهنده الگوها ارائه میکند. برای این منظور، مدلسازی فضایی برای شناسایی و تعیین کمیت اثرات عوامل محیطی و فرهنگی در شکلدهی الگوهای فضایی فعلی در تلاشهای نمونهگیری مشارکتکنندگان eBird انجام شد. رویکرد Maxent ( بخش 2.3.3 ) برای مدلسازی الگوی فضایی در تلاشهای نمونهگیری eBird بر اساس مکانهای نمونهگیری در جدیدترین سال کامل 2019 ( بخش 2.3.1 ) و دادههای کمکی که عوامل محیطی و فرهنگی را مشخص میکند ( بخش 2.3) اتخاذ شد. 2 ).
2.3.1. تلاش های نمونه گیری
در سال 2019، 2،131،692 مکان نمونه برداری eBird از نظر جغرافیایی منحصر به فرد در سراسر جهان وجود داشت ( شکل 1 ). این مکانهای نمونهبرداری نشاندهنده تلاشهای نمونهگیری داوطلبانه در یک چرخه تمام سال اخیر است. توجه داشته باشید که مکان های روی دریا مشاهدات انجام شده از کشتی ها را نشان می دهد.
2.3.2. متغیرهای کمکی
مجموعهای از پنج متغیر کمکی نشاندهنده عوامل محیطی و فرهنگی برای مدلسازی الگوی فضایی در تلاشهای نمونهگیری eBird استفاده شد. بر اساس تجزیه و تحلیل داده های چهار پروژه علمی شهروندی در دانمارک [ 29 ]، پوشش زمین، تراکم جمعیت و تراکم جاده اغلب متغیرهای اصلی هستند که سوگیری فضایی را در علم شهروندی تعیین می کنند. این متغیرهای کمکی شاخص هایی از وضعیت پوشش گیاهی/کاربری زمین، شدت فعالیت انسانی و زیرساخت هستند. علاوه بر این، شاخص توسعه انسانی سازمان ملل متحد (HDI) در سطح کشور، معیاری خلاصه از میانگین دستاوردها در ابعاد کلیدی توسعه انسانی از جمله امید به زندگی، سالهای تحصیل و درآمد ناخالص ملی سرانه است. 35 ]]، در مدلسازی مورد استفاده قرار گرفت، زیرا پرندهپروری بهعنوان یک فعالیت تفریحی اغلب توسط شهروندان تحصیلکرده با درآمد سالانه بالاتر انجام میشود [ 36 ]. اگرچه متغیرهای کمکی اغلب همبستگی دارند، اما هر کدام از آنها حاوی مقدار مشخصی اطلاعات مستقل هستند. علاوه بر این، روش مدلسازی Maxent مورد استفاده در این مطالعه ( بخش 2.3.3 ) برای دستیابی به عملکرد خوب مدل به متغیرهای غیرهمبسته نیاز ندارد.
علاوه بر این، با توجه به اینکه eBird یک پروژه جهانی با مشارکت کنندگان از سراسر جهان است که داده ها را از طریق برنامه تلفن همراه یا وب سایت eBird ارسال می کنند، دانش مشارکت کننده از زبان نوشتاری که برنامه یا وب سایت در آن در دسترس است نیز می تواند در تعیین حجم بزرگ نقش داشته باشد. – مقیاس سوگیری فضایی در داده های eBird. به طور خاص، از آگوست 2015، برنامه تلفن همراه eBird فقط به پنج زبان از جمله اسپانیایی، فرانسوی، چینی (سنتی)، آلمانی و انگلیسی در دسترس است. 37 ]]، اگرچه از آن زمان به بعد زبان های بیشتری اضافه شده است. زبانی که برنامه و وبسایت در آن در دسترس است ممکن است بر مکان و اینکه چه کسی از آنها برای کمک به دادهها در eBird استفاده میکند تأثیر بگذارد. بنابراین، یک نقشه زبان رسمی در سطح کشور به عنوان یک متغیر فرهنگی اضافی در مدلسازی الگوی فضایی در تلاشهای نمونهگیری eBird استفاده شد. توجه داشته باشید که اگرچه زبان های گفتاری اغلب دارای مرزهای جغرافیایی مبهم هستند، زبان های رسمی مرزهای بسیار واضح تری دارند (مثلاً مرزهای سیاسی). علاوه بر این، زبان های رسمی، اغلب شامل اجزای گفتاری و نوشتاری، به طور گسترده در سیستم آموزشی یک کشور تدریس می شود.
مجموعه دادههای پوشش جهانی توافقنامهای که توسط پروژه EarthEnv [ 38 ] گردآوری شده بود از اینجا [ 39 ] دانلود شد. نقشه تراکم جمعیت پیشبینیشده برای سال 2020 توسط مرکز دادهها و برنامههای اجتماعی اقتصادی ناسا [ 40 ] از اینجا [ 41 ] دانلود شد. داده های تراکم جاده گردآوری شده توسط پروژه فهرست جهانی جاده ها [ 42 ] از اینجا [ 43 ] دانلود شد. تراکم جاده برای همه جاده ها (بزرگراه ها، جاده های اولیه، جاده های فرعی، جاده های سوم و جاده های محلی) بود. آخرین انتشار داده های HDI 2018 [ 35 ] با مقادیر HDI برای همه کشورهای عضو سازمان ملل [ 35 ] از اینجا دانلود شد [ 35 ] 44 ] دانلود شد]. نقشه زبان رسمی در سطح کشور که توسط CIA World Factbook، دانشگاه گرونینگن گردآوری شده است، از طریق یک سرویس ویژگی وب در اینجا دانلود شده است [ 45 ]. این شامل اولین، دوم و سوم (در صورت وجود) زبان های رسمی هر کشور است. در این مطالعه کشورها بر اساس فهرست ترتیب زبان های رسمی دسته بندی شدند. دادههای پوشش زمین، تراکم جمعیت و تراکم جاده در قالب شطرنجی با وضوح مکانی 30 ثانیه قوسی (حدود 1 کیلومتر در خط استوا) هستند. نقشه HDI با فرمت برداری و نقشه زبان با وضوح فضایی مشابه سایر متغیرهای کمکی شطرنجی شدند ( شکل 2 ).
توزیع فراوانی مکانهای نمونه بر روی متغیرهای کمکی در برابر توزیعهای فراوانی پسزمینه مربوطه (توزیع همه مقادیر متغیرهای کمکی در سراسر جهان) ترسیم شد ( شکل 3 ). توزیع پسزمینه متغیر کمکی زبان رسمی بهعنوان درصد هر زبان از جمعیت جهان در سال 2019 در سطح کشور محاسبه شد (دادههای جمعیت در اینجا [ 46 ] به دست آمد.]). توزیع پسزمینه HDI به عنوان توزیع فراوانی مقادیر HDI در سطح کشور با وزن جمعیت هر کشور در سال 2019 محاسبه شد. فراوانیهای نسبی نوع پوشش زمین، تراکم جمعیت و تراکم جاده به عنوان درصد مساحت محاسبه شد. توزیعهای فراوانی نشان میدهد که شدت نمونهبرداری از مشارکتکنندگان eBird در مناطقی از پوشش گیاهی کشتشده و مدیریتشده و در مناطق شهری/ساختشده بالاتر است. اگرچه تنها حدود 40 درصد از مکان های نمونه برداری در مناطقی با تراکم جمعیت بالای 100 نفر در کیلومتر مربع است .، با توجه به توزیع پس زمینه، این درصد بالایی است. حدود 75 درصد از محل های نمونه برداری در مناطقی با تراکم جاده بیش از 250 متر بر کیلومتر است. تقریباً 65 درصد از مکانهای نمونهگیری در کشورهایی هستند که انگلیسی زبان رسمی آنهاست (مثلاً ایالات متحده و بریتانیا) و 10 درصد دیگر در کشورهایی که زبان اسپانیایی زبان رسمی است. در نهایت، 80 درصد از مکانهای نمونهگیری در کشورهای توسعهیافته با HDI بیشتر از 0.9 است. همه نشان دهنده سوگیری در تلاش های نمونه گیری در امتداد ابعاد عوامل محیطی و فرهنگی است.
2.3.3. روش مدلسازی
رویکرد Maxent (حداکثر آنتروپی) [ 47 ] برای مدلسازی الگوی فضایی در تلاشهای نمونهگیری eBird اتخاذ شد. Maxent یک روش یادگیری ماشینی همه منظوره برای پیشبینی یا استنتاج از اطلاعات ناقص است و به طور گسترده در حوزههای کاربردی مختلف استفاده شده است، به عنوان مثال، مدلسازی توزیع گونهها بر اساس دادههای «فقط حضور» گونهها (مانند مکانهای وقوع) [ 47 ] و مدلسازی توزیع جغرافیایی گردشگران از مکانهایی که گردشگران بازدید کردهاند [ 48 ]. Maxent برای مدلسازی تلاشهای نمونهگیری eBird مناسب است زیرا مکانهای پرنده نیز دادههای «فقط حضور» هستند. یک مرور مفهومی از روش Maxent در زیر ارائه شده است (خوانندگان علاقه مند به جزئیات ریاضی به [ 47 مراجعه می کنند]).
Maxent یک توزیع احتمال را بر روی یک منطقه جغرافیایی متشکل از سلولهای شطرنجی گسسته (سطح احتمال) بر اساس دو ورودی تخمین میزند: مکانهایی که وقوع یک رویداد هدف را نشان میدهند و لایههای داده کمکی که عوامل محیطی را مشخص میکنند که بر وقوع رویداد تأثیر میگذارند. احتمال وقوع رویداد در یک سلول تابعی از شرایط محیطی درجا است. توزیع احتمال بر اساس اصل آنتروپی حداکثر تعیین می شود. یعنی توزیع باید تا حد امکان به یک توزیع یکنواخت نزدیک باشد در حالی که با محدودیتهای تعبیهشده در محلهای وقوع رویداد مطابقت دارد. به عنوان مثال، انتظار از توزیع بر روی متغیرهای محیطی باید نزدیک به میانگین تجربی مشاهده شده در محل وقوع باشد.47 ] و برای پیش بینی توزیع جغرافیایی گردشگران [ 48 ].
در این مطالعه، مکانهای نمونهبرداری eBird (یعنی مکانهای وقوع) و لایه دادههای شطرنجی چهار متغیر محیطی و فرهنگی برای تخمین احتمال نمونهبرداری از یک مکان توسط پرندگان (احتمال نمونهگیری) وارد Maxent شدند. در این مطالعه از نرم افزار Maxent نسخه 3.4.0 [ 49 ] استفاده شد. اکثر تنظیمات پارامتر Maxent در حالت پیشفرض نگه داشته شدند (به عنوان مثال، ویژگی خودکار، فرمت خروجی cloglog) زیرا روی یک مجموعه داده بزرگ بهخوبی تنظیم شدهاند و به طور کلی قرار است به خوبی کار کنند [ 50 ]]. تغییرات در چهار پارامتر ایجاد شد. اولاً، نمونهها (مکانهای نمونهگیری eBird) به پسزمینه اضافه نشدند، زیرا نویسنده مشاهده کرد افزودن نمونهها به پسزمینه عملکرد مدل را تا حد زیادی کاهش میدهد، زیرا تعداد زیاد مکانهای نمونهگیری وقتی به پسزمینه اضافه میشوند، به شدت پسزمینه را سوگیری میکنند. دوم، تعداد نقاط پس زمینه 500000 (پیش فرض 10000 است) با توجه به منطقه مورد مطالعه بزرگ (یعنی قاره ها و جزایر جهان) که از آن نقاط پس زمینه تصادفی انتخاب می شود، تنظیم شد. سوم، حداکثر تعداد تکرارها از 500 تکرار پیشفرض به 2000 تکرار تغییر کرد تا اطمینان حاصل شود که رویه بهینهسازی همگرا میشود. چهارم، Maxent بهطور پیشفرض مکانهای نمونه را که در همان سلول شطرنجی متغیرهای کمکی قرار دارند، حذف میکند. این تنظیم پیشفرض طوری تغییر کرد که فقط مکانهای تکراری با مختصات جغرافیایی یکسان حذف شدند. از آنجایی که موارد تکراری توسط مدل حذف میشوند، اطلاعات مربوط به بازدیدهای مکرر از همان مکان در فرآیند مدلسازی در نظر گرفته نشد. بنابراین این مدل به طور موثر احتمال وقوع حداقل یک رویداد نمونهگیری را در یک مکان مدل میکند، که با مدلسازی کل سوگیری فضایی در تلاشهای نمونهبرداری eBird متفاوت است، زیرا برخی از سایتها/مکانها رویدادهای نمونهگیری زیادی دارند. پس از حذف مکان های خارج از محدوده و مکان های تکراری، تعداد مکان های نمونه برداری eBird به کاهش یافت. بنابراین این مدل به طور موثر احتمال وقوع حداقل یک رویداد نمونهگیری را در یک مکان مدل میکند، که با مدلسازی کل سوگیری فضایی در تلاشهای نمونهبرداری eBird متفاوت است، زیرا برخی از سایتها/مکانها رویدادهای نمونهگیری زیادی دارند. پس از حذف مکان های خارج از محدوده و مکان های تکراری، تعداد مکان های نمونه برداری eBird به کاهش یافت. بنابراین این مدل به طور موثر احتمال وقوع حداقل یک رویداد نمونهگیری را در یک مکان مدل میکند، که با مدلسازی کل سوگیری فضایی در تلاشهای نمونهبرداری eBird متفاوت است، زیرا برخی از سایتها/مکانها رویدادهای نمونهگیری زیادی دارند. پس از حذف مکان های خارج از محدوده و مکان های تکراری، تعداد مکان های نمونه برداری eBird به کاهش یافت.n = 1,920,182. نیمی از مکانها ( 960091= n ) برای آموزش مدل و نیمی دیگر به عنوان دادههای آزمون برای ارزیابی عملکرد مدل استفاده شد.
عملکرد مدل Maxent با محاسبه AUC (منطقه زیر منحنی) نقشه احتمال نمونهبرداری پیشبینیشده بر اساس مکانهای نمونهگیری در دادههای آزمون و مکانهای پسزمینه بهطور تصادفی انتخاب شده ارزیابی شد [ 50 ]. AUC، یک معیار عملکرد مدل مستقل از آستانه، احتمال این است که احتمال نمونهگیری پیشبینیشده در یک مکان بهطور تصادفی انتخابشده بیشتر از یک مکان پسزمینه انتخابی تصادفی باشد [ 47 ]. محدوده AUC از 0 تا 1 است، با AUC = 1 نشان دهنده عملکرد کامل مدل، AUC = 0.5 نشان دهنده عملکرد قابل مقایسه با یک مدل تصادفی، و AUC <0.5 نشان دهنده عملکرد مدل بدتر از مدل تصادفی است.
3. نتایج
3.1. الگوهای مکانی و زمانی
3.1.1. رویدادهای نمونه برداری
رویدادهای نمونهگیری که توسط مشارکتکنندگان eBird انجام شد، در فضای جغرافیایی بسیار مغرضانه بود ( شکل 4 ). بسیاری از نقاط جهان هنوز توسط eBirders نمونه برداری نشده اند. در میان سلولهای شبکهای که نمونهبرداری شدهاند، نیمی از آنها کمتر از نه رویداد نمونهگیری در یک سلول دارند. مناطق نمونه عمدتاً مناطق توسعه یافته جهان با دسترسی بهتر (به عنوان مثال، تراکم جاده بالاتر) هستند. بیشترین مناطق نمونه برداری شده در مجاورت شهرهای بزرگ جهان قرار دارند.
به صورت سالانه، تعداد کل رویدادهای نمونه گیری از سال 2002 به طور تصاعدی (یعنی با سرعت بیشتری) افزایش یافته است ( شکل 5 ). طی ماههای سالهای 2002-2019، تعداد رویدادهای نمونهبرداری در نیمکره شمالی از مارس یا آوریل افزایش یافت و در ماه می به اوج خود رسید ( شکل 6 ). سپس تلاشهای نمونهگیری به طور قابلتوجهی کاهش یافت و در جولای یا آگوست به کمترین میزان خود رسید. در نیمکره جنوبی، رویدادهای نمونه برداری در ماه مه یا ژوئن کمترین و در اکتبر یا نوامبر بیشترین تعداد را داشتند. تعداد کلی رویدادهای نمونه برداری در سراسر جهان روند ماهانه مشابهی را در نیمکره شمالی دنبال کرد. در طول روزهای هفته تا سالها ( شکل 7، رویدادهای نمونه گیری در تعطیلات آخر هفته بیشتر از روزهای هفته بود.
تعداد گونههای گزارششده در سراسر رویدادهای نمونهبرداری کجشده است ( شکل 8 ). به طور متوسط در هر رویداد نمونه برداری 13 گونه گزارش شد. با این حال، بیش از نه گونه در نیمی از رویدادهای نمونهبرداری گزارش نشده است. حدود 15.5٪ از رویدادهای نمونه برداری فقط یک گونه، 36.1٪ 2-10 گونه، 37.5٪ 10-30 گونه، و 10.6٪ 30 گونه یا بیشتر را گزارش کردند.
رویدادهای نمونه برداری با تعداد بسیار زیادی از گونه ها وجود دارد. پس از بررسی سوابق در پایگاه داده، مشخص شد که n = 29 رویداد با 300 گونه یا بیشتر مشاهده شده، و n = 480 رویداد با 200 گونه یا بیشتر (آمار به دست آمده بر اساس مشاهدات پرندگان بررسی و تایید شده توسط eBird) وجود دارد. اکثر ( n= 349) از رویدادها با نظرات سفر همراه هستند که اطلاعات متنی را ارائه می دهند، اگرچه برخی به زبان انگلیسی نیستند. به طور کلی، بسیاری از این رویدادها با تعداد زیادی گونه، رویدادهای پرنده “معمولی” نیستند. برای مثال، برخی رویدادها عبارتند از (1) مجموعهای از سوابق پرنده در دورههای طولانی پرنده (به عنوان مثال، روزها یا هفتهها)، (2) سوابق وارد شده از نشریات، (3) رویدادهای پرنده شامل گروههایی از پرندگان که سوابقی را در یک رکورد ارسال کردهاند، (4) رویدادهای ویژه پرنده مانند راهنمای صحرایی، و (5) رویدادهای پرنده روز بزرگ که هدف پرندهها یافتن بیشترین تعداد پرنده در یک روز بود. با این وجود، با توجه به حجم نمونه بسیار بزرگ ( n ) انتظار نمی رود که چنین رویدادهای پرندگان تأثیر قابل توجهی بر آمار گزارش شده در این مقاله داشته باشند (به عنوان مثال، میانگین تعداد گونه ها در هر رویداد).= 53,837,394 رویداد در کل).
3.1.2. ناظران
الگوی توزیع فضایی مشارکت کنندگان (ناظران) eBird بر روی سلول های شبکه 0.25 درجه عرض جغرافیایی × 0.25 درجه طول جغرافیایی ( شکل 9 ) مشابه رویدادهای نمونه گیری بود. در میان سلولهای شبکهای که توسط ناظران پوشانده شدهاند، نیمی از سلولها کمتر از چهار ناظر مشارکتکننده دارند.
تعداد ناظران فعال (ناظرانی که حداقل در یک رویداد نمونهگیری مشارکت داشتهاند) از سال 2002 بهطور تصاعدی افزایش یافته است ( شکل 10 ). قابل توجه است که افزایش قابل توجهی در تعداد ناظران در سال 2013 وجود داشت. طی ماههای سال ( شکل 11 )، بیشترین اوج در تعداد ناظران فعال در نیمکره شمالی اغلب در ماه مه رخ داد، اما از سال 2013 شاهد دیگری بود. اوج در فوریه در نیمکره جنوبی، پرندگان در اکتبر یا نوامبر بیشترین فعالیت را داشتند، اما از سال 2015 اوج دیگری در ماه مه وجود داشت ( برای توضیحات احتمالی به بخش 4.2.2 مراجعه کنید). تعداد کلی ناظران فعال در سراسر جهان روند ماهانه مشابهی را در نیمکره شمالی دنبال کرد. در طول روزهای هفته (شکل 12 )، تعداد ناظران فعال در تعطیلات آخر هفته بیشتر از روزهای هفته بود.
ناظران بر اساس (1) سالی که در آن اولین مشاهده را به eBird ارسال کردند، (2) سالی که در آن آخرین مشاهده را ارسال کردند، (3) تعداد سال های بین اولین و آخرین مشاهدات، و (4) گروه بندی شدند. تعداد روزهای مشاهدات ( شکل 13). نتایج گروه بندی (1) و (2) به ترتیب تعداد ناظران ورودی و خروجی eBird در هر سال (به جز سال 2019) را نشان می دهد. با گذشت سالها، تعداد ناظران ورودی و خروجی هر دو به طور تقریبی افزایش یافت. افزایش شدیدی در تعداد ناظرانی که در سال 2013 وارد eBird شدند، به دنبال آن کاهش جزئی و فلات طی سالهای 2014 تا 2017 و افزایش اندک در سال 2018 و جهش قابل توجه دیگری در سال 2019 مشاهده شد. نتایج گروهبندی (3) و (4) گستره زمانی فعالیت های پرنده ناظران را به ترتیب در واحدهای سال و روز نشان می دهد. حدود 67.9 درصد از ناظران تنها در یک سال، 9.7 درصد در دو سال متوالی، 5.2 درصد در سه سال متوالی و 17.2 درصد در چهار سال متوالی یا بیشتر مشارکت کردند. صحبت از تعداد روزهای با مشاهده، 40. 6٪ از ناظران مشاهدات را در یک روز، 36.3٪ در 2 تا 10 روز، و 23.1٪ در 10 روز یا بیشتر مشارکت داشتند. چنین الگوهایی در مشارکت کنندگان در طول زمان با چرخه زندگی مشارکت کنندگان در جوامع آنلاین مشترک سازگار است [51 ].
به طور متوسط، هر ناظر 98 رویداد نمونهبرداری را انجام داد، از 32 مکان نمونه برداری کرد و 84 گونه را گزارش کرد ( شکل 14 ). با این وجود، نیمی از ناظران بیش از سه رویداد نمونهبرداری انجام ندادند، تنها از یک مکان نمونهبرداری کردند و بیش از 17 گونه را گزارش نکردند. حدود 37٪ از ناظران فقط یک رویداد نمونه گیری، 53.8٪ 2-100 رویداد نمونه گیری، و 9.2٪ 100 یا بیشتر رویداد نمونه گیری مشارکت داشتند. تقریباً 52.9٪ از ناظران تنها از یک مکان نمونه برداری کردند، 41.4٪ از 2-100 مکان و 5.7٪ از 100 مکان یا بیشتر نمونه برداری کردند. تقریباً 13.5٪ از ناظران فقط یک گونه، 67.2٪ 2-100 گونه و 19.3٪ 100 گونه یا بیشتر را گزارش کردند.
3.1.3. گونه پرنده
توزیع گونه های پرنده گزارش شده توسط مشارکت کنندگان eBird نیز بسیار منحرف و از نظر مکانی مغرضانه است ( شکل 15 ). در بسیاری از نقاط جهان هنوز هیچ گونه پرنده ای گزارش نشده است زیرا تلاش های نمونه برداری در آن مناطق انجام نشده است ( بخش 3.1.1 ). در میان سلولهای شبکهای با مشاهدات پرندگان، نیمی از آنها تعدادی گونه پرنده گزارششده زیر 42 دارند.
تعداد کل گونه های گزارش شده به eBird در یک سال از سال 2002 به صورت خطی در حال افزایش بوده است، اما از سال 2017 به فلج رسیده است ( شکل 16 ). از سال 2002 تا 2019، تعداد گونه های پرنده گزارش شده از 8740 به 10053 گونه افزایش یافته است (حدود 15 درصد افزایش). یک افزایش شدید در سال 2005 و یک جهش دیگر در حدود سال 2010 وجود داشت. تعداد بیشتری از گونه ها در ماه نوامبر تا مارس در نیمکره شمالی در حالی که در ژوئیه تا نوامبر در نیمکره جنوبی مشاهده شد ( شکل 17 ). تعداد کلی گونه های گزارش شده اغلب در اکتبر یا نوامبر به اوج خود رسید. در طول روزهای هفته ( شکل 18 )، تعداد بیشتری از گونه ها در تعطیلات آخر هفته نسبت به روزهای هفته گزارش شده است.
برای هر گونه پرنده موجود در پایگاه داده eBird، تعداد ناظرانی که گونه را گزارش کردند و تعداد رویدادهای نمونه برداری که در آن گونه گزارش شده بود شمارش شد ( شکل 19 ). نیمی از گونه ها توسط بیش از 671 ناظر و در بیش از 1942 رویداد نمونه گزارش شده است. به طور متوسط، هر گونه پرنده توسط 3617 ناظر و در 66037 رویداد نمونهبرداری گزارش شد، که نشاندهنده مشاهده کلی گونههای بسیار تکراری است. تنها 0.4 درصد از گونه ها توسط یک ناظر و 0.3 درصد در یک رویداد نمونه برداری گزارش شده است، در حالی که حدود 83.7 درصد از گونه ها توسط بیش از 100 ناظر و 89.2 درصد در بیش از 100 رویداد نمونه گیری گزارش شده است.
3.2. مدل سازی تلاش های نمونه گیری
3.2.1. تجزیه و تحلیل اهمیت متغیر
با توجه به تخمین درصد مشارکت متغیرهای محیطی و فرهنگی به مدل ارائه شده در خروجی Maxent ( جدول 2)به نظر می رسد تراکم جاده و زبان رسمی دو عامل مهم در مدل Maxent هستند. پوشش زمین و HDI سهم بسیار کمتری دارند و تراکم جمعیت سهم بسیار کمی در مدل دارد. اهمیت جایگشت برای هر متغیر، افت حاصل در AUC آموزشی است (نرمال شده به درصد) زمانی که مقادیر آن متغیر در نمونهگیری آموزشی و مکانهای پسزمینه بهطور تصادفی جابهجا میشوند و مدل بر روی دادههای جایگزین آموزش داده میشود. AUC آموزش زمانی که مقادیر HDI جایگشت مییابد و پس از آن زبان رسمی، بیشترین کاهش را خواهد داشت. جایگشت در سه متغیر دیگر باعث کاهش کمی در AUC آموزشی می شود. این نشان میدهد که HDI و زبان رسمی عوامل کنترلکننده مهمی هستند که مکانهای نمونهگیری پرندگان را در مقیاسهای فضایی بزرگ (مثلاً در سطح کشور) تعیین میکنند.
علاوه بر این، بر اساس نتایج آزمون jackknife با اهمیت متغیر ( شکل 20متغیر با بالاترین AUC تست زمانی که به صورت مجزا استفاده می شود، تراکم جاده است، بنابراین به نظر می رسد که به خودی خود مفیدترین اطلاعات را داشته باشد. با این استاندارد، HDI و زبان رسمی اطلاعات مفید کمی دارند و پوشش زمین و جمعیت کمترین اطلاعات مفید را دارند. متغیری که AUC آزمون را در صورت حذف شدن بیشتر کاهش می دهد، زبان رسمی است، بنابراین به نظر می رسد بیشترین اطلاعاتی را دارد که در سایر متغیرها وجود ندارد. با این وجود، کاهش در AUC آزمون هنگام حذف هر متغیر نسبتاً ناچیز است، به این معنی که استفاده از هر چهار متغیر منجر به عملکرد مدل (که توسط AUC اندازهگیری میشود) بسیار نزدیک به عملکرد هر پنج متغیر میشود. با این حال، سهم متغیر و اهمیت متغیر باید با احتیاط تفسیر شود زمانی که متغیرهای پیش بینی همبسته هستند. در این مورد،پیرسون r = 0.48، p < 0.001) و بین HDI و میانگین تراکم جاده در سطح کشور ( Pearson ‘s r = 0.27، p <0.001).
3.2.2. احتمال نمونه گیری مدل شده
نقشه احتمال نمونه گیری مشارکت کنندگان eBird (یعنی احتمال وقوع حداقل یک رویداد نمونه برداری) که با استفاده از روش Maxent مدل و پیش بینی شده است (با هر پنج متغیر کمکی) در شکل 21 نشان داده شده است.. AUC محاسبهشده برای نقشه احتمال بر اساس دادههای آزمون نگهداشتهشده 0.955 است که نشاندهنده عملکرد عالی مدل است. به این معنا که مدل به طور کلی مقادیر احتمال نمونهگیری بالاتری را در مکانهای نمونهگیری در دادههای آزمایشی نسبت به مکانهای پسزمینه انتخابی تصادفی پیشبینی میکند. در سراسر جهان، کشورهای انگلیسی و اسپانیایی زبان بالاترین احتمال نمونه گیری مدل شده را دارند. سایر کشورهای اروپایی و برخی از کشورهای آسیایی نیز احتمال نمونه گیری مدل شده بالاتری دارند. جالب اینجاست که اکثر کشورهایی که احتمال نمونه گیری مدل شده بالایی دارند، کشورهای بسیار توسعه یافته در جهان هستند. تنوع فضایی زیادی در احتمال نمونه برداری مدل شده در هر کشور وجود دارد. برای مثال، احتمال نمونهگیری بالاتر در بخشهای جنوبی کانادا و نیمه شرقی و ساحل غربی ایالات متحده مدلسازی شد. به ویژه در مجاورت شهرهای بزرگ. در استرالیا، بیشترین احتمال نمونه برداری در سواحل شرقی و جنوب شرقی، به ویژه در مجاورت شهرهای بزرگ مشاهده شد. این مناطق و/یا شهرها جایی هستند که اکثر جمعیت در آن ساکن هستند و بیشتر زیرساخت ها (به عنوان مثال، جاده ها) ساخته شده است.
4. بحث
4.1. الگوهای فضایی در داده های eBird
تلاشهای نمونهگیری eBird موجود (رویدادهای نمونهبرداری و مشاهدهکنندگان) بیشتر در مناطقی با جمعیتهای متراکمتر و/یا دسترسی بهتر (مثلاً تراکم جادههای بالاتر) متمرکز شدهاند، و بیشترین مناطق نمونهبرداری شده در مجاورت شهرهای بزرگ در مناطق توسعهیافته جهان قرار دارند. شکل 4 و شکل 9 ). چنین سوگیری فضایی تفاوت های قابل توجهی را در فعالیت های پرنده خواری مشارکت کنندگان eBird در مناطق توسعه یافته و توسعه نیافته برجسته می کند. با توجه به تلاشهای نمونهبرداری با سوگیری فضایی، تعداد گونههای پرنده گزارششده نیز از نظر فضایی به سمت مناطقی که تلاشهای نمونهبرداری بیشتری انجام میشود، سوق داده شد ( شکل 15).). با وجود پوشش جغرافیایی گسترده دادههای eBird، شکافهایی در تلاشهای نمونهگیری مشارکتکنندگان eBird وجود دارد. بسیاری از نقاط جهان مانند آفریقای مرکزی، آمازون و سیبری هنوز نمونه برداری نشده اند.
برخی از دلایل زیربنای الگوهای فضایی در تلاش های نمونه گیری مشارکت کنندگان eBird به ویژگی های محیط اجتماعی و فیزیکی مربوط می شود. مدلسازی حداکثری تلاشهای نمونهگیری با متغیرهای کمکی منتخب برای آشکار کردن برخی از این اثرات در نظر گرفته شد. همانطور که توسط نتایج تجزیه و تحلیل اهمیت متغیر ( بخش 3.2.1 ) نشان داده شد، در میان عوامل در نظر گرفته شده، زبان رسمی، تراکم جاده و HDI می تواند به توضیح بیشتر تنوع مکانی در تلاش های نمونه گیری مشارکت کنندگان eBird در سراسر جهان کمک کند. به نظر میرسد زبان رسمی و HDI تعصب فضایی را در تلاشهای نمونهگیری در مقیاسهای فضایی بزرگ (مثلاً در سطح کشور) تعیین میکنند. کشورهای انگلیسی و اسپانیایی زبان به طور فشرده توسط مشارکت کنندگان eBird نمونه برداری شده اند ( شکل 3). وب سایت eBird و برنامه تلفن همراه تنها به چند زبان در دسترس هستند. مزیت زبان ممکن است مشارکت برخی از جمعیت های پرنده را تشویق کرده باشد، اما همچنین مانعی است که ممکن است از مشارکت سایر پرنده ها در eBird جلوگیری کند. بخش بزرگی (80%) از مکانهای نمونهبرداری در کشورهای توسعهیافته با مقادیر HDI بالا (بالاتر از 0.9) یافت میشود ( شکل 3)) نشان می دهد که پرنده نگری به عنوان یک فعالیت تفریحی بیشتر توسط شهروندان کشورهای توسعه یافته انجام می شود. تراکم جاده ممکن است تعصب فضایی را در تلاشهای نمونهبرداری در مقیاسهای فضایی کوچکتر تعیین کند (مثلاً در داخل کشورها). بخش بزرگی از مکانهای نمونهبرداری در مناطق با تراکم جادهای زیاد است. در مقابل، مناطقی با تلاش کم یا بدون تلاش برای نمونه برداری (مثلاً آفریقای مرکزی، آمازون ها و سیبری) مناطق جغرافیایی با دسترسی بسیار محدود هستند.
با این حال، نباید انتظار داشت که متغیرهای کمکی در نظر گرفته شده در مدلسازی، همه متغیرهای فضایی را در تلاشهای نمونهگیری eBird توضیح دهند، زیرا در واقع عوامل بسیار بیشتری ممکن است نقش داشته باشند (و بنابراین مدلسازی با استفاده از متغیرهای کمکی دیگر ممکن است به نتایج معنیداری منجر شود). برای مثال، تعداد محدود مشاهدات پرنده الکترونیکی در برخی کشورها را میتوان با استفاده از سایر پلتفرمهای محلی برای تماشای پرندگان توضیح داد، مانند پلت فرم رسمی تبادل پرندگان در سوئیس [ 52 ]، که به زبانهای ایتالیایی، فرانسوی و آلمانی نیز موجود است. یا پلتفرم عمومی تر iNaturalist [ 53]. در کشورهای پیشرفته اروپایی، عدم مشاهده eBird به دلیل استفاده از چنین پلتفرم های جایگزین به جای یک مانع زبان ساده است. در حالی که در کشورهای آفریقایی دلایل متفاوتی به جز زبان و زیرساخت برای گزارش کم در مورد eBird وجود دارد، به عنوان مثال، درگیری های داخلی و نظامی [ 54 ].
دلایل دیگر زیربنای الگوهای فضایی محلی در مشاهدات ممکن است به ویژگی های هدف مشاهده مربوط باشد، به عنوان مثال، نادر بودن و غنای گونه های پرنده و غیره (نگاه کنید به [ 55 ]] و ارجاعات موجود در آن). پرندگان به امید دیدن پرندگان به تماشای پرنده می روند. بنابراین، جایی که فعالیت های پرنده انجام می شود بستگی به محل حضور پرندگان دارد. اگر پرنده داران اطلاعات قبلی از مکان (منطقه جغرافیایی) پرندگان را داشته باشند، تمایل دارند در چنین مناطقی به دنبال پرندگان بگردند. اپلیکیشن موبایل و وبسایت eBird، بر اساس مشاهدات موجود در پایگاه داده، یک نقشه «نقاط داغ» تولید میکند که مناطقی از گونههای پرندگان غنی و نقشههای گونهای را نشان میدهد که فراوانی نسبی گونهها را نشان میدهد. بسیاری از مشارکت کنندگان eBird احتمالاً هنگام تصمیم گیری در مورد مکان تماشای پرندگان از چنین نقشه هایی به عنوان راهنما استفاده می کنند، که ممکن است به بهبود کارایی پرنده کمک کند (به عنوان مثال، پرندگان بیشتری را در یک جلسه پرنده مشاهده کنید). با این حال، این ممکن است سوگیری فضایی موجود در تلاشهای نمونهگیری را نیز تقویت کند، زیرا نقشه «نقاط داغ» بر اساس دادههای حاصل از تلاشهای نمونهگیری با سوگیری فضایی است.
4.2. الگوهای زمانی در داده های eBird
دلایل احتمالی زیربنای الگوهای زمانی در دادههای eBird در طول سالها، ماهها و روزهای هفته در سه بخش فرعی زیر مورد بحث قرار گرفتهاند.
4.2.1. الگوها در طول سالها
در طول سالها، رویدادهای نمونهگیری و ناظران از سال 2002 بهطور تصاعدی افزایش یافتهاند ( شکل 5 و شکل 10 ). این روندی است که در بسیاری از جوامع آنلاین در مقیاس بزرگ ثابت است، و چنین افزایش هایی به طور کلی به پیشرفت های فناوری اطلاعات و ارتباطات، توسعه زیرساخت ها و غیره مربوط می شود [ 22 ، 56 ]. به طور خاص در مورد eBird، چندین پیشرفت در تاریخ پروژه eBird ممکن است به افزایش سریع فعالیتهای مشارکت دادههای داوطلبانه کمک کرده باشد، به عنوان مثال، انتشار ابزارهای جذاب پرنده در اواسط سال 2005 [ 32 ]. گسترش eBird به نیوزیلند در سال 2008 و بعداً برای پوشش کل جهان در سال 2010 [ 57]؛ برنامه موبایل منتشر شده به نام “BirdLog” که اولین و تنها برنامه ای بود که امکان ضبط و ارسال اطلاعات به eBird را در این زمینه برای پرندگان فراهم کرد [ 58 ]. انتشار اپلیکیشن موبایل eBird [ 58 ] و اپلیکیشن موبایل مرلین برای شناسایی پرنده در سال 2014 [ 59 ]. و انتشار برنامه تلفن همراه eBird با پشتیبانی از چندین زبان در سال 2015 [ 37 ]. افزایش قابل توجه تعداد ناظران از 2012 تا 2013 ( شکل 10 و شکل 13 ) ممکن است به انتشار برنامه تلفن همراه “BirdLog” در سال 2012 نسبت داده شود.
علیرغم افزایش تصاعدی در تلاشهای نمونهبرداری، تعداد گونههای گزارششده به eBird تنها به صورت خطی در طول سالها افزایش یافت ( شکل 16 )، که نشان میدهد افزایش حاشیهای در تعداد گونههای جدید گزارششده به eBird به طور نامتناسبی کمتر قابل توجه است. حجم عظیمی از تلاشهای نمونهگیری اضافی که توسط ناظران جدید انجام شده است. افزایش قابل توجه در تعداد گونه های گزارش شده در سال 2005 و در سال 2010 ممکن است به ترتیب به دلیل انتشار ابزارهای جذب کننده پرنده در سال 2005 و گسترش eBird به پوشش جهانی در سال 2010 باشد.
4.2.2. الگوها در ماه ها
طی ماهها، روندهای زمانی در رویدادهای نمونهبرداری، ناظران و گونههای پرنده گزارششده در سراسر نیمکره شمالی و جنوبی متفاوت است ( شکل 6 ، شکل 11 و شکل 17 ). در نیمکره شمالی، تعداد رویدادهای نمونه برداری، ناظران و گونه های گزارش شده پرندگان همه در ماه می به اوج خود رسید. این ممکن است به این دلیل باشد که در این نیمکره، فصل زادآوری بسیاری از پرندگان در ماه مه آغاز میشود و بسیاری از پرندگان در آن فصل با شدت بیشتری به تماشای پرندگان میروند (مثلاً، بررسی پرندگان پرورشدهنده آمریکای شمالی). اوج بالاتر دیگری در فوریه در میان ناظران از سال 2013 وجود داشت. ممکن است توضیح داده شود که (1) بسیاری از پرندگان در سراسر جهان هر فوریه در شمارش پرندگان حیاط خلوت بزرگ (GBBC) شرکت می کنند [ 60 ]]؛ (2) برنامه پرنده پرنده تلفن همراه «BirdLog» که در سال 2012 منتشر شد، ضبط و ارسال داده ها را مستقیماً در میدان امکان پذیر کرد [ 58 ]، که ممکن است به مشارکت پرندگان بیشتری در GBBC کمک کند. گونه های بیشتری در ماه های زمستان و حوالی آن در ماه های نوامبر تا مارس گزارش شد. با توجه به اینکه تلاشهای نمونهبرداری از نظر تعداد پرندگان فعال و تعداد رویدادهای نمونهبرداری در ماههای زمستان چندان فشرده نبود، تعداد بیشتر گونههای پرنده گزارششده ممکن است نشاندهنده فعالیتهای پرنده زمستانی بسیار «کارآمد» گروه کوچکتری از پرندگان باشد. پرندگان ماهری که می توانند گونه های پرندگان زیادی را شناسایی کنند. به عنوان مثال، تعداد پرندگان کریسمس از 14 دسامبر تا 5 ژانویه هر سال، بیشتر در ایالات متحده و کانادا رخ می دهد. هیچ گونه افزایشی در ماه دسامبر یا ژانویه در تعداد پرنده های فعال و همچنین در تعداد رویدادهای نمونه گیری مشاهده نشد.شکل 6 و شکل 11 ). ممکن است پرندههایی که در کریسمس Bird Count شرکت کردهاند، قبلاً در دورههای دیگر فعال بوده باشند. تنها 0.2 تا 0.5 درصد از رویدادهای نمونهگیری در هر سال در طول سالهای 2002 تا 2019 «تعداد پرندگان کریسمس» (یا انواع آن) را در نظرات سفر ذکر کردند. با این حال، شرکت کنندگان CBC ممکن است در تعداد زیادی از گونه های گزارش شده در دسامبر و ژانویه نقش داشته باشند ( شکل 17 ).
قلهها در نیمکره جنوبی در ماههای متفاوتی نسبت به شمال سقوط کردند، اما به طور کلی از مسیرهای فصلی مشابهی پیروی کردند. برای مثال، تلاشهای نمونهبرداری (رویدادهای نمونهگیری، ناظران) از ماه می یا ژوئن تا اکتبر یا نوامبر افزایش یافت ( شکل 6 و شکل 11 )، دورهای که فصل تولید مثل پرندگان در نیمکره جنوبی را در بر میگیرد. گونه های بیشتری نیز در این دوره گزارش شد ( شکل 17 ). تعداد پرندگان فعال اغلب در ماه اکتبر یا نوامبر به اوج خود می رسد، اما از سال 2015 اوج دیگری در ماه مه وجود داشت و اوج اکتبر بسیار بیشتر از تعداد پرندگان در نوامبر و دسامبر بود، که ممکن است به دلیل رویداد سالانه روز جهانی بزرگ در ماه مه باشد. 61 ] و رویداد روز بزرگ اکتبر [ 62] توسط eBird سازماندهی شده است تا پرنده داران بیشتری را درگیر پرنده گردانی کند. با این حال، از آنجایی که اکثر مشارکتکنندگان، مشارکتکنندگان موقتی هستند که تنها یک رکورد را ارسال میکنند، چنین رویدادهایی (به عنوان مثال، روز بزرگ، پرنده حیاط خلوت بزرگ) ممکن است تنها در بازههای زمانی محدود رویدادها مشارکت را افزایش دهند. افزایش در مشارکت کلی بیشتر به پیشرفتهای دیگر مربوط میشود (به عنوان مثال، انتشار “BirdLog” در سال 2012).
زمان مهاجرت پرندگان نیز ممکن است به توضیح نوسانات ماهانه کمک کند. بسیاری از پرنده داران اغلب منتظر فصل های مهاجرت هستند تا به بیرون بروند و به دنبال پرندگان مهاجر بگردند. برای مثال، در نیمکره شمالی، افزایش تعداد رویدادهای نمونهبرداری، پرندهها و گونههای فعال در ماههای مارس-آوریل و در سپتامبر-اکتبر به ترتیب با جدول زمانی ورود مهاجرت بهار و خروج پاییز مطابقت دارد.
در سطح جهانی، الگوهای زمانی در تلاشهای نمونهگیری در طول ماهها مشابه نمونههای نیمکره شمالی است که در مقایسه با نیمکره جنوبی، رویدادهای نمونهگیری و ناظران بیشتری داشتند و بنابراین، الگوها را در تلاشهای نمونهگیری کلی در سراسر جهان هدایت میکردند. کره زمین تعداد گونههای گزارششده دارای بزرگی قابل مقایسه در دو نیمکره است، اما به دلیل فصلی مخالف در دو نیمکره، طی ماهها از روندهای «متضاد» پیروی کرده است.
4.2.3. الگوها در سراسر روزهای هفته
در طول روزهای یک هفته، ناظران بیشتری در تعطیلات آخر هفته نسبت به روزهای هفته فعال بودند و تعداد بیشتری از رویدادهای نمونه برداری و گونه های بیشتری را گزارش کردند. این الگو در طول سالها ثابت است ( شکل 7 ، شکل 12 و شکل 18 ). این را می توان به این دلیل نسبت داد که پرنده نگری برای بسیاری از مردم فقط یک سرگرمی است، برخی از آنها ممکن است در تعطیلات آخر هفته از زندگی معمولی و مسئولیت های کاری خود استراحت کنند و در نتیجه می توانند زمان بیشتری را صرف پرنده شدن کنند.
با این حال، سطح تخصص پرندههایی که در تعطیلات آخر هفته فعال بودند و کیفیت ارسال دادههای آنها بهطور قابلتوجهی با کسانی که در روزهای هفته فعال بودند متفاوت بود ( شکل 22).). میانگین تعداد گونهها به ازای هر ناظر، که نشاندهنده سطح تخصص پرندگان است، در میان پرندگان فعال در آخر هفتهها کمتر بود. علاوه بر این، تعداد چک لیست های ناقص (یعنی همه گونه ها شناسایی و گزارش نشدند) و مشاهدات تایید نشده به ازای هر ناظر، دو شاخص کیفیت داده ها، هر دو در میان پرندگان فعال در تعطیلات آخر هفته بیشتر بود. شواهد نشان میدهد پرندههایی که در روزهای هفته فعال بودند، به طور کلی از سطح تخصص بالاتری برخوردار بودند و دادههای ارائه شده توسط آنها کیفیت بالاتری داشتند. این ممکن است به این دلیل باشد که تعداد بیشتری از پرندههای مبتدی فقط در آخر هفتهها به پرندهگری میروند، در حالی که پرندههای متخصص ممکن است در روزهای هفته علاوه بر آخر هفته، پرندهسازی را انجام دهند.
4.3. سوگیری ها در VGI و پیامدهای آنها
اشکال مختلفی از سوگیری در VGI به دلیل ویژگی های فعالیت های مشارکت داده داوطلبانه وجود دارد. هنگام استفاده از VGI، باید تناسب استفاده از VGI را در زمینه برنامههای کاربردی خاص با بررسی میزان سوگیریها، تأثیرات بالقوه آنها و روشهای ممکن برای توضیح سوگیریها ارزیابی کرد.
4.3.1. تعصب فضایی
سوگیری فضایی اغلب در تلاش های نمونه گیری مشارکت کنندگان داده های داوطلب ذاتی است. برخلاف نمونهگیری سنتی جغرافیایی که مکانهای نمونهگیری بر اساس یک طرح نمونهگیری فضایی مشخص (مثلاً نمونهگیری تصادفی طبقهای) طراحی میشوند، داوطلبان فردی مکانهای نمونهگیری (یعنی محل انجام مشاهدات) را عمدتاً به میل خود به شیوههای موقت یا فرصتطلبانه و بدون هماهنگی انتخاب میکنند. تلاش های نمونه گیری با سایر داوطلبان [ 18 ]. در نتیجه، تلاشهای نمونهگیری داوطلبانه اغلب در مناطق در دسترستر متمرکز میشوند ( شکل 4)) و چنین تلاشهای نمونهگیری در معرض سوگیری فضایی است. در برخی موارد، داوطلبان در مورد محل نمونه گیری بر اساس جایی که دیگران نمونه برداری کرده اند، تصمیم می گیرند. برای مثال، مشارکتکنندگان eBird ممکن است به نقشه «نقاط داغ» و نقشههای توزیع گونههای ارائهشده توسط eBird [ 34 ] مراجعه کنند و بر این اساس «نقاط داغ» (مناطق با تعداد بیشتری از گونههای پرنده گزارششده) را برای پرندگان انتخاب کنند. با این حال، این ممکن است سوگیری فضایی موجود را در تلاشهای نمونهگیری تقویت کند، زیرا مناطقی با شدت نمونهبرداری بالاتر به طور مکرر نمونهبرداری میشوند (نمونهبرداری بیش از حد) در حالی که مناطق با شدت نمونهبرداری پایینتر نمونهبرداری میشوند.
دادههای جغرافیایی ارائهشده توسط داوطلبان، هنگام استفاده از نمونههای جغرافیایی برای تجزیه و تحلیل و مدلسازی، باید معرف باشد تا بتوان ویژگیهای جمعیت زیربنایی را از نمونه با دقت رضایتبخش استنباط کرد. نمایندگی نمونههای جغرافیایی جمعآوریشده از طریق پروتکلهای نمونهگیری فضایی سنتی اغلب با پیروی از یک طرح نمونهگیری دقیق تضمین میشود، به گونهای که مکانهای نمونهبرداری به درستی شیبهای محیطی در منطقه جغرافیایی مورد علاقه را پوشش میدهند [ 63 ]. با این حال، به دلیل سوگیری فضایی در تلاشهای نمونهگیری داوطلبانه، مکانهای نمونهبرداری ممکن است پوشش خوبی نسبت به شیبهای محیطی نداشته باشند، که مانع از بازنمایی نمونههای جغرافیایی داوطلبانه میشود [ 64 ]]. برای مثال، مکانهای بیشتر یک گونه پرنده در مناطق شهری همانطور که در پایگاه داده eBird منعکس شده است، لزوماً به این معنی نیست که گونهها واقعاً زیستگاههای شهری را ترجیح میدهند. ممکن است به سادگی تلاشهای نمونهبرداری کافی در زیستگاههای غیر شهری برای کشف این گونه انجام نشده باشد. هنگامی که از مکانهای وقوع برای پیشبینی توزیع گونهها استفاده میشود، به عنوان مثال، از طریق مدلسازی توزیع گونهها، برای بهبود مدلسازی و دقت پیشبینی باید چنین سوگیری فضایی در نظر گرفته شود [ 8 ، 16 ، 17 ، 55 ، 65 ، 66 ، 67 ].
4.3.2. تعصب زمانی
سوگیری زمانی نیز در تلاشهای نمونهگیری داوطلبانه وجود دارد، به طور بالقوه در دانهبندیهای زمانی متعدد. همانطور که نمایهسازی دادههای eBird نشان میدهد، تلاشهای نمونهبرداری و گونههای گزارششده پرندگان در طول سالها افزایش مییابد، با نوسانات ماهانه قابل توجه و بهویژه مشارکتهای بیشتر در آخر هفتهها. هنگامی که مشاهدات از VGI برای تجزیه و تحلیل تغییرات زمانی پدیده های جغرافیایی استفاده می شود، چنین سوگیری زمانی باید در نظر گرفته شود [ 15 ]. به عنوان مثال، افزایش تعداد گونه های پرنده به eBird گزارش شده است ( شکل 16) به معنای افزایش تنوع پرندگان در زمین نیست. این افزایش اساساً به افزایش تلاشهای نمونهگیری نسبت داده میشود. به عنوان مثالی دیگر، اگرچه در نیمکره شمالی تعداد بیشتری از گونه های پرنده در ماه می نسبت به ماه سپتامبر به eBird گزارش شده است، نمی توان به طور قطع نتیجه گرفت که گونه های پرنده بیشتری در ماه می وجود دارند. به سادگی تعداد زیادی تلاش برای نمونه گیری در ماه سپتامبر وجود ندارد، و بنابراین، مقایسه بدون تفکیک اثرات تلاش های نمونه گیری نابرابر معنادار نخواهد بود. در واقع، زمانی که مشاهدات eBird برای مدلسازی و پیشبینی توزیع جغرافیایی گونهها استفاده میشود، تغییرات زمانی در تلاشهای نمونهبرداری اغلب با انتخاب تنها مشاهدات در دورههای معینی از تلاشهای نمونهبرداری تقریباً یکنواخت کنترل میشوند [ 8 ، 17 ]].
4.3.3. تعصب مشارکت کننده
مشارکت کنندگان داوطلب سطوح مختلفی از مهارت در ارائه داده ها دارند و سطح مهارت همان مشارکت کننده ممکن است در طول زمان تغییر کند. به عنوان مثال، سطوح مختلف تخصص در میان مشارکت کنندگان eBird ممکن است به خوبی در تعداد روزهای فعالی که مشاهدات را گزارش می کنند ( شکل 13 ) و در تعداد رویدادهای نمونه برداری گزارش شده، مکان های نمونه برداری و گونه های پرنده منعکس شود ( شکل 14 ). بسیاری از ناظران، مشارکتکنندگان موقتی هستند که تنها یک رکورد را ارسال میکنند. تنها بخش کوچکی از مشارکت کنندگان متخصصانی هستند که تمایل دارند به طور فعال مقادیر زیادی از داده ها را در درازمدت مشارکت دهند [ 51 ]. در واقع، هنگام شمارش پرندگان، هر دو تفاوت بین ناظر وجود دارد [ 68] و تفاوتهای درون مشاهدهگر (یعنی تغییر در توانایی شمارش پرندگان یک گونه خاص پس از تجربه سال اول مشاهدهگر) [ 69 ].
هنگام استفاده از داده های VGI در تجزیه و تحلیل، ممکن است لازم باشد چنین سوگیری ناظری در نظر گرفته شود. به عنوان مثال، [ 70 ] نشان می دهد که برای جمعیت های کم تراکم، استفاده از داده های ارائه شده توسط ناظران تازه کار و با تجربه ممکن است منجر به مدل های اشغال سایت اشتباه شود. مطالعات دیگر نشان دادهاند که مهارتهای مشاهده مشارکتکنندگان داوطلب را میتوان با استفاده از منحنیهای انباشت گونه [ 71 ] و ترکیب کیفیت مشاهدهگر بهعنوان یک متغیر کمکی برای توضیح تفاوتهای مشاهدهگر تخمین زد [ 68 ]. حذف اولین سال مشاهده ناظر [ 69 ] تخمین روند جمعیت را بهبود می بخشد، و ترکیب تخمین های تخصص ناظر در مدل اشغال، توزیع گونه ها را از داده های علم شهروندی بهبود می بخشد [ 72 ]].
4.3.4. تعصب مشاهده
سوگیری در مورد هدف مشاهده نیز وجود دارد. در حالی که مشاهده و شناسایی برخی از اهداف آسان است، برخی دیگر ممکن است چالش برانگیزتر باشند. در نتیجه، مشاهدات داوطلب ممکن است به سمت اهداف آسان در حجم داده ها سوگیری داشته باشد. گونه های رایج ممکن است به طور مکرر در بسیاری از رویدادهای نمونه برداری و توسط بسیاری از ناظران گزارش شوند، در حالی که تنها تعداد کمی از گونه های نادر و گریزان ممکن است گزارش شود. عارضه دیگر این است که ناظران ممکن است ترجیحات خود را در مورد آنچه که باید مشاهده و گزارش کنند داشته باشند. پرنده داران خبره ممکن است فقط به گزارش گونه های کمیاب علاقه داشته باشند و در عین حال گونه های رایج را نادیده بگیرند. چنین سوگیری مشاهده ای در VGI ممکن است در برخی کاربردهای VGI مستحق درمان باشد. در واقع، eBird به کاربران اجازه می دهد گزارش دهند که آیا یک چک لیست (یعنی رویداد نمونه برداری) شامل همه گونه هایی است که می توانند شناسایی و شناسایی کنند (چک لیست “کامل”).73 ]. eBird ناظران را تشویق میکند تا چکلیستهای کامل را ارسال کنند و نسبت بالایی (75%) از چکلیستهای ارسالشده در پایگاه داده eBird کامل هستند.
5. نتیجه گیری ها
با استفاده از eBird به عنوان مثال، این مطالعه الگوهای مکانی و زمانی را در فعالیتهای مشارکت دادههای داوطلبانه بررسی میکند. تلاشهای نمونهگیری مشارکتکنندگان eBird در مکان و زمان مغرضانه است. بیشتر تلاشهای نمونهگیری در مناطقی با جمعیتهای متراکمتر و/یا دسترسی بهتر متمرکز شدهاند، و بیشترین مناطق نمونهبرداری شده در مجاورت شهرهای بزرگ در مناطق توسعهیافته جهان هستند. با توجه به تلاشهای نمونهبرداری با سوگیری فضایی، گونههای پرنده گزارششده نیز از نظر فضایی نسبت به مناطقی که تلاشهای نمونهبرداری بیشتری انجام میشود، سوگیری دارند. به طور موقت، تلاشهای نمونهگیری eBird و گونههای پرنده گزارششده در طول سالها افزایش مییابد، با نوسانات ماهانه قابل توجه و بهویژه دادههای بیشتر گزارششده در آخر هفتهها. چنین روندهایی با توسعه مستمر پروژه eBird و ویژگی های هر دو گونه پرنده هدایت می شود (به عنوان مثال، فصل تولید مثل) و ناظران (به عنوان مثال، پرندگان بیشتر در تعطیلات آخر هفته). سایر اشکال سوگیری نیز در فعالیت های مشارکت داده های داوطلبانه وجود دارد (به عنوان مثال، سوگیری مشارکت کننده، سوگیری مشاهده). تناسب استفاده از VGI در زمینه کاربردهای خاص باید با بررسی میزان سوگیری های مکانی، زمانی و دیگر و تأثیرات بالقوه آنها ارزیابی شود. در بسیاری از موارد، سوگیری ها باید به گونه ای در نظر گرفته شوند که بتوان استنباط های قابل اعتمادی را از مشاهدات VGI انجام داد. سوگیری های زمانی و دیگر و تأثیرات بالقوه آنها. در بسیاری از موارد، سوگیری ها باید به گونه ای در نظر گرفته شوند که بتوان استنباط های قابل اعتمادی را از مشاهدات VGI انجام داد. سوگیری های زمانی و دیگر و تأثیرات بالقوه آنها. در بسیاری از موارد، سوگیری ها باید به گونه ای در نظر گرفته شوند که بتوان استنباط های قابل اعتمادی را از مشاهدات VGI انجام داد.
منابع
- Goodchild، MF Citizens به عنوان حسگر: دنیای جغرافیای داوطلبانه. ژئوژورنال 2007 ، 69 ، 211-221. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- هاکلی، م. Weber, P. OpenStreetMap: نقشه های خیابانی تولید شده توسط کاربر. محاسبات فراگیر IEEE 2008 ، 7 ، 12-18. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- سالیوان، BL; چوب، CL; ایلیف، ام جی; بانی، RE; فینک، دی. Kelling، S. eBird: یک شبکه رصد پرندگان مبتنی بر شهروند در علوم زیستی. Biol. حفظ کنید. 2009 ، 142 ، 2282-2292. [ Google Scholar ] [ CrossRef ]
- چوب، سی. سالیوان، بی. ایلیف، ام. فینک، دی. Kelling، S. eBird: درگیر کردن پرندگان در علم و حفاظت. PLoS Biol. 2011 ، 9 ، e1001220. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- ارسنجانی، ج. Zipf، A.; مونی، پی. Helbich, M. OpenStreetMap در GIScience: Experiences, Research, and Applications ; Springer: برلین/هایدلبرگ، آلمان، 2015; ISBN 3319142801. [ Google Scholar ]
- سالیوان، BL; آیکریگ، جی ال. بری، جی اچ. بانی، RE; برونز، ن. کوپر، سی بی؛ دامولاس، تی. Dhondt، AA; دیتریش، تی. فارنسورث، ا. و همکاران شرکت eBird: رویکردی یکپارچه برای توسعه و کاربرد علم شهروندی. Biol. حفظ کنید. 2014 ، 169 ، 31-40. [ Google Scholar ] [ CrossRef ]
- ساچدوا، اس. مک کافری، اس. لاک، دی. رویکردهای رسانه های اجتماعی برای مدل سازی پراکندگی دود آتش سوزی: تحقیقات علمی مکانی و زمانی و اجتماعی. Inf. اشتراک. Soc. 2017 ، 20 ، 1146-1161. [ Google Scholar ] [ CrossRef ]
- فینک، دی. هوچاچکا، WM; زاکربرگ، بی. وینکلر، DW; شابی، بی. مونسون، MA; هوکر، جی. ریدوالد، ام. شلدون، دی. Kelling، S. مدلهای اکتشافی فضایی-زمانی برای دادههای پیمایش در مقیاس وسیع. Ecol. Appl. 2010 ، 20 ، 2131-2147. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
- مالک، م.م. لامبا، اچ. ناکوس، سی. Pfeffer, J. تعصب جمعیت در توییتهای دارای برچسب جغرافیایی. در مجموعه مقالات نهمین کنفرانس بین المللی AAAI در وب و رسانه های اجتماعی، آکسفورد، انگلستان، 26-29 مه 2015. ص 18-27. [ Google Scholar ]
- براون، جی. مروری بر اثرات نمونهگیری و سوگیری پاسخ در نقشهبرداری مشارکتی اینترنتی (PPGIS/PGIS/VGI). ترانس. GIS 2017 ، 21 ، 39-56. [ Google Scholar ] [ CrossRef ]
- هچت، بی. استفنز، ام. داستان شهرها: سوگیری های شهری در اطلاعات جغرافیایی داوطلبانه. در مجموعه مقالات هشتمین کنفرانس بین المللی وب و رسانه های اجتماعی (ICWSM)، ان آربور، MI، ایالات متحده، 1 تا 4 ژوئن 2014. صص 197-205. [ Google Scholar ]
- ژانگ، ی. لی، ایکس. وانگ، آ. بائو، تی. تیان، اس. تراکم و تنوع شبکههای جادهای OpenStreetMap در چین. J. Urban Manag. 2015 ، 4 ، 135-146. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- یانگ، آ. فن، اچ. جینگ، ن. سان، ی. Zipf، A. تحلیل زمانی در مورد نابرابری مشارکت در نقشه خیابان باز: مطالعه مقایسه ای برای چهار کشور. ISPRS Int. J. Geo-Inf. 2016 ، 5 ، 5. [ Google Scholar ] [ CrossRef ]
- بصیری، ع. هاکلی، م. فودی، جی. Mooney, P. کیفیت دادههای جغرافیایی جمعسپاری شده: چالشها و مسیرهای آینده. بین المللی جی. جئوگر. Inf. علمی 2019 ، 33 ، 1588-1593. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- Boakes، EH; مک گوان، PJK؛ فولر، RA; دینگ، سی. کلارک، NE; اوکانر، ک. گرز، GM دیدگاه های تحریف شده از تنوع زیستی: سوگیری مکانی و زمانی در داده های وقوع گونه ها. PLoS Biol. 2010 ، 8 ، e1000385. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- ژانگ، جی. تقویت معناشناسی برنامه VGI با حسابداری برای تعصب فضایی. داده های بزرگ زمین 2019 ، 3 ، 255–268. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- ژانگ، جی. زو، A.-X. یک رویکرد معطوف به نمایندگی برای کاهش تعصب فضایی در VGI برای نقشهبرداری پیشبینیکننده. بین المللی جی. جئوگر. Inf. علمی 2019 ، 33 ، 1873-1893. [ Google Scholar ] [ CrossRef ]
- زو، A.-X. ژانگ، جی. وانگ، دبلیو. شیائو، دبلیو. هوانگ، Z.-P. Dunzhu، G.-S. رن، جی. Qin، C.-Z. یانگ، ال. پی، تی. و همکاران یک رویکرد مبتنی بر دادههای شهروندی برای نقشهبرداری پیشبینیکننده تغییرات فضایی پدیدههای طبیعی. بین المللی جی. جئوگر. Inf. علمی 2015 ، 29 ، 1864-1886. [ Google Scholar ] [ CrossRef ]
- Boakes، EH; گلیوزو، جی. سیمور، وی. هاروی، ام. اسمیت، سی. روی، دی بی. هاکلی، ام. الگوهای مشارکت در پروژه های تنوع زیستی علم شهروندی درک رفتار ثبت داوطلبان را افزایش می دهد. علمی Rep. 2016 , 6 , 1-11. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
- آنتونیو، وی. Skopeliti، A. اندازه گیری ها و شاخص های کیفیت VGI: یک مرور کلی. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2015 ، II-3/W5 ، 345-351. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- ساورمانا، اچ. Franzonib، C. الگوهای مشارکت کاربران علم جمعیت و پیامدهای آنها. Proc. Natl. آکادمی علمی ایالات متحده آمریکا 2015 ، 112 ، 679-684. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- نیس، پ. Zipf، A. تجزیه و تحلیل فعالیت مشارکت کننده یک پروژه داوطلبانه اطلاعات جغرافیایی – مورد OpenStreetMap. ISPRS Int. J. Geo-Inf. 2012 ، 1 ، 146-165. [ Google Scholar ] [ CrossRef ]
- لی، ال. Goodchild، MF; Xu، B. الگوهای مکانی، زمانی و اجتماعی-اقتصادی در استفاده از توییتر و فلیکر. کارتوگر. Geogr. Inf. علمی 2013 ، 40 ، 61-77. [ Google Scholar ] [ CrossRef ]
- نیلسن، جی. قانون 90-9-1 برای نابرابری مشارکت در رسانه های اجتماعی و جوامع آنلاین. 2006. در دسترس آنلاین: https://www.nngroup.com/articles/participation-inequality (در 1 اکتبر 2020 قابل دسترسی است).
- هاکلی، من چرا نابرابری مشارکت مهم است؟ Ubiquity Press: لندن، بریتانیا، 2016. [ Google Scholar ]
- کارون آرتور، بی. کانینگهام، جی. گریفیث، KM توصیف توزیع مشارکت در یک گروه پشتیبانی اینترنتی بر اساس فرکانس پست: مقایسه ای از اصل 90-9-1 و قانون Zipf. مصاحبه اینترنتی 2014 ، 1 ، 165-168. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- Girres, J.-F. Touya, G. ارزیابی کیفیت مجموعه داده OpenStreetMap فرانسه. ترانس. GIS 2010 ، 14 ، 435-459. [ Google Scholar ] [ CrossRef ]
- Bittner, C. تنوع در اطلاعات جغرافیایی داوطلبانه: مقایسه OpenStreetMap و Wikimapia در اورشلیم. جئوژورنال 2017 ، 82 ، 887–906. [ Google Scholar ] [ CrossRef ]
- گلدمن، جی. هایلمن کلاوزن، جی. هولم، تی. لوینسکی، آی. مارکوسن، بی. اولسن، ک. راهبک، سی. Tøttrup، AP چه چیزی سوگیری فضایی را در علم شهروندی تعیین می کند؟ بررسی چهار طرح ضبط با الزامات مهارتی متفاوت. غواصان. توزیع کنید. 2016 ، 22 ، 1139-1149. [ Google Scholar ] [ CrossRef ]
- ادوبون. آزمایشگاه اویتنولوژی کرنل درباره پرنده الکترونیکی. موجود به صورت آنلاین: https://ebird.org/about (در 17 سپتامبر 2019 قابل دسترسی است).
- eBird. eBird Basic Dataset Metadata (نسخه 1.12). 2019. در دسترس آنلاین: https://ebird.org/science/download-ebird-data-products (در 17 سپتامبر 2019 قابل دسترسی است).
- کلینگ، اس. لاگوزه، سی. وانگ، دبلیو.-ک. یو، جی. دامولاس، تی. گربراخت، جی. فینک، دی. Gomes, C. eBird: یک شبکه یادگیری انسان/رایانه برای بهبود حفاظت و تحقیقات تنوع زیستی. AI Mag. 2013 ، 34 ، 10-20. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- La Sorte، FA; Somveille, M. بررسی کامل پایگاه داده شهروندی-علمی جهانی از وقوع پرندگان. اکوگرافی 2020 ، 43 ، 34-43. [ Google Scholar ] [ CrossRef ]
- eBird. Hotspots-eBird را کاوش کنید. در دسترس آنلاین: https://ebird.org/hotspots (در 17 سپتامبر 2019 قابل دسترسی است).
- UNDP. شاخص ها و شاخص های توسعه انسانی: به روز رسانی آماری 2018 ; UNDP: نیویورک، نیویورک، ایالات متحده آمریکا، 2018. [ Google Scholar ]
- USFWS. پرندگان در ایالات متحده: ضمیمه تجزیه و تحلیل جمعیتی و اقتصادی به بررسی ملی ماهیگیری، شکار، و تفریحات مرتبط با حیات وحش در سال 2011 . خدمات ماهی و حیات وحش ایالات متحده: واشنگتن، دی سی، ایالات متحده آمریکا، 2013. در دسترس آنلاین: https://digitalmedia.fws.gov/digital/collection/document/id/1874/ (در 1 اکتبر 2020 قابل دسترسی است).
- eBird. موبایل اکنون به 5 زبان موجود است. در دسترس آنلاین: https://ebird.org/news/mobiletranslation/ (دسترسی در 20 مارس 2020).
- Tuanmu، MN; جتز، دبلیو. یک محصول اجماعی جهانی 1 کیلومتری پوشش زمین برای تنوع زیستی و مدلسازی اکوسیستم. گلوب. Ecol. Biogeogr. 2014 ، 23 ، 1031-1045. [ Google Scholar ] [ CrossRef ]
- پوشش زمین اجماع 1 کیلومتری جهانی. در دسترس آنلاین: https://www.earthenv.org/landcover (در 15 ژوئن 2020 قابل دسترسی است).
- مرکز شبکه بین المللی اطلاعات علوم زمین-CIESIN-دانشگاه کلمبیا. Gridded Population of the World, Version 4 (GPWv4): Population Density, Revision 11. 2018. موجود آنلاین: https://data.nasa.gov/dataset/Gridded-Population-of-the-World-Version-4-GPWv4 -Po/w4yu-b8bh (در 15 ژوئن 2020 قابل دسترسی است).
- تراکم جمعیت، نسخه 4.11 (2000، 2005، 2010، 2015، 2020). در دسترس آنلاین: https://sedac.ciesin.columbia.edu/data/set/gpw-v4-population-density-rev11 (در 15 ژوئن 2020 قابل دسترسی است).
- Meijer، JR; Huijbregts، MAJ; شوتن، KCGJ; Schipper، AM الگوهای جهانی زیرساخت های جاده ای فعلی و آینده. محیط زیست Res. Lett. 2018 , 13 , 064006. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- پایگاه داده جاده های جهانی GRIP. در دسترس آنلاین: https://www.globio.info/download-grip-dataset (در 15 ژوئن 2020 قابل دسترسی است).
- داده های توسعه انسانی (1990-2018). در دسترس آنلاین: https://hdr.undp.org/en/data (در 1 اکتبر 2020 قابل دسترسی است).
- مروری بر تمام زبان های رسمی صحبت شده در هر کشور. در دسترس آنلاین: https://www.arcgis.com/home/item.html?id=5c6ec52c374249a781aede5802994c95 (در 15 ژوئن 2020 قابل دسترسی است).
- 2020 جمعیت جهان بر اساس کشور. در دسترس آنلاین: https://worldpopulationreview.com/ (در 15 ژوئن 2020 قابل دسترسی است).
- فیلیپس، اس جی. اندرسون، آر.پی. Schapire، RE مدلسازی حداکثر آنتروپی توزیعهای جغرافیایی گونهها. Ecol. مدل. 2006 ، 190 ، 231-259. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- یان، ی. کو، سی. فنگ، سی. هوانگ، دبلیو. فن، اچ. مدلسازی حداکثر آنتروپی با دادههای رسانههای اجتماعی دارای برچسب جغرافیایی برای تعیین توزیع جغرافیایی گردشگران. بین المللی جی. جئوگر. Inf. علمی 2018 ، 32 ، 1699-1736. [ Google Scholar ] [ CrossRef ]
- فیلیپس، اس جی. دودیک، م. Schapire، نرم افزار RE Maxent برای مدل سازی سوله ها و توزیع های گونه ها، (نسخه 3.4.1). 2019. در دسترس آنلاین: https://biodiversityinformatics.amnh.org/open_source/maxent (در 1 مارس 2019 قابل دسترسی است).
- فیلیپس، اس جی. Dudík، M. مدل سازی توزیع گونه ها با Maxent: الحاقات جدید و ارزیابی جامع. اکوگرافی 2008 ، 31 ، 161-175. [ Google Scholar ] [ CrossRef ]
- بگین، دی. دیویلر، آر. Roche, S. چرخه زندگی مشارکت کنندگان در جوامع آنلاین مشترک – مورد OpenStreetMap. بین المللی جی. جئوگر. Inf. علمی 2018 ، 32 ، 1611-1630. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- به ornitho.ch خوش آمدید. در دسترس آنلاین: https://www.ornitho.ch/ (در 1 اکتبر 2020 قابل دسترسی است).
- inNaturalist. در دسترس آنلاین: https://www.inaturalist.org/ (در 1 اکتبر 2020 قابل دسترسی است).
- Conflict هنوز هم بزرگترین چالش آفریقا در سال 2020 است. در دسترس به صورت آنلاین: https://reliefweb.int/report/world/conflict-still-africa-s-biggest-challenge-2020 (در 1 اکتبر 2020 قابل دسترسی است).
- جانستون، ا. موران، ن. ماسگرو، ا. فینک، دی. بیلی، SR تخمین توزیع گونهها از دادههای علوم شهروندی با سوگیری فضایی. Ecol. مدل. 2020 , 422 , 108927. [ Google Scholar ] [ CrossRef ]
- نیومن، جی. گراهام، جی. کرال، ا. لایتوری، ام. هنر و علم حمایت از علم شهروندی چند مقیاسی. Ecol. آگاه کردن. 2011 ، 6 ، 217-227. [ Google Scholar ] [ CrossRef ]
- ویکی پدیا ای برد در دسترس آنلاین: https://en.wikipedia.org/wiki/EBird (در 17 ژوئیه 2020 قابل دسترسی است).
- برنامه موبایل eBird برای iOS اکنون در دسترس است! در دسترس آنلاین: https://ebird.org/news/ebird_mobile_ios1 (در 1 اکتبر 2020 قابل دسترسی است).
- آزمایشگاه اورینیتولوژی کورنل مرلین. در دسترس آنلاین: https://merlin.allaboutbirds.org/the-story/ (در 21 ژوئیه 2020 قابل دسترسی است).
- تعداد پرندگان حیاط خلوت عالی (جهانی) این آخر هفته! در دسترس آنلاین: https://ebird.org/news/great-global-backyard-bird-count-this-weekend/ (در 3 اکتبر 2020 قابل دسترسی است).
- روز بزرگ جهانی — 9 مه 2020. در دسترس آنلاین: https://ebird.org/news/global-big-day-9-may-2020 (در 21 ژوئیه 2020 قابل دسترسی است).
- روز بزرگ اکتبر — 19 اکتبر 2019. در دسترس به صورت آنلاین: https://ebird.org/news/october-big-day-19-october-2019 (در 21 ژوئیه 2020 قابل دسترسی است).
- جنسن، RR; Shumway، JM نمونهبرداری از جهان ما. در روش تحقیق در جغرافیا: مقدمه ای انتقادی ; Gomez, B., Jones, JP, III, Eds. جان وایلی و پسران: هوبوکن، نیوجرسی، ایالات متحده آمریکا، 2010; صص 77-90. [ Google Scholar ]
- ژانگ، جی. زو، A.-X. نمایندگی و سوگیری فضایی اطلاعات جغرافیایی داوطلبانه: یک بررسی ان GIS 2018 ، 24 ، 151-162. [ Google Scholar ] [ CrossRef ]
- پاردو، آی. پاتا، نماینده مجلس؛ گومز، دی. García, MB یک روش جدید برای مدیریت اثر تلاش نمونه برداری ناهموار در پایگاه های داده تنوع زیستی. PLoS ONE 2013 ، 8 ، e52786. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- استولار، جی. نیلسن، SE حسابداری برای تلاش نمونه گیری با سوگیری فضایی در مدل سازی توزیع گونه های فقط حضوری. غواصان. توزیع کنید. 2015 ، 21 ، 595-608. [ Google Scholar ] [ CrossRef ]
- رابینسون، OJ; رویز-گوتیرز، وی. فینک، دی. تصحیح تعصب در مدلسازی توزیع برای گونههای کمیاب با استفاده از دادههای علوم شهروندی. غواصان. توزیع کنید. 2018 ، 24 ، 460-472. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- Sauer، JR; Peterjohn، BG; پیوند، تفاوتهای WA Observer در نظرسنجی پرورش پرندگان آمریکای شمالی. Auk 1994 ، 111 ، 50-62. [ Google Scholar ] [ CrossRef ]
- کندال، WL; Peterjohn، BG; Sauer، JR; Url, S. اثرات ناظر برای اولین بار در نظرسنجی پرورش پرندگان آمریکای شمالی. Auk 1996 ، 113 ، 823-829. [ Google Scholar ] [ CrossRef ]
- فیتزپاتریک، ام سی؛ پریسر، EL; الیسون، AM; Elkinton، تعصب JS Observer و تشخیص جمعیت های کم تراکم. Ecol. Appl. 2009 ، 19 ، 1673-1679. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
- کلینگ، اس. جانستون، ا. هوچاچکا، WM; ایلیف، ام. فینک، دی. گربراخت، جی. لاگوزه، سی. La Sorte، FA; مور، تی. ویگینز، ای. و همکاران آیا می توان مهارت های رصدی دانشمندان شهروند را با استفاده از منحنی های تجمع گونه ها تخمین زد؟ PLoS ONE 2015 , 10 , e0139600. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
- جانستون، ا. فینک، دی. هوچاچکا، WM; Kelling، S. برآورد تخصص ناظر، توزیع گونه ها را از داده های علم شهروندی بهبود می بخشد. روش ها Ecol. تکامل. 2018 ، 9 ، 88-97. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- جانستون، ا. هوچاچکا، دبلیو. استریماس-مکی، ام. رویز گوتیرز، وی. رابینسون، او. اوئر، تی. کلینگ، اس. Fink, D. دستورالعملهای تحلیلی برای افزایش ارزش دادههای علوم شهروندی: استفاده از دادههای eBird برای تخمین وقوع گونهها. bioRxiv 2020 . در دسترس آنلاین: https://www.biorxiv.org/content/10.1101/574392v3.full.pdf (دسترسی در 15 ژوئن 2020).

شکل 1. توزیع فضایی مکان های نمونه برداری eBird در سال 2019.

شکل 2. متغیرهای کمکی مورد استفاده برای مدل سازی الگوی فضایی در تلاش های نمونه گیری مشارکت کنندگان eBird.

شکل 3. توزیع فراوانی مکان های نمونه برداری و جهان بر روی متغیرهای کمکی.

شکل 4. تعداد رویدادهای نمونه برداری تجمعی eBird تا 31 دسامبر 2019 روی سلول های شبکه طول جغرافیایی 0.25 درجه × طول جغرافیایی 0.25 درجه نقشه برداری شده است. فواصل زمانی به روش طبقهبندی چارکی مشخص شد.

شکل 5. تعداد رویدادهای نمونه گیری در هر سال (2002-2019).

شکل 6. درصد رویدادهای نمونه گیری در هر ماه نسبت به تعداد کل سالانه رویدادها.

شکل 7. میانگین تعداد رویدادهای نمونه گیری در هر روز از هفته در طول سالها.

شکل 8. توزیع فراوانی رویدادهای نمونه برداری بر اساس تعداد گونه های گزارش شده.

شکل 9. تعداد تجمعی ناظران تا 31 دسامبر 2019 بر روی سلول های شبکه طول جغرافیایی 0.25 درجه × طول جغرافیایی 0.25 درجه نقشه برداری شده است. فواصل زمانی به روش طبقهبندی چارکی مشخص شد.

شکل 10. تعداد ناظران فعال در هر سال (2002–2019).

شکل 11. درصد ناظران در هر ماه نسبت به تعداد کل سالانه ناظران.

شکل 12. میانگین تعداد ناظران فعال در هر روز هفته در طول سالها.

شکل 13. توزیع فراوانی ناظران بر اساس سال اولین مشاهده ( بالا سمت چپ )، سال آخرین مشاهده ( بالا سمت راست )، تعداد سالهای بین اولین و آخرین مشاهده ( پایین سمت چپ )، و تعداد تاریخهای فعال ( پایین سمت راست ).

شکل 14. توزیع فراوانی ناظران بر اساس تعداد گونه های گزارش شده ( سمت چپ )، تعداد رویدادهای نمونه برداری ( مرکز ) و تعداد مکان های نمونه برداری ( سمت راست ).

شکل 15. تعداد تجمعی گونههای گزارششده به eBird تا 31 دسامبر 2019 روی سلولهای شبکه طول جغرافیایی 0.25 درجه × طول جغرافیایی 0.25 درجه نقشهبرداری شده است. فواصل زمانی به روش طبقهبندی چارکی مشخص شد.

شکل 16. تعداد گونه های گزارش شده در هر سال (2002-2019).

شکل 17. درصد گونه های گزارش شده در هر ماه نسبت به تعداد کل سالانه گونه ها.

شکل 18. میانگین تعداد گونه های گزارش شده در هر روز هفته در طول سال ها.

شکل 19. توزیع تعداد گونه ها بر اساس تعداد ناظرانی که همان گونه پرنده را گزارش کردند ( سمت چپ ) و بر اساس تعداد رویدادهای نمونه برداری که در آن گونه مشابه گزارش شده است ( سمت راست ).

شکل 20. آزمون Jackknife با اهمیت متغیر برای مدل Maxent بر اساس آزمون AUC.

شکل 21. نقشه احتمال نمونه برداری مشارکت کنندگان eBird که با استفاده از Maxent مدل و پیش بینی شده است.

شکل 22. تعداد گونه ها ( بالا )، چک لیست های ناقص ( مرکز )، و مشاهدات تایید نشده ( پایین ) به ازای هر ناظر در طول روزهای هفته.
بدون دیدگاه