خلاصه

اطلاعات جغرافیایی داوطلبانه (VGI) پتانسیل زیادی برای آشکار کردن پویایی مکانی و زمانی پدیده‌های جغرافیایی دارد. با این حال، انواع سوگیری های بالقوه در VGI شناخته شده است، که بسیاری از آنها از فعالیت های مشارکت داده های داوطلبانه ریشه می گیرند. بررسی الگوها در فعالیت های مشارکت داده داوطلبانه به درک سوگیری ها کمک می کند. با استفاده از eBird به عنوان یک مطالعه موردی، این مطالعه الگوهای مکانی و زمانی را در فعالیت‌های مشارکت داده‌های مشارکت‌کنندگان eBird بررسی می‌کند. تلاش‌های نمونه‌گیری eBird در مکان و زمان مغرضانه است. بیشتر تلاش‌های نمونه‌گیری در مناطقی با جمعیت‌های متراکم‌تر و/یا دسترسی بهتر متمرکز شده‌اند، و بیشترین مناطق نمونه‌برداری شده در مجاورت شهرهای بزرگ در مناطق توسعه‌یافته جهان هستند. گونه‌های پرنده گزارش‌شده نیز از نظر فضایی نسبت به مناطقی که تلاش‌های نمونه‌برداری بیشتری انجام می‌شود، تعصب دارند. به طور موقت، تلاش‌های نمونه‌گیری eBird و گونه‌های پرنده گزارش‌شده در طول سال‌ها افزایش می‌یابد، با نوسانات ماهانه قابل توجه و به‌ویژه داده‌های بیشتر گزارش‌شده در آخر هفته‌ها. چنین روندهایی با گسترش eBird و ویژگی های گونه های پرنده و ناظران هدایت می شود. تناسب استفاده از VGI باید در زمینه کاربردها با بررسی سوگیری های مکانی، زمانی و دیگر ارزیابی شود. ممکن است لازم باشد اقداماتی برای در نظر گرفتن سوگیری ها انجام شود تا بتوان استنباط های قوی را از مشاهدات VGI انجام داد. تناسب استفاده از VGI باید در زمینه کاربردها با بررسی سوگیری های مکانی، زمانی و دیگر ارزیابی شود. ممکن است لازم باشد اقداماتی برای در نظر گرفتن سوگیری ها انجام شود تا بتوان استنباط های قوی را از مشاهدات VGI انجام داد. تناسب استفاده از VGI باید در زمینه کاربردها با بررسی سوگیری های مکانی، زمانی و دیگر ارزیابی شود. ممکن است لازم باشد اقداماتی برای در نظر گرفتن سوگیری ها انجام شود تا بتوان استنباط های قوی را از مشاهدات VGI انجام داد.

کلید واژه ها:

اطلاعات جغرافیایی داوطلبانه (VGI) ؛ فعالیت های مشارکت داده ها ; الگوهای مکانی و زمانی تعصبات _ eBird

1. معرفی

بسیاری از شهروندان عادی با قدرت گرفتن از فناوری‌های فضایی فراگیر مانند ردیاب‌های ماهواره‌ای ناوبری جهانی و تلفن‌های هوشمند آگاه از موقعیت مکانی، اکنون به عنوان حسگرهای انسانی عمل می‌کنند و داوطلبانه در مشاهدات زمینی ارجاع‌شده زمینی در مورد طیف وسیعی از پدیده‌های طبیعی و اجتماعی مشارکت می‌کنند. چنین داده های جغرافیایی ارائه شده توسط داوطلبان شهروند در مجموع به عنوان اطلاعات جغرافیایی داوطلبانه (VGI) نامیده می شوند [ 1 ]. برجسته‌ترین ابتکار VGI OpenStreetMap (OSM) [ 2 ] است، پلتفرمی که داوطلبان داده‌های نقشه (مثلاً خیابان‌ها، جاده‌ها، نقاط مورد علاقه و غیره) را برای بسیاری از نقاط جهان بر روی آن جمع‌آوری می‌کنند. eBird، یک پروژه علمی شهروندی محبوب [ 3 ، 4]، یکی دیگر از پلتفرم‌های VGI است که در آن پرنده‌نگاران در سرتاسر جهان به صورت روزانه سوابق پرندگان مرجع جغرافیایی را به اشتراک می‌گذارند. داده‌های چنین پلت‌فرم‌های VGI به طور گسترده مورد استفاده قرار گرفته‌اند، به عنوان مثال، برای پشتیبانی از مدیریت زمین، مدل‌سازی شبکه و مسیریابی [ 5 ]، و حفاظت از تنوع زیستی و تحقیقات [ 3 ، 6 ].
VGI پتانسیل زیادی برای آشکار کردن پویایی های مکانی و زمانی پدیده های جغرافیایی تحت مشاهده دارد [ 7 ، 8 ]. با این حال، مسائل مربوط به کیفیت داده های VGI مدت هاست که تحت بررسی قرار گرفته اند و به ویژه، انواع سوگیری های بالقوه در VGI شناخته شده است [ 3 ، 9 ، 10 ، 11 ، 12 ، 13 ، 14 ، 15 ]. به منظور استنتاج قوی از VGI، چنین سوگیری ها باید درک شوند و به درستی در تجزیه و تحلیل داده های VGI توضیح داده شوند [ 16 ، 17 ، 18]. برخی از سوگیری ها (به عنوان مثال، سوگیری های ناظر و طبقه بندی) را می توان به پیشینه مشارکت کنندگان داوطلب نسبت داد (به عنوان مثال، وضعیت اجتماعی، جمعیتی و اقتصادی، سطح تخصص). دیگران عمیقاً در فعالیت های مشارکت داده خود ریشه دارند [ 3 ، 19 ، 20]. به عنوان مثال، داوطلبان فردی علایق یا انگیزه های خود را دارند و اغلب تعیین می کنند که کجا و چه زمانی مشاهدات را به میل خود انجام دهند، بدون اینکه قصدی برای هماهنگی تلاش های نمونه گیری با یکدیگر و یا پیروی از طرح نمونه گیری طراحی شده (مثلاً نمونه گیری تصادفی طبقه ای) داشته باشند. به این ترتیب، مشارکت داده‌های داوطلب اغلب در مکان و زمان مغرضانه است، که منجر به پوشش مکانی و زمانی مغرضانه در مشاهدات VGI می‌شود. بررسی الگوهای مکانی و زمانی در فعالیت‌های مشارکت داده‌های داوطلب، درک سوگیری‌های مکانی و زمانی تعبیه‌شده در VGI را بهبود می‌بخشد. چنین تحقیقاتی به نوبه خود بر ابداع روش‌هایی برای کاهش سوگیری برای بهبود قابلیت اطمینان استنتاج‌های حاصل از VGI [ 17 ، 18 ] روشن می کند.]. همچنین به شناسایی شکاف‌های مشاهدات مکانی و زمانی در مجموعه داده‌های VGI کمک می‌کند تا تلاش‌های نمونه‌برداری آینده به سمت آن هدایت شوند.
چند مطالعه الگوها را در فعالیت‌های مشارکت داده‌های داوطلبانه در پروژه‌های مختلف بررسی کرده‌اند، و برخی الگوهای ثابت وجود دارد. با توجه به تنوع مشارکت کنندگان، سهم نسبتاً کمی از داوطلبان اغلب بیشتر داده ها را ارائه می دهند در حالی که بخش بزرگی از مشارکت کنندگان زودگذر هستند [ 19 ، 21 ، 22 ، 23 ]، که پدیده ای از نابرابری مشارکت است که به طور مداوم در جوامع آنلاین مشاهده می شود. با قانون Zipf و قانون 90-10-1 مشخص می شود [ 24 ، 25 ، 26 ]. با توجه به تنوع زمانی، مشارکت داده‌های داوطلبانه در طول زمان بسیار ناهموار است [ 21]. به عنوان مثال، بیشتر کمک‌ها به OSM در ساعات بعدازظهر و عصر و مشارکت‌های بیشتری در یکشنبه‌ها انجام شد [ 22 ]. کاربران توییتر در طول هفته در حدود ساعت 13:00 تا 1400 و 20:00 تا 21:00 توییت می کنند در حالی که کاربران فلیکر در تعطیلات آخر هفته فعال تر هستند و بیشتر عکس ها در ساعات بعد از ظهر گرفته می شوند [ 23 ]. از نظر تنوع فضایی، بیشتر مناطق جغرافیایی مشارکت‌کنندگان و مشارکت‌های کمی دارند و بیشتر مشارکت‌ها در شهرهای بزرگ با تراکم جمعیت بالا خوشه‌بندی می‌شوند [ 23 ، 27 ]. در مورد شناسایی عوامل شکل‌دهنده الگو، Bittner [ 28 ] سوگیری‌های اجتماعی را در مشارکت داده‌ها به OSM و Wikimapia در اورشلیم، اسرائیل شناسایی کرد. بوکس و همکاران [ 19] نشان داد فراوانی گونه‌ها، سهولت شناسایی و ارتفاع درخت به طور مثبتی با تعداد رکوردهایی که در سه پروژه علمی شهروندی تنوع زیستی در منطقه لندن بزرگ مشارکت داشتند، مرتبط بودند. گلدمن و همکاران بر اساس مطالعه ای با استفاده از داده های چهار پروژه علمی شهروندی در دانمارک. [ 29 ] فاصله پیشنهادی تا جاده‌ها، تراکم جمعیت انسانی و پوشش زمین را می‌توان برای توضیح سوگیری فضایی در تلاش‌های نمونه‌گیری داوطلبانه مورد استفاده قرار داد. لی و همکاران [ 23] کشف کرد که افراد تحصیلکرده در مشاغل مدیریت، تجارت، علم و هنر بیشتر در تولید توییت های جغرافیایی در توییتر و عکس ها در فلیکر مشارکت دارند. اگرچه این مطالعات الگوهای مشارکت داده‌های داوطلبانه را از طریق آرایه‌ای از عدسی‌ها بررسی کردند، تعداد کمی الگوها را در امتداد ابعاد مکانی و زمانی به طور همزمان بررسی کرده‌اند (به جز [ 23 ]). تحقیقات بیشتری نیز برای مدل‌سازی و درک اینکه چگونه عوامل مختلف ممکن است الگوهای مشارکت داده‌های داوطلبانه را شکل دهند، نیاز است.
هدف این مطالعه بررسی کامل الگوهای مکانی و زمانی در فعالیت‌های مشارکت داده‌های داوطلبانه در میان مشارکت‌کنندگان eBird است. eBird توسط آزمایشگاه پرنده شناسی کورنل و انجمن ملی Audubon در سال 2002 راه اندازی شد و به بزرگترین پروژه علمی شهروندی مرتبط با تنوع زیستی در جهان تبدیل شد [ 3 ، 30 ]. داده‌های پرندگان الکترونیکی برای همه آزادانه در دسترس است و برای حمایت از تصمیم‌های حفاظتی و کمک به اطلاع‌رسانی تحقیقات پرندگان در سراسر جهان استفاده شده است. 30 ]]. با استفاده از اپلیکیشن موبایل یا وب‌سایت eBird، پرنده‌ها می‌توانند اطلاعات مربوط به زمان، مکان و نحوه انجام پرنده را آپلود کنند و چک لیستی از پرندگانی که دیده و شنیده شده را پر کنند. تا 31 دسامبر 2019، بیش از نیم میلیون شرکت کننده eBird به طور جمعی بیش از 50 میلیون رویداد نمونه برداری جغرافیایی ارجاع شده (یعنی چک لیست) شامل بیش از 700 میلیون مشاهده پرنده در بیش از 10000 گونه پرنده در 253 کشور و قلمرو در سراسر جهان را مشارکت داده اند. 31 ].
الگوهای مشارکت داده در eBird از طریق پروفایل مکانی یا زمانی مورد بررسی قرار گرفته است. به عنوان مثال، محققان تعداد مشاهدات و چک لیست های ارسال شده را طی سال های 2003-2013 بر اساس ماه مشخص کردند [ 3 ، 6 ، 32 ]. با این حال، پروفایل زمانی در دانه بندی دقیق تر وجود ندارد. در ارزیابی کامل بودن نظرسنجی جهانی از داده‌های eBird، La Sorte و Somveille [ 33 ] تعداد چک‌لیست‌ها، تعداد گونه‌ها، و کامل بودن نظرسنجی (محاسبه‌شده بر اساس روز، هفته و ماه) را بر اساس داده‌های انباشته‌شده در طول سال‌های 2002-2018 در حد مساوی مشاهده کردند. – مساحت سلول های شش ضلعی که 49811 کیلومتر است استدر منطقه با بهترین وضوح فضایی. این یک وضوح فضایی نسبتاً درشت برای آشکار کردن الگوهای فضایی در مقیاس‌های فضایی ظریف‌تر است. بسیاری از این نتایج (به جز [ 33 ]) با توجه به ظرفیت رشد سریع eBird منسوخ شده اند. به عنوان مثال، از 1 ژانویه 2015 تا 31 دسامبر 2019، بیش از 33 میلیون رویداد نمونه برداری جدید (~ 62٪ از کل) و 450 میلیون مشاهده جدید پرنده (~64٪ از کل) به eBird ارسال شد و تعداد تجمعی مشارکت کنندگان بیش از دو برابر شد [ 31 ]. وب‌سایت eBird ( ebird.org ) نقشه‌های شبکه‌ای تعاملی سلولی (حدود 20 کیلومتر) را ارائه می‌کند که توزیع فضایی تعداد گونه‌های پرنده مشاهده‌شده و فراوانی نسبی گونه‌ها را نشان می‌دهد [ 34]. چنین تجسمی به درک روند در توزیع گونه ها کمک می کند. با این حال، آنها برای آشکار کردن الگوهای مکانی و زمانی در فعالیت‌های مشارکت داده پرنده (یعنی تلاش‌های نمونه‌برداری) بسیار مفید نیستند. به طور خلاصه، برای درک بهتر وضعیت موجود الگوهای مشارکت داده ها در VGI، یک پروفایل مکانی و زمانی به روز و جامع از داده های eBird در وضوح های مکانی و زمانی دقیق تر، و اثرات مدل سازی عوامل در شکل دادن به تلاش های نمونه گیری بسیار مورد نیاز است. پروژه هایی مانند eBird و فراتر از آن.
این مطالعه یک پروفایل جامع از داده‌های eBird را برای کشف الگوهای مکانی و زمانی در فعالیت‌های مشارکت داده‌های داوطلبانه گزارش می‌کند. کشف الگوها به درک سوگیری های مکانی و زمانی کمک می کند و بنابراین استفاده بهتر از داده ها را به شما اطلاع می دهد. همچنین می‌تواند شکاف‌های مکانی و زمانی را در تلاش‌های نمونه‌گیری موجود نشان دهد. پرنده‌ها ممکن است تلاش‌های آینده پرنده را به مناطق و/یا دوره‌های زمانی کمتر مشاهده‌شده هدایت کنند تا پوشش داده‌های eBird را بهبود بخشند. علاوه بر این، تأثیر عوامل محیطی و فرهنگی در شکل‌دهی به الگوی فضایی تلاش‌های نمونه‌گیری داوطلبانه در این مطالعه از طریق مدل‌سازی صریح فضایی مورد بررسی قرار گرفته است. مدل‌سازی اطلاعات کمی در مورد تغییرات مکانی تلاش‌های نمونه‌گیری ارائه می‌کند، که ممکن است در سایر فرآیندهای مدل‌سازی گنجانده شود (به عنوان مثال،29 ].

2. مواد و روشها

2.1. داده های eBird

داده‌های eBird (نسخه: جولای 2020) از وب‌سایت eBird ( ebird.org ) درخواست و دانلود شدند، و سوابق با تاریخ مشاهده قبل یا در 31 دسامبر 2019 برای تجزیه و تحلیل در این مطالعه استفاده شد. مجموعه داده شامل داده های رویداد نمونه و داده های مشاهده پرنده [ 31]. اساساً، داده‌های رویداد نمونه‌برداری دارای سوابق مربوط به مکان (طول جغرافیایی، طول جغرافیایی)، زمان (تاریخ مشاهده) و توسط چه کسی (شناسایی شده توسط شناسه ناظر) هر جلسه پرنده (شناسایی شده توسط شناسه رویداد نمونه‌برداری) است. این سوابق نشان دهنده تلاش های نمونه برداری پرنده است. داده‌های رصد پرندگان حاوی اطلاعاتی درباره گونه‌های پرنده مشاهده‌شده (شناسایی شده با نام علمی گونه) و تخمین تعداد آنها، در میان سایر موارد، در طول هر جلسه پرنده است. یک مشاهده پرنده را می توان به یک پایگاه رویداد نمونه بر روی یک شناسه رویداد نمونه گیری مشترک موجود در هر دو رکورد مرتبط دانست.
داده‌های eBird از قبل پردازش شده، تجزیه و در PostgreSQL/PostGIS، یک پایگاه‌داده‌ای آزاد و منبع باز ارتباطی شی با قابلیت‌های مکانی (postgis.net) بارگذاری شدند. تا 31 دسامبر 2019، مجموعاً 548365 مشارکت‌کننده (ناظر) eBird در 53837394 رویداد نمونه‌برداری شامل 716876356 مشاهده پرنده در 10379 گونه پرنده در 253 کشور و قلمرو جهان مشارکت داشتند. توزیع داده‌های eBird در سراسر کشورها و سرزمین‌ها بسیار ناهنجار است ( جدول 1 ). کشورها و سرزمین‌هایی که دارای 10 بیشترین تعداد رویدادهای نمونه‌گیری هستند، 9/89 درصد از رویدادهای نمونه‌گیری و 6/84 درصد از مکان‌های نمونه‌گیری در سراسر جهان را تشکیل می‌دهند.

2.2. تجسم الگوهای مکانی و زمانی

الگوهای مکانی و زمانی در فعالیت های مشارکت داده های مشارکت کنندگان eBird با تجسم نتایج پرس و جوها و تحلیل های مکانی و زمانی بر روی داده های eBird مورد بررسی قرار گرفت. پرس و جوهای SQL (زبان پرس و جو استاندارد) برای به دست آوردن آمار خلاصه در مورد رویدادهای نمونه برداری، ناظران و گونه های گزارش شده پرندگان استفاده شد. دو آمار اول نشان دهنده تلاش های نمونه برداری از مشارکت کنندگان eBird است، در حالی که آمار سوم نشان دهنده تنوع مشاهده شده گونه های پرنده است.
آمار خلاصه بالا جمع‌آوری و بر روی شبکه‌ای از سلول‌های طول جغرافیایی 0.25 درجه × 0.25 درجه طول جغرافیایی (28 کیلومتر × 28 کیلومتر در استوا) در سراسر جهان برای تجسم الگوهای فضایی نقشه‌برداری شد. الگوهای زمانی با جمع آوری و رسم آمار خلاصه در طول دوره های زمانی دانه بندی های مختلف (سال، ماه، روز هفته) تجسم شدند. این تجسم‌ها با هم دیدی کلی از الگوهای مکانی و زمانی در فعالیت‌های مشارکت داده‌های داوطلبانه مشارکت‌کنندگان eBird ارائه می‌کنند.

2.3. مدل سازی تلاش های نمونه گیری

تجسم‌های مکانی و زمانی بالا، اگرچه برای کشف الگوهای مکانی و زمانی در فعالیت‌های مشارکت داده‌های داوطلبانه مفید است، اما بینش کمی در مورد محرک‌های اساسی شکل‌دهنده الگوها ارائه می‌کند. برای این منظور، مدل‌سازی فضایی برای شناسایی و تعیین کمیت اثرات عوامل محیطی و فرهنگی در شکل‌دهی الگوهای فضایی فعلی در تلاش‌های نمونه‌گیری مشارکت‌کنندگان eBird انجام شد. رویکرد Maxent ( بخش 2.3.3 ) برای مدل‌سازی الگوی فضایی در تلاش‌های نمونه‌گیری eBird بر اساس مکان‌های نمونه‌گیری در جدیدترین سال کامل 2019 ( بخش 2.3.1 ) و داده‌های کمکی که عوامل محیطی و فرهنگی را مشخص می‌کند ( بخش 2.3) اتخاذ شد. 2 ).

2.3.1. تلاش های نمونه گیری

در سال 2019، 2،131،692 مکان نمونه برداری eBird از نظر جغرافیایی منحصر به فرد در سراسر جهان وجود داشت ( شکل 1 ). این مکان‌های نمونه‌برداری نشان‌دهنده تلاش‌های نمونه‌گیری داوطلبانه در یک چرخه تمام سال اخیر است. توجه داشته باشید که مکان های روی دریا مشاهدات انجام شده از کشتی ها را نشان می دهد.
2.3.2. متغیرهای کمکی
مجموعه‌ای از پنج متغیر کمکی نشان‌دهنده عوامل محیطی و فرهنگی برای مدل‌سازی الگوی فضایی در تلاش‌های نمونه‌گیری eBird استفاده شد. بر اساس تجزیه و تحلیل داده های چهار پروژه علمی شهروندی در دانمارک [ 29 ]، پوشش زمین، تراکم جمعیت و تراکم جاده اغلب متغیرهای اصلی هستند که سوگیری فضایی را در علم شهروندی تعیین می کنند. این متغیرهای کمکی شاخص هایی از وضعیت پوشش گیاهی/کاربری زمین، شدت فعالیت انسانی و زیرساخت هستند. علاوه بر این، شاخص توسعه انسانی سازمان ملل متحد (HDI) در سطح کشور، معیاری خلاصه از میانگین دستاوردها در ابعاد کلیدی توسعه انسانی از جمله امید به زندگی، سال‌های تحصیل و درآمد ناخالص ملی سرانه است. 35 ]]، در مدل‌سازی مورد استفاده قرار گرفت، زیرا پرنده‌پروری به‌عنوان یک فعالیت تفریحی اغلب توسط شهروندان تحصیل‌کرده با درآمد سالانه بالاتر انجام می‌شود [ 36 ]. اگرچه متغیرهای کمکی اغلب همبستگی دارند، اما هر کدام از آنها حاوی مقدار مشخصی اطلاعات مستقل هستند. علاوه بر این، روش مدل‌سازی Maxent مورد استفاده در این مطالعه ( بخش 2.3.3 ) برای دستیابی به عملکرد خوب مدل به متغیرهای غیرهمبسته نیاز ندارد.
علاوه بر این، با توجه به اینکه eBird یک پروژه جهانی با مشارکت کنندگان از سراسر جهان است که داده ها را از طریق برنامه تلفن همراه یا وب سایت eBird ارسال می کنند، دانش مشارکت کننده از زبان نوشتاری که برنامه یا وب سایت در آن در دسترس است نیز می تواند در تعیین حجم بزرگ نقش داشته باشد. – مقیاس سوگیری فضایی در داده های eBird. به طور خاص، از آگوست 2015، برنامه تلفن همراه eBird فقط به پنج زبان از جمله اسپانیایی، فرانسوی، چینی (سنتی)، آلمانی و انگلیسی در دسترس است. 37 ]]، اگرچه از آن زمان به بعد زبان های بیشتری اضافه شده است. زبانی که برنامه و وب‌سایت در آن در دسترس است ممکن است بر مکان و اینکه چه کسی از آنها برای کمک به داده‌ها در eBird استفاده می‌کند تأثیر بگذارد. بنابراین، یک نقشه زبان رسمی در سطح کشور به عنوان یک متغیر فرهنگی اضافی در مدل‌سازی الگوی فضایی در تلاش‌های نمونه‌گیری eBird استفاده شد. توجه داشته باشید که اگرچه زبان های گفتاری اغلب دارای مرزهای جغرافیایی مبهم هستند، زبان های رسمی مرزهای بسیار واضح تری دارند (مثلاً مرزهای سیاسی). علاوه بر این، زبان های رسمی، اغلب شامل اجزای گفتاری و نوشتاری، به طور گسترده در سیستم آموزشی یک کشور تدریس می شود.
مجموعه داده‌های پوشش جهانی توافق‌نامه‌ای که توسط پروژه EarthEnv [ 38 ] گردآوری شده بود از اینجا [ 39 ] دانلود شد. نقشه تراکم جمعیت پیش‌بینی‌شده برای سال 2020 توسط مرکز داده‌ها و برنامه‌های اجتماعی اقتصادی ناسا [ 40 ] از اینجا [ 41 ] دانلود شد. داده های تراکم جاده گردآوری شده توسط پروژه فهرست جهانی جاده ها [ 42 ] از اینجا [ 43 ] دانلود شد. تراکم جاده برای همه جاده ها (بزرگراه ها، جاده های اولیه، جاده های فرعی، جاده های سوم و جاده های محلی) بود. آخرین انتشار داده های HDI 2018 [ 35 ] با مقادیر HDI برای همه کشورهای عضو سازمان ملل [ 35 ] از اینجا دانلود شد [ 35 ] 44 ] دانلود شد]. نقشه زبان رسمی در سطح کشور که توسط CIA World Factbook، دانشگاه گرونینگن گردآوری شده است، از طریق یک سرویس ویژگی وب در اینجا دانلود شده است [ 45 ]. این شامل اولین، دوم و سوم (در صورت وجود) زبان های رسمی هر کشور است. در این مطالعه کشورها بر اساس فهرست ترتیب زبان های رسمی دسته بندی شدند. داده‌های پوشش زمین، تراکم جمعیت و تراکم جاده در قالب شطرنجی با وضوح مکانی 30 ثانیه قوسی (حدود 1 کیلومتر در خط استوا) هستند. نقشه HDI با فرمت برداری و نقشه زبان با وضوح فضایی مشابه سایر متغیرهای کمکی شطرنجی شدند ( شکل 2 ).
توزیع فراوانی مکان‌های نمونه بر روی متغیرهای کمکی در برابر توزیع‌های فراوانی پس‌زمینه مربوطه (توزیع همه مقادیر متغیرهای کمکی در سراسر جهان) ترسیم شد ( شکل 3 ). توزیع پس‌زمینه متغیر کمکی زبان رسمی به‌عنوان درصد هر زبان از جمعیت جهان در سال 2019 در سطح کشور محاسبه شد (داده‌های جمعیت در اینجا [ 46 ] به دست آمد.]). توزیع پس‌زمینه HDI به عنوان توزیع فراوانی مقادیر HDI در سطح کشور با وزن جمعیت هر کشور در سال 2019 محاسبه شد. فراوانی‌های نسبی نوع پوشش زمین، تراکم جمعیت و تراکم جاده به عنوان درصد مساحت محاسبه شد. توزیع‌های فراوانی نشان می‌دهد که شدت نمونه‌برداری از مشارکت‌کنندگان eBird در مناطقی از پوشش گیاهی کشت‌شده و مدیریت‌شده و در مناطق شهری/ساخت‌شده بالاتر است. اگرچه تنها حدود 40 درصد از مکان های نمونه برداری در مناطقی با تراکم جمعیت بالای 100 نفر در کیلومتر مربع است .، با توجه به توزیع پس زمینه، این درصد بالایی است. حدود 75 درصد از محل های نمونه برداری در مناطقی با تراکم جاده بیش از 250 متر بر کیلومتر است. تقریباً 65 درصد از مکان‌های نمونه‌گیری در کشورهایی هستند که انگلیسی زبان رسمی آنهاست (مثلاً ایالات متحده و بریتانیا) و 10 درصد دیگر در کشورهایی که زبان اسپانیایی زبان رسمی است. در نهایت، 80 درصد از مکان‌های نمونه‌گیری در کشورهای توسعه‌یافته با HDI بیشتر از 0.9 است. همه نشان دهنده سوگیری در تلاش های نمونه گیری در امتداد ابعاد عوامل محیطی و فرهنگی است.
2.3.3. روش مدلسازی
رویکرد Maxent (حداکثر آنتروپی) [ 47 ] برای مدل‌سازی الگوی فضایی در تلاش‌های نمونه‌گیری eBird اتخاذ شد. Maxent یک روش یادگیری ماشینی همه منظوره برای پیش‌بینی یا استنتاج از اطلاعات ناقص است و به طور گسترده در حوزه‌های کاربردی مختلف استفاده شده است، به عنوان مثال، مدل‌سازی توزیع گونه‌ها بر اساس داده‌های «فقط حضور» گونه‌ها (مانند مکان‌های وقوع) [ 47 ] و مدل‌سازی توزیع جغرافیایی گردشگران از مکان‌هایی که گردشگران بازدید کرده‌اند [ 48 ]. Maxent برای مدل‌سازی تلاش‌های نمونه‌گیری eBird مناسب است زیرا مکان‌های پرنده نیز داده‌های «فقط حضور» هستند. یک مرور مفهومی از روش Maxent در زیر ارائه شده است (خوانندگان علاقه مند به جزئیات ریاضی به [ 47 مراجعه می کنند]).
Maxent یک توزیع احتمال را بر روی یک منطقه جغرافیایی متشکل از سلول‌های شطرنجی گسسته (سطح احتمال) بر اساس دو ورودی تخمین می‌زند: مکان‌هایی که وقوع یک رویداد هدف را نشان می‌دهند و لایه‌های داده کمکی که عوامل محیطی را مشخص می‌کنند که بر وقوع رویداد تأثیر می‌گذارند. احتمال وقوع رویداد در یک سلول تابعی از شرایط محیطی درجا است. توزیع احتمال بر اساس اصل آنتروپی حداکثر تعیین می شود. یعنی توزیع باید تا حد امکان به یک توزیع یکنواخت نزدیک باشد در حالی که با محدودیت‌های تعبیه‌شده در محل‌های وقوع رویداد مطابقت دارد. به عنوان مثال، انتظار از توزیع بر روی متغیرهای محیطی باید نزدیک به میانگین تجربی مشاهده شده در محل وقوع باشد.47 ] و برای پیش بینی توزیع جغرافیایی گردشگران [ 48 ].
در این مطالعه، مکان‌های نمونه‌برداری eBird (یعنی مکان‌های وقوع) و لایه داده‌های شطرنجی چهار متغیر محیطی و فرهنگی برای تخمین احتمال نمونه‌برداری از یک مکان توسط پرندگان (احتمال نمونه‌گیری) وارد Maxent شدند. در این مطالعه از نرم افزار Maxent نسخه 3.4.0 [ 49 ] استفاده شد. اکثر تنظیمات پارامتر Maxent در حالت پیش‌فرض نگه داشته شدند (به عنوان مثال، ویژگی خودکار، فرمت خروجی cloglog) زیرا روی یک مجموعه داده بزرگ به‌خوبی تنظیم شده‌اند و به طور کلی قرار است به خوبی کار کنند [ 50 ]]. تغییرات در چهار پارامتر ایجاد شد. اولاً، نمونه‌ها (مکان‌های نمونه‌گیری eBird) به پس‌زمینه اضافه نشدند، زیرا نویسنده مشاهده کرد افزودن نمونه‌ها به پس‌زمینه عملکرد مدل را تا حد زیادی کاهش می‌دهد، زیرا تعداد زیاد مکان‌های نمونه‌گیری وقتی به پس‌زمینه اضافه می‌شوند، به شدت پس‌زمینه را سوگیری می‌کنند. دوم، تعداد نقاط پس زمینه 500000 (پیش فرض 10000 است) با توجه به منطقه مورد مطالعه بزرگ (یعنی قاره ها و جزایر جهان) که از آن نقاط پس زمینه تصادفی انتخاب می شود، تنظیم شد. سوم، حداکثر تعداد تکرارها از 500 تکرار پیش‌فرض به 2000 تکرار تغییر کرد تا اطمینان حاصل شود که رویه بهینه‌سازی همگرا می‌شود. چهارم، Maxent به‌طور پیش‌فرض مکان‌های نمونه را که در همان سلول شطرنجی متغیرهای کمکی قرار دارند، حذف می‌کند. این تنظیم پیش‌فرض طوری تغییر کرد که فقط مکان‌های تکراری با مختصات جغرافیایی یکسان حذف شدند. از آنجایی که موارد تکراری توسط مدل حذف می‌شوند، اطلاعات مربوط به بازدیدهای مکرر از همان مکان در فرآیند مدل‌سازی در نظر گرفته نشد. بنابراین این مدل به طور موثر احتمال وقوع حداقل یک رویداد نمونه‌گیری را در یک مکان مدل می‌کند، که با مدل‌سازی کل سوگیری فضایی در تلاش‌های نمونه‌برداری eBird متفاوت است، زیرا برخی از سایت‌ها/مکان‌ها رویدادهای نمونه‌گیری زیادی دارند. پس از حذف مکان های خارج از محدوده و مکان های تکراری، تعداد مکان های نمونه برداری eBird به کاهش یافت. بنابراین این مدل به طور موثر احتمال وقوع حداقل یک رویداد نمونه‌گیری را در یک مکان مدل می‌کند، که با مدل‌سازی کل سوگیری فضایی در تلاش‌های نمونه‌برداری eBird متفاوت است، زیرا برخی از سایت‌ها/مکان‌ها رویدادهای نمونه‌گیری زیادی دارند. پس از حذف مکان های خارج از محدوده و مکان های تکراری، تعداد مکان های نمونه برداری eBird به کاهش یافت. بنابراین این مدل به طور موثر احتمال وقوع حداقل یک رویداد نمونه‌گیری را در یک مکان مدل می‌کند، که با مدل‌سازی کل سوگیری فضایی در تلاش‌های نمونه‌برداری eBird متفاوت است، زیرا برخی از سایت‌ها/مکان‌ها رویدادهای نمونه‌گیری زیادی دارند. پس از حذف مکان های خارج از محدوده و مکان های تکراری، تعداد مکان های نمونه برداری eBird به کاهش یافت.n = 1,920,182. نیمی از مکان‌ها ( 960091= n ) برای آموزش مدل و نیمی دیگر به عنوان داده‌های آزمون برای ارزیابی عملکرد مدل استفاده شد.
عملکرد مدل Maxent با محاسبه AUC (منطقه زیر منحنی) نقشه احتمال نمونه‌برداری پیش‌بینی‌شده بر اساس مکان‌های نمونه‌گیری در داده‌های آزمون و مکان‌های پس‌زمینه به‌طور تصادفی انتخاب شده ارزیابی شد [ 50 ]. AUC، یک معیار عملکرد مدل مستقل از آستانه، احتمال این است که احتمال نمونه‌گیری پیش‌بینی‌شده در یک مکان به‌طور تصادفی انتخاب‌شده بیشتر از یک مکان پس‌زمینه انتخابی تصادفی باشد [ 47 ]. محدوده AUC از 0 تا 1 است، با AUC = 1 نشان دهنده عملکرد کامل مدل، AUC = 0.5 نشان دهنده عملکرد قابل مقایسه با یک مدل تصادفی، و AUC <0.5 نشان دهنده عملکرد مدل بدتر از مدل تصادفی است.

3. نتایج

3.1. الگوهای مکانی و زمانی

3.1.1. رویدادهای نمونه برداری

رویدادهای نمونه‌گیری که توسط مشارکت‌کنندگان eBird انجام شد، در فضای جغرافیایی بسیار مغرضانه بود ( شکل 4 ). بسیاری از نقاط جهان هنوز توسط eBirders نمونه برداری نشده اند. در میان سلول‌های شبکه‌ای که نمونه‌برداری شده‌اند، نیمی از آنها کمتر از نه رویداد نمونه‌گیری در یک سلول دارند. مناطق نمونه عمدتاً مناطق توسعه یافته جهان با دسترسی بهتر (به عنوان مثال، تراکم جاده بالاتر) هستند. بیشترین مناطق نمونه برداری شده در مجاورت شهرهای بزرگ جهان قرار دارند.
به صورت سالانه، تعداد کل رویدادهای نمونه گیری از سال 2002 به طور تصاعدی (یعنی با سرعت بیشتری) افزایش یافته است ( شکل 5 ). طی ماه‌های سال‌های 2002-2019، تعداد رویدادهای نمونه‌برداری در نیمکره شمالی از مارس یا آوریل افزایش یافت و در ماه می به اوج خود رسید ( شکل 6 ). سپس تلاش‌های نمونه‌گیری به طور قابل‌توجهی کاهش یافت و در جولای یا آگوست به کمترین میزان خود رسید. در نیمکره جنوبی، رویدادهای نمونه برداری در ماه مه یا ژوئن کمترین و در اکتبر یا نوامبر بیشترین تعداد را داشتند. تعداد کلی رویدادهای نمونه برداری در سراسر جهان روند ماهانه مشابهی را در نیمکره شمالی دنبال کرد. در طول روزهای هفته تا سالها ( شکل 7، رویدادهای نمونه گیری در تعطیلات آخر هفته بیشتر از روزهای هفته بود.
تعداد گونه‌های گزارش‌شده در سراسر رویدادهای نمونه‌برداری کج‌شده است ( شکل 8 ). به طور متوسط ​​در هر رویداد نمونه برداری 13 گونه گزارش شد. با این حال، بیش از نه گونه در نیمی از رویدادهای نمونه‌برداری گزارش نشده است. حدود 15.5٪ از رویدادهای نمونه برداری فقط یک گونه، 36.1٪ 2-10 گونه، 37.5٪ 10-30 گونه، و 10.6٪ 30 گونه یا بیشتر را گزارش کردند.
رویدادهای نمونه برداری با تعداد بسیار زیادی از گونه ها وجود دارد. پس از بررسی سوابق در پایگاه داده، مشخص شد که n = 29 رویداد با 300 گونه یا بیشتر مشاهده شده، و n = 480 رویداد با 200 گونه یا بیشتر (آمار به دست آمده بر اساس مشاهدات پرندگان بررسی و تایید شده توسط eBird) وجود دارد. اکثر ( n= 349) از رویدادها با نظرات سفر همراه هستند که اطلاعات متنی را ارائه می دهند، اگرچه برخی به زبان انگلیسی نیستند. به طور کلی، بسیاری از این رویدادها با تعداد زیادی گونه، رویدادهای پرنده “معمولی” نیستند. برای مثال، برخی رویدادها عبارتند از (1) مجموعه‌ای از سوابق پرنده در دوره‌های طولانی پرنده (به عنوان مثال، روزها یا هفته‌ها)، (2) سوابق وارد شده از نشریات، (3) رویدادهای پرنده شامل گروه‌هایی از پرندگان که سوابقی را در یک رکورد ارسال کرده‌اند، (4) رویدادهای ویژه پرنده مانند راهنمای صحرایی، و (5) رویدادهای پرنده روز بزرگ که هدف پرنده‌ها یافتن بیشترین تعداد پرنده در یک روز بود. با این وجود، با توجه به حجم نمونه بسیار بزرگ ( n ) انتظار نمی رود که چنین رویدادهای پرندگان تأثیر قابل توجهی بر آمار گزارش شده در این مقاله داشته باشند (به عنوان مثال، میانگین تعداد گونه ها در هر رویداد).= 53,837,394 رویداد در کل).
3.1.2. ناظران
الگوی توزیع فضایی مشارکت کنندگان (ناظران) eBird بر روی سلول های شبکه 0.25 درجه عرض جغرافیایی × 0.25 درجه طول جغرافیایی ( شکل 9 ) مشابه رویدادهای نمونه گیری بود. در میان سلول‌های شبکه‌ای که توسط ناظران پوشانده شده‌اند، نیمی از سلول‌ها کمتر از چهار ناظر مشارکت‌کننده دارند.
تعداد ناظران فعال (ناظرانی که حداقل در یک رویداد نمونه‌گیری مشارکت داشته‌اند) از سال 2002 به‌طور تصاعدی افزایش یافته است ( شکل 10 ). قابل توجه است که افزایش قابل توجهی در تعداد ناظران در سال 2013 وجود داشت. طی ماه‌های سال ( شکل 11 )، بیشترین اوج در تعداد ناظران فعال در نیمکره شمالی اغلب در ماه مه رخ داد، اما از سال 2013 شاهد دیگری بود. اوج در فوریه در نیمکره جنوبی، پرندگان در اکتبر یا نوامبر بیشترین فعالیت را داشتند، اما از سال 2015 اوج دیگری در ماه مه وجود داشت ( برای توضیحات احتمالی به بخش 4.2.2 مراجعه کنید). تعداد کلی ناظران فعال در سراسر جهان روند ماهانه مشابهی را در نیمکره شمالی دنبال کرد. در طول روزهای هفته (شکل 12 )، تعداد ناظران فعال در تعطیلات آخر هفته بیشتر از روزهای هفته بود.
ناظران بر اساس (1) سالی که در آن اولین مشاهده را به eBird ارسال کردند، (2) سالی که در آن آخرین مشاهده را ارسال کردند، (3) تعداد سال های بین اولین و آخرین مشاهدات، و (4) گروه بندی شدند. تعداد روزهای مشاهدات ( شکل 13). نتایج گروه بندی (1) و (2) به ترتیب تعداد ناظران ورودی و خروجی eBird در هر سال (به جز سال 2019) را نشان می دهد. با گذشت سالها، تعداد ناظران ورودی و خروجی هر دو به طور تقریبی افزایش یافت. افزایش شدیدی در تعداد ناظرانی که در سال 2013 وارد eBird شدند، به دنبال آن کاهش جزئی و فلات طی سال‌های 2014 تا 2017 و افزایش اندک در سال 2018 و جهش قابل توجه دیگری در سال 2019 مشاهده شد. نتایج گروه‌بندی (3) و (4) گستره زمانی فعالیت های پرنده ناظران را به ترتیب در واحدهای سال و روز نشان می دهد. حدود 67.9 درصد از ناظران تنها در یک سال، 9.7 درصد در دو سال متوالی، 5.2 درصد در سه سال متوالی و 17.2 درصد در چهار سال متوالی یا بیشتر مشارکت کردند. صحبت از تعداد روزهای با مشاهده، 40. 6٪ از ناظران مشاهدات را در یک روز، 36.3٪ در 2 تا 10 روز، و 23.1٪ در 10 روز یا بیشتر مشارکت داشتند. چنین الگوهایی در مشارکت کنندگان در طول زمان با چرخه زندگی مشارکت کنندگان در جوامع آنلاین مشترک سازگار است [51 ].
به طور متوسط، هر ناظر 98 رویداد نمونه‌برداری را انجام داد، از 32 مکان نمونه برداری کرد و 84 گونه را گزارش کرد ( شکل 14 ). با این وجود، نیمی از ناظران بیش از سه رویداد نمونه‌برداری انجام ندادند، تنها از یک مکان نمونه‌برداری کردند و بیش از 17 گونه را گزارش نکردند. حدود 37٪ از ناظران فقط یک رویداد نمونه گیری، 53.8٪ 2-100 رویداد نمونه گیری، و 9.2٪ 100 یا بیشتر رویداد نمونه گیری مشارکت داشتند. تقریباً 52.9٪ از ناظران تنها از یک مکان نمونه برداری کردند، 41.4٪ از 2-100 مکان و 5.7٪ از 100 مکان یا بیشتر نمونه برداری کردند. تقریباً 13.5٪ از ناظران فقط یک گونه، 67.2٪ 2-100 گونه و 19.3٪ 100 گونه یا بیشتر را گزارش کردند.
3.1.3. گونه پرنده
توزیع گونه های پرنده گزارش شده توسط مشارکت کنندگان eBird نیز بسیار منحرف و از نظر مکانی مغرضانه است ( شکل 15 ). در بسیاری از نقاط جهان هنوز هیچ گونه پرنده ای گزارش نشده است زیرا تلاش های نمونه برداری در آن مناطق انجام نشده است ( بخش 3.1.1 ). در میان سلول‌های شبکه‌ای با مشاهدات پرندگان، نیمی از آن‌ها تعدادی گونه پرنده گزارش‌شده زیر 42 دارند.
تعداد کل گونه های گزارش شده به eBird در یک سال از سال 2002 به صورت خطی در حال افزایش بوده است، اما از سال 2017 به فلج رسیده است ( شکل 16 ). از سال 2002 تا 2019، تعداد گونه های پرنده گزارش شده از 8740 به 10053 گونه افزایش یافته است (حدود 15 درصد افزایش). یک افزایش شدید در سال 2005 و یک جهش دیگر در حدود سال 2010 وجود داشت. تعداد بیشتری از گونه ها در ماه نوامبر تا مارس در نیمکره شمالی در حالی که در ژوئیه تا نوامبر در نیمکره جنوبی مشاهده شد ( شکل 17 ). تعداد کلی گونه های گزارش شده اغلب در اکتبر یا نوامبر به اوج خود رسید. در طول روزهای هفته ( شکل 18 )، تعداد بیشتری از گونه ها در تعطیلات آخر هفته نسبت به روزهای هفته گزارش شده است.
برای هر گونه پرنده موجود در پایگاه داده eBird، تعداد ناظرانی که گونه را گزارش کردند و تعداد رویدادهای نمونه برداری که در آن گونه گزارش شده بود شمارش شد ( شکل 19 ). نیمی از گونه ها توسط بیش از 671 ناظر و در بیش از 1942 رویداد نمونه گزارش شده است. به طور متوسط، هر گونه پرنده توسط 3617 ناظر و در 66037 رویداد نمونه‌برداری گزارش شد، که نشان‌دهنده مشاهده کلی گونه‌های بسیار تکراری است. تنها 0.4 درصد از گونه ها توسط یک ناظر و 0.3 درصد در یک رویداد نمونه برداری گزارش شده است، در حالی که حدود 83.7 درصد از گونه ها توسط بیش از 100 ناظر و 89.2 درصد در بیش از 100 رویداد نمونه گیری گزارش شده است.

3.2. مدل سازی تلاش های نمونه گیری

3.2.1. تجزیه و تحلیل اهمیت متغیر

با توجه به تخمین درصد مشارکت متغیرهای محیطی و فرهنگی به مدل ارائه شده در خروجی Maxent ( جدول 2)به نظر می رسد تراکم جاده و زبان رسمی دو عامل مهم در مدل Maxent هستند. پوشش زمین و HDI سهم بسیار کمتری دارند و تراکم جمعیت سهم بسیار کمی در مدل دارد. اهمیت جایگشت برای هر متغیر، افت حاصل در AUC آموزشی است (نرمال شده به درصد) زمانی که مقادیر آن متغیر در نمونه‌گیری آموزشی و مکان‌های پس‌زمینه به‌طور تصادفی جابه‌جا می‌شوند و مدل بر روی داده‌های جایگزین آموزش داده می‌شود. AUC آموزش زمانی که مقادیر HDI جایگشت می‌یابد و پس از آن زبان رسمی، بیشترین کاهش را خواهد داشت. جایگشت در سه متغیر دیگر باعث کاهش کمی در AUC آموزشی می شود. این نشان می‌دهد که HDI و زبان رسمی عوامل کنترل‌کننده مهمی هستند که مکان‌های نمونه‌گیری پرندگان را در مقیاس‌های فضایی بزرگ (مثلاً در سطح کشور) تعیین می‌کنند.
علاوه بر این، بر اساس نتایج آزمون jackknife با اهمیت متغیر ( شکل 20متغیر با بالاترین AUC تست زمانی که به صورت مجزا استفاده می شود، تراکم جاده است، بنابراین به نظر می رسد که به خودی خود مفیدترین اطلاعات را داشته باشد. با این استاندارد، HDI و زبان رسمی اطلاعات مفید کمی دارند و پوشش زمین و جمعیت کمترین اطلاعات مفید را دارند. متغیری که AUC آزمون را در صورت حذف شدن بیشتر کاهش می دهد، زبان رسمی است، بنابراین به نظر می رسد بیشترین اطلاعاتی را دارد که در سایر متغیرها وجود ندارد. با این وجود، کاهش در AUC آزمون هنگام حذف هر متغیر نسبتاً ناچیز است، به این معنی که استفاده از هر چهار متغیر منجر به عملکرد مدل (که توسط AUC اندازه‌گیری می‌شود) بسیار نزدیک به عملکرد هر پنج متغیر می‌شود. با این حال، سهم متغیر و اهمیت متغیر باید با احتیاط تفسیر شود زمانی که متغیرهای پیش بینی همبسته هستند. در این مورد،پیرسون r = 0.48، p < 0.001) و بین HDI و میانگین تراکم جاده در سطح کشور ( Pearson ‘s r = 0.27، p <0.001).
3.2.2. احتمال نمونه گیری مدل شده
نقشه احتمال نمونه گیری مشارکت کنندگان eBird (یعنی احتمال وقوع حداقل یک رویداد نمونه برداری) که با استفاده از روش Maxent مدل و پیش بینی شده است (با هر پنج متغیر کمکی) در شکل 21 نشان داده شده است.. AUC محاسبه‌شده برای نقشه احتمال بر اساس داده‌های آزمون نگه‌داشته‌شده 0.955 است که نشان‌دهنده عملکرد عالی مدل است. به این معنا که مدل به طور کلی مقادیر احتمال نمونه‌گیری بالاتری را در مکان‌های نمونه‌گیری در داده‌های آزمایشی نسبت به مکان‌های پس‌زمینه انتخابی تصادفی پیش‌بینی می‌کند. در سراسر جهان، کشورهای انگلیسی و اسپانیایی زبان بالاترین احتمال نمونه گیری مدل شده را دارند. سایر کشورهای اروپایی و برخی از کشورهای آسیایی نیز احتمال نمونه گیری مدل شده بالاتری دارند. جالب اینجاست که اکثر کشورهایی که احتمال نمونه گیری مدل شده بالایی دارند، کشورهای بسیار توسعه یافته در جهان هستند. تنوع فضایی زیادی در احتمال نمونه برداری مدل شده در هر کشور وجود دارد. برای مثال، احتمال نمونه‌گیری بالاتر در بخش‌های جنوبی کانادا و نیمه شرقی و ساحل غربی ایالات متحده مدل‌سازی شد. به ویژه در مجاورت شهرهای بزرگ. در استرالیا، بیشترین احتمال نمونه برداری در سواحل شرقی و جنوب شرقی، به ویژه در مجاورت شهرهای بزرگ مشاهده شد. این مناطق و/یا شهرها جایی هستند که اکثر جمعیت در آن ساکن هستند و بیشتر زیرساخت ها (به عنوان مثال، جاده ها) ساخته شده است.

4. بحث

4.1. الگوهای فضایی در داده های eBird

تلاش‌های نمونه‌گیری eBird موجود (رویدادهای نمونه‌برداری و مشاهده‌کنندگان) بیشتر در مناطقی با جمعیت‌های متراکم‌تر و/یا دسترسی بهتر (مثلاً تراکم جاده‌های بالاتر) متمرکز شده‌اند، و بیشترین مناطق نمونه‌برداری شده در مجاورت شهرهای بزرگ در مناطق توسعه‌یافته جهان قرار دارند. شکل 4 و شکل 9 ). چنین سوگیری فضایی تفاوت های قابل توجهی را در فعالیت های پرنده خواری مشارکت کنندگان eBird در مناطق توسعه یافته و توسعه نیافته برجسته می کند. با توجه به تلاش‌های نمونه‌برداری با سوگیری فضایی، تعداد گونه‌های پرنده گزارش‌شده نیز از نظر فضایی به سمت مناطقی که تلاش‌های نمونه‌برداری بیشتری انجام می‌شود، سوق داده شد ( شکل 15).). با وجود پوشش جغرافیایی گسترده داده‌های eBird، شکاف‌هایی در تلاش‌های نمونه‌گیری مشارکت‌کنندگان eBird وجود دارد. بسیاری از نقاط جهان مانند آفریقای مرکزی، آمازون و سیبری هنوز نمونه برداری نشده اند.
برخی از دلایل زیربنای الگوهای فضایی در تلاش های نمونه گیری مشارکت کنندگان eBird به ویژگی های محیط اجتماعی و فیزیکی مربوط می شود. مدل‌سازی حداکثری تلاش‌های نمونه‌گیری با متغیرهای کمکی منتخب برای آشکار کردن برخی از این اثرات در نظر گرفته شد. همانطور که توسط نتایج تجزیه و تحلیل اهمیت متغیر ( بخش 3.2.1 ) نشان داده شد، در میان عوامل در نظر گرفته شده، زبان رسمی، تراکم جاده و HDI می تواند به توضیح بیشتر تنوع مکانی در تلاش های نمونه گیری مشارکت کنندگان eBird در سراسر جهان کمک کند. به نظر می‌رسد زبان رسمی و HDI تعصب فضایی را در تلاش‌های نمونه‌گیری در مقیاس‌های فضایی بزرگ (مثلاً در سطح کشور) تعیین می‌کنند. کشورهای انگلیسی و اسپانیایی زبان به طور فشرده توسط مشارکت کنندگان eBird نمونه برداری شده اند ( شکل 3). وب سایت eBird و برنامه تلفن همراه تنها به چند زبان در دسترس هستند. مزیت زبان ممکن است مشارکت برخی از جمعیت های پرنده را تشویق کرده باشد، اما همچنین مانعی است که ممکن است از مشارکت سایر پرنده ها در eBird جلوگیری کند. بخش بزرگی (80%) از مکان‌های نمونه‌برداری در کشورهای توسعه‌یافته با مقادیر HDI بالا (بالاتر از 0.9) یافت می‌شود ( شکل 3)) نشان می دهد که پرنده نگری به عنوان یک فعالیت تفریحی بیشتر توسط شهروندان کشورهای توسعه یافته انجام می شود. تراکم جاده ممکن است تعصب فضایی را در تلاش‌های نمونه‌برداری در مقیاس‌های فضایی کوچک‌تر تعیین کند (مثلاً در داخل کشورها). بخش بزرگی از مکان‌های نمونه‌برداری در مناطق با تراکم جاده‌ای زیاد است. در مقابل، مناطقی با تلاش کم یا بدون تلاش برای نمونه برداری (مثلاً آفریقای مرکزی، آمازون ها و سیبری) مناطق جغرافیایی با دسترسی بسیار محدود هستند.
با این حال، نباید انتظار داشت که متغیرهای کمکی در نظر گرفته شده در مدل‌سازی، همه متغیرهای فضایی را در تلاش‌های نمونه‌گیری eBird توضیح دهند، زیرا در واقع عوامل بسیار بیشتری ممکن است نقش داشته باشند (و بنابراین مدل‌سازی با استفاده از متغیرهای کمکی دیگر ممکن است به نتایج معنی‌داری منجر شود). برای مثال، تعداد محدود مشاهدات پرنده الکترونیکی در برخی کشورها را می‌توان با استفاده از سایر پلت‌فرم‌های محلی برای تماشای پرندگان توضیح داد، مانند پلت فرم رسمی تبادل پرندگان در سوئیس [ 52 ]، که به زبان‌های ایتالیایی، فرانسوی و آلمانی نیز موجود است. یا پلتفرم عمومی تر iNaturalist [ 53]. در کشورهای پیشرفته اروپایی، عدم مشاهده eBird به دلیل استفاده از چنین پلتفرم های جایگزین به جای یک مانع زبان ساده است. در حالی که در کشورهای آفریقایی دلایل متفاوتی به جز زبان و زیرساخت برای گزارش کم در مورد eBird وجود دارد، به عنوان مثال، درگیری های داخلی و نظامی [ 54 ].
دلایل دیگر زیربنای الگوهای فضایی محلی در مشاهدات ممکن است به ویژگی های هدف مشاهده مربوط باشد، به عنوان مثال، نادر بودن و غنای گونه های پرنده و غیره (نگاه کنید به [ 55 ]] و ارجاعات موجود در آن). پرندگان به امید دیدن پرندگان به تماشای پرنده می روند. بنابراین، جایی که فعالیت های پرنده انجام می شود بستگی به محل حضور پرندگان دارد. اگر پرنده داران اطلاعات قبلی از مکان (منطقه جغرافیایی) پرندگان را داشته باشند، تمایل دارند در چنین مناطقی به دنبال پرندگان بگردند. اپلیکیشن موبایل و وب‌سایت eBird، بر اساس مشاهدات موجود در پایگاه داده، یک نقشه «نقاط داغ» تولید می‌کند که مناطقی از گونه‌های پرندگان غنی و نقشه‌های گونه‌ای را نشان می‌دهد که فراوانی نسبی گونه‌ها را نشان می‌دهد. بسیاری از مشارکت کنندگان eBird احتمالاً هنگام تصمیم گیری در مورد مکان تماشای پرندگان از چنین نقشه هایی به عنوان راهنما استفاده می کنند، که ممکن است به بهبود کارایی پرنده کمک کند (به عنوان مثال، پرندگان بیشتری را در یک جلسه پرنده مشاهده کنید). با این حال، این ممکن است سوگیری فضایی موجود در تلاش‌های نمونه‌گیری را نیز تقویت کند، زیرا نقشه «نقاط داغ» بر اساس داده‌های حاصل از تلاش‌های نمونه‌گیری با سوگیری فضایی است.

4.2. الگوهای زمانی در داده های eBird

دلایل احتمالی زیربنای الگوهای زمانی در داده‌های eBird در طول سال‌ها، ماه‌ها و روزهای هفته در سه بخش فرعی زیر مورد بحث قرار گرفته‌اند.

4.2.1. الگوها در طول سالها

در طول سال‌ها، رویدادهای نمونه‌گیری و ناظران از سال 2002 به‌طور تصاعدی افزایش یافته‌اند ( شکل 5 و شکل 10 ). این روندی است که در بسیاری از جوامع آنلاین در مقیاس بزرگ ثابت است، و چنین افزایش هایی به طور کلی به پیشرفت های فناوری اطلاعات و ارتباطات، توسعه زیرساخت ها و غیره مربوط می شود [ 22 ، 56 ]. به طور خاص در مورد eBird، چندین پیشرفت در تاریخ پروژه eBird ممکن است به افزایش سریع فعالیت‌های مشارکت داده‌های داوطلبانه کمک کرده باشد، به عنوان مثال، انتشار ابزارهای جذاب پرنده در اواسط سال 2005 [ 32 ]. گسترش eBird به نیوزیلند در سال 2008 و بعداً برای پوشش کل جهان در سال 2010 [ 57]؛ برنامه موبایل منتشر شده به نام “BirdLog” که اولین و تنها برنامه ای بود که امکان ضبط و ارسال اطلاعات به eBird را در این زمینه برای پرندگان فراهم کرد [ 58 ]. انتشار اپلیکیشن موبایل eBird [ 58 ] و اپلیکیشن موبایل مرلین برای شناسایی پرنده در سال 2014 [ 59 ]. و انتشار برنامه تلفن همراه eBird با پشتیبانی از چندین زبان در سال 2015 [ 37 ]. افزایش قابل توجه تعداد ناظران از 2012 تا 2013 ( شکل 10 و شکل 13 ) ممکن است به انتشار برنامه تلفن همراه “BirdLog” در سال 2012 نسبت داده شود.
علیرغم افزایش تصاعدی در تلاش‌های نمونه‌برداری، تعداد گونه‌های گزارش‌شده به eBird تنها به صورت خطی در طول سال‌ها افزایش یافت ( شکل 16 )، که نشان می‌دهد افزایش حاشیه‌ای در تعداد گونه‌های جدید گزارش‌شده به eBird به طور نامتناسبی کمتر قابل توجه است. حجم عظیمی از تلاش‌های نمونه‌گیری اضافی که توسط ناظران جدید انجام شده است. افزایش قابل توجه در تعداد گونه های گزارش شده در سال 2005 و در سال 2010 ممکن است به ترتیب به دلیل انتشار ابزارهای جذب کننده پرنده در سال 2005 و گسترش eBird به پوشش جهانی در سال 2010 باشد.
4.2.2. الگوها در ماه ها
طی ماه‌ها، روندهای زمانی در رویدادهای نمونه‌برداری، ناظران و گونه‌های پرنده گزارش‌شده در سراسر نیمکره شمالی و جنوبی متفاوت است ( شکل 6 ، شکل 11 و شکل 17 ). در نیمکره شمالی، تعداد رویدادهای نمونه برداری، ناظران و گونه های گزارش شده پرندگان همه در ماه می به اوج خود رسید. این ممکن است به این دلیل باشد که در این نیمکره، فصل زادآوری بسیاری از پرندگان در ماه مه آغاز می‌شود و بسیاری از پرندگان در آن فصل با شدت بیشتری به تماشای پرندگان می‌روند (مثلاً، بررسی پرندگان پرورش‌دهنده آمریکای شمالی). اوج بالاتر دیگری در فوریه در میان ناظران از سال 2013 وجود داشت. ممکن است توضیح داده شود که (1) بسیاری از پرندگان در سراسر جهان هر فوریه در شمارش پرندگان حیاط خلوت بزرگ (GBBC) شرکت می کنند [ 60 ]]؛ (2) برنامه پرنده پرنده تلفن همراه «BirdLog» که در سال 2012 منتشر شد، ضبط و ارسال داده ها را مستقیماً در میدان امکان پذیر کرد [ 58 ]، که ممکن است به مشارکت پرندگان بیشتری در GBBC کمک کند. گونه های بیشتری در ماه های زمستان و حوالی آن در ماه های نوامبر تا مارس گزارش شد. با توجه به اینکه تلاش‌های نمونه‌برداری از نظر تعداد پرندگان فعال و تعداد رویدادهای نمونه‌برداری در ماه‌های زمستان چندان فشرده نبود، تعداد بیشتر گونه‌های پرنده گزارش‌شده ممکن است نشان‌دهنده فعالیت‌های پرنده زمستانی بسیار «کارآمد» گروه کوچک‌تری از پرندگان باشد. پرندگان ماهری که می توانند گونه های پرندگان زیادی را شناسایی کنند. به عنوان مثال، تعداد پرندگان کریسمس از 14 دسامبر تا 5 ژانویه هر سال، بیشتر در ایالات متحده و کانادا رخ می دهد. هیچ گونه افزایشی در ماه دسامبر یا ژانویه در تعداد پرنده های فعال و همچنین در تعداد رویدادهای نمونه گیری مشاهده نشد.شکل 6 و شکل 11 ). ممکن است پرنده‌هایی که در کریسمس Bird Count شرکت کرده‌اند، قبلاً در دوره‌های دیگر فعال بوده باشند. تنها 0.2 تا 0.5 درصد از رویدادهای نمونه‌گیری در هر سال در طول سال‌های 2002 تا 2019 «تعداد پرندگان کریسمس» (یا انواع آن) را در نظرات سفر ذکر کردند. با این حال، شرکت کنندگان CBC ممکن است در تعداد زیادی از گونه های گزارش شده در دسامبر و ژانویه نقش داشته باشند ( شکل 17 ).
قله‌ها در نیمکره جنوبی در ماه‌های متفاوتی نسبت به شمال سقوط کردند، اما به طور کلی از مسیرهای فصلی مشابهی پیروی کردند. برای مثال، تلاش‌های نمونه‌برداری (رویدادهای نمونه‌گیری، ناظران) از ماه می یا ژوئن تا اکتبر یا نوامبر افزایش یافت ( شکل 6 و شکل 11 )، دوره‌ای که فصل تولید مثل پرندگان در نیمکره جنوبی را در بر می‌گیرد. گونه های بیشتری نیز در این دوره گزارش شد ( شکل 17 ). تعداد پرندگان فعال اغلب در ماه اکتبر یا نوامبر به اوج خود می رسد، اما از سال 2015 اوج دیگری در ماه مه وجود داشت و اوج اکتبر بسیار بیشتر از تعداد پرندگان در نوامبر و دسامبر بود، که ممکن است به دلیل رویداد سالانه روز جهانی بزرگ در ماه مه باشد. 61 ] و رویداد روز بزرگ اکتبر [ 62] توسط eBird سازماندهی شده است تا پرنده داران بیشتری را درگیر پرنده گردانی کند. با این حال، از آنجایی که اکثر مشارکت‌کنندگان، مشارکت‌کنندگان موقتی هستند که تنها یک رکورد را ارسال می‌کنند، چنین رویدادهایی (به عنوان مثال، روز بزرگ، پرنده حیاط خلوت بزرگ) ممکن است تنها در بازه‌های زمانی محدود رویدادها مشارکت را افزایش دهند. افزایش در مشارکت کلی بیشتر به پیشرفت‌های دیگر مربوط می‌شود (به عنوان مثال، انتشار “BirdLog” در سال 2012).
زمان مهاجرت پرندگان نیز ممکن است به توضیح نوسانات ماهانه کمک کند. بسیاری از پرنده داران اغلب منتظر فصل های مهاجرت هستند تا به بیرون بروند و به دنبال پرندگان مهاجر بگردند. برای مثال، در نیمکره شمالی، افزایش تعداد رویدادهای نمونه‌برداری، پرنده‌ها و گونه‌های فعال در ماه‌های مارس-آوریل و در سپتامبر-اکتبر به ترتیب با جدول زمانی ورود مهاجرت بهار و خروج پاییز مطابقت دارد.
در سطح جهانی، الگوهای زمانی در تلاش‌های نمونه‌گیری در طول ماه‌ها مشابه نمونه‌های نیمکره شمالی است که در مقایسه با نیمکره جنوبی، رویدادهای نمونه‌گیری و ناظران بیشتری داشتند و بنابراین، الگوها را در تلاش‌های نمونه‌گیری کلی در سراسر جهان هدایت می‌کردند. کره زمین تعداد گونه‌های گزارش‌شده دارای بزرگی قابل مقایسه در دو نیمکره است، اما به دلیل فصلی مخالف در دو نیمکره، طی ماه‌ها از روندهای «متضاد» پیروی کرده است.
4.2.3. الگوها در سراسر روزهای هفته
در طول روزهای یک هفته، ناظران بیشتری در تعطیلات آخر هفته نسبت به روزهای هفته فعال بودند و تعداد بیشتری از رویدادهای نمونه برداری و گونه های بیشتری را گزارش کردند. این الگو در طول سالها ثابت است ( شکل 7 ، شکل 12 و شکل 18 ). این را می توان به این دلیل نسبت داد که پرنده نگری برای بسیاری از مردم فقط یک سرگرمی است، برخی از آنها ممکن است در تعطیلات آخر هفته از زندگی معمولی و مسئولیت های کاری خود استراحت کنند و در نتیجه می توانند زمان بیشتری را صرف پرنده شدن کنند.
با این حال، سطح تخصص پرنده‌هایی که در تعطیلات آخر هفته فعال بودند و کیفیت ارسال داده‌های آن‌ها به‌طور قابل‌توجهی با کسانی که در روزهای هفته فعال بودند متفاوت بود ( شکل 22).). میانگین تعداد گونه‌ها به ازای هر ناظر، که نشان‌دهنده سطح تخصص پرندگان است، در میان پرندگان فعال در آخر هفته‌ها کمتر بود. علاوه بر این، تعداد چک لیست های ناقص (یعنی همه گونه ها شناسایی و گزارش نشدند) و مشاهدات تایید نشده به ازای هر ناظر، دو شاخص کیفیت داده ها، هر دو در میان پرندگان فعال در تعطیلات آخر هفته بیشتر بود. شواهد نشان می‌دهد پرنده‌هایی که در روزهای هفته فعال بودند، به طور کلی از سطح تخصص بالاتری برخوردار بودند و داده‌های ارائه شده توسط آنها کیفیت بالاتری داشتند. این ممکن است به این دلیل باشد که تعداد بیشتری از پرنده‌های مبتدی فقط در آخر هفته‌ها به پرنده‌گری می‌روند، در حالی که پرنده‌های متخصص ممکن است در روزهای هفته علاوه بر آخر هفته، پرنده‌سازی را انجام دهند.

4.3. سوگیری ها در VGI و پیامدهای آنها

اشکال مختلفی از سوگیری در VGI به دلیل ویژگی های فعالیت های مشارکت داده داوطلبانه وجود دارد. هنگام استفاده از VGI، باید تناسب استفاده از VGI را در زمینه برنامه‌های کاربردی خاص با بررسی میزان سوگیری‌ها، تأثیرات بالقوه آن‌ها و روش‌های ممکن برای توضیح سوگیری‌ها ارزیابی کرد.

4.3.1. تعصب فضایی

سوگیری فضایی اغلب در تلاش های نمونه گیری مشارکت کنندگان داده های داوطلب ذاتی است. برخلاف نمونه‌گیری سنتی جغرافیایی که مکان‌های نمونه‌گیری بر اساس یک طرح نمونه‌گیری فضایی مشخص (مثلاً نمونه‌گیری تصادفی طبقه‌ای) طراحی می‌شوند، داوطلبان فردی مکان‌های نمونه‌گیری (یعنی محل انجام مشاهدات) را عمدتاً به میل خود به شیوه‌های موقت یا فرصت‌طلبانه و بدون هماهنگی انتخاب می‌کنند. تلاش های نمونه گیری با سایر داوطلبان [ 18 ]. در نتیجه، تلاش‌های نمونه‌گیری داوطلبانه اغلب در مناطق در دسترس‌تر متمرکز می‌شوند ( شکل 4)) و چنین تلاش‌های نمونه‌گیری در معرض سوگیری فضایی است. در برخی موارد، داوطلبان در مورد محل نمونه گیری بر اساس جایی که دیگران نمونه برداری کرده اند، تصمیم می گیرند. برای مثال، مشارکت‌کنندگان eBird ممکن است به نقشه «نقاط داغ» و نقشه‌های توزیع گونه‌های ارائه‌شده توسط eBird [ 34 ] مراجعه کنند و بر این اساس «نقاط داغ» (مناطق با تعداد بیشتری از گونه‌های پرنده گزارش‌شده) را برای پرندگان انتخاب کنند. با این حال، این ممکن است سوگیری فضایی موجود را در تلاش‌های نمونه‌گیری تقویت کند، زیرا مناطقی با شدت نمونه‌برداری بالاتر به طور مکرر نمونه‌برداری می‌شوند (نمونه‌برداری بیش از حد) در حالی که مناطق با شدت نمونه‌برداری پایین‌تر نمونه‌برداری می‌شوند.
داده‌های جغرافیایی ارائه‌شده توسط داوطلبان، هنگام استفاده از نمونه‌های جغرافیایی برای تجزیه و تحلیل و مدل‌سازی، باید معرف باشد تا بتوان ویژگی‌های جمعیت زیربنایی را از نمونه با دقت رضایت‌بخش استنباط کرد. نمایندگی نمونه‌های جغرافیایی جمع‌آوری‌شده از طریق پروتکل‌های نمونه‌گیری فضایی سنتی اغلب با پیروی از یک طرح نمونه‌گیری دقیق تضمین می‌شود، به گونه‌ای که مکان‌های نمونه‌برداری به درستی شیب‌های محیطی در منطقه جغرافیایی مورد علاقه را پوشش می‌دهند [ 63 ]. با این حال، به دلیل سوگیری فضایی در تلاش‌های نمونه‌گیری داوطلبانه، مکان‌های نمونه‌برداری ممکن است پوشش خوبی نسبت به شیب‌های محیطی نداشته باشند، که مانع از بازنمایی نمونه‌های جغرافیایی داوطلبانه می‌شود [ 64 ]]. برای مثال، مکان‌های بیشتر یک گونه پرنده در مناطق شهری همانطور که در پایگاه داده eBird منعکس شده است، لزوماً به این معنی نیست که گونه‌ها واقعاً زیستگاه‌های شهری را ترجیح می‌دهند. ممکن است به سادگی تلاش‌های نمونه‌برداری کافی در زیستگاه‌های غیر شهری برای کشف این گونه انجام نشده باشد. هنگامی که از مکان‌های وقوع برای پیش‌بینی توزیع گونه‌ها استفاده می‌شود، به عنوان مثال، از طریق مدل‌سازی توزیع گونه‌ها، برای بهبود مدل‌سازی و دقت پیش‌بینی باید چنین سوگیری فضایی در نظر گرفته شود [ 8 ، 16 ، 17 ، 55 ، 65 ، 66 ، 67 ].
4.3.2. تعصب زمانی
سوگیری زمانی نیز در تلاش‌های نمونه‌گیری داوطلبانه وجود دارد، به طور بالقوه در دانه‌بندی‌های زمانی متعدد. همانطور که نمایه‌سازی داده‌های eBird نشان می‌دهد، تلاش‌های نمونه‌برداری و گونه‌های گزارش‌شده پرندگان در طول سال‌ها افزایش می‌یابد، با نوسانات ماهانه قابل توجه و به‌ویژه مشارکت‌های بیشتر در آخر هفته‌ها. هنگامی که مشاهدات از VGI برای تجزیه و تحلیل تغییرات زمانی پدیده های جغرافیایی استفاده می شود، چنین سوگیری زمانی باید در نظر گرفته شود [ 15 ]. به عنوان مثال، افزایش تعداد گونه های پرنده به eBird گزارش شده است ( شکل 16) به معنای افزایش تنوع پرندگان در زمین نیست. این افزایش اساساً به افزایش تلاش‌های نمونه‌گیری نسبت داده می‌شود. به عنوان مثالی دیگر، اگرچه در نیمکره شمالی تعداد بیشتری از گونه های پرنده در ماه می نسبت به ماه سپتامبر به eBird گزارش شده است، نمی توان به طور قطع نتیجه گرفت که گونه های پرنده بیشتری در ماه می وجود دارند. به سادگی تعداد زیادی تلاش برای نمونه گیری در ماه سپتامبر وجود ندارد، و بنابراین، مقایسه بدون تفکیک اثرات تلاش های نمونه گیری نابرابر معنادار نخواهد بود. در واقع، زمانی که مشاهدات eBird برای مدل‌سازی و پیش‌بینی توزیع جغرافیایی گونه‌ها استفاده می‌شود، تغییرات زمانی در تلاش‌های نمونه‌برداری اغلب با انتخاب تنها مشاهدات در دوره‌های معینی از تلاش‌های نمونه‌برداری تقریباً یکنواخت کنترل می‌شوند [ 8 ، 17 ]].
4.3.3. تعصب مشارکت کننده
مشارکت کنندگان داوطلب سطوح مختلفی از مهارت در ارائه داده ها دارند و سطح مهارت همان مشارکت کننده ممکن است در طول زمان تغییر کند. به عنوان مثال، سطوح مختلف تخصص در میان مشارکت کنندگان eBird ممکن است به خوبی در تعداد روزهای فعالی که مشاهدات را گزارش می کنند ( شکل 13 ) و در تعداد رویدادهای نمونه برداری گزارش شده، مکان های نمونه برداری و گونه های پرنده منعکس شود ( شکل 14 ). بسیاری از ناظران، مشارکت‌کنندگان موقتی هستند که تنها یک رکورد را ارسال می‌کنند. تنها بخش کوچکی از مشارکت کنندگان متخصصانی هستند که تمایل دارند به طور فعال مقادیر زیادی از داده ها را در درازمدت مشارکت دهند [ 51 ]. در واقع، هنگام شمارش پرندگان، هر دو تفاوت بین ناظر وجود دارد [ 68] و تفاوت‌های درون مشاهده‌گر (یعنی تغییر در توانایی شمارش پرندگان یک گونه خاص پس از تجربه سال اول مشاهده‌گر) [ 69 ].
هنگام استفاده از داده های VGI در تجزیه و تحلیل، ممکن است لازم باشد چنین سوگیری ناظری در نظر گرفته شود. به عنوان مثال، [ 70 ] نشان می دهد که برای جمعیت های کم تراکم، استفاده از داده های ارائه شده توسط ناظران تازه کار و با تجربه ممکن است منجر به مدل های اشغال سایت اشتباه شود. مطالعات دیگر نشان داده‌اند که مهارت‌های مشاهده مشارکت‌کنندگان داوطلب را می‌توان با استفاده از منحنی‌های انباشت گونه [ 71 ] و ترکیب کیفیت مشاهده‌گر به‌عنوان یک متغیر کمکی برای توضیح تفاوت‌های مشاهده‌گر تخمین زد [ 68 ]. حذف اولین سال مشاهده ناظر [ 69 ] تخمین روند جمعیت را بهبود می بخشد، و ترکیب تخمین های تخصص ناظر در مدل اشغال، توزیع گونه ها را از داده های علم شهروندی بهبود می بخشد [ 72 ]].
4.3.4. تعصب مشاهده
سوگیری در مورد هدف مشاهده نیز وجود دارد. در حالی که مشاهده و شناسایی برخی از اهداف آسان است، برخی دیگر ممکن است چالش برانگیزتر باشند. در نتیجه، مشاهدات داوطلب ممکن است به سمت اهداف آسان در حجم داده ها سوگیری داشته باشد. گونه های رایج ممکن است به طور مکرر در بسیاری از رویدادهای نمونه برداری و توسط بسیاری از ناظران گزارش شوند، در حالی که تنها تعداد کمی از گونه های نادر و گریزان ممکن است گزارش شود. عارضه دیگر این است که ناظران ممکن است ترجیحات خود را در مورد آنچه که باید مشاهده و گزارش کنند داشته باشند. پرنده داران خبره ممکن است فقط به گزارش گونه های کمیاب علاقه داشته باشند و در عین حال گونه های رایج را نادیده بگیرند. چنین سوگیری مشاهده ای در VGI ممکن است در برخی کاربردهای VGI مستحق درمان باشد. در واقع، eBird به کاربران اجازه می دهد گزارش دهند که آیا یک چک لیست (یعنی رویداد نمونه برداری) شامل همه گونه هایی است که می توانند شناسایی و شناسایی کنند (چک لیست “کامل”).73 ]. eBird ناظران را تشویق می‌کند تا چک‌لیست‌های کامل را ارسال کنند و نسبت بالایی (75%) از چک‌لیست‌های ارسال‌شده در پایگاه داده eBird کامل هستند.

5. نتیجه گیری ها

با استفاده از eBird به عنوان مثال، این مطالعه الگوهای مکانی و زمانی را در فعالیت‌های مشارکت داده‌های داوطلبانه بررسی می‌کند. تلاش‌های نمونه‌گیری مشارکت‌کنندگان eBird در مکان و زمان مغرضانه است. بیشتر تلاش‌های نمونه‌گیری در مناطقی با جمعیت‌های متراکم‌تر و/یا دسترسی بهتر متمرکز شده‌اند، و بیشترین مناطق نمونه‌برداری شده در مجاورت شهرهای بزرگ در مناطق توسعه‌یافته جهان هستند. با توجه به تلاش‌های نمونه‌برداری با سوگیری فضایی، گونه‌های پرنده گزارش‌شده نیز از نظر فضایی نسبت به مناطقی که تلاش‌های نمونه‌برداری بیشتری انجام می‌شود، سوگیری دارند. به طور موقت، تلاش‌های نمونه‌گیری eBird و گونه‌های پرنده گزارش‌شده در طول سال‌ها افزایش می‌یابد، با نوسانات ماهانه قابل توجه و به‌ویژه داده‌های بیشتر گزارش‌شده در آخر هفته‌ها. چنین روندهایی با توسعه مستمر پروژه eBird و ویژگی های هر دو گونه پرنده هدایت می شود (به عنوان مثال، فصل تولید مثل) و ناظران (به عنوان مثال، پرندگان بیشتر در تعطیلات آخر هفته). سایر اشکال سوگیری نیز در فعالیت های مشارکت داده های داوطلبانه وجود دارد (به عنوان مثال، سوگیری مشارکت کننده، سوگیری مشاهده). تناسب استفاده از VGI در زمینه کاربردهای خاص باید با بررسی میزان سوگیری های مکانی، زمانی و دیگر و تأثیرات بالقوه آنها ارزیابی شود. در بسیاری از موارد، سوگیری ها باید به گونه ای در نظر گرفته شوند که بتوان استنباط های قابل اعتمادی را از مشاهدات VGI انجام داد. سوگیری های زمانی و دیگر و تأثیرات بالقوه آنها. در بسیاری از موارد، سوگیری ها باید به گونه ای در نظر گرفته شوند که بتوان استنباط های قابل اعتمادی را از مشاهدات VGI انجام داد. سوگیری های زمانی و دیگر و تأثیرات بالقوه آنها. در بسیاری از موارد، سوگیری ها باید به گونه ای در نظر گرفته شوند که بتوان استنباط های قابل اعتمادی را از مشاهدات VGI انجام داد.

منابع

  1. Goodchild، MF Citizens به عنوان حسگر: دنیای جغرافیای داوطلبانه. ژئوژورنال 2007 ، 69 ، 211-221. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  2. هاکلی، م. Weber, P. OpenStreetMap: نقشه های خیابانی تولید شده توسط کاربر. محاسبات فراگیر IEEE 2008 ، 7 ، 12-18. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  3. سالیوان، BL; چوب، CL; ایلیف، ام جی; بانی، RE; فینک، دی. Kelling، S. eBird: یک شبکه رصد پرندگان مبتنی بر شهروند در علوم زیستی. Biol. حفظ کنید. 2009 ، 142 ، 2282-2292. [ Google Scholar ] [ CrossRef ]
  4. چوب، سی. سالیوان، بی. ایلیف، ام. فینک، دی. Kelling، S. eBird: درگیر کردن پرندگان در علم و حفاظت. PLoS Biol. 2011 ، 9 ، e1001220. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  5. ارسنجانی، ج. Zipf، A.; مونی، پی. Helbich, M. OpenStreetMap در GIScience: Experiences, Research, and Applications ; Springer: برلین/هایدلبرگ، آلمان، 2015; ISBN 3319142801. [ Google Scholar ]
  6. سالیوان، BL; آیکریگ، جی ال. بری، جی اچ. بانی، RE; برونز، ن. کوپر، سی بی؛ دامولاس، تی. Dhondt، AA; دیتریش، تی. فارنسورث، ا. و همکاران شرکت eBird: رویکردی یکپارچه برای توسعه و کاربرد علم شهروندی. Biol. حفظ کنید. 2014 ، 169 ، 31-40. [ Google Scholar ] [ CrossRef ]
  7. ساچدوا، اس. مک کافری، اس. لاک، دی. رویکردهای رسانه های اجتماعی برای مدل سازی پراکندگی دود آتش سوزی: تحقیقات علمی مکانی و زمانی و اجتماعی. Inf. اشتراک. Soc. 2017 ، 20 ، 1146-1161. [ Google Scholar ] [ CrossRef ]
  8. فینک، دی. هوچاچکا، WM; زاکربرگ، بی. وینکلر، DW; شابی، بی. مونسون، MA; هوکر، جی. ریدوالد، ام. شلدون، دی. Kelling، S. مدل‌های اکتشافی فضایی-زمانی برای داده‌های پیمایش در مقیاس وسیع. Ecol. Appl. 2010 ، 20 ، 2131-2147. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  9. مالک، م.م. لامبا، اچ. ناکوس، سی. Pfeffer, J. تعصب جمعیت در توییت‌های دارای برچسب جغرافیایی. در مجموعه مقالات نهمین کنفرانس بین المللی AAAI در وب و رسانه های اجتماعی، آکسفورد، انگلستان، 26-29 مه 2015. ص 18-27. [ Google Scholar ]
  10. براون، جی. مروری بر اثرات نمونه‌گیری و سوگیری پاسخ در نقشه‌برداری مشارکتی اینترنتی (PPGIS/PGIS/VGI). ترانس. GIS 2017 ، 21 ، 39-56. [ Google Scholar ] [ CrossRef ]
  11. هچت، بی. استفنز، ام. داستان شهرها: سوگیری های شهری در اطلاعات جغرافیایی داوطلبانه. در مجموعه مقالات هشتمین کنفرانس بین المللی وب و رسانه های اجتماعی (ICWSM)، ان آربور، MI، ایالات متحده، 1 تا 4 ژوئن 2014. صص 197-205. [ Google Scholar ]
  12. ژانگ، ی. لی، ایکس. وانگ، آ. بائو، تی. تیان، اس. تراکم و تنوع شبکه‌های جاده‌ای OpenStreetMap در چین. J. Urban Manag. 2015 ، 4 ، 135-146. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  13. یانگ، آ. فن، اچ. جینگ، ن. سان، ی. Zipf، A. تحلیل زمانی در مورد نابرابری مشارکت در نقشه خیابان باز: مطالعه مقایسه ای برای چهار کشور. ISPRS Int. J. Geo-Inf. 2016 ، 5 ، 5. [ Google Scholar ] [ CrossRef ]
  14. بصیری، ع. هاکلی، م. فودی، جی. Mooney, P. کیفیت داده‌های جغرافیایی جمع‌سپاری شده: چالش‌ها و مسیرهای آینده. بین المللی جی. جئوگر. Inf. علمی 2019 ، 33 ، 1588-1593. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  15. Boakes، EH; مک گوان، PJK؛ فولر، RA; دینگ، سی. کلارک، NE; اوکانر، ک. گرز، GM دیدگاه های تحریف شده از تنوع زیستی: سوگیری مکانی و زمانی در داده های وقوع گونه ها. PLoS Biol. 2010 ، 8 ، e1000385. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  16. ژانگ، جی. تقویت معناشناسی برنامه VGI با حسابداری برای تعصب فضایی. داده های بزرگ زمین 2019 ، 3 ، 255–268. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  17. ژانگ، جی. زو، A.-X. یک رویکرد معطوف به نمایندگی برای کاهش تعصب فضایی در VGI برای نقشه‌برداری پیش‌بینی‌کننده. بین المللی جی. جئوگر. Inf. علمی 2019 ، 33 ، 1873-1893. [ Google Scholar ] [ CrossRef ]
  18. زو، A.-X. ژانگ، جی. وانگ، دبلیو. شیائو، دبلیو. هوانگ، Z.-P. Dunzhu، G.-S. رن، جی. Qin، C.-Z. یانگ، ال. پی، تی. و همکاران یک رویکرد مبتنی بر داده‌های شهروندی برای نقشه‌برداری پیش‌بینی‌کننده تغییرات فضایی پدیده‌های طبیعی. بین المللی جی. جئوگر. Inf. علمی 2015 ، 29 ، 1864-1886. [ Google Scholar ] [ CrossRef ]
  19. Boakes، EH; گلیوزو، جی. سیمور، وی. هاروی، ام. اسمیت، سی. روی، دی بی. هاکلی، ام. الگوهای مشارکت در پروژه های تنوع زیستی علم شهروندی درک رفتار ثبت داوطلبان را افزایش می دهد. علمی Rep. 2016 , 6 , 1-11. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  20. آنتونیو، وی. Skopeliti، A. اندازه گیری ها و شاخص های کیفیت VGI: یک مرور کلی. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2015 ، II-3/W5 ، 345-351. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  21. ساورمانا، اچ. Franzonib، C. الگوهای مشارکت کاربران علم جمعیت و پیامدهای آنها. Proc. Natl. آکادمی علمی ایالات متحده آمریکا 2015 ، 112 ، 679-684. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  22. نیس، پ. Zipf، A. تجزیه و تحلیل فعالیت مشارکت کننده یک پروژه داوطلبانه اطلاعات جغرافیایی – مورد OpenStreetMap. ISPRS Int. J. Geo-Inf. 2012 ، 1 ، 146-165. [ Google Scholar ] [ CrossRef ]
  23. لی، ال. Goodchild، MF; Xu، B. الگوهای مکانی، زمانی و اجتماعی-اقتصادی در استفاده از توییتر و فلیکر. کارتوگر. Geogr. Inf. علمی 2013 ، 40 ، 61-77. [ Google Scholar ] [ CrossRef ]
  24. نیلسن، جی. قانون 90-9-1 برای نابرابری مشارکت در رسانه های اجتماعی و جوامع آنلاین. 2006. در دسترس آنلاین: https://www.nngroup.com/articles/participation-inequality (در 1 اکتبر 2020 قابل دسترسی است).
  25. هاکلی، من چرا نابرابری مشارکت مهم است؟ Ubiquity Press: لندن، بریتانیا، 2016. [ Google Scholar ]
  26. کارون آرتور، بی. کانینگهام، جی. گریفیث، KM توصیف توزیع مشارکت در یک گروه پشتیبانی اینترنتی بر اساس فرکانس پست: مقایسه ای از اصل 90-9-1 و قانون Zipf. مصاحبه اینترنتی 2014 ، 1 ، 165-168. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  27. Girres, J.-F. Touya, G. ارزیابی کیفیت مجموعه داده OpenStreetMap فرانسه. ترانس. GIS 2010 ، 14 ، 435-459. [ Google Scholar ] [ CrossRef ]
  28. Bittner, C. تنوع در اطلاعات جغرافیایی داوطلبانه: مقایسه OpenStreetMap و Wikimapia در اورشلیم. جئوژورنال 2017 ، 82 ، 887–906. [ Google Scholar ] [ CrossRef ]
  29. گلدمن، جی. هایلمن کلاوزن، جی. هولم، تی. لوینسکی، آی. مارکوسن، بی. اولسن، ک. راهبک، سی. Tøttrup، AP چه چیزی سوگیری فضایی را در علم شهروندی تعیین می کند؟ بررسی چهار طرح ضبط با الزامات مهارتی متفاوت. غواصان. توزیع کنید. 2016 ، 22 ، 1139-1149. [ Google Scholar ] [ CrossRef ]
  30. ادوبون. آزمایشگاه اویتنولوژی کرنل درباره پرنده الکترونیکی. موجود به صورت آنلاین: https://ebird.org/about (در 17 سپتامبر 2019 قابل دسترسی است).
  31. eBird. eBird Basic Dataset Metadata (نسخه 1.12). 2019. در دسترس آنلاین: https://ebird.org/science/download-ebird-data-products (در 17 سپتامبر 2019 قابل دسترسی است).
  32. کلینگ، اس. لاگوزه، سی. وانگ، دبلیو.-ک. یو، جی. دامولاس، تی. گربراخت، جی. فینک، دی. Gomes, C. eBird: یک شبکه یادگیری انسان/رایانه برای بهبود حفاظت و تحقیقات تنوع زیستی. AI Mag. 2013 ، 34 ، 10-20. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  33. La Sorte، FA; Somveille, M. بررسی کامل پایگاه داده شهروندی-علمی جهانی از وقوع پرندگان. اکوگرافی 2020 ، 43 ، 34-43. [ Google Scholar ] [ CrossRef ]
  34. eBird. Hotspots-eBird را کاوش کنید. در دسترس آنلاین: https://ebird.org/hotspots (در 17 سپتامبر 2019 قابل دسترسی است).
  35. UNDP. شاخص ها و شاخص های توسعه انسانی: به روز رسانی آماری 2018 ; UNDP: نیویورک، نیویورک، ایالات متحده آمریکا، 2018. [ Google Scholar ]
  36. USFWS. پرندگان در ایالات متحده: ضمیمه تجزیه و تحلیل جمعیتی و اقتصادی به بررسی ملی ماهیگیری، شکار، و تفریحات مرتبط با حیات وحش در سال 2011 . خدمات ماهی و حیات وحش ایالات متحده: واشنگتن، دی سی، ایالات متحده آمریکا، 2013. در دسترس آنلاین: https://digitalmedia.fws.gov/digital/collection/document/id/1874/ (در 1 اکتبر 2020 قابل دسترسی است).
  37. eBird. موبایل اکنون به 5 زبان موجود است. در دسترس آنلاین: https://ebird.org/news/mobiletranslation/ (دسترسی در 20 مارس 2020).
  38. Tuanmu، MN; جتز، دبلیو. یک محصول اجماعی جهانی 1 کیلومتری پوشش زمین برای تنوع زیستی و مدل‌سازی اکوسیستم. گلوب. Ecol. Biogeogr. 2014 ، 23 ، 1031-1045. [ Google Scholar ] [ CrossRef ]
  39. پوشش زمین اجماع 1 کیلومتری جهانی. در دسترس آنلاین: https://www.earthenv.org/landcover (در 15 ژوئن 2020 قابل دسترسی است).
  40. مرکز شبکه بین المللی اطلاعات علوم زمین-CIESIN-دانشگاه کلمبیا. Gridded Population of the World, Version 4 (GPWv4): Population Density, Revision 11. 2018. موجود آنلاین: https://data.nasa.gov/dataset/Gridded-Population-of-the-World-Version-4-GPWv4 -Po/w4yu-b8bh (در 15 ژوئن 2020 قابل دسترسی است).
  41. تراکم جمعیت، نسخه 4.11 (2000، 2005، 2010، 2015، 2020). در دسترس آنلاین: https://sedac.ciesin.columbia.edu/data/set/gpw-v4-population-density-rev11 (در 15 ژوئن 2020 قابل دسترسی است).
  42. Meijer، JR; Huijbregts، MAJ; شوتن، KCGJ; Schipper، AM الگوهای جهانی زیرساخت های جاده ای فعلی و آینده. محیط زیست Res. Lett. 2018 , 13 , 064006. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  43. پایگاه داده جاده های جهانی GRIP. در دسترس آنلاین: https://www.globio.info/download-grip-dataset (در 15 ژوئن 2020 قابل دسترسی است).
  44. داده های توسعه انسانی (1990-2018). در دسترس آنلاین: https://hdr.undp.org/en/data (در 1 اکتبر 2020 قابل دسترسی است).
  45. مروری بر تمام زبان های رسمی صحبت شده در هر کشور. در دسترس آنلاین: https://www.arcgis.com/home/item.html?id=5c6ec52c374249a781aede5802994c95 (در 15 ژوئن 2020 قابل دسترسی است).
  46. 2020 جمعیت جهان بر اساس کشور. در دسترس آنلاین: https://worldpopulationreview.com/ (در 15 ژوئن 2020 قابل دسترسی است).
  47. فیلیپس، اس جی. اندرسون، آر.پی. Schapire، RE مدل‌سازی حداکثر آنتروپی توزیع‌های جغرافیایی گونه‌ها. Ecol. مدل. 2006 ، 190 ، 231-259. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  48. یان، ی. کو، سی. فنگ، سی. هوانگ، دبلیو. فن، اچ. مدل‌سازی حداکثر آنتروپی با داده‌های رسانه‌های اجتماعی دارای برچسب جغرافیایی برای تعیین توزیع جغرافیایی گردشگران. بین المللی جی. جئوگر. Inf. علمی 2018 ، 32 ، 1699-1736. [ Google Scholar ] [ CrossRef ]
  49. فیلیپس، اس جی. دودیک، م. Schapire، نرم افزار RE Maxent برای مدل سازی سوله ها و توزیع های گونه ها، (نسخه 3.4.1). 2019. در دسترس آنلاین: https://biodiversityinformatics.amnh.org/open_source/maxent (در 1 مارس 2019 قابل دسترسی است).
  50. فیلیپس، اس جی. Dudík، M. مدل سازی توزیع گونه ها با Maxent: الحاقات جدید و ارزیابی جامع. اکوگرافی 2008 ، 31 ، 161-175. [ Google Scholar ] [ CrossRef ]
  51. بگین، دی. دیویلر، آر. Roche, S. چرخه زندگی مشارکت کنندگان در جوامع آنلاین مشترک – مورد OpenStreetMap. بین المللی جی. جئوگر. Inf. علمی 2018 ، 32 ، 1611-1630. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  52. به ornitho.ch خوش آمدید. در دسترس آنلاین: https://www.ornitho.ch/ (در 1 اکتبر 2020 قابل دسترسی است).
  53. inNaturalist. در دسترس آنلاین: https://www.inaturalist.org/ (در 1 اکتبر 2020 قابل دسترسی است).
  54. Conflict هنوز هم بزرگترین چالش آفریقا در سال 2020 است. در دسترس به صورت آنلاین: https://reliefweb.int/report/world/conflict-still-africa-s-biggest-challenge-2020 (در 1 اکتبر 2020 قابل دسترسی است).
  55. جانستون، ا. موران، ن. ماسگرو، ا. فینک، دی. بیلی، SR تخمین توزیع گونه‌ها از داده‌های علوم شهروندی با سوگیری فضایی. Ecol. مدل. 2020 , 422 , 108927. [ Google Scholar ] [ CrossRef ]
  56. نیومن، جی. گراهام، جی. کرال، ا. لایتوری، ام. هنر و علم حمایت از علم شهروندی چند مقیاسی. Ecol. آگاه کردن. 2011 ، 6 ، 217-227. [ Google Scholar ] [ CrossRef ]
  57. ویکی پدیا ای برد در دسترس آنلاین: https://en.wikipedia.org/wiki/EBird (در 17 ژوئیه 2020 قابل دسترسی است).
  58. برنامه موبایل eBird برای iOS اکنون در دسترس است! در دسترس آنلاین: https://ebird.org/news/ebird_mobile_ios1 (در 1 اکتبر 2020 قابل دسترسی است).
  59. آزمایشگاه اورینیتولوژی کورنل مرلین. در دسترس آنلاین: https://merlin.allaboutbirds.org/the-story/ (در 21 ژوئیه 2020 قابل دسترسی است).
  60. تعداد پرندگان حیاط خلوت عالی (جهانی) این آخر هفته! در دسترس آنلاین: https://ebird.org/news/great-global-backyard-bird-count-this-weekend/ (در 3 اکتبر 2020 قابل دسترسی است).
  61. روز بزرگ جهانی — 9 مه 2020. در دسترس آنلاین: https://ebird.org/news/global-big-day-9-may-2020 (در 21 ژوئیه 2020 قابل دسترسی است).
  62. روز بزرگ اکتبر — 19 اکتبر 2019. در دسترس به صورت آنلاین: https://ebird.org/news/october-big-day-19-october-2019 (در 21 ژوئیه 2020 قابل دسترسی است).
  63. جنسن، RR; Shumway، JM نمونه‌برداری از جهان ما. در روش تحقیق در جغرافیا: مقدمه ای انتقادی ; Gomez, B., Jones, JP, III, Eds. جان وایلی و پسران: هوبوکن، نیوجرسی، ایالات متحده آمریکا، 2010; صص 77-90. [ Google Scholar ]
  64. ژانگ، جی. زو، A.-X. نمایندگی و سوگیری فضایی اطلاعات جغرافیایی داوطلبانه: یک بررسی ان GIS 2018 ، 24 ، 151-162. [ Google Scholar ] [ CrossRef ]
  65. پاردو، آی. پاتا، نماینده مجلس؛ گومز، دی. García, MB یک روش جدید برای مدیریت اثر تلاش نمونه برداری ناهموار در پایگاه های داده تنوع زیستی. PLoS ONE 2013 ، 8 ، e52786. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  66. استولار، جی. نیلسن، SE حسابداری برای تلاش نمونه گیری با سوگیری فضایی در مدل سازی توزیع گونه های فقط حضوری. غواصان. توزیع کنید. 2015 ، 21 ، 595-608. [ Google Scholar ] [ CrossRef ]
  67. رابینسون، OJ; رویز-گوتیرز، وی. فینک، دی. تصحیح تعصب در مدل‌سازی توزیع برای گونه‌های کمیاب با استفاده از داده‌های علوم شهروندی. غواصان. توزیع کنید. 2018 ، 24 ، 460-472. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  68. Sauer، JR; Peterjohn، BG; پیوند، تفاوت‌های WA Observer در نظرسنجی پرورش پرندگان آمریکای شمالی. Auk 1994 ، 111 ، 50-62. [ Google Scholar ] [ CrossRef ]
  69. کندال، WL; Peterjohn، BG; Sauer، JR; Url, S. اثرات ناظر برای اولین بار در نظرسنجی پرورش پرندگان آمریکای شمالی. Auk 1996 ، 113 ، 823-829. [ Google Scholar ] [ CrossRef ]
  70. فیتزپاتریک، ام سی؛ پریسر، EL; الیسون، AM; Elkinton، تعصب JS Observer و تشخیص جمعیت های کم تراکم. Ecol. Appl. 2009 ، 19 ، 1673-1679. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  71. کلینگ، اس. جانستون، ا. هوچاچکا، WM; ایلیف، ام. فینک، دی. گربراخت، جی. لاگوزه، سی. La Sorte، FA; مور، تی. ویگینز، ای. و همکاران آیا می توان مهارت های رصدی دانشمندان شهروند را با استفاده از منحنی های تجمع گونه ها تخمین زد؟ PLoS ONE 2015 , 10 , e0139600. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  72. جانستون، ا. فینک، دی. هوچاچکا، WM; Kelling، S. برآورد تخصص ناظر، توزیع گونه ها را از داده های علم شهروندی بهبود می بخشد. روش ها Ecol. تکامل. 2018 ، 9 ، 88-97. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  73. جانستون، ا. هوچاچکا، دبلیو. استریماس-مکی، ام. رویز گوتیرز، وی. رابینسون، او. اوئر، تی. کلینگ، اس. Fink, D. دستورالعمل‌های تحلیلی برای افزایش ارزش داده‌های علوم شهروندی: استفاده از داده‌های eBird برای تخمین وقوع گونه‌ها. bioRxiv 2020 . در دسترس آنلاین: https://www.biorxiv.org/content/10.1101/574392v3.full.pdf (دسترسی در 15 ژوئن 2020).
شکل 1. توزیع فضایی مکان های نمونه برداری eBird در سال 2019.
شکل 2. متغیرهای کمکی مورد استفاده برای مدل سازی الگوی فضایی در تلاش های نمونه گیری مشارکت کنندگان eBird.
شکل 3. توزیع فراوانی مکان های نمونه برداری و جهان بر روی متغیرهای کمکی.
شکل 4. تعداد رویدادهای نمونه برداری تجمعی eBird تا 31 دسامبر 2019 روی سلول های شبکه طول جغرافیایی 0.25 درجه × طول جغرافیایی 0.25 درجه نقشه برداری شده است. فواصل زمانی به روش طبقه‌بندی چارکی مشخص شد.
شکل 5. تعداد رویدادهای نمونه گیری در هر سال (2002-2019).
شکل 6. درصد رویدادهای نمونه گیری در هر ماه نسبت به تعداد کل سالانه رویدادها.
شکل 7. میانگین تعداد رویدادهای نمونه گیری در هر روز از هفته در طول سالها.
شکل 8. توزیع فراوانی رویدادهای نمونه برداری بر اساس تعداد گونه های گزارش شده.
شکل 9. تعداد تجمعی ناظران تا 31 دسامبر 2019 بر روی سلول های شبکه طول جغرافیایی 0.25 درجه × طول جغرافیایی 0.25 درجه نقشه برداری شده است. فواصل زمانی به روش طبقه‌بندی چارکی مشخص شد.
شکل 10. تعداد ناظران فعال در هر سال (2002–2019).
شکل 11. درصد ناظران در هر ماه نسبت به تعداد کل سالانه ناظران.
شکل 12. میانگین تعداد ناظران فعال در هر روز هفته در طول سالها.
شکل 13. توزیع فراوانی ناظران بر اساس سال اولین مشاهده ( بالا سمت چپ )، سال آخرین مشاهده ( بالا سمت راست )، تعداد سال‌های بین اولین و آخرین مشاهده ( پایین سمت چپ )، و تعداد تاریخ‌های فعال ( پایین سمت راست ).
شکل 14. توزیع فراوانی ناظران بر اساس تعداد گونه های گزارش شده ( سمت چپ )، تعداد رویدادهای نمونه برداری ( مرکز ) و تعداد مکان های نمونه برداری ( سمت راست ).
شکل 15. تعداد تجمعی گونه‌های گزارش‌شده به eBird تا 31 دسامبر 2019 روی سلول‌های شبکه طول جغرافیایی 0.25 درجه × طول جغرافیایی 0.25 درجه نقشه‌برداری شده است. فواصل زمانی به روش طبقه‌بندی چارکی مشخص شد.
شکل 16. تعداد گونه های گزارش شده در هر سال (2002-2019).
شکل 17. درصد گونه های گزارش شده در هر ماه نسبت به تعداد کل سالانه گونه ها.
شکل 18. میانگین تعداد گونه های گزارش شده در هر روز هفته در طول سال ها.
شکل 19. توزیع تعداد گونه ها بر اساس تعداد ناظرانی که همان گونه پرنده را گزارش کردند ( سمت چپ ) و بر اساس تعداد رویدادهای نمونه برداری که در آن گونه مشابه گزارش شده است ( سمت راست ).
شکل 20. آزمون Jackknife با اهمیت متغیر برای مدل Maxent بر اساس آزمون AUC.
شکل 21. نقشه احتمال نمونه برداری مشارکت کنندگان eBird که با استفاده از Maxent مدل و پیش بینی شده است.
شکل 22. تعداد گونه ها ( بالا )، چک لیست های ناقص ( مرکز )، و مشاهدات تایید نشده ( پایین ) به ازای هر ناظر در طول روزهای هفته.

بدون دیدگاه

دیدگاهتان را بنویسید