1. معرفی
فنآوری پیشرفته در دستگاههای تلفن همراه تعبیهشده در سیستم موقعیتیابی جهانی (GPS) و وب 2.0 به شهروندان اجازه میدهد تا مستقیماً در ساخت دادههای مکانی مشارکت کنند و توسعه اطلاعات جغرافیایی داوطلبانه (VGI) را ترویج میکند [ 1 ]. منابع داده VGI شامل وبسایتهای اشتراکگذاری تصویر (به عنوان مثال، فلیکر و پانورامیو)، پلتفرمهای رسانههای اجتماعی شخصی (بهعنوان مثال، Weibo و Twitter)، و برنامههای نقشهبرداری تعاملی (OpenStreetMap و OSM) است. Mapillary ( https://www.mapillar.com)، به عنوان اولین پلتفرم مبتنی بر جمع سپاری برای ارائه تصاویر دقیق از خیابان، به مشارکت کنندگان اجازه می دهد بدون توجه به حالت سفر: پیاده روی، دوچرخه سواری، یا رانندگی، تصاویر سطح خیابان را از طریق برنامه های تلفن همراه ضبط و آپلود کنند. علاوه بر آپلود برنامه پشتیبانی ارائه شده، رابط وب، برنامه دسکتاپ و ابزارهای خط فرمان، آپلود انعطاف پذیر تصاویر و ویدیوها را در Mapillary امکان پذیر می کند. روشهای مشارکت راحت داوطلبان را بر آن داشته تا از ابتدای سال 2014 در فعالیتهای مشارکت شرکت کنند و طبق آمار رسمی، اکنون Mapillary در مجموع 543.8 میلیون تصویر دارد.
در مقایسه با Google Street View (GSV)، تصاویر در پلتفرم Mapillary از مجوز Creative Commons Attribution-ShareAlike 4.0 International (CC BY SA 4.0) پیروی می کنند که همه می توانند به صورت رایگان از آن استفاده کنند. تصاویر Mapillary به طور گسترده برای ساخت مجموعه دادههای سطح خیابان برای شناسایی اتومبیلها، آسمانها و 64 دسته شی دیگر برای دستیابی به درک معنایی صحنههای خیابان استفاده شدهاند [ 2 ]. از آنجایی که تصاویر Mapillary شامل اطلاعات مربوط به زمان و مختصات جغرافیایی است، رفتار اجتماعی و فیزیکی انسان ها را می توان در مقیاس جهانی از طریق بررسی الگوهای مشارکت کاربر مورد مطالعه قرار داد [ 3 ]]. مشابه سایر دادههای VGI، الگوهای مشارکت کاربر و فرآیند انباشت دادهها تفاوتهای اساسی بین Mapillary و پلتفرمهای داده نمای خیابان سنتی [ 4 ] است و این تجزیه و تحلیلها میتوانند مبنایی برای پاسخ به سؤالات درباره کمیت، کیفیت و نوع Mapillary فراهم کنند. داده ها [ 5 ، 6 ]. والدن شراینر و همکاران [ 7 ] از عکسهای فلیکر برای ارزیابی الگوهای فصلی استفاده بازدیدکنندگان در مناطق کوهستانی حفاظتشده استفاده کرد و مبنایی برای مدیریت مؤثر مناطق حفاظتشده فراهم کرد. لی و همکاران [ 6 ] یک تحلیل اکتشافی از ویژگی های مشارکت کنندگان با استفاده از داده های توییتر و فلیکر انجام داد. با این حال، مطالعات مرتبط در Mapillary وجود ندارد. Juhász و Hochmair [ 8] مرحله اولیه Mapillary را با توجه به رشد کلی و رفتار مشارکت فردی Mapillary در سال اول، مانند روزهای مشارکت فعال، تجزیه و تحلیل کرد. در حال حاضر، Mapillary بیش از پنج سال است که در حال توسعه است، اما هیچ تحقیق اخیر وضعیت توسعه آن و الگوهای مشارکت کاربر را بررسی نکرده است.
تجزیه و تحلیل رفتارهای مشارکت کاربر می تواند به ما کمک کند تا منابع داده را بهتر بشناسیم، و منابع داده ارتباط نزدیکی با کیفیت داده Mapillary دارند [ 8 ، 9 ]]. در این مطالعه، ما یک تجزیه و تحلیل اکتشافی از داده های Mapillary انجام دادیم تا بینشی عمیق نسبت به جامعه Mapillary داشته باشیم. تجزیه و تحلیل تغییرات در تعداد و سهم کاربران در مناطق مختلف می تواند به ما در ارزیابی وفاداری کاربران در جمع آوری داده ها کمک کند. به طور کلی، یک پلت فرم کاربر پسند برای کاربران جذاب است. Mapillary به طور خاص یک فرصت به اشتراک گذاری داده چند مکانیزمی را فراهم می کند. ما فرض میکنیم که کاربران همچنان تصاویر را به Mapillary ارسال میکنند، که به طور قابلتوجهی به الزامات بهموقع بودن دادههای نمای خیابان پاسخ میدهد، در حالی که بسیاری از پلتفرمهای نمای خیابان سطح بالا (مانند GSV) بهروزرسانیهای داده زمان طولانی و مقدار زیادی منابع را میطلبند. علاوه بر این، آگاهی از الگوهای مشارکت کاربر (پیاده روی، دوچرخه سواری، و رانندگی) و تجهیزات مورد استفاده برای مشارکت می توانند درک هدفمندتری از ترکیب داده Mapillary را به ما ارائه دهند. نابرابری مشارکت تأثیرات اساسی و پیچیده ای بر کیفیت داده ها و پیشرفت های پروژه دارد.4 ]. ما انتظار ظهور مجموعه کوچکی از کاربران را داریم که بیشتر کارها را در جامعه Mapillary انجام می دهند. این بدان معناست که بیشتر دادهها از مشارکتکنندگان فعال با تخصص در ابزارهای مورد استفاده و تجربیات غنی میآیند، که ممکن است منجر به کیفیت دادههای بالاتر شود، اما همچنین به این معنی است که تعداد کمی از مشارکتکنندگان میتوانند تأثیر زیادی بر پروژه داشته باشند. بنابراین، تجزیه و تحلیل این کاربران فعال برای بررسی رفتارهای مشارکت در Mapillary برای ما نمایندهتر است.
ساختار بقیه مقاله به شرح زیر است: بخش 2 کار مرتبط را مرور می کند. بخش 3 منابع داده و وضعیت فعلی Mapillary را معرفی می کند. بخش 4 عدم تعادل در Mapillary را بررسی می کند. رفتارهای مشارکت کاربران اصلی در بخش 5 تحلیل شده است. در نهایت، نتایج این مقاله در بخش 6 خلاصه شده است.
2. کارهای مرتبط
مشکل نابرابری سهم در مشارکت داده های VGI رایج است، با تحقیقاتی که در ویکی پدیا [ 10 ]، فلیکر [ 3 ]، پانورامیو [ 3 ] و OSM [ 5 ] گزارش شده است. آرازی و نوامبر [ 11 ] هر دو اثر مستقیم و غیرمستقیم نابرابری های مشارکت را در ویکی پدیا بررسی کردند و دریافتند که نابرابری جهانی به طور قابل توجهی بر کیفیت مقاله تأثیر مثبت دارد. یانگ و همکاران [ 4] یک تحلیل زمانی از نابرابری مشارکت در OSM در کشورهای مختلف انجام داد که نشان میدهد نابرابری سهم به واردات دادهها مرتبط است. هاکلی [ 12 ] پس از بررسی ظهور نابرابری مشارکت در هر دو مقیاس زمانی و مکانی و ارزیابی پیامدهای استفاده از VGI پیشنهاد کرد که نابرابری مشارکت در تجزیه و تحلیل یک پروژه VGI باید در نظر گرفته شود. در تحقیقات اولیه Mapillary، نابرابری سهم نیز یافت شد [ 8]، نشان می دهد که تعداد کمی از افراد میانگین سهم زیادی در هفته دارند که با فعالیت مشارکت طولانی تر همراه است. مشارکت کاربر در Mapillary ادامه دارد. چگونه نابرابری مشارکت در Mapillary تغییر خواهد کرد؟ تجزیه و تحلیل تغییرات در نابرابری سهم به درک توسعه Mapillary کمک می کند. این موضوع در این مطالعه مورد بررسی قرار گرفت.
کیفیت داده های VGI همیشه در کانون توجه بوده است. بسیاری از مطالعات کیفیت داده های OSM را از سطوح مختلف شی مانند شبکه جاده [ 13 ]، نقطه [ 14 ]، خط [ 15 ] و چند ضلعی [ 16 ] ارزیابی کرده اند. Hagenauer و Helbich [ 17 ] در تحقیقات خود ذکر کردند که تقریباً تمام «مطالعات تجربی نشان دادهاند که مناطق شهری بهتر نقشهبرداری شدهاند» در OSM. کامل بودن داده ها یکی از عناصر اصلی کیفیت داده است، Juhász و Hochmair [ 8 ] کامل بودن Mapillary را تجزیه و تحلیل کردند و معتقد بودند که داده های آن پوشش بهتری در مسیرهای پیاده و دوچرخه در برخی شهرها نسبت به GSV دارند. ولادیمیر و همکاران [ 18] از تصاویر Mapillary و GSV برای تعیین موقعیت جغرافیایی شی شناسایی شده استفاده کرد و آزمایشها نشان داد که با افزایش تعداد تصاویر Mapillary، دقت تشخیص به دادههای سطح بالای خیابان نزدیکتر است. در بسیاری از سناریوها، Mapillary می تواند تا حدی به عنوان جایگزینی برای تصاویر GSV استفاده شود. توسعه VGI حجم زیادی از تحقیقات مرتبط را تولید کرده است که نه تنها به کیفیت داده های VGI مربوط می شود، بلکه در مورد مشارکت کنندگانی که در فعالیت های VGI شرکت کرده اند نیز مرتبط است. Neis و Zipf [ 5 ] مشارکت کنندگان OSM را با توجه به تعداد گره های ارائه شده توسط اعضا به چهار دسته تقسیم کردند و ویژگی های اعضا مانند مکان و ناحیه فعالیت را تجزیه و تحلیل کردند. علیوند و هوچمیر [ 3] الگوهای مشارکت عکس Panoramio و Flickr در کالیفرنیا، ایالات متحده، از جمله نوع رشد داده ها و محیط مرتبط با تعداد مشارکت داده ها را تجزیه و تحلیل کرد. یانگ و همکاران [ 19 ] برای ارزیابی تخصص مشارکت کنندگان اصلی و قضاوت در مورد حرفه ای بودن یا آماتور بودن آنها بر رویکرد مبتنی بر رفتار تکیه کرد. Juhász و Hochmair [ 8 ] الگوهای مشارکت کاربر Mapillary را در سطح کشور و قاره و همچنین در سطح فردی تجزیه و تحلیل کردند و توسعه اولیه Mapillary را آشکار کردند. تجزیه و تحلیل الگوهای مشارکت در پروژههای VGI به بررسی بیشتر مکانیسمهای رفتار افراد و ارزیابی کیفیت دادههای VGI کمک میکند. آنتونیو و شلیدر [ 20] رفتار فضایی مشارکت کنندگان OpenStreetMap در منطقه لندن بزرگ را مورد مطالعه قرار داد، آن را به مکانیسم های گیمیفیکیشن مرتبط کرد و دریافت که می تواند در پرداختن به مسائل مشارکت با بازی های تخصیص فضایی کمک کند. زیلسترا و همکاران [ 21 ] روشی را برای تعیین مناطق اصلی مشارکت کنندگان OSM پیشنهاد کرد، که صرفاً بر اساس خوشه بندی فضایی گره های ایجاد شده با تجزیه و تحلیل انواع داده های OSM و رفتارهای ویرایشی کاربران است. بگین و همکاران [ 22 ] مطالعه رفتار نقشه برداری مشارکت کنندگان، مانند ترجیحات اشیاء برای نقشه، برای درک ویژگی ها و کیفیت داده های تولید شده را پیشنهاد کرد.
3. مروری بر Mapillary Today
در این بخش، داده های Mapillary به صورت آماری تجزیه و تحلیل می شوند تا یک نمای کلی از توسعه Mapillary تا به امروز ارائه شود.
3.1. آماده سازی داده ها
دادههای Mapillary حاوی تصاویری است که توسط دستگاههای تعبیهشده در GPS هنگام رانندگی خودرو، دوچرخهسواری یا پیادهروی گرفته شده است. هنگامی که از برنامه Mapillary استفاده می شود، دستگاه به طور خودکار تصاویر نمای خیابان را در فواصل زمانی منظم می گیرد. بنابراین، هر تصویر را می توان با یک گره GPS با مهر زمانی نشان داد. این گره های متوالی یک مسیر را تشکیل می دهند که در Mapillary به آن دنباله می گویند. اگر برنامه متوقف شود یا سیگنال GPS از بین برود، تصاویر به دست آمده بعدی به عنوان دنباله دیگری در نظر گرفته می شوند.
دادههای Mapillary را میتوان از طریق رابط برنامهنویسی رسمی برنامه (API)، شامل تصاویر و توالیها به عنوان دو نوع اصلی، دسترسی داشت. در این مقاله از داده های توالی برای تحلیل استفاده می کنیم. ما محتوای تصویر را در نظر نگرفتیم و فقط به اطلاعات ویژگی توالی دسترسی پیدا کردیم و دانلود کردیم. دادهها از ژانویه 2014 تا فوریه 2019 را پوشش میدهند. Mapillary به توسعهدهندگان اجازه میدهد با استفاده از پارامترهای مختلف Uniform Resource Locator (URL) به جستجوی داده بپردازند ( جدول 1 )) و ما از «bbox» و «end_time» به عنوان پارامترهای URL برای دسترسی به داده ها استفاده می کنیم. “Bbox” به معنای فیلتر کردن توسط جعبه مرزی است که با چهار پارامتر از جمله حداقل/حداکثر طول و عرض جغرافیایی جعبه مرزی تعریف می شود. “end_time” نشان دهنده دنباله های فیلتری است که قبل از زمان پایان گرفته شده اند. از آنجایی که Mapillary تنها دارای 1000 داده در هر صفحه برای یک منطقه به خصوص متراکم است، لازم بود که به صورت سلسله مراتبی کادر محدود برای پرس و جوهای تکراری تقسیم بندی شود تا داده های توالی کامل به دست آید. ما جعبه مرزی حاوی بیش از 1000 رکورد توالی را به چهار بلوک با اندازه مساوی تقسیم کردیم و سپس دادههای هر بلوک کوچک را جستجو و دانلود کردیم. یک بلوک بیشتر تقسیم شد تا اینکه هیچ بلوک فرعی حاوی بیش از 1000 دنباله نبود.
داده های توالی دانلود شده در قالب Geojson بودند. در مجموع، ما حدود 37 گیگابایت داده به دست آوردیم. برای عملیات فضایی و تجزیه و تحلیل بعدی، ما داده های دنباله را در پایگاه داده PostgreSQL با پسوندهای PostGIS ذخیره کردیم. همانطور که در جدول 2 نشان داده شده است، هر دنباله دارای خواص مختلفی بود . هر کاربر با یک “user_key” جداگانه مطابقت دارد و هر دنباله نیز “کلید” جداگانه خود را دارد. در صورت تاری تصویر و/یا از دست دادن سیگنال GPS، Mapillary از گرفتن عکس توسط دستگاه جلوگیری می کند و توالی فعلی را می بندد. با این حال، این مکانیسم در روزهای اولیه Mapillary اجرا نشد. برای حذف این خطاهای داده در نسخه قبلی، Juhász and Hochmair [ 8] بخش های خط مستقیم را که 1 کیلومتر یا بیشتر بودند حذف کرد. در شرایط عادی، اگر برنامه Mapillary سیگنال داشته باشد و به طور معمول کار کند، فاصله بین دو نقطه داده آپلود شده توسط کاربر باید نسبتا نزدیک باشد. اگر دو نقطه از هم دور باشند، این نشان میدهد که برنامه احتمالاً با خطا مواجه شده است. در این مطالعه، ما همچنین از 1 کیلومتر به عنوان آستانه برای حذف داده های اشتباه استفاده کردیم تا اطمینان حاصل کنیم که توالی ها پوشش واقعی تصاویر گرفته شده را نشان می دهند.
در Mapillary، هیچ اطلاعاتی در مورد محل قرارگیری کاربر ارائه نمی شود، زیرا کاربران مجبور نیستند در هنگام ثبت نام یا آپلود داده ها، پروفایل های جغرافیایی (به عنوان مثال، کشور محل سکونت) را ارائه دهند. بنابراین، شناسایی کشوری که کاربر Mapillary اهل آن است دشوار است. در این مطالعه، ما کشورهای محل اقامت کاربران را بر اساس دانش رایجی که کاربران معمولاً در مناطقی که در آن زندگی میکنند مشارکت میکنند، شناسایی کردیم. قوانین مورد استفاده برای شناسایی به شرح زیر بود:
- (1)
-
محاسبه تعداد روزهایی که کاربر در مکانهای مختلف مشارکت میکند، و مکانی که بیشترین تعداد مشارکت را دارد، کشور کاربر را تعیین میکند.
- (2)
-
وقتی روزهای مشارکت یکسان است، کشور کاربر با توجه به طول توالی مشارکت انباشته تعیین می شود.
- (3)
-
هنگامی که هیچ یک از دو مورد بالا نتوانستند شناسایی ایجاد کنند، کشور کاربر با توجه به مکان اولین توالی مشارکتی کاربر تعیین شد.
تشخیص دقیق محل سکونت کاربر دشوار است. به طور کلی، هر چه کاربر بیشتر در یک کشور مشارکت داشته باشد، احتمال بیشتری دارد که در اینجا زندگی کند. بنابراین، ابتدا کشور محل اقامت را بر اساس تعداد روزهایی که کاربر مشارکت کرده است، تعیین کردیم. طول دنباله نشان دهنده زمان و میزان مشارکت کاربر در منطقه است. معمولاً، کاربران محلی احتمال بیشتری برای مشارکت در منظره خیابانی از راه دور دارند. وقتی هیچ یک از قوانین فعلی در دسترس نباشد، فرض می کنیم که اولین دنباله ایجاد شده توسط کاربر در نزدیکی محل سکونت او قرار دارد. در واقع، کاربران جدید عموماً اولین اشیاء جدید خود را در مناطقی ایجاد می کنند که با آن آشنا هستند [ 5]. قابل ذکر است که هویت کشور کاربران در این اثر به معنای ملیت یا کشوری که آنها به آن تعلق دارند به هیچ وجه سیاسی نیست. در این کار، شناسایی کشور جایی است که کاربران هنگام مشارکت در Mapillary، در صورتی که با کشوری شناسایی شوند، در آن زندگی میکنند.
شکل 1 توزیع کاربران Mapillary را بر اساس کشور بر اساس قوانین فوق نشان می دهد. فقط 14 کشور برتر در اینجا نشان داده شده است. نتایج آماری نشان داد که تمامی کاربران شناسایی شده در 190 کشور زندگی می کنند. ما نتوانستیم اطلاعات کشور را برای 2.63٪ از کاربران تعیین کنیم، شاید به دلیل عواملی مانند تغییر موقعیت GPS. تا پایان فوریه 2019، حدود 9.2٪ از کل کاربران با ایالات متحده شناسایی شدند که بیشترین تعداد کاربر را در همه کشورها دارد. تعداد قابل توجهی از کاربران در کشورهای اروپایی متمرکز بودند. در میان کشورهای برتر آلمان، فرانسه، سوئد و بریتانیا بودند. نتایج مشابهی در آمار OSM نیز گزارش شده است، جایی که تعداد اعضای آلمانی نیز در خط مقدم بود [ 5 ]]. این نشان دهنده این است که پروژه VGI دارای یک محیط توسعه خوب در آلمان است و بسیاری از مردم الگوی توسعه VGI را می شناسند و مایل به شرکت در فعالیت ها هستند. سوئد به عنوان مبدأ پروژه Mapillary نیز پایگاه کاربری خاصی دارد. به جز ایالات متحده، کشورهایی که تعداد کاربران زیادی در قاره آمریکا دارند مکزیک و برزیل هستند. ما کاربران زیادی از چین و هند در آسیا پیدا کردیم.
3.2. وضعیت کلی نقشه
در مجموع، تا فوریه 2019، 2,609,215 دنباله برای کل جهان وجود داشت که طول کل آن 6,256,943,445 کیلومتر بود. در برخی جادهها، توالیهای ارائهشده توسط کاربران همپوشانی داشتند. این داده ها توسط 21948 کاربر ارائه شده است و 211 کشور و منطقه را پوشش می دهد. شکل 2 سهم ماهانه را بر حسب طول سکانس ها در سراسر جهان نشان می دهد. از سال 2014، تعداد معینی از دنبالههای تصویر نمای خیابان هر ماه در Mapillary آپلود شد و طول کل هر سال افزایش مییابد. در شکل 2، بیشترین مشارکت ماهانه طول دنباله کاربر در جولای یا آگوست هر سال متمرکز شده است (بیشترین مشارکت در سال 2018 در ماه مه ارائه شد و مشارکت در جولای و آگوست کمی کمتر بود). این زمانی است که کاربران هر سال بیشترین مشارکت را دارند. پایین ترین سطح مربوط به سهم سالانه در شکل 2 در ژانویه یا فوریه هر سال رخ می دهد. با این حال، مشاهدات کلی، قله های مربوطه، فرورفتگی ها و مقادیر میانگین هر سال، به دنبال یک گرایش خطی، به رشد خود ادامه می دهند. به طور همزمان، توزیع قله ها و فرودها هر ساله مشابه است و نظم خاصی را نشان می دهد که نشان می دهد سهم کاربران با زمان مرتبط است. ما این موضوع را در بخش 5.1 با جزئیات بیشتر مورد بحث قرار می دهیم .
برای بررسی تفاوتها در توسعه Mapillary در مناطق مختلف، ما تغییرات را در دادههای توالی جهانی و تعداد کاربران در سطح قاره تحلیل کردیم. تقریباً هیچ فعالیتی در قطب جنوب ثبت نشده است و بنابراین در نظر گرفته نشده است. خطوط در شکل 3نشان می دهد که چگونه طول کل توالی های Mapillary جمع آوری شده در هر قاره از ژانویه 2014 تا فوریه 2019 ماهانه تغییر کرده است. این هیستوگرام ها تعداد تجمعی کاربران شرکت کننده در فعالیت های مشارکت Mapillary را برای سال های مختلف در هر قاره از سال 2014 تا 2018 نشان می دهد. در حالی که رشد نرخ در طول توالی قاره های مختلف متفاوت است، همه آنها روند رشد تدریجی را نشان می دهند. از فوریه 2019، طول کل سکانس ها در اروپا، آمریکای شمالی و آسیا در سه رتبه اول قرار گرفتند. در میان آنها، اروپا و آمریکای شمالی بسیار فراتر از طول توالی در آسیا هستند، که نشان می دهد کاربران در این دو منطقه فعال هستند و سهم Mapillary مثبت است. رشد داده های Mapillary از مشارکت و مشارکت مداوم کاربران جدید و قدیمی جدایی ناپذیر است. تا پایان سال 2018، تعداد کاربران در اروپا بسیار جلوتر بود و پس از آن آسیا و آمریکای شمالی. تعداد کاربران در سه قاره دیگر نسبتاً کم بود. نرخ رشد کاربران اروپایی بسیار بیشتر از سایر قاره ها است. با توجه به طول توالی هر قاره، به طور کلی، توسعه Mapillary در اروپا سریعتر بوده است. تعداد زیادی از کاربران در اروپا شرکت می کنند و حجم کلی داده ها زیاد است. در مقایسه، هم طول کل و هم نرخ رشد دنباله ها در آمریکای شمالی به طور قابل توجهی بیشتر از آن در آسیا است، در حالی که تعداد کاربران فعال در آسیا بیشتر از آمریکای شمالی هر سال است. این بدان معناست که کاربران فعال در آمریکای شمالی نسبت به کاربران آسیایی بازدهی بیشتری دارند. تعداد کاربران در سه قاره دیگر نسبتاً کم بود. نرخ رشد کاربران اروپایی بسیار بیشتر از سایر قاره ها است. با توجه به طول توالی هر قاره، به طور کلی، توسعه Mapillary در اروپا سریعتر بوده است. تعداد زیادی از کاربران در اروپا شرکت می کنند و حجم کلی داده ها زیاد است. در مقایسه، هم طول کل و هم نرخ رشد دنباله ها در آمریکای شمالی به طور قابل توجهی بیشتر از آن در آسیا است، در حالی که تعداد کاربران فعال در آسیا بیشتر از آمریکای شمالی هر سال است. این بدان معناست که کاربران فعال در آمریکای شمالی نسبت به کاربران آسیایی بازدهی بیشتری دارند. تعداد کاربران در سه قاره دیگر نسبتاً کم بود. نرخ رشد کاربران اروپایی بسیار بیشتر از سایر قاره ها است. با توجه به طول توالی هر قاره، به طور کلی، توسعه Mapillary در اروپا سریعتر بوده است. تعداد زیادی از کاربران در اروپا شرکت می کنند و حجم کلی داده ها زیاد است. در مقایسه، هم طول کل و هم نرخ رشد دنباله ها در آمریکای شمالی به طور قابل توجهی بیشتر از آن در آسیا است، در حالی که تعداد کاربران فعال در آسیا بیشتر از آمریکای شمالی هر سال است. این بدان معناست که کاربران فعال در آمریکای شمالی نسبت به کاربران آسیایی بازدهی بیشتری دارند. به طور کلی، توسعه Mapillary در اروپا سریعتر بوده است. تعداد زیادی از کاربران در اروپا شرکت می کنند و حجم کلی داده ها زیاد است. در مقایسه، هم طول کل و هم نرخ رشد دنباله ها در آمریکای شمالی به طور قابل توجهی بیشتر از آن در آسیا است، در حالی که تعداد کاربران فعال در آسیا بیشتر از آمریکای شمالی هر سال است. این بدان معناست که کاربران فعال در آمریکای شمالی نسبت به کاربران آسیایی بازدهی بیشتری دارند. به طور کلی، توسعه Mapillary در اروپا سریعتر بوده است. تعداد زیادی از کاربران در اروپا شرکت می کنند و حجم کلی داده ها زیاد است. در مقایسه، هم طول کل و هم نرخ رشد دنباله ها در آمریکای شمالی به طور قابل توجهی بیشتر از آن در آسیا است، در حالی که تعداد کاربران فعال در آسیا بیشتر از آمریکای شمالی هر سال است. این بدان معناست که کاربران فعال در آمریکای شمالی نسبت به کاربران آسیایی بازدهی بیشتری دارند. در حالی که تعداد کاربران فعال در آسیا هر سال بیشتر از آمریکای شمالی است. این بدان معناست که کاربران فعال در آمریکای شمالی نسبت به کاربران آسیایی بازدهی بیشتری دارند. در حالی که تعداد کاربران فعال در آسیا هر سال بیشتر از آمریکای شمالی است. این بدان معناست که کاربران فعال در آمریکای شمالی نسبت به کاربران آسیایی بازدهی بیشتری دارند.
ما مشارکتکنندگان را بر اساس سال مشارکت در Mapillary از سال 2014 به شش بخش تقسیم کردیم. شکل 4 تغییرات ترکیب ماهانه در نوع مشارکتکنندگان را نشان میدهد. تعداد قابل توجهی از کاربران جدید هر سال به فعالیت جمعآوری داده Mapillary میپیوندند و برخی از کاربران قدیمی هنوز هم مشارکت داشتند. برخی از کاربرانی که از ابتدای پروژه در سال 2014 مشارکت داشته اند هنوز در سال 2019 فعال هستند.
ما تغییرات تعداد کاربرانی را که هر سال بدون وقفه به مشارکت خود ادامه می دادند، شمارش کردیم. در جدول 3 ، اولین عدد در هر ردیف، تعداد کاربران جدیدی را که شروع به مشارکت در سال A کردند (سال فهرست شده برای آن سطر یا ستون) نشان می دهد. سلول زیر تعداد کاربرانی را که هنوز در سال B (سال ذکر شده در ستون مربوطه) مشارکت داشتهاند را نشان میدهد. برای مثال، 1740 کاربر در سال 2014 شروع به مشارکت کردند که 779 نفر از آنها هنوز در سال 2015 مشارکت داشتند. تا فوریه 2019، 140 نفر از این کاربران قدیمی برای بیش از پنج سال در این مشارکت مشارکت داشتند. این کاربران عمدتا از 40 کشور در سراسر جهان هستند. توزیع خاص در شکل 5 نشان داده شده است. بیشترین تعداد کاربران در آلمان بود، جایی که 20 کاربر هر سال برای بیش از پنج سال داده های Mapillary را ارائه کردند و پس از آن ایالات متحده و ژاپن به ترتیب با 14 و 11 کاربر در رتبه های بعدی قرار گرفتند. طبق آمار، سه کاربر برتر از کل طول مشارکت در بین 140 کاربر قدیمی قرار دارند. کاربری با طولانی ترین دنباله های ارائه شده از ایالات متحده است، با سهم تجمعی بیش از 278000 کیلومتر. کاربری که بیشترین سهم را دارد نیز از ایالات متحده و سومین نفر از سوئد است.
در حالی که کاربران مسنتر برای سالها به مشارکت خود ادامه میدهند، تعداد کاربران جدید هر سال در حال افزایش است. رشد سریع جامعه نشان میدهد که افراد بیشتری از Mapillary حمایت میکنند و توسعه بعدی و غنیسازی داده Mapillary را تضمین میکنند. کاربران Mapillary که مشارکت های طولانی مدت ارائه کرده اند، اغلب تجربه و تکنیک های جمع آوری بیشتری دارند که تا حدی تضمین می کند که Mapillary داده های با کیفیت بهتری دریافت می کند. فعالیت های مشارکت مستمر نشان می دهد که Mapillary تجربه کاربری خوبی را ارائه می دهد که برای کاربران جذاب است. به طور کلی، جامعه Mapillary در وضعیت خوبی قرار دارد.
ما طول توالی Mapillary را در کشورها تجزیه و تحلیل آماری کردیم. نتایج نشان داد که توسعه بین کشورها نامتوازن است. مقدار در بخش کوچکی از یک منطقه بسیار زیاد است، در حالی که طول توالی در بسیاری از مناطقی که منطقه بزرگی از نقشه جهان را اشغال می کنند کوتاه است. برای توصیف واضح تر و شهودی تر طول توالی واحد Mapillary در هر منطقه، از یک الگوریتم [ 23 ] برای نمایش داده ها استفاده کردیم ( شکل 6 ). شکل 6نشان می دهد که مناطق با طول توالی بالاتر در واحد سطح عمدتا در اروپا متمرکز شده اند. هلند در رتبه اول جهان قرار دارد و پس از آن آلمان، بلژیک، دانمارک و سایر کشورهای اروپایی قرار دارند. در آمریکای شمالی، طول دنباله در واحد سطح در ایالات متحده بیشتر است. در آسیا، بسیاری از کشورها ارزش های نسبتاً پایینی دارند، بنابراین کشورهایی مانند روسیه و چین که منطقه جغرافیایی زیادی را اشغال می کنند، به شدت تحریف شده اند. فقط ژاپن و تایلند ارزش نسبتا بالایی دارند. بسیاری از کاربران در چین و هند در Mapillary درگیر هستند، اما همانطور که در شکل 6 مشاهده می شود، طول دنباله در واحد مساحت این دو کشور کوچک است. بسیاری از کاربران ممکن است به سادگی یک جمع آوری داده Mapillary را انجام دهند یا در مقیاس کوچک مشارکت کنند. برای چین، داده های Mapillary عمدتا در تایوان و هنگ کنگ متمرکز شده اند. به طور کلی، پوشش جهانی Mapillary ناهموار است. بیشتر کشورهای اروپایی و ایالات متحده داده های فراوان تری دارند.
ما کشورهایی را با تعداد زیادی کاربر و دادههای توالی غنی انتخاب کردیم تا ترکیب کشوری کاربران را بررسی کنیم. شکل 7مشارکت متقابل کاربران از هشت کشور از جمله آلمان، ایالات متحده و فرانسه را نشان می دهد. کشورهای مختلف در شکل با کمان هایی با رنگ های مختلف نشان داده شده اند و نوارهای همرنگ با کمان ها نشان می دهد که کاربران کشورهای مربوطه به کشورهای دیگر کمک کرده اند. هرچه نوار پهن تر باشد، کاربران بیشتری نشان داده می شوند. مشارکت کاربران در کشورهای خارجی در Mapillary رایج است. کاربران در کشورهایی که از نظر جغرافیایی نزدیک هستند کمک بیشتری به یکدیگر می کنند. بسیاری از کاربران آلمانی به Mapillary در کشورهای دیگر کمک کرده اند. بسیاری از توالی های جمع آوری شده توسط این کاربران در بسیاری از کشورهای اروپایی مانند هلند و بریتانیا یافت می شود. اکثر کاربران آلمانی به فرانسه کمک کردند. بسیاری از کاربران در سایر کشورهای اروپایی نیز توالی Mapillary را در آلمان نقشه برداری کرده اند. کاربران در ایالات متحده همچنین پیوندهای نزدیکی با کشورهای اروپایی دارند و آنها به یکدیگر کمک می کنند. ترکیب کاربر در ژاپن و استرالیا متنوع است، اما تعداد کاربران متصل به شش کشور دیگر نسبتا کم است.
از تلفن های همراه گرفته تا دوربین های سطح بالا، پلتفرم Mapillary می تواند تصاویر را از دستگاه های مختلف پردازش کند. بنابراین ابزارهای مورد استفاده کاربران برای جمع آوری داده ها متنوع است. شکل 8توزیع دستگاههایی را که مشارکتکنندگان هنگام جمعآوری دادهها استفاده میکنند، نشان میدهد. در اینجا، ما فقط دستگاه هایی با بیش از 1000 دنباله نمایش می دهیم. در این میان سامسونگ، اپل، مایکروسافت، گارمین و سونی پیشتاز هستند. تنظیمات عکسبرداری شامل گوشی های هوشمند (سامسونگ، هواوی، اپل و غیره) و همچنین دستگاه های عکاسی حرفه ای (Trimble، Garmin و غیره) می شود. گوشی های هوشمند برندهای مختلف بیشترین استفاده را توسط کاربران دارند. دستگاه های موجود همه کاره هستند و محیط کسب محدود نیست، که بسیار کاربرپسند است. مردم می توانند از ابزارهای ساده برای جمع آوری تصاویر نمای خیابان استفاده کنند و در Mapillary مشارکت کنند، که جمع آوری داده ها را برای کاربران تسهیل می کند و تجربه مشارکت کاربران جدید را افزایش می دهد.
سنسورهای دوربین و دستگاههایی که در هر کشور برای جمعآوری توالی Mapillary استفاده میشوند، متنوع هستند. ما پنج تجهیزات برتر را که در برخی کشورها برای گرفتن توالی Mapillary استفاده میشوند، شمارش کردیم و دریافتیم که 16 نوع اصلی در 9 کشور مورد استفاده قرار گرفته است ( شکل 9 ). نمودار پایه در شکل 9 تعداد تصاویر نمای خیابان در واحد سطح (1 کیلومتر مربع ) را با استفاده از الگوریتم مشابه شکل 6 نشان می دهد. توزیع تعداد تصاویر در واحد سطح مشابه طول توالی در واحد مساحت است ( شکل 6و اروپا چگالی تصویر بالاتری دارد. ما برخی از کشورهای با تراکم بالا را برای شمارش انواع دستگاه های پرکاربرد (پنج برتر) و ارائه نتایج در نمودارهای دونات انتخاب کردیم. اپل متداول ترین برند مورد استفاده بود و در بین 9 کشور منتخب در بین پنج کشور برتر قرار گرفت. سامسونگ و سونی نیز محبوب بودند.
Mapillary به افراد اجازه می دهد تا هنگام پیاده روی، دوچرخه سواری یا رانندگی، داده های نمای خیابان را جمع آوری کنند. مدلهای مختلف مشارکت به افراد کمک میکنند تا بهتر در Mapillary شرکت کنند. ما میانگین سرعت هر دنباله را برای تعیین روش مشارکت زمانی که کاربر در حال جمعآوری دادهها بود، محاسبه کردیم. برای کاهش تاثیر تجهیزات و خطاهای موقعیتیابی، دنبالههایی را با کمتر از 20 تصویر حذف کردیم. برای سکانسهای باقیمانده، زمان ثبت اولین و آخرین تصاویر در سکانس را به دست آوردیم و از فاصله بین آنها به عنوان کل زمان جمعآوری استفاده کردیم. نسبت بین فاصله جغرافیایی مربوط به دنباله و کل زمان به عنوان سرعت متوسط در نظر گرفته شد. بر اساس اطلاعات به دست آمده، سرعت پیاده روی اکثر افراد 5 کیلومتر بر ساعت و سرعت دوچرخه سواری حدود 20 کیلومتر بر ساعت بوده است. در این مطالعه، توالی هایی با سرعت کمتر از 8 کیلومتر در ساعت در حین راه رفتن جمع آوری می شوند. توالی هایی با سرعت بیشتر از 25 کیلومتر در ساعت در نظر گرفته شد که با رانندگی جمع آوری می شوند. سایر سکانس ها در حین دوچرخه سواری توسط کاربران گرفته شده است.شکل 10 توزیع تعداد دنباله ها و تصاویر گرفته شده به روش های مختلف را نشان می دهد. توالی هایی با کمتر از 20 تصویر 40.9٪ را به خود اختصاص دادند، اما تعداد کل تصاویر مربوطه بسیار کم بود و تنها 0.5٪ از کل تصاویر را تشکیل می داد. این با رابطه بین طول دنباله و تعداد تصاویر مطابقت دارد. یعنی هر چه دنباله کوتاهتر باشد، تعداد تصاویر کمتر می شود. تعداد زیادی از دنباله های کوتاه نشان می دهد که بیشتر مشارکت کنندگان فقط تلاش های ساده ای انجام داده اند. در شکل 1072.8 درصد از تصاویر با رانندگی جمع آوری شده است. این بدان معنی است که اکثر کاربران ترجیح می دهند هنگام رانندگی از Mapillary استفاده کنند. به طور کلی، کاربران با رانندگی راحت تر و بیشتر سفر می کنند، به طوری که تعداد تصاویر در مسیرهای دور نیز زیاد بود. این بیشتر توضیح می دهد که چرا تصاویر موجود در دنباله های ارائه شده توسط رانندگی 72.8٪ از کل تصاویر را تشکیل می دهند.
4. نابرابری سهم
شکل 11 توزیع تعداد توالی ها و تصاویر ارائه شده توسط کاربران را از زیاد به پایین نشان می دهد. هیستوگرام های شکل 11 a,c به شدت دارای انحراف راست هستند و این حالت توزیع با شکل قانون توان مطابقت دارد. قانون قدرت اغلب دم سنگین یا توزیع دم بلند نامیده می شود که نشان دهنده عدم تعادل در توزیع کمیت است [ 24 ]. در این مقاله، نشان میدهد که بسیاری از کاربران Mapillary تعداد کمی از تصاویر و دنبالهها را ارائه میکنند، در حالی که تعداد کمی از کاربران مقدار زیادی داده را ارائه میکنند. شکل 11 b,d نمودارهای log-log مربوطه هستند. با افزایش تصاعدی تعداد دنباله ها و تصاویر، تعداد کاربرانی که این مشارکت ها را ارائه می کنند به میزان قابل توجهی کاهش می یابد. جوهاز و هوخمیر [8 ] همچنین دریافتند که کاربران Mapillary الگوهای توزیع مشابهی از نظر میانگین فاصله سهم هفتگی، روزهای فعال و شعاع چرخش دارند.
مشارکت کاربران در Mapillary نامتعادل است، بنابراین ما میخواستیم تعیین کنیم که چگونه نابرابری در جامعه Mapillary در طول زمان تغییر کرده است و آیا تفاوتهایی بین مناطق مختلف وجود دارد یا خیر. یانگ و همکاران [ 4 ] روشی برای کمی کردن نابرابری برای بررسی تغییرات زمانی در نابرابری مشارکت در فعالیتهای مشارکت OSM پیشنهاد کرد. در این مطالعه، ما همچنین از ضریب جینی ( G ) برای به تصویر کشیدن یک اندازه گیری کمی از نابرابری مشارکت استفاده کردیم. G یک عدد واحد است که درجه نابرابری را در یک توزیع اندازه می گیرد. مقدار آن از صفر تا یک متغیر است، جایی که مقدار بزرگتر نشان دهنده سطح بالاتری از نابرابری است. G معمولاً بر اساس منحنی لورنز به صورت ریاضی تعریف می شود. همانطور که در نشان داده شده استشکل 12 ، ما سهم کاربران را به ترتیب صعودی مرتب کردیم و سهم تجمعی مشارکت کنندگان را به عنوان X و سهم تجمعی مشارکت ها را به عنوان Y تنظیم کردیم تا منحنی لورنز سهم Mapillary را به دست آوریم. خط 45 درجه که خط برابری نامیده می شود، نشان دهنده برابری کامل مشارکت ها است (مقدار G صفر است). سپس می توان G را به عنوان نسبت مساحتی که بین خط برابری و منحنی لورنز ( A ) بر کل مساحت زیر خط برابری ( A و B ) قرار دارد در نظر گرفت. به این معنا که:
برای بررسی بیشتر تفاوتهای زمانی و مکانی در نابرابریهای مشارکت کاربران، برخی از کشورها را با دادههای فراوان و توزیع گسترده انتخاب کردیم تا تنوع در G را تحلیل کنیم . شکل 13 نشان می دهد که مقادیر G هفت کشور نسبتاً بالا است، در حالی که نابرابری سهم از سال 2014 تا 2018 در نوسان بوده است، اما ارزش افزایش یافته است. این نشان می دهد که نابرابری شدید سهم در همه کشورها وجود دارد و وضعیت همچنان در حال رشد است. در سال 2018، G از همه کشورها از 0.9 فراتر رفت که ژاپن از 0.95 بسیار بالاتر بود. این مقادیر به طور قابل توجهی بالاتر از نابرابری مشارکت ویکیپدیا (0.84) [ 25 ] هستند، اما بیشتر آنها کمتر از OSM (بیش از 0.95) هستند [4 ].
ما همچنین برای نشان دادن بیشتر تغییرات در نابرابری سهم به تفکیک کشورها، شاخص X% بالای همه مشارکتکنندگان را محاسبه کردیم، که Y% از همه مشارکتها را به خود اختصاص داد. شکل 14تغییرات کشورهای منتخب را هر سه ماه از سال 2014 تا 2019 نشان می دهد، از جمله درصد کاربران برتر که 95٪، 90٪، 80٪ و 50٪ از همه مشارکت ها را تکمیل کرده اند. نسبت کاربران برتر مورد نیاز برای تکمیل یک مشارکت در طول زمان به طور قابل توجهی کاهش یافته است زیرا بیشتر مشارکتهای داوطلبان جدید نسبتاً اندک است و تعداد کمی از کاربران قدیمی در گذشته حجم زیادی از دادهها را ارائه کردهاند و به طور مداوم تصاویر را جمعآوری میکنند. بنابراین نسبت مشارکت تجمعی افزایش می یابد. به عنوان مثال، در آلمان، ارائه 90٪ از مشارکت ها در مارس 2014 به حدود 40٪ از کاربران نیاز داشت، در حالی که تا سال 2018، تنها 13٪ مورد نیاز بود. قابل ذکر است، کاربران استرالیا، بریتانیا و سایر کشورها در اوایل سال 2014، به دلیل تعداد نسبتاً کم کاربران، 90٪ یا بیشتر به همه کاربران نیاز داشتند. با این حال،
5. رفتارهای مشارکت کنندگان عمده
تعداد زیادی از کاربران تنها مقدار نسبتاً کمی از داده ها را ارائه می دهند، و اکثر داده های ارائه شده نتیجه کار کاربران برتر است، بنابراین رفتار تعداد کمی از کاربران می تواند جامعه Mapillary را به طور عینی تری منعکس کند. در این مطالعه، ما کاربرانی را با مشارکت نسبتاً بزرگ بهعنوان مشارکتکنندگان اصلی در تجزیه و تحلیل انتخاب کردیم، که عمدتاً شامل کاربران برتری میشود که بیش از 90 درصد مشارکتها (طول تمام دنبالهها) را از سال 2014 تا 2019 ارائه کردهاند. ما آنها را «مهم» نامیدیم. مشارکت کنندگان». طبق آمار در مجموع 1294 کاربر انتخاب شدند. این کاربران از 111 کشور هستند. جدول 415 کشور برتر را با تعداد کل مشارکت کنندگان اصلی نشان می دهد. در این میان، آمریکا و آلمان به ترتیب با 222 و 143 بیشترین تعداد را دارند.
داده های ارائه شده توسط این مشارکت کنندگان عمده دارای توزیع جغرافیایی گسترده ای است. ما نسبت هر کشور را بر حسب تعداد دنبالهها و طول دنباله در کل مشارکتها تا سال 2019 محاسبه کردیم. جدول 5 نتایج مشارکت کاربران را در 15 کشور برتر نشان میدهد و بر اساس تعداد دنبالهها مرتب شده است. مشارکتکنندگان اصلی در ایالات متحده نزدیک به 30 درصد از طول کل سکانسها و تعداد کل سکانسها از 26 درصد فراتر رفت، که هر دو بسیار بیشتر از کشورهای دیگر بودند. مشابه جدول 4 ، تعداد توالی های ارائه شده توسط این کاربران در آلمان در رتبه دوم قرار دارد. ما بیشتر الگوهای مشارکت این مشارکت کنندگان اصلی را تجزیه و تحلیل کردیم.
5.1. الگوی زمانی مشارکت ها
هر دنباله دارای ویژگی “captured_at” ( جدول 1 ) است که نشان دهنده زمانی است که توالی نمای خیابان مربوطه گرفته شده است. این ویژگی به ما کمک می کند تا توزیع زمانی فعالیت های مشارکت کاربر را بررسی کنیم. با توجه به تفاوتهای زیاد منطقه زمانی و اندازه منطقه جهانی، برخی از کشورها را از جدول 5 با مناطق زمانی و مکانهای جغرافیایی مختلف برای تحلیل مقایسه انتخاب کردیم. شکل 15کمک های هر کشور را در ماه های مختلف نشان می دهد. سوئد، هلند و آلمان در عرض های جغرافیایی بالاتر نیمکره شمالی قرار دارند. روند مشارکت آلمان و هلند برای هر ماه مشابه است: به تدریج از ژانویه تا مه افزایش می یابد و از آگوست تا پایان سال کاهش می یابد. مشارکت در ژوئن و ژوئیه به طور قابل توجهی در مقایسه با ماه مه و اوت کمتر بود. سوئد که در عرض جغرافیایی بالاتری نسبت به دو کشور دیگر قرار دارد، سهم بیشتری در ماه های ژوئن، جولای و آگوست داشته است. این احتمالاً بیشتر مربوط به دما و طول روز در فصول مختلف است. در هوای گرم در آلمان در ماه های ژوئن و جولای، مردم فعالیت های خود را در فضای باز کاهش می دهند و سهم آنها در Mapillary کاهش می یابد. در مواقع دیگر، با تغییر دمای ماهانه، کمک های مردم بر این اساس تغییر می کند. به دلیل عرض های جغرافیایی زیاد در سوئد، دما خیلی زیاد نیست، اما در ماه های ژوئن، جولای و آگوست نسبتا گرم است و مشارکت کنندگان اصلی در آن ماه ها فعال تر هستند. ایالات متحده و ژاپن که عرض جغرافیایی پایین تری دارند، چنین روند آشکاری ندارند. مربوط به استرالیا در نیمکره جنوبی، ماه های کمک اصلی در نوامبر، دسامبر و ژانویه متمرکز بود، زیرا دما در طول سال بالاتر است.
Mapillary از فرمت UTC برای توصیف ویژگی زمان دنباله استفاده می کند. ما UTC را به زمان محلی مربوطه تبدیل کردیم تا سهم کاربر را در دورههای مختلف روز بررسی کنیم. در اینجا، از شش کشور فوق به عنوان مثال برای تحلیل استفاده کردیم. برای کشورهایی که طول جغرافیایی وسیعی دارند، مانند ایالات متحده و استرالیا، از منطقه زمانی مرکزی کشور به عنوان مبنا استفاده کردیم. شکل 16توزیع زمانی توالی های جذب مشارکت کننده اصلی را به تصویر می کشد. مشارکت کاربران به وضوح با زمان روز مرتبط است. کمک های زیادی در طول دوره ظهر ارائه می شود و کمک های کمی در صبح و عصر انجام می شود. در حالی که زمان اوج مشارکت در هر روز از کشوری به کشور دیگر متفاوت است، روند کلی مشابه است: همه آنها قبل از بالاترین سهم به تدریج افزایش مییابند و سپس کاهش مییابند. صعود و سقوط هر دو با نوساناتی همراه است که با درک کلی ما همخوانی دارد. عکسبرداری از داده های نمای خیابان نیازمند شرایط نوری خاصی است و می توان داده های بهتری را در طول روز به دست آورد. ژاپن و استرالیا همچنان کمک های نسبتاً بالایی در نیمه های شب ارائه کردند. ما برخی از محتوای تصاویر مربوطه را مشاهده کردیم و متوجه شدیم که زمان ویژگی بسیاری از تصاویر اشتباه است. ما متوجه شدیم که زمان تصویر پلتفرم Mapillary بیان می کند که اواخر شب است، اما محتوای تصویر مربوط به صحنه های روز است. این نشان میدهد که مشکلی با ویژگی زمان دستهای از دادهها در دادههای Mapillary رخ داده است، که ممکن است به دلیل آپلود کاربر، ناشی از خطا در هنگام انجام تبدیل UTC باشد.
5.2. تراکم مشارکت فضایی کاربران اصلی
مشارکت کنندگان Mapillary پدیده ای از مشارکت های مکرر در یک جاده را نشان می دهند. برای تجزیه و تحلیل سهم مکرر کاربران اصلی، ما چگالی فضایی را به عنوان یک شاخص تحلیل کمی تعریف کردیم. شکل 17مراحل پردازش برای محاسبه چگالی فضایی را نشان می دهد. ابتدا، حداقل مستطیل مرزی، بر اساس تمام موقعیت های دنباله ارائه شده توسط کاربر، به دست آمد. سپس، حداقل مستطیل مرز را به شبکههایی با ابعاد 500×500 متر تقسیم کردیم (شبکههایی با لبههای کمتر از 500 متر گسترش یافتند). متعاقباً، شبکههایی که توالیها را قطع نمیکردند، حذف شدند و شبکههای باقیمانده نشاندهنده منطقهای بودند که کاربر در آن مشارکتهای خود را به Mapillary ارائه کرد. این شبکههای باقیمانده در این مقاله «شبکههای مشارکت» نامیده میشوند. در نهایت، تعداد دنبالههایی را که با هر کدام در شبکههای مشارکت قطع میشوند، محاسبه کردیم. این کمیت چگالی فضایی شبکه مربوطه است. هرچه تراکم بیشتر باشد، کاربر بیشتر در منطقه فعال است و داده های نمای خیابان در منطقه نسبتاً غنی است.شکل 18 چگالی مکانی جزئی یکی از کاربران اصلی را به تصویر می کشد. کاربر از بنگلادش می آید و منطقه نشان داده شده در شکل در داکا قرار دارد. هر چه رنگ تیره تر باشد، توالی های بیشتری در شبکه ها وجود دارد.
هنگامی که کاربران مختلف به Mapillary کمک می کنند، حوزه های فعالیت به طور قابل توجهی متفاوت است. بنابراین، تعداد شبکه های مشارکت مربوط به کاربران مختلف نیز متفاوت است. در تجزیه و تحلیل، کاربران با توجه به تعداد شبکه ها به سه دسته تقسیم شدند. نسبت کاربران با منطقه مشارکتی که کمتر از 1000 شبکه را پوشش میدهند 30.3 درصد بود که ما آن را مشارکتکنندگان در مقیاس کوچک نامیدیم. مشارکت کنندگان در مقیاس متوسط، که تعداد شبکه تجمعی آنها بین 1000 و 2000 بود، حدود 44.7٪ از کل کاربران را اشغال کردند. و نسبت مشارکت کنندگان در مقیاس بزرگ با تعداد شبکه تجمعی بیش از 2000 25.0٪ بود.
الگوهایی با مقدار اندازه گیری بالاتر از آستانه داده شده، الگوهای جالب با توجه به آن معیار نامیده می شوند [ 26]. به طور مشابه، برای همه شبکه های مشارکت، یک شبکه با چگالی بیشتر از سه به عنوان شبکه فعال تعریف کردیم. یک شبکه فعال به این معنی است که کاربران حداقل چهار دنباله را در شبکه مشارکت می دهند، که نشان می دهد کاربران چندین بار در منطقه مربوطه عبور کرده اند. این مناطق معمولاً برای کاربر نسبتاً آشنا یا مهم هستند. به طور کلی، مشارکت کنندگان در مقیاس کوچک به احتمال زیاد به طور مکرر داده ها را در یک منطقه خاص ارائه می دهند. آمار همچنین نشان داد که نسبت شبکه های فعال سه گروه از کاربران به ترتیب 24.4، 12.3 و 8.9 درصد از کل مشارکت های هر گروه را به خود اختصاص داده است. این نشان میدهد که با گسترش دامنه مشارکتهای کاربران، نسبت مناطقی که کاربران به طور مکرر دادهها را در آن مشارکت میکنند کاهش مییابد. منطقه ای که فرد دائماً در آن فعال است محدود است.
شکل 19توزیع تعداد شبکه های فعال را برای هر گروه از کاربران نمایش می دهد. با گسترش دامنه مشارکت ها، نسبت کاربران با بیش از 200 شبکه فعال به طور قابل توجهی افزایش می یابد. این نسبت برای مشارکت کنندگان کوچک، متوسط و بزرگ به ترتیب 29.3٪، 37.7٪ و 53.7٪ است. هنگام گسترش دامنه مشارکت، کاربران به ناچار مشارکتهای مکرری را در مناطقی که قبلاً مشارکت دادهاند ارائه میکنند. این ممکن است به این دلیل رخ دهد که محیط زندگی کاربر و سیستم جاده اطراف آن نسبتاً ثابت است. بنابراین، کاربر باید به طور مکرر از برخی از مناطق ترافیکی و زندگی عبور کند و داده های نمای خیابان را در مناطق جدید ارسال کند. با این حال، منطقه مشارکت جدید هنوز بسیار بزرگتر از مساحت این مناطق مشارکت مکرر است. بنابراین، با افزایش سطح مشارکت کل،
6. نتیجه گیری و کار آینده
در این مطالعه، ما وضعیت کلی Mapillary را از جنبههای مختلف تحلیل کردیم. بر اساس دادههای جمعآوریشده، تا فوریه ۲۰۱۹، در مجموع ۲۱۹۴۸ کاربر در سراسر جهان به Mapillary کمک کردهاند. در میان آنها، 140 کاربر به طور مداوم از ابتدای سال 2014 تا فوریه 2019 داده ها را ارائه کردند. داده های نقشه برداری به طور گسترده ای بر اساس قاره متفاوت است. تصاویر نمای خیابان در اروپا و آمریکای شمالی فراوان است و کاربران زیادی در سراسر جهان دارند. ما کشور کاربر را طبق قوانین تعیین شده تعیین کردیم. حدود 62 درصد از کاربران از اروپا، آسیا و آمریکای شمالی بودند. این کاربران عمدتاً با ایالات متحده، آلمان، چین، هند و ایتالیا شناسایی شدند. ما 2019 کاربر را در ایالات متحده شناسایی کردیم که بیشترین تعداد کاربر در همه کشورها است. برای همه کاربران، تقریباً 10٪ حداقل به دو کشور کمک کرده اند. کاربران در کشورهایی با نزدیکی جغرافیایی، مشارکت های متقابل بیشتری را ارائه می کنند. ما تفاوت های زیادی در طول دنباله و تعداد تصاویر در مناطق مختلف پیدا کردیم. بسیاری از کشورهای اروپایی و ایالات متحده دارای سکانس های طولانی Mapillary و تعداد زیادی تصویر نمای خیابان بودند. در حالی که بسیاری از کاربران در آسیا قرار داشتند، طول کلی دنباله کوتاه بود. این در توزیع طول دنباله در واحد مساحت هر کشور نشان داده شد. تنها ژاپن و تایلند دارای طول مشخصی در آسیا بودند که نشان میدهد کاربران در اروپا و آمریکای شمالی نسبت به آسیا بازده بیشتری داشتند. دستگاه هایی که کاربران هنگام جمع آوری داده ها از آنها استفاده می کنند متنوع بودند. تنظیمات عکاسی پرکاربرد شامل گوشی های هوشمند (سامسونگ، هوآوی، اپل و غیره) و دستگاه های عکاسی حرفه ای (تیانبائو، گارمین و غیره) بود. کاربران می توانند هنگام راه رفتن با استفاده از دستگاه های دستی داده ها را جمع آوری کنند و همچنین می توانند هنگام دوچرخه سواری و رانندگی به Mapillary کمک کنند. بیش از 70 درصد از تصاویر نمای خیابان توسط کاربران هنگام رانندگی گرفته شده است. این تجزیه و تحلیل ها بینش بیشتری در مورد ترکیب داده های Mapillary از دیدگاه های مختلف به ما می دهد. در همین حال، تحقیقات ما منبع واقعی دادههای جمعسپاری و توزیع کمی Mapillary را نشان میدهد که میتواند به ما در درک توسعه Mapillary در مراحل مختلف کمک کند.
مشابه دیگر پلتفرمهای مشارکت داده VGI، نابرابریهایی را در مشارکتها در Mapillary پیدا کردیم. درصد کمی از کاربران بیشتر دادههای نمای خیابان را ارائه کردند، که نشان میدهد کیفیت داده Mapillary ارتباط نزدیکی با تعداد کمی از کاربران دارد. ما 1294 کاربر اصلی را برای تجزیه و تحلیل انتخاب کردیم که کاربران برتر بودند که بیش از 90٪ طول توالی تجمعی را از سال 2014 تا 2019 داشتند. ما عمدتاً کاربران اصلی را از دو جنبه تجزیه و تحلیل کردیم: زمان و مکان. نتایج آماری نشان داد که مشارکت کاربران با دما و طول روز در فصول مختلف ارتباط نزدیکی دارد. کاربران در طول ماه های گرمتر داده های بیشتری را ارائه کردند. سهم در ظهر بالاترین بود. در ماه های گرم، مردم رفت و آمدهای خود را کاهش دادند و کمک هایشان کاهش یافت. ما مشارکتهای مکرر کاربران اصلی در مناطق فضایی خاص را بررسی کردیم. مفهوم چگالی فضایی برای تحلیل کمی پیشنهاد شد. با توجه به دامنه فعالیت کاربران، کاربران را به مشارکت کنندگان کوچک، متوسط و بزرگ تقسیم کردیم. ما از مناطقی با تراکم فضایی بیشتر از سه برای نشان دادن جایی که کاربر اغلب فعال است استفاده کردیم و توزیع شبکههای فعال را برای گروههای مختلف کاربران بررسی کردیم. نتایج نشان داد که با گسترش دامنه مشارکتها، مقیاس تکرار افزایش مییابد. با این حال، نسبت منطقه تکرار شده بسیار کمتر از منطقه ای بود که کاربران به تازگی تصاویر نمای خیابان را ثبت کردند. این نشان می دهد که مشارکت اکثر کاربران همیشه در اطراف یک منطقه خاص بوده است که می تواند محل سکونت یا فضای اداری باشد.
تجزیه و تحلیل اکتشافی در این مقاله درک شهودی تری از فرآیند توسعه جامعه Mapillary ارائه می دهد و آنها مبنای ارزشمندی برای پاسخ به سؤالات در مورد کیفیت داده Mapillary [ 5 ] ارائه می دهند. داده های Mapillary همچنین شامل برخی ویژگی های دیگر مانند ویژگی “ویرایش ها” است که پردازش بیشتر داده ها را برای کاربر امکان پذیر می کند. کاربر را می توان متعاقباً با ترکیب ویژگی های بیشتر با کیفیت تصاویر کاربر تجزیه و تحلیل کرد. علاوه بر این، ما میتوانیم مشارکتکنندگان را از مکانهای مختلف با رفتارهای مشارکتی مشابه جمعآوری کنیم تا ویژگیهای رفتار گروهی مشارکتکنندگان را تحلیل کنیم [ 27 ].
تا به امروز، کاربران پرشور (کاربرانی که از زمان ثبت نام به همکاری ادامه می دهند) Mapillary به طور پیوسته سالانه بیش از 100 نفر افزایش می یابد. این امر توسعه سالم پروژه را تضمین می کند. در چند سال آینده، تصاویر در Mapillary به سرعت در حال افزایش خواهند بود و مشکل نابرابری در مشارکت ها باقی خواهد ماند. با این حال، نابرابری در پوشش تصویر به طور قابل توجهی کاهش می یابد، زیرا مردم به مناطق کمتر تحت پوشش کمک می کنند. در عین حال، ما بر این باوریم که Mapillary توجه بیشتری را از حوزه تحقیقاتی به ویژه با ژئوماتیک شهری و رانندگی خودمختار جلب خواهد کرد.
بدون دیدگاه