در این مقاله، روش جدیدی برای تشخیص مقررات ترافیکی در تقاطع ها با استفاده از ردیابی GPS پیشنهاد شده است. دانش قوانین راهنمایی و رانندگی برای مکان‌های تنظیم‌شده می‌تواند به برنامه‌های کاربردی مختلف مبتنی بر مکان در زمینه شهرهای هوشمند، مانند برآورد دقیق زمان سفر و مصرف سوخت از نقطه شروع تا مقصد، کمک کند. قوانین ترافیک به عنوان ویژگی های نقشه، با این حال، به طور شگفت انگیزی هنوز تا حد زیادی در نقشه ها غایب هستند، اگرچه بر جریان ترافیک تأثیر می گذارند که به نوبه خود، زمان بیکار بودن وسیله نقلیه در تقاطع ها، مصرف سوخت و CO را تحت تأثیر قرار می دهد. 2انتشار و زمان رسیدن علاوه بر این، نقشه برداری از آنها با استفاده از تجهیزات نقشه برداری پرهزینه است و هر فرآیند به روز رسانی دارای محدودیت زمانی شدید است. این حقیقت دقیقاً انگیزه این مطالعه است. بنابراین، هدف آن پیشنهاد یک روش خودکار، سریع، مقیاس پذیر و ارزان برای شناسایی نوع کنترل تقاطع (به عنوان مثال، چراغ راهنمایی، علائم توقف) است. یک روش جدید مبتنی بر خلاصه کردن رفتار جمعی از تقاطع های عبور وسایل نقلیه پیشنهاد شده است. اصلاح یک الگوریتم خوشه بندی شناخته شده برای شناسایی قسمت های توقف و کاهش سرعت استفاده می شود. سپس از این قسمت‌ها برای دسته‌بندی عبور وسایل نقلیه از تقاطع‌ها به چهار دسته ترافیک احتمالی (p1: جریان آزاد، p2: کاهش سرعت بدون توقف، p3: فقط یک رویداد توقف، p4: بیش از یک رویداد توقف) استفاده می‌شود.مدل پویا ). نتایج طبقه‌بندی مدل پویا با نتایج مدل استاتیک مقایسه می‌شود ، جایی که ویژگی‌های طبقه‌بندی از OpenStreetMap استخراج می‌شوند. در نهایت، یک مدل ترکیبی نیز مورد آزمایش قرار می‌گیرد که در آن ترکیبی از ویژگی‌های پویا و استاتیک استفاده شده است که از دو مدل دیگر برتری دارد. برای هر یک از این سه مدل، دو نوع بردار مشخصه آزمایش می‌شود: یکی که در آن فقط ویژگی‌های مرتبط با یک بازوی تقاطع منفرد استفاده می‌شود ( مدل یک بازویی ) و دیگری که در آن از ویژگی‌های بازوهای تقاطع همسایه همان تقاطع استفاده می‌شود. دسته بندی یک بازو ( مدل تمام بازو). روش بر روی سه مجموعه داده آزمایش شد و نتایج نشان می‌دهد که مدل‌های همه‌بازویی بهتر از مدل‌های تک بازویی با دقت 95 تا 97 درصد عمل می‌کنند.

کلید واژه ها:

قوانین ترافیکی ؛ مقررات ترافیکی ؛ جمع سپاری ; GPS-trace ; خط سیر ; طبقه بندی ; الگوهای حرکتی ؛ خوشه بندی ; رفتار جمعی ; شهر هوشمند

1. مقدمه

ایده ایجاد و به اشتراک گذاری اطلاعات جغرافیایی از طریق افراد جدید نیست. افرادی که به عنوان حسگر محیط خود عمل می کنند به عنوان شهروندان به عنوان حسگرها [ 1 ] توصیف شده اند که می توانند انواع مختلفی از داده ها را جمع آوری کنند یا اطلاعات محیطی را که در آن هستند به اشتراک بگذارند، مانند عکس ها، اخبار، نویز، اندازه گیری سرعت، داده های آلودگی هوا، از آنجایی که این داده ها با موقعیت جغرافیایی که از آن گرفته شده ترکیب می شوند، می توان اطلاعات جالبی در مورد یک پدیده خاص در این مکان ها برای یک زمان معین یا یک دوره زمانی معین تخمین زد، به عنوان مثال، سطح نویز یک مکان، محدودیت سرعت جاده و غیره
استفاده گسترده از دستگاه های تلفن همراه مدرن، امکانات جدیدی را برای جمع سپاری فضایی (SC) باز کرده است، اصطلاحی که «پتانسیل جمعیت را برای انجام کارهای دنیای واقعی با ماهیت فضایی قوی که توسط تکنیک های جمع سپاری مرسوم (CC) پشتیبانی نمی شود، توصیف می کند. ” [ 2 ]. تکنیک‌های CC فاقد عنصر فضایی هستند و بر تراکنش‌هایی که کاملاً از طریق اینترنت انجام می‌شوند تمرکز دارند. در مقابل، SC نیاز به حضور فیزیکی در محل دارد و چنین اطلاعاتی به صورت فرصت طلبانه یا با مشارکت فعال جمع آوری می شود، رویکردی که پتانسیل افزایشی دارد [ 3 ].
برخی از نمونه‌های اعمال نفوذ داده‌های جمع‌آوری‌شده از افراد شامل تشخیص خودکار تغییرات شبکه جاده‌ها و به‌روزرسانی‌های نقشه با استفاده از داده‌های مسیر GPS [ 4 ، 5 ]، تشخیص چاله‌ها با استفاده از داده‌های حسگر وسیله نقلیه جمع‌آوری شده [ 6 ]، تخمین ناهمواری جاده از منبع جمعیت است. اندازه گیری شتاب دوچرخه [ 7 ]، و استنتاج وضعیت ترافیک جاده ها با تجزیه و تحلیل سیگنال صوتی جمع آوری شده از سنسور میکروفون گوشی هوشمند کاربر [ 8 ]. پیش‌بینی پدیده‌هایی مانند زلزله (هشدار اولیه زلزله)، که تا همین اواخر به تجهیزات ویژه نیاز داشت، اکنون می‌تواند با استفاده از دستگاه‌های رایج مصرف‌کننده، مانند گوشی‌های هوشمند با سنسورهای کم‌هزینه اجرا شود [ 9 ]]. یکی دیگر از خدمات مبتنی بر جمع سپاری برای شهروندان شهرهای بزرگ، اطلاعات مربوط به وجود فضاهای خالی پارکینگ در نزدیکی مقصد است [ 10 ]. در نهایت، جمع‌سپاری رسانه‌های اجتماعی همچنین می‌تواند درک ما از پویایی انسانی و ویژگی‌های مکانی-زمانی شهرها را افزایش دهد و اطلاعاتی را درباره شهرها منتقل کند [ 11 ].
سایر برنامه های کاربردی مبتنی بر مکان که وعده می دهد زندگی روزمره ما را بسیار آسان تر می کند، تخمین دقیق زمان سفر از نقطه شروع به مقصد [ 12 ]، حذف هشدارهای نادرست در سیستم های پیشرفته کمک راننده ارائه شده توسط وسایل نقلیه مدرن است [ 13 ]. ] و سنجش محیط وسایل نقلیه خودران، که در آن خطرات مرتبط با ترافیک را می توان پیش بینی کرد و اقدامات رانندگی را می توان بر اساس آن برنامه ریزی کرد [ 14 ]. علاوه بر این، تنظیم کننده های ترافیکی، مانند علائم راهنمایی و رانندگی، به طور قابل توجهی بر جریان ترافیک در تقاطع ها تأثیر می گذارد که به نوبه خود بر مصرف سوخت و آلودگی هوا تأثیر می گذارد. تقاطع ها یکی از مکان های غالبی هستند که در آن سوخت بیش از حد مصرف می شود [ 15] و برخی مقررات راهنمایی و رانندگی، به عنوان مثال، علائم راهنمایی و رانندگی، در مقایسه با سایرین (به عنوان مثال، علائم توقف)، به دلیل انتشار بیش از حد وسایل نقلیه که در آن مکان های تنظیم شده مشاهده می شود، بیشتر به آلودگی هوا کمک می کنند [ 16 ]. بنابراین، برای راه حل های سازگار با محیط زیست و پایدار مرتبط با رفت و آمد روزانه و ترافیک، چنین اطلاعاتی حیاتی است. با این وجود، نوع مقررات ترافیکی محلی، که به‌عنوان ویژگی‌های نقشه نشان داده می‌شود، به‌طور شگفت‌انگیزی هنوز تا حد زیادی در نقشه‌های آژانس‌های ملی و نقشه‌های باز، مانند OpenStreetMap (OSM) وجود ندارد [ 17 ]. این مطالعه با انگیزه این واقعیت انجام شده است و سؤال اصلی تحقیق این است که چگونه به طور خودکار و مقرون به صرفه مقررات ترافیکی را با استفاده از داده های جمع سپاری شناسایی کنیم. طبق [ 18]، جاده ها سالانه تا 15 درصد تغییر می کنند و نقشه برداری از آنها با استفاده از تجهیزات نقشه برداری محدودیت های هزینه و زمانی جدی دارد. بنابراین، پاسخ به سوال فوق در چارچوب جمع سپاری بررسی خواهد شد. در پاراگراف بعدی روش‌های موجود برای تشخیص مقررات ترافیکی از داده‌های GPS را بررسی می‌کنیم.

1.1. کار موجود

مطالعات مربوط به تشخیص مقررات ترافیکی (TRR)، عمدتاً از مسیرهای GPS یا تصاویر استفاده می کنند [ 19 ]. تشخیص علائم راهنمایی و رانندگی از دوربین های داخل خودرو یک موضوع محبوب در جامعه بینایی کامپیوتر است که تشخیص دقیق علائم راهنمایی و رانندگی را فراهم می کند [ 20 ، 21 ]. با این حال، اگرچه خودروهای مدرن دارای دوربین هستند، اما سازندگان اطلاعات خود را به اشتراک نمی گذارند. با این حال، حتی اگر چنین داده‌هایی در دسترس بود، استفاده از آن در سناریوی جمع‌سپاری که قبلاً تعریف شده بود، ضرر تولید مقدار زیادی داده (تصاویر) و در نتیجه مصرف منابع، مانند پهنای باند و فضای ذخیره‌سازی را دارد. علاوه بر این، دوربین ها باید در وسایل نقلیه قرار داده شوند و محدودیت های بیشتری برای مشارکت گسترده کاربران اضافه شود. با توجه به [ 22]، موضوع کلیدی مرحله راه اندازی یک پروژه جمع سپاری متقاعد کردن مردم برای شروع کار داوطلبانه است و برای متقاعد کردن آنها، مهم است که به وضوح نشان دهیم که چقدر آسان است. در یک سناریوی فرضی از تصاویر جمع‌سپاری برای تشخیص مقررات ترافیکی با دوربین‌های تلفن همراه، افراد باید هر بار که رانندگی می‌کنند، تلفن‌های همراه خود را روی نگهدارنده تلفن همراه ماشین قرار دهند، از تمیز بودن لنزهای دوربین و شیشه ماشین اطمینان حاصل کنند. باتری گوشی شارژ می شود یا به شارژر تلفن وصل می شود (مصرف باتری در هنگام عکس گرفتن بسیار زیاد است) و مشکلات احتمالی دیگر را برطرف می کند، مانند اینکه آیا ذخیره اطلاعات کافی یا داده های اینترنتی موجود در دستگاه تلفن وجود دارد، آیا اینترنت وجود دارد یا خیر. اتصال و غیره23 ].
یکی دیگر از رویکردهای مبتنی بر تصویر می‌تواند از تصاویری از عکس‌های سطح خیابان ارائه شده توسط پلتفرم‌هایی مانند Google Street و Mapillary استفاده کند. همانطور که هو و همکاران. [ 24] اشاره کرد، هنوز شهرها و مکان‌های زیادی هستند که تحت پوشش این خدمات نیستند و بنابراین، هیچ تصویری برای خزیدن برای تشخیص مقررات ترافیکی در دسترس نیست. به عنوان مثال، در Google Street View، اگرچه کشورهایی مانند ایالات متحده و اکثر کشورهای اروپایی به خوبی پوشش داده شده اند، سایر کشورها یا به دلایل قانونی یا حریم خصوصی تا حدی تحت پوشش قرار می گیرند (مثلاً در آلمان فقط برخی از شهرهای بزرگ موافقت کرده اند که به Google اجازه دهند. عکس های خیابانی) یا اصلاً (مثلاً کشورهای شرقی). در مقابل، ردیابی‌های GPS (یعنی توالی‌های مرتب‌شده مکان‌های ثبت‌شده) نمایش فشرده مکان‌های متوالی هستند که یک جسم متحرک در طول زمان از آن‌ها عبور می‌کند و می‌توان آن را بدون تجهیزات خاص و بدون نیاز به نصب دستگاه در جلو پنجره ضبط کرد. از ماشین به عنوان مثال، با توجه به [25 ]، یک آیفون 6 میانگین کلی دقت موقعیت مکانی در یک محیط شهری 7 تا 13 متر (بسته به فصل، زمان روز و دوره استفاده از Wi-Fi) دارد و بنابراین می‌تواند برای این منظور استفاده شود. بنابراین، برای اهداف این مطالعه که در انتهای این بخش ذکر شده است، استفاده از ردیابی GPS را برای رسیدن به هدف خود انتخاب کردیم.
با تمرکز بر روش‌های موجود TRR که از داده‌های غیر بصری استفاده می‌کنند، ما یک طبقه‌بندی جدید از مطالعات مرتبط با توجه به ویژگی‌های مورد استفاده برای طبقه‌بندی مقررات ترافیکی پیشنهاد می‌کنیم. این طبقه بندی سه دسته را متمایز می کند، یعنی رویکردهای ایستا ، پویا و ترکیبی . ما ویژگی های ایستا را آنهایی می نامیم که در طول زمان تغییر نمی کنند، یا اگر تغییر کنند، اغلب این کار را انجام نمی دهند. چنین اطلاعاتی را می توان از نقشه ها استخراج کرد. در مقابل، پویا می نامیمویژگی هایی که از موجودیت های پویا استخراج می شوند که در طول زمان تغییر می کنند، مانند مسیرهای حرکت از اجسام متحرک (مانند وسایل نقلیه). از مسیر حرکت وسیله نقلیه می توان سرعت وسیله نقلیه، مدت توقف آن و غیره را استخراج کرد. رویکردهای مبتنی بر ترکیبی شامل روش هایی هستند که از ترکیبی از ویژگی های ایستا و پویا استفاده می کنند. طبقه بندی به صورت گرافیکی در شکل 1 نشان داده شده است.
در اینجا، ما فقط برخی از مطالعات متمایز در این زمینه را مرور می کنیم. شرح مفصلی از روش های مقالات بررسی شده (مقالاتی که قبل از سال 2019 منتشر شده اند)، محدودیت های آنها و یک مرور کلی انتقادی جامع از زمینه تحقیق را می توان در یک مرور ادبیات سیستماتیک مرتبط [ 19 ]، اولین و تنها تلاش، یافت. برای نشان دادن پیشرفت و چالش های حوزه پژوهشی. یک عنصر متداول روش شناختی همه این مطالعات، استخراج ویژگی های طبقه بندی از داده های موجود و سپس استفاده از آنها برای طبقه بندی بازوهای تقاطع است. اصطلاح بازوی تقاطع به جاده ای اشاره دارد که یک تقاطع را به تقاطع دیگر متصل می کند، همانطور که در شکل 2 نشان داده شده است.. یک تقاطع سه بازویی (سه طرفه) دارای سه بازو و یک تقاطع چهار طرفه دارای چهار بازو است، همانطور که در شکل 2 a,b نشان داده شده است.
در رده استاتیک تنها یک مطالعه وجود دارد که از ویژگی های طبقه بندی ایستا استفاده می کند، که از نقشه های خیابان باز، مانند OSM استخراج شده است. صارمی و عبدالظاهر [ 26] ویژگی های OSM مربوط به سرعت و همچنین مسافت را استخراج کنید. به طور خاص، آنها رتبه بندی سرعت بخش های جاده، فاصله نزدیک ترین تقاطع های متصل، فاصله انتها به انتهای جاده ای که یک تقاطع به آن تعلق دارد، نیمه فواصل یک تقاطع از هر دو انتهای جاده تا که به آن تعلق دارد و دسته ای از بخش جاده ای که اهمیت آن را در شبکه راه ها مشخص می کند (به عنوان مثال، اولیه، فرعی، بزرگراه و غیره). یک مشاهدات مهم در این روش این است که ویژگی های طبقه بندی برای یک بازوی تقاطع حاوی اطلاعاتی از بازوهای همسایه همان اتصال است که از این به بعد آن را زمینه می نامیم.بازوها یک طبقه‌بندی جنگل تصادفی با 500 درخت برای دسته‌بندی سه نوع تنظیم‌کننده آموزش دیده است: چراغ‌های راهنمایی، علائم توقف و تقاطع‌های کنترل نشده. دقت طبقه بندی، با سطح اطمینان 80 درصد در پیش بینی، 95 درصد گزارش شده است (بدترین حالت در شهرهای مختلف آزمایش شده). هیچ آزمایشی در مورد تأثیر تعداد مسیرهایی که ویژگی‌های طبقه‌بندی از آنها استخراج می‌شوند بر عملکرد طبقه‌بندی انجام نشد.
مقوله TRR پویا شامل رویکردهایی است که از ویژگی‌های مختلفی عمدتاً مربوط به توقف و/یا کاهش سرعت، و همچنین به دنباله‌های سرعت (پروفایل سرعت) وسایل نقلیه در حین نزدیک شدن به تقاطع استفاده می‌کنند. این ویژگی ها معمولاً از مجموعه بزرگی از مسیرها استخراج می شوند. اپیزودهای توقف/کاهش سرعت در هر مسیری که از یک بازوی تقاطع عبور می‌کند شناسایی می‌شود و سپس معیارهای آماری از این ویژگی‌ها برای همه مسیرهایی که از یک بازوی تقاطع عبور می‌کنند، محاسبه می‌شوند، مانند میانگین تعداد قسمت‌های توقف، حداقل تعداد قسمت‌های کاهش سرعت مشاهده‌شده در مسیرهایی که از یک بازو عبور می‌کنند. تقاطع، و غیره. اثر متمایز این دسته از Hu و همکاران است. [ 24 ] که دو دسته از ویژگی های طبقه بندی را تعریف می کند،فیزیکی و آماری. ویژگی‌های فیزیکی شامل مدت زمان آخرین توقف قبل از عبور از تقاطع، حداقل سرعت عبور، تعداد قسمت‌های کاهش سرعت خودرو، تعداد قسمت‌های توقف، و فاصله آخرین قسمت توقف از تقاطع است. ویژگی های آماری به عنوان حداقل، حداکثر، میانگین و واریانس ویژگی های فیزیکی تعریف می شوند. فقط از مسیرهای مستقیم برای استخراج ویژگی ها برای حذف سوگیری احتمالی که ممکن است مسیرهای چرخشی داشته باشند استفاده می شود. با حذف مسیرهای چرخشی، بازوهای خاصی در تقاطع های T شکل که مسیرها همیشه باید بچرخند، همیشه به طور کامل از طبقه بندی حذف می شوند. به همین دلیل، قانون دانش دامنه زیر اعمال می‌شود و آن بازوها را از تقاطع‌های T برچسب‌گذاری می‌کند: (به A، B، و C برای انتهای چپ، راست و پایین تقاطع نشان دهید): اگر A/B کنترل نشده باشد (قانون حق تقدم اعمال می شود)، سپس C کنترل شده است، در غیر این صورت C همان نوع A و B است. به عبارت دیگر، اگر A/B دارای چراغ راهنمایی باشد، C نیز وجود دارد. در غیر این صورت C دارای علامت توقف است. طبقه‌بندی‌کننده جنگل تصادفی، و همچنین خوشه‌بندی طیفی، برای یک مشکل طبقه‌بندی سه دسته‌ای (چراغ‌های راهنمایی، علائم توقف، و تقاطع‌های کنترل‌نشده)، با دستیابی به دقت بالای 90 درصد برای تنظیمات ویژگی‌های مختلف و آزمایش‌های طبقه‌بندی آزمایش شدند.
صارمی و عبدالظاهر [ 26 ] یک روش طبقه بندی را پیشنهاد می کنند (آنها آن را روش مبتنی بر جمعیت می نامند.) که از میانگین، حداقل، حداکثر و انحراف استاندارد مقادیر سه ویژگی استخراج شده از مسیرهای عبور از یک تقاطع استفاده می کند: سرعت عبور، تعداد قسمت های توقف، و مدت زمان دوم. سرعت عبور به عنوان کمترین سرعت لحظه ای وسیله نقلیه در هنگام عبور از یک تقاطع در نزدیکی آن در امتداد بازوی تقاطع معین در نظر گرفته می شود. تعداد اپیزودهای توقف، تعداد فواصل زمانی در نظر گرفته می‌شود که طی آن وسیله نقلیه در هنگام عبور از آخرین بخش جاده در امتداد بازوی تقاطع معین توقف کرده و در حال حرکت است. مدت توقف به عنوان طول آخرین بازه زمانی در نظر گرفته می شود که طی آن وسیله نقلیه متوقف و بیکار شده است. مشخص نیست که آیا تعداد تقاطع های مورد استفاده برای آزمایش مدل مبتنی بر نقشه (به دسته استاتیک مراجعه کنید) برای این مدل یکسان است یا خیر. زیرا گزارش طبقه بندی دقیقی در مقاله ارائه نشده است. علاوه بر این، هیچ توصیف کمی از مجموعه داده های مورد استفاده (به عنوان مثال، تعداد تنظیم کننده ها در هر دسته تنظیم کننده) ارائه نشده است. با این حال، مشابه مدل پیشنهادی مبتنی بر نقشه، یک طبقه‌بندی جنگل تصادفی برای دسته‌بندی سه نوع تنظیم‌کننده آموزش داده شده است: چراغ‌های راهنمایی، علائم توقف، و تقاطع‌های کنترل‌نشده. دقت طبقه بندی، با سطح اطمینان 80 درصد در پیش بینی، 91 درصد گزارش شده است. از آنجا که گزارش طبقه بندی دقیقی که نتایج را به ازای هر کلاس تنظیم کننده توصیف می کند، ارائه نشده است، و همچنین توصیف کمی از مجموعه داده ها ارائه نشده است (به عنوان مثال، تعداد تنظیم کننده ها در هر کلاس تنظیم کننده)، ما نمی توانیم نتایج خود را با این مطالعه مقایسه کنیم، اگرچه ما این کار را تأیید می کنیم. از نظر روش شناختی به کار ما نزدیک است. هیچ توصیف کمی از مجموعه داده های مورد استفاده (به عنوان مثال، تعداد تنظیم کننده ها در هر دسته تنظیم کننده) ارائه نشده است. با این حال، مشابه مدل پیشنهادی مبتنی بر نقشه، یک طبقه‌بندی جنگل تصادفی برای دسته‌بندی سه نوع تنظیم‌کننده آموزش داده شده است: چراغ‌های راهنمایی، علائم توقف، و تقاطع‌های کنترل‌نشده. دقت طبقه بندی، با سطح اطمینان 80 درصد در پیش بینی، 91 درصد گزارش شده است. از آنجا که گزارش طبقه بندی دقیقی که نتایج را به ازای هر کلاس تنظیم کننده توصیف می کند، ارائه نشده است، و همچنین توصیف کمی از مجموعه داده ها ارائه نشده است (به عنوان مثال، تعداد تنظیم کننده ها در هر کلاس تنظیم کننده)، ما نمی توانیم نتایج خود را با این مطالعه مقایسه کنیم، اگرچه این کار را تایید می کنیم. از نظر روش شناختی به کار ما نزدیک است. هیچ توصیف کمی از مجموعه داده های مورد استفاده (به عنوان مثال، تعداد تنظیم کننده ها در هر دسته تنظیم کننده) ارائه نشده است. با این حال، مشابه مدل پیشنهادی مبتنی بر نقشه، یک طبقه‌بندی جنگل تصادفی برای دسته‌بندی سه نوع تنظیم‌کننده آموزش داده شده است: چراغ‌های راهنمایی، علائم توقف، و تقاطع‌های کنترل‌نشده. دقت طبقه بندی، با سطح اطمینان 80 درصد در پیش بینی، 91 درصد گزارش شده است. از آنجا که گزارش طبقه بندی دقیقی که نتایج را به ازای هر کلاس تنظیم کننده توصیف می کند، ارائه نشده است، و همچنین توصیف کمی از مجموعه داده ها ارائه نشده است (به عنوان مثال، تعداد تنظیم کننده ها در هر کلاس تنظیم کننده)، ما نمی توانیم نتایج خود را با این مطالعه مقایسه کنیم، اگرچه ما این کار را تأیید می کنیم. از نظر روش شناختی به کار ما نزدیک است. مشابه مدل پیشنهادی مبتنی بر نقشه، طبقه‌بندی‌کننده جنگل تصادفی برای دسته‌بندی سه نوع تنظیم‌کننده آموزش دیده است: چراغ‌های راهنمایی، علائم توقف، و تقاطع‌های کنترل‌نشده. دقت طبقه بندی، با سطح اطمینان 80 درصد در پیش بینی، 91 درصد گزارش شده است. از آنجا که گزارش طبقه بندی دقیقی که نتایج را به ازای هر کلاس تنظیم کننده توصیف می کند، ارائه نشده است، و همچنین توصیف کمی از مجموعه داده ها ارائه نشده است (به عنوان مثال، تعداد تنظیم کننده ها در هر کلاس تنظیم کننده)، ما نمی توانیم نتایج خود را با این مطالعه مقایسه کنیم، اگرچه ما این کار را تأیید می کنیم. از نظر روش شناختی به کار ما نزدیک است. مشابه مدل پیشنهادی مبتنی بر نقشه، طبقه‌بندی‌کننده جنگل تصادفی برای دسته‌بندی سه نوع تنظیم‌کننده آموزش دیده است: چراغ‌های راهنمایی، علائم توقف، و تقاطع‌های کنترل‌نشده. دقت طبقه بندی، با سطح اطمینان 80 درصد در پیش بینی، 91 درصد گزارش شده است. از آنجا که گزارش طبقه بندی دقیقی که نتایج را به ازای هر کلاس تنظیم کننده توصیف می کند، ارائه نشده است، و همچنین توصیف کمی از مجموعه داده ها ارائه نشده است (به عنوان مثال، تعداد تنظیم کننده ها در هر کلاس تنظیم کننده)، ما نمی توانیم نتایج خود را با این مطالعه مقایسه کنیم، اگرچه ما این کار را تأیید می کنیم. از نظر روش شناختی به کار ما نزدیک است. با سطح اطمینان 80 درصد در پیش بینی، 91 درصد گزارش شده است. از آنجا که گزارش طبقه بندی دقیقی که نتایج را به ازای هر کلاس تنظیم کننده توصیف می کند، ارائه نشده است، و همچنین توصیف کمی از مجموعه داده ها ارائه نشده است (به عنوان مثال، تعداد تنظیم کننده ها در هر کلاس تنظیم کننده)، ما نمی توانیم نتایج خود را با این مطالعه مقایسه کنیم، اگرچه این کار را تایید می کنیم. از نظر روش شناختی به کار ما نزدیک است. با سطح اطمینان 80 درصد در پیش بینی، 91 درصد گزارش شده است. از آنجا که گزارش طبقه بندی دقیقی که نتایج را به ازای هر کلاس تنظیم کننده توصیف می کند، ارائه نشده است، و همچنین توصیف کمی از مجموعه داده ها ارائه نشده است (به عنوان مثال، تعداد تنظیم کننده ها در هر کلاس تنظیم کننده)، ما نمی توانیم نتایج خود را با این مطالعه مقایسه کنیم، اگرچه این کار را تایید می کنیم. از نظر روش شناختی به کار ما نزدیک است.
گلزه و همکاران [ 27] یک طبقه‌بندی جنگل تصادفی با نمونه‌برداری بیش‌ازحد و یک تقویت‌کننده Bagging برای پیش‌بینی تنظیم‌کننده‌های تقاطع با دقت 90.4 درصد پیشنهاد کرد. همراه با سایر ویژگی های فیزیکی، مانند تعداد رویدادهای سکون، مدت زمان رویدادهای سکون، میانگین فاصله از محل اتصال همه رویدادهای سکون، مدت زمان آخرین رویداد سکون، فاصله از محل اتصال آخرین رویداد سکون، میانگین سرعت و حداکثر سرعت در حین نزدیک شدن به محل اتصال، درصد مسیرهای با حداقل یک رویداد سکون را نیز محاسبه می کنند. آنها با انجام تحلیل اهمیت ویژگی نشان می‌دهند که آخرین ویژگی در مقایسه با سایر ویژگی‌های طبقه‌بندی از اهمیت بالایی برخوردار است. علاوه بر این، آنها مورد استفاده از مسیرهای مستقیم و همچنین مسیرهای مستقیم و چرخشی را آزمایش کردند.
دو رویکرد پویا متمایز که از ویژگی‌های مبتنی بر سرعت به جای ویژگی‌های مبتنی بر اپیزود استفاده می‌کنند، مانند قسمت‌های توقف و کاهش سرعت، موارد [ 28 ، 29 ] هستند. منروکس و همکاران [ 28] تشخیص علائم ترافیکی (مشکل طبقه بندی باینری) با استفاده از پروفایل های سرعت. با آزمایش سه روش مختلف برای استخراج ویژگی – تجزیه و تحلیل عملکردی ضبط‌های سرعت، اندازه‌گیری سرعت خام، و تکنیک‌های تشخیص تصویر – آنها دریافتند که توصیف عملکردی پروفایل‌های سرعت با استفاده از تبدیل موجک از روش‌های دیگر بهتر عمل می‌کند. طبقه بندی جنگل تصادفی بهترین دقت (95٪) را در مقایسه با سایر تکنیک های طبقه بندی آزمایش شده به دست آورد. با این حال، نویسندگان اشاره می‌کنند که کمبود داده محدودیت شدید آزمایش‌ها است، زیرا مجموعه داده‌های آن‌ها فقط شامل 44 نمونه از چراغ‌های راهنمایی بود. علاوه بر این، چنگ و همکاران. [ 29] یک چارچوب ترتیب به ترتیب برای مقابله با یک مشکل طبقه بندی سه کلاسه (چراغ های راهنمایی، علائم اولویت و اتصالات کنترل نشده) با تغذیه پروفایل های سرعت به یک طبقه بندی کننده یادگیری عمیق پیشنهاد می کند، که نشان می دهد یک رمزگذار خودکار متغیر شرطی (CVAE) می‌تواند تنظیم‌کننده‌ها را با دقت 90 درصد پیش‌بینی کند، بهتر از مدل پایه (یک طبقه‌بندی جنگل تصادفی با دقت 88 درصد) که از آمار خلاصه‌شده حرکت به عنوان ویژگی‌ها استفاده می‌کند.
در رده مبتنی بر ترکیبی ، دو مطالعه وجود دارد که از ترکیبی از ویژگی‌های استاتیک و پویا استفاده می‌کنند. صارمی و عبدالظاهر [ 26] اولین مدلی است که چنین مدلی را آغاز کرد، که در آن، علاوه بر اطلاعات مبتنی بر نقشه استخراج شده از OSM، از در دسترس بودن اطلاعات پویا جمع آوری منبع (ردیابی GPS) برای گنجاندن ویژگی هایی در مدل طبقه بندی که از خط سیر، مانند سرعت تراورس، تعداد توقف ها و مدت توقف آخرین بازه زمانی که وسیله نقلیه متوقف شده و در حال حرکت است. علاوه بر این، پس از طبقه بندی، روش شامل مرحله ای است که در آن یک بررسی سازگاری بین برچسب های پیش بینی شده در سطح تقاطع تکمیل می شود. قانون دانش دامنه زیر استفاده می شود: یا همه یا هیچ یک از رویکردهای کمک کننده به همان تقاطع دارای چراغ راهنمایی هستند. این بدان معناست که وقتی طبقه‌بندی‌کننده برخی از نزدیک‌های یک تقاطع را برچسب‌گذاری می‌کند، اما نه همه آنها را چراغ راهنمایی، برچسب پیش بینی شده باید تجدید نظر شود. این تجدید نظر باعث می‌شود همه یا هیچ‌کدام از رویکردهای تقاطع دارای چراغ راهنمایی باشند، این با استفاده از احتمالات محاسبه‌شده بر اساس کسری از درخت‌های تصمیم‌گیری که برای برچسب‌های جایگزین رویکردها رای می‌دهند، تصمیم‌گیری می‌شود. یک طبقه‌بندی جنگل تصادفی با 500 درخت برای دسته‌بندی سه نوع تنظیم‌کننده آموزش دیده است: چراغ‌های راهنمایی، علائم توقف و تقاطع‌های کنترل‌نشده. دقت طبقه‌بندی، با سطح اطمینان 80 درصد در پیش‌بینی، 97 درصد گزارش شده است، که از هر دو مدل مبتنی بر نقشه و مبتنی بر جمعیت (پویا) بهتر عمل می‌کند (به دسته‌های ایستا و پویا مراجعه کنید). این تصمیم بر اساس استفاده از احتمالات محاسبه شده بر اساس کسری از درختان تصمیم گیری برای برچسب های جایگزین رویکردها است. طبقه‌بندی‌کننده جنگل تصادفی با 500 درخت برای دسته‌بندی سه نوع تنظیم‌کننده آموزش دیده است: چراغ‌های راهنمایی، علائم توقف و تقاطع‌های کنترل‌نشده. دقت طبقه‌بندی، با سطح اطمینان 80 درصد در پیش‌بینی، 97 درصد گزارش شده است که از هر دو مدل مبتنی بر نقشه و مبتنی بر جمعیت (دینامیک) بهتر عمل می‌کند (به دسته‌های ایستا و پویا مراجعه کنید). این تصمیم بر اساس استفاده از احتمالات محاسبه شده بر اساس کسری از درختان تصمیم گیری برای برچسب های جایگزین رویکردها است. طبقه‌بندی‌کننده جنگل تصادفی با 500 درخت برای دسته‌بندی سه نوع تنظیم‌کننده آموزش دیده است: چراغ‌های راهنمایی، علائم توقف و تقاطع‌های کنترل‌نشده. دقت طبقه‌بندی، با سطح اطمینان 80 درصد در پیش‌بینی، 97 درصد گزارش شده است که از هر دو مدل مبتنی بر نقشه و مبتنی بر جمعیت (دینامیک) بهتر عمل می‌کند (به دسته‌های ایستا و پویا مراجعه کنید).
علاوه بر این، لیائو و همکاران. [ 30 ] یک تشخیص چراغ راهنمایی (مسئله طبقه بندی باینری) و چارچوب ارزیابی تأثیر را توصیف کرد که می تواند وجود علائم راهنمایی و رانندگی را تشخیص دهد و محدوده تأثیر چراغ های راهنمایی (در مکان و زمان) را با استفاده از سری های زمانی سرعت استخراج شده از مسیرهای GPS و تقاطع تخمین بزند. – ویژگی های مرتبط، مانند نوع تقاطع (اتصال جاده های شریانی، اتصال جاده های فرعی، اتصال جاده های شریانی و فرعی)، نوع جاده (با توجه به دو محدودیت سرعت) و اطلاعات جریان ترافیک. یک شبکه عصبی حافظه کوتاه‌مدت توزیع‌شده (DLSTM) در چارچوب پیشنهادی استفاده می‌شود که ویژگی‌های گسسته و متوالی را به طور جداگانه بررسی می‌کند و به یک مقدار AUC در زیر منحنی ROC 0.95 دست می‌یابد.
اولین مشاهده در مورد روش شناسی های موجود این است که تنها در آثار صارمی و عبدالظاهر [ 26 ]] و برای مدل مبتنی بر نقشه (استاتیک)، ویژگی های طبقه بندی برای یک بازوی تقاطع حاوی اطلاعاتی از بازوهای زمینه است. تا آنجا که ما می دانیم، هیچ روش دیگری که تا به امروز پیشنهاد شده است، به عنوان مثال، مدل های پویا، استفاده از ویژگی هایی را که شامل اطلاعات بازوهای همسایه است، در نظر نگرفته است. ما این را جنبه جالبی از مشکل برای بررسی می‌دانیم، زیرا اطلاعات از سلاح‌های همسایه ممکن است آموزنده باشد. علاوه بر این، همه روش ها از ویژگی های طبقه بندی بسیار مشابه (قسمت های توقف و کاهش سرعت، مقادیر سرعت، ویژگی های استخراج شده نقشه) استفاده می کنند. استفاده از تحلیل اهمیت ویژگی و بررسی اینکه کدام ویژگی واقعا برای کار طبقه‌بندی مهم است و اینکه آیا انتخاب ویژگی اهمیت طبقه‌بندی را بهبود می‌بخشد، جالب خواهد بود. علاوه بر این،27 ]، در حالی که کار [ 24 ] گزارش می دهد که مسیرهای چرخشی را از محاسبه ویژگی حذف می کند. تمام مقالات دیگر هیچ اشاره ای به این جنبه از مشکل ندارند. علاوه بر این، با انگیزه تنها قانون اساسی که [ 26 ] برای تصحیح طبقه‌بندی اشتباه احتمالی در تقاطع‌های کنترل‌شده با چراغ راهنمایی و قانون برچسب‌گذاری که [ 24 ] برای برچسب‌گذاری بازوهای تقاطع‌های T شکل استفاده می‌کند، معتقدیم که بررسی برچسب‌های پیش‌بینی‌شده در یک مرحله پس از طبقه‌بندی می‌تواند مکانیزمی را برای تصحیح برچسب‌های پیش‌بینی‌شده بر اساس قوانین دانش بنیادی ایجاد کند که ثبات برچسب را در سطح تقاطع حفظ می‌کند. به این ترتیب، طبقه بندی اشتباه احتمالی بازوهای تقاطع می تواند اصلاح شود.
علاوه بر این، اگر عملکرد طبقه‌بندی در همه مطالعات با معیارهای یکسان ارزیابی شود و اگر گزارش‌های طبقه‌بندی دقیق، از جمله تعداد نمونه‌های آموزشی و آزمایشی در هر کلاس نظارتی ارائه شود، می‌توان نتیجه‌گیری بیشتری گرفت. اگر همه روش‌های TRR روی مجموعه داده‌های یکسانی آزمایش شوند، حتی بهتر است، زیرا مجموعه داده‌های مسیر می‌توانند به طور قابل‌توجهی از نظر نرخ نمونه‌گیری، تراکم مسیر، تعداد تقاطع‌ها و کلاس‌های نظارتی ترافیک متفاوت باشند. مجموعه داده های مرجع (معیارها) مقایسه مستقیم بین روش های مختلف TRR را تسهیل می کند. علاوه بر این، به نظر می رسد که روش های ترکیبی، مانند [ 26]، که ویژگی‌های استاتیک و پویا را ترکیب می‌کنند بهتر از آنهایی که فقط از ویژگی‌های ایستا یا پویا استفاده می‌کنند، عمل می‌کنند، و با توجه به اینکه این ایده تنها در دو مقاله [ 26 ، 30 ] مورد بررسی قرار گرفته است، ممکن است یک جهت روش‌شناختی جالب برای بررسی بیشتر باشد.

1.2. شکاف پژوهشی و مشارکت های مقاله

ایده استفاده از داده های GPS برای شناسایی مقررات ترافیکی تقاطع ها بر اساس دو فرض است: (1) کنترل های ترافیکی بر رفتار راننده به شیوه ای نشان دهنده و یکنواخت برای همه رانندگانی که از یک تقاطع عبور می کنند (یا برای همه گذرگاه های یک راننده که از یک تقاطع عبور می کنند تأثیر می گذارد. تقاطع چندین بار)، و (2) الگوهای حرکتی مشابه در تقاطع های مختلف مشاهده می شود که توسط یک کنترل ترافیک تنظیم می شود. به عبارت دیگر، مفروضات این است که یک الگوی حرکتی خاص را می توان در یک مکان تنظیم شده از مسیرهای عبور از آن مکان مشخص شناسایی کرد و الگوهای حرکتی مشابه را می توان در مکان های مختلف (تقاطع ها) مشاهده کرد که توسط یک کنترل ترافیک یکسان تنظیم می شوند. البته ممکن است رانندگانی وجود داشته باشند که در شرایط خاصی علائم راهنمایی و رانندگی یا ایست را نقض کنند. و در نتیجه، رفتار حرکتی آن‌ها با الگوی اصلی متفاوت است، اما روش‌شناسی TRR فرض می‌کند که اکثریت قریب به اتفاق رانندگان به‌طور سیستماتیک قوانین راهنمایی و رانندگی را نقض نمی‌کنند و اگر چنین مواردی در مجموعه داده بیان شده باشد، می‌توان آن‌ها را پرت در نظر گرفت. بنابراین، انتظار این است که اکثریت قریب به اتفاق رانندگان به قوانین راهنمایی و رانندگی جاده احترام بگذارند و دو فرضی که قبلاً ذکر شد فقط تحت این پیش نیاز می تواند معتبر باشد.
با توجه به محدودیت‌های روش‌شناسی موجود، همانطور که در بخش قبل توضیح داده شد، جهت‌های تحقیقاتی جدیدی باز می‌شود که این مقاله به آنها می‌پردازد. به طور دقیق تر، مشارکت های پژوهشی این پژوهش را می توان به شرح زیر خلاصه کرد:
1.
این روش یک روش جدید تشخیص تنظیم کننده ترافیک را پیشنهاد و آزمایش می کند و آن را در تنظیمات مجموعه داده های مختلف، به عنوان مثال، شهرهای مختلف، تنظیم کننده ها، تراکم مسیر و اندازه مجموعه داده ها ( بخش 2.2.2 ) ارزیابی می کند.
2.
از آنجایی که بررسی ادبیات مشخص کرد که روش‌های ترکیبی به نظر بهتر عمل می‌کنند، یک روش ترکیبی TRR پیشنهادی این فرضیه را آزمایش می‌کند (مدل ترکیبی: TRR از داده‌های جمع‌سپاری (ویژگی‌های پویا و استاتیک)).
3.
این اثر نرخ نمونه برداری GPS را در عملکرد طبقه بندی بررسی می کند (اثر نرخ نمونه برداری). این جنبه از مشکل از نرخ های مختلف نمونه برداری از مجموعه داده های مورد استفاده برای آزمایش روش، و همچنین از مشاهده اینکه کیفیت مسیرهای GPS ممکن است بر عملکرد طبقه بندی تأثیر بگذارد، برانگیخته شد.
4.
روش پیشنهادی تحت تنظیمات ویژگی های مختلف آزمایش می شود، به عنوان مثال، شامل اطلاعات از بازوهای زمینه و استفاده منحصراً از اطلاعات یک بازو ( بخش 2.2.3 ). تجزیه و تحلیل اهمیت ویژگی ها نیز برای تعیین ویژگی های کلیدی برای کار طبقه بندی انجام می شود.
5.
روش پیشنهادی اثر (در صورت وجود) مسیرهای چرخشی در عملکرد طبقه‌بندی را بررسی می‌کند (اثر مسیرهای چرخشی/بدون چرخش).
6.
روش پیشنهادی بررسی می‌کند که آیا تعداد معینی از مسیرها در هر بازوی تقاطع وجود دارد که منجر به عملکرد طبقه‌بندی بهینه می‌شود (اثر تعداد مسیرها).
7.
روش پیشنهادی یک بررسی سازگاری اضافی از برچسب‌های پیش‌بینی‌شده در سطح تقاطع را پیشنهاد می‌کند و در صورت امکان، تنظیم‌کننده‌های طبقه‌بندی اشتباه را اصلاح می‌کند ( بخش 2.3 ).
8.
این یک مجموعه داده مسیر جدید همراه با تنظیم‌کننده‌های تقاطع حقیقت پایه که مسیرها از آن عبور می‌کنند در دسترس قرار می‌دهد، که می‌تواند به عنوان معیار روش‌شناسی TRR مورد استفاده قرار گیرد.

2. مواد و روشها

2.1. مجموعه داده ها

در این بخش، ما الزامات داده را برای پرداختن به مشکل تشخیص مقررات ترافیکی (TRR) از داده‌های جمع‌سپاری (مسیرهای GPS و OSM) و همچنین محدودیت‌های آن الزامات را شرح می‌دهیم.

2.1.1. الزامات و محدودیت های مجموعه داده

از آنجایی که روش پیشنهادی مبتنی بر طبقه بندی نظارت شده است، هم ردیابی GPS (برای محاسبه ویژگی) و هم تنظیم کننده (به عنوان برچسب) بازوهای تقاطع مورد نیاز است. فرآیند برچسب‌گذاری زمان‌بر است و محدودیت‌های کلی برای کاوش در مسئله شناسایی مقررات ایجاد می‌کند، زیرا چنین نقشه‌ای از حقیقت پایه همیشه برای اهداف آموزشی و/یا اعتبارسنجی مورد نیاز است (بحث بیشتر در مورد این محدودیت را می‌توان در [ 19 ] یافت). اگرچه مجموعه داده‌های مسیر باز زیادی وجود دارد که می‌توان آنها را آزادانه دانلود کرد تا در زمینه سؤال تحقیقی که در اینجا به آن می‌پردازیم استفاده شود، داده‌های برچسب‌گذاری‌شده اضافی که همچنین مورد نیاز هستند (مقررات اتصالات) در دسترس نیستند.
علاوه بر این، محدودیت دیگری در مورد مجموعه داده مسیری که می توان از آن استفاده کرد، نرخ نمونه برداری از ردیابی GPS است. اکثر مجموعه داده‌های مسیر باز نرخ نمونه‌برداری پایینی دارند (مثلاً 1 نمونه در هر 15 ثانیه یا در دقیقه) و نمی‌توان از آنها برای استخراج ویژگی‌هایی مانند رویدادهای توقف یا کاهش سرعت استفاده کرد، زیرا بین دو نمونه GPS گرفته‌شده به عنوان مثال، هر 15 ثانیه، یک یا رویدادهای توقف/کاهش سرعت بیشتری ممکن است رخ دهد و شناسایی نشوند. بنابراین، مجبور به مقابله با این چالش‌های مجموعه داده‌ها، در مجموع توانستیم به سه مجموعه داده مناسب دسترسی داشته باشیم: یکی که توسط نویسنده اول این مقاله ثبت شده و اکنون به عنوان مجموعه داده باز [ 31 ، 32 ] در دسترس است، یکی که توسط نویسنده اول به اشتراک گذاشته شده است. از مقاله مجله [ 24 ]، و یک مجموعه داده مسیر باز [ 33] که برای آن نقشه حقیقت پایه باید به صورت دستی توسط نویسنده اول این مقاله انجام می شد و اکنون به عنوان یک مجموعه داده باز نیز در دسترس است [ 34 ]. سه مجموعه داده در بخش بعدی توضیح داده شده است.

2.1.2. مجموعه داده ها برای آزمایش روش پیشنهادی

در جدول 1 ، توصیفی از مجموعه داده‌هایی را که برای آزمایش روش پیشنهادی و انجام آزمایش‌هایی بر روی تعداد مسیرها در هر تقاطع مورد نیاز برای دقت طبقه‌بندی بهینه استفاده کردیم، ارائه می‌کنیم (اثر مسیرهای چرخشی/بدون چرخش). مجموعه داده ها شامل ترکیب های مختلفی از قوانین، با Champaign [ 24 ] و Chicago [ 33] مجموعه داده‌های حاوی کلاس‌های قانون یکسان (کنترل نشده (UN)، علامت توقف (SS) و علائم راهنمایی و رانندگی (TS)) و مجموعه داده هانوفر حاوی زیرمجموعه‌ای از قوانین از مجموعه داده‌های Champaign و Chicago، به علاوه تنظیم‌کننده دیگر (UN، علامت اولویت ( PS) و TS). برای هر بازوی تقاطع یک قاعده در نظر می گیریم، به این معنی که یک تقاطع سه راهه یا T دارای سه قانون و یک اتصال چهار طرفه چهار قانون است. از این رو، بسته به نوع تقاطع ها (به عنوان مثال، سه طرفه، چهار طرفه، و غیره)، تعداد کل قوانین در هر مجموعه داده بر این اساس متفاوت است. غنی ترین مجموعه داده از نظر قوانین، مجموعه داده هانوفر و غنی ترین از نظر ردیابی GPS (مسیر) مجموعه داده Champaign است. فقط مجموعه داده مسیر شیکاگو به صورت عمومی در دسترس است [ 33]. بقیه خود جمع آوری می شوند. همه داده ها طبیعت گرایانه هستند (داده های طبیعی را می توان به عنوان داده هایی تعریف کرد که سوابقی از فعالیت های انسانی را تشکیل می دهند که نه توسط اقدامات محققان برانگیخته شده و نه تحت تأثیر آنها قرار می گیرند [ 35 ]). به این معنا که به رانندگان دستورالعمل های خارجی در مورد نحوه رانندگی داده نشده است . شکل 3 سه مجموعه داده را نشان می دهد.
علاوه بر این، همه به جز نقشه حقیقت پایه شیکاگو تنظیم کننده ها به صورت دستی با مشاهده میدانی (بازدید از تمام تقاطع ها و مقررات ثبت) ایجاد شدند. برای به دست آوردن مقررات مربوط به مجموعه داده شیکاگو، ما از داده های تصاویر خیابان Mapillary [ 36 ] استفاده کردیم که توسط منابع دیگر تأیید شد و قوانین تقاطع را به صورت دستی استخراج کردیم. نقشه حقیقت اصلی شیکاگو در اینجا موجود است [ 34 ]. مجموعه داده هانوفر (مسیرها و قوانین ترافیکی حقیقت پایه) در اینجا موجود است [ 31 ، 32]. علاوه بر این، مجموعه داده Champaign دارای نرخ نمونه برداری متوسط ​​1 هرتز، هانوفر 0.59 هرتز (1 نمونه در هر 1.7 ثانیه) و شیکاگو به طور متوسط ​​0.28 هرتز است. در نهایت، اگرچه مجموعه داده هانوفر حاوی بازوهای کنترل شده با عملکرد (YS) است، اما بیشتر آنها به صورت پراکنده نمونه برداری می شوند (چند آهنگ از آنها عبور می کنند). به همین دلیل، ما YS را از تحلیل خود حذف کردیم.

2.2. روش شناسی

یکی از عناصر مهم الگوهای حرکت، رویدادهای توقف و کاهش سرعت هستند که بر اساس رویکرد خوشه‌بندی شناسایی می‌شوند. در این بخش، اصلاح یک الگوریتم خوشه‌بندی شناخته شده برای تشخیص رویدادهای مهم کوتاه‌مدت ( بخش 2.2.1 )، و همچنین یک روش جدید TRR ( بخش 2.2.2 ) را توصیف می‌کنیم که کارایی آن تحت تنظیمات مختلف (اثر) بررسی می‌شود. از مسیرهای تراش / بدون گردش و اثر تعداد مسیرها).

2.2.1. تشخیص رویداد توقف و کاهش سرعت مبتنی بر خوشه در مسیرها (الگوریتم CB-SDot)

الگوریتم CB-SDoT (به الگوریتم 2 در پیوست A مراجعه کنید ) اصلاحی از الگوریتم CB-SMoT [ 37 ] برای تشخیص رویدادهای توقف/کاهش سرعت است. CB-SMoT در ابتدا برای کشف مکان های جالب در مسیرها پیشنهاد شد. یک مکان پتانسیل جالب بودن [ 38 ] یا قابل توجه بودن [ 39 ] را دارد، اگر کسی مدت معینی از زمان (یعنی بیش از یک محدودیت زمانی) را در آن صرف کند. این بدان معنی است که با تجزیه و تحلیل مسیر حرکت یک جسم متحرک (مثلاً یک عابر پیاده، وسیله نقلیه، حیوان و غیره)، می توانیم مکان هایی را که برای شی مشاهده شده جالب است، با توجه به اینکه برای مدت نسبتاً طولانی در آنجا باقی مانده است، تشخیص دهیم. مشکل پارتیشن بندی مسیرها به دنباله هایی ازتوقف و حرکت می کند موضوعی است که به خوبی مطالعه شده است [ 40 ] و الگوریتم های مختلفی وجود دارد که راه حل ارائه می دهند (به عنوان مثال، [ 41 ، 42 ، 43 ]).
در اینجا، ما راه‌حل CB-SMoT [ 37 ] را اتخاذ کردیم، که یک تکنیک خوشه‌بندی است که مشابه الگوریتم خوشه‌بندی شناخته شده مبتنی بر چگالی DB-SCAN [ 44 ] عمل می‌کند، اما علاوه بر فاصله بین نقاط، به برای تعیین معیارهای خوشه بندی، فواصل زمانی بین آنها را در نظر بگیرید. CB-SDoT خوشه هایی از نقاط را شناسایی می کند ( شکل 4 ) که در یک فاصله معین Eپسحداقل باقی بماند مترمنnتیمنمترهو (برخلاف CB-SMoT) بیش از مترآایکستیمنمتره. اضافی مترآایکستیمنمترهمحدودیت لازم است تا توقف های طولانی تر، غیر مرتبط با رویدادهای ترافیکی، مانند بازدید از فروشگاه، به عنوان رویداد جالب تلقی نشوند. مقادیر این پارامترها به صورت تجربی تعریف شد (توقف: Eپس= 10 متر، مترمنnتیمنمتره= 4 ثانیه، مترآایکستیمنمتره= 600 ثانیه، کاهش سرعت: Eپس= 10 متر، مترمنnتیمنمتره= 2.4 ثانیه، مترآایکستیمنمتره= 3.9 ثانیه). هر خوشه شناسایی شده یک توالی مرتب شده از نقاط است که نشان دهنده یک توقف یا یک رویداد کاهش سرعت است. برای هر خوشه، نقطه ای را به عنوان نماینده خوشه تعریف می کنیم. چنین نقطه ای را به عنوان آخرین نقطه در سری زمانی نقاط خوشه شناسایی شده که کمترین سرعت را دارد تعریف می کنیم. مفاهیم نقطه مرکزی ، همسایگی خطی و نقاط همسایه به همان مواردی اشاره دارد که در ابتدا در [ 37 ، 44 ] تعریف شده بودند و به خاطر فضا، از ارائه تعاریف آنها در اینجا صرف نظر می کنیم.
2.2.2. یادگیری تنظیم کننده های ترافیک از داده های Crowdsourced

ج-مدل پویا: TRR از طریق خلاصه‌سازی رفتار حرکت جمعی

روش تشخیص مقررات پیشنهادی مبتنی بر این فرضیه است که هر کلاس تنظیم‌کننده وسایل نقلیه را مجبور می‌کند بر روی الگوهای متحرک خاصی حرکت کنند و با شناسایی آن الگوها می‌توانیم آن را بازیابی کنیم.تنظیم کننده ها ما الگوهای حرکت مشاهده‌شده را با استفاده از عناصر اصلی (بلوک‌های الگو)، رویدادهای توقف و کاهش سرعت، و همچنین عدم مشاهده آنها، یعنی بدون توقف و بدون رویداد کاهش سرعت (چهار بلوک الگو) توصیف می‌کنیم. به عنوان مثال، یک الگوی حرکتی می تواند یک عبور آزاد از یک اتصال باشد که در آن هیچ رویداد توقف یا کاهش سرعت مشاهده نمی شود. الگوی دیگر می تواند توقف فقط یک بار قبل از عبور از تقاطع باشد. با ترکیب این بلوک های الگو می توان الگوهای متعددی را تعریف کرد. سپس، هر بازوی اتصال تنظیم شده را می توان از روی الگوهای حرکتی مشاهده شده در محل آن، با خلاصه کردن ساده الگوها (هر کدام با رویدادهای توقف/کاهش سرعت توصیف شده) تمام مسیرهایی که از آن بازوی اتصال عبور می کنند، توصیف کرد.

برای مثال، فرض کنید مسیرهای N از یک بازوی اتصال عبور کنند من_آrمتر. از مسیرهای N ، مسیرهای M از مسیر عبور می کنند من_آrمترداشتن سرعت ثابت ( پ1: جریان آزاد، یعنی بدون توقف، بدون رویدادهای کاهش سرعت) و ن-ممسیرها یک بار در محل اتصال متوقف می شوند و برای چند ثانیه صبر می کنند ( پ2: یک توقف قبل از عبور از تقاطع). سپس می توانیم آن را توصیف کنیم من_آrمتربا استفاده از نسبت مسیرهای زیر دو الگوی حرکت، پ1و پ2. تعریف کردن پ1به عنوان الگوی حرکت جریان آزاد و پ2به عنوان الگوی حرکت با توقف، سپس من_آrمتررا می توان از نظر کمی به عنوان مکانی توصیف کرد که در آن یک رفتار حرکت مختلط به طور جمعی مشاهده می شود و می توان آن را به صورت زیر خلاصه کرد:

[پ1،پ2]من_آrمتر=[من،ن-من]،wمنتیساعت∑n=12پn=1
با اعمال این ایده در زمینه مشکل خود ، به جای دو الگوی حرکتی که در مثال قبلی استفاده کردیم، چهار الگوی حرکتی مختلف را که در شکل 5 نشان داده شده است، تعریف می کنیم.∑n=14پn=1):
  • پ1: حرکت آزاد (بدون مانع) هنگام عبور از تقاطع. در نتیجه، هیچ رویداد کاهش یا توقف مشاهده نمی شود.
  • پ2: خودرو بدون توقف سرعت خود را کاهش می دهد.
  • پ3: وسیله نقلیه فقط یک بار قبل از عبور از تقاطع توقف می کند. با این حال، ممکن است بیش از یک بار کند شود.
  • پ4: وسیله نقلیه بیش از یک بار قبل از عبور از تقاطع توقف می کند.
به صورت شماتیک، این ایده در شکل 6 نشان داده شده است . چنین ترکیبی از الگوهای حرکتی در [ 45 ] استفاده شده است]، اما در زمینه ای متفاوت. در آنجا، هدف تعیین پویا محدوده یک تقاطع برای به دست آوردن سرعت جریان ترافیک و تاخیر تقاطع تحت الگوهای ترافیکی مختلف بود. در اینجا، ما الگوهای حرکتی را برای خلاصه کردن رفتار جمعی وسایل نقلیه در یک تقاطع تعریف می کنیم. انتخاب چهار الگو پس از ایجاد نمودارهای پروفیل سرعت وسیله نقلیه در تقاطع‌های مختلف انجام شد و مشاهدات زیر را انجام داد: در یک چراغ راهنمایی ترکیبی از الگوها مشاهده شد که در آن الگوهای 1 و 4 به طور متناسب در مقایسه با مقادیر مربوطه در اولویت متمایز بودند. تقاطع کنترل شده یا در علامت اولویت.
همراه با این چهار الگوی محاسبه شده در هر بازوی اتصال، که به عنوان ویژگی های طبقه بندی استفاده می شود، شش صدک سرعت متوسط ​​(10، 20، 40، 60، 80، و 95) از مسیرهایی را که از هر پیوند عبور می کنند، به بردار ویژگی اضافه می کنیم. بازو این ویژگی‌ها، دوباره، از پروفایل‌های سرعتی که ما در تقاطع‌های مختلف ترسیم کردیم، ایجاد شد و توزیع‌های سرعت متفاوتی را بین تقاطع‌هایی که توسط تنظیم‌کننده‌های مختلف کنترل می‌شد، مشاهده کردند. بنابراین، یک بردار ویژگی 10 بعدی (چهار مقدار الگو به اضافه 6 مقدار صدک) به طبقه‌بندی کننده برای TRR داده می‌شود. ما به این روش به عنوان مدل c-dynamic اشاره می کنیم (c- مخفف compact است، در ادامه تفاوت مدل c-dynamic از مدل دینامیک را توضیح می دهیم). شکل 7گردش کار رویکرد پیشنهادی را نشان می دهد.
با توجه به اجرای این ایده، تمام مراحل، از استخراج ویژگی تا طبقه بندی تقاطع، در الگوریتم 1 بیان شده است. از آنجایی که مسئله به عنوان یک مسئله طبقه بندی فرمول بندی شده است، ابتدا ویژگی هایی را که طبقه بندی کننده برای یادگیری نحوه نگاشت به برچسب نیاز دارد، استخراج می کنیم. فضا. همانطور که قبلا توضیح دادیم، هر تقاطع با 10 ویژگی نشان داده می شود. ما ابتدا تمام رویدادهای توقف و کاهش سرعت را برای هر مسیر با استفاده از الگوریتم CB-SDoT محاسبه می کنیم ( بخش 2.2.1 ).
در مرحله بعد، برای هر بازوی تقاطع مجموعه داده، تمام مسیرهایی را که از آن عبور می کنند، و برای هر مسیر، تعداد رویدادهای توقف و کند شدن (در صورت وجود) را که در نیمی از فاصله بین تقاطع فعلی و تقاطع قبلی بازدید شده، و همچنین میانگین سرعت. همانطور که  شکل 8 نشان می دهد، برای تقاطعی که دارای چهار بازو است، من_آrمتر، متر_آrمتر، j_آrمتر، و ک_آrمتر، برای هر بازو و برای هر مسیری که از آن عبور می کند، رویدادهای توقف و کاهش سرعت را در نیم فاصله ای که تقاطع را با بازوی قبلی (فلش های سفید) وصل می کند، محاسبه می کنیم. با استفاده از چنین فاصله‌ای غیر ثابت، از داشتن ویژگی‌های محاسبه‌شده در طول یک بخش جاده که در امتداد بیش از یک بازوی تقاطع قرار دارند، اجتناب می‌کنیم. به عنوان مثال، با فرض استفاده از فاصله ثابت 100 متر، در مناطق مسکونی ممکن است تقاطع هایی وجود داشته باشد که کمتر از 100 متر از تقاطع های مجاور خود فاصله داشته باشند. در چنین مواردی، ویژگی های محاسبه شده در امتداد بازوهای تقاطعی که بیش از یک تقاطع را رد می کنند محاسبه می شود. با توجه به رویدادهای توقف / کاهش سرعت یافت شده در مسیری که از یک بازوی تقاطع عبور می کند، ما رفتار حرکتی هر مسیر را به یکی از چهار الگوی حرکت دسته بندی می کنیم.Ijgi 12 00004 i001

مدل دینامیک: TRR از مسیرهای GPS

مدل دینامیکی را می‌توان به‌عنوان توسعه‌ای از مدل c دینامیک در نظر گرفت و علاوه بر ده ویژگی مورد استفاده مدل اخیر، از برخی ویژگی‌های آماری (میانگین، واریانس، حداقل و حداکثر مقادیر) به دست آمده از توقف و کاهش سرعت استفاده می‌کند. رویدادها و از سرعت تخمینی خودرو. در مقایسه با مدل‌های موجود، به عنوان مثال، [ 24 ، 26 ، 27 ، 46 ]، این مدل بردار ویژگی غنی‌تری دارد (در مجموع 86 ویژگی) که شامل ویژگی‌های مربوط به کاهش سرعت و سرعت بیشتر است. همه ویژگی ها در جدول 2 فهرست شده اند . محاسبه ویژگی ها و مراحل TRR به روشی مشابه مدل c-dynamic کامل می شود.

مدل استاتیک: TRR از ویژگی های استخراج شده OSM

مدل استاتیک از ویژگی های استخراج شده از OSM استفاده می کند که در اصل از صارمی و عبدالظاهر [ 26 ] پیشنهاد شده است. هر رویکرد تقاطع (بازو) با پنج ویژگی توصیف می شود. سه مورد از آنها طول خیابان ها را در نظر می گیرند و در شکل 9 نشان داده شده اند . به طور خاص، ویژگی های مدل استاتیک به شرح زیر است:
1.
فاصله سرتاسر خیابانی که بازوی تقاطع به آن تعلق دارد (فلش آبی روشن در شکل 9 ). طول یک خیابان نشان دهنده اهمیت آن در شبکه خیابانی است. همین منطق در مورد سایر ویژگی های مبتنی بر فاصله نیز صدق می کند (2، 3).
2.
نیمه فاصله بازوی تقاطع فاصله از مرکز اتصال تا مرکز دورترین تقاطع است که بازوی تقاطع به آن متصل است (فلش زرد رنگ در شکل 9 ).
3.
نزدیکترین فاصله یک بازوی تقاطع فاصله از مرکز اتصالی است که بازو به آن تعلق دارد، تا مرکز نزدیکترین اتصالی که بازو به آن متصل است (فلش سبز در شکل 9 ).
4.
حداکثر سرعت یک تقاطع، حداکثر سرعت مجاز در طول آن است . تقاطع هایی که با علائم راهنمایی و رانندگی کنترل می شوند به طور کلی محدودیت سرعت بالاتری دارند (مثلاً 50 کیلومتر در ساعت) در مقایسه با تقاطع های کنترل شده با علائم ایست (مثلاً 30 کیلومتر در ساعت).
5.
دسته خیابان به دسته نوع خیابان بازوی تقاطع (به عنوان مثال، اولیه، ثانویه، سوم، مسکونی) اشاره دارد.

مدل ترکیبی: TRR از داده‌های جمع‌سپاری (ویژگی‌های پویا و استاتیک)

مدل ترکیبی از ویژگی های هر دو مدل پویا و استاتیک استفاده می کند، یعنی 86 ویژگی مدل پویا و 5 ویژگی استاتیک، در مجموع 91 ویژگی.
2.2.3. مدل های تک بازو در مقابل تمام بازوها
تاکنون، در چهار مدل طبقه‌بندی (c-dynamic، دینامیک، استاتیک، ترکیبی)، هر بازوی تقاطع با مجموعه‌ای از ویژگی‌های استخراج شده منحصراً از آن بازو ( مدل‌های یک بازویی ) نشان داده می‌شود. با انگیزه این واقعیت که برای طبقه بندی یک بازوی تقاطع، اطلاعات مربوط به بازوهای تقاطع مجاور نیز ممکن است مرتبط باشد، هر مدل با ویژگی های بیشتر که منجر به مدل تمام بازوی مربوطه می شود غنی می شود ، که در آن هر بازوی تقاطع در بردار ویژگی با نشان داده می شود. ترکیبی از ویژگی های استخراج شده از بازوهای زمینه. به عنوان مثال، i_arm تقاطع نشان داده شده در شکل 8a مطابق مدل تمام بازو c-dynamic دارای 4 (بازو) × 10 (ویژگی) = 40 ویژگی است: 10 ویژگی برای هر بازوی تقاطع، از i_arm شروع می شود و ویژگی ها را از بازوهای زمینه به ترتیب جهت عقربه های ساعت اضافه می کند:
[پ1،پ2،پ3،پ4،س1،س2،س3،س4،س5،س6]من_آrمتر، [پ1،پ2،پ3،پ4،س1،س2،س3،س4،س5،س6]ک_آrمتر،
[پ1،پ2،پ3،پ4،س1،س2،س3،س4،س5،س6]j_آrمتر، [پ1،پ2،پ3،پ4،س1،س2،س3،س4،س5،س6]متر_آrمتر
j-arm به طور مشابه با بردار ویژگی زیر نشان داده می‌شود که از j_arm شروع می‌شود و ویژگی‌هایی را از بازوهای زمینه دیگر به ترتیب در جهت عقربه‌های ساعت اضافه می‌کند:
[پ1،پ2،پ3،پ4،س1،س2،س3،س4،س5،س6]j_آrمتر، [پ1،پ2،پ3،پ4،س1،س2،س3،س4،س5،س6]متر_آrمتر،
[پ1،پ2،پ3،پ4،س1،س2،س3،س4،س5،س6]من_آrمتر، [پ1،پ2،پ3،پ4،س1،س2،س3،س4،س5،س6]ک_آrمتر
برای مدل هیبریدی، سه نوع تمام بازو بررسی شده است. یک بازو من_آrمتریک تقاطع X تحت سه مدل نوع هیبریدی به شرح زیر تعریف می شود:
1.
تحت مدل هیبریدی تمام استاتیک ، تمام ویژگی‌های استاتیک از تمام بازوهای تقاطع X در بردار ویژگی و همچنین ویژگی‌های دینامیکی گنجانده شده است. من_آrمتر.
2.
در مدل هیبریدی تمام دینامیک ، تمام ویژگی‌های دینامیکی از همه بازوهای X به همراه ویژگی‌های استاتیک در نظر گرفته می‌شوند. من_آrمتر.
3.
در مدل ترکیبی ، تمام ویژگی‌های ایستا و پویا از تمام بازوهای تقاطع X در بردار ویژگی گنجانده شده است.
از روش‌های پویا و ترکیبی موجود، تا جایی که نویسندگان می‌دانند، هیچ‌یک چنین تنظیمات ویژگی را در نظر نگرفته‌اند.
2.2.4. تست عملکرد طبقه بندی تحت تنظیمات مسیرهای مختلف

تأثیر نرخ نمونه گیری

یکی از مشاهداتی که به سه مجموعه داده مسیر نگاه می‌کند این است که نرخ‌های نمونه‌گیری متفاوتی دارند: Champaign-1 هرتز، شیکاگو-0.28 هرتز (1 نمونه در هر 3.6 ثانیه)، و هانوفر-0.59 هرتز (1 نمونه در هر 1 ثانیه). نرخ نمونه‌برداری می‌تواند هم بر سرعت محاسبه‌شده وسیله نقلیه و هم بر تشخیص رویدادهای توقف و کاهش سرعت تأثیر بگذارد، همانطور که در بخش 2.2.1 توضیح داده شد.. بدیهی است که هر چه میزان نمونه برداری بیشتر باشد، محاسبه سرعت دقیق تر است و قسمت های حرکتی بیشتری تشخیص داده می شود. برای آزمایش این فرضیه، آزمایش‌هایی را روی دو مجموعه داده با نرخ نمونه‌گیری بالاتر، Champaign و Hanover، با کم‌نمونه‌گیری از مجموعه داده‌های اصلی و مقایسه عملکرد مجموعه داده‌های نمونه‌برداری شده با مجموعه داده‌های اصلی انجام دادیم. مجموعه داده Champaign در ≈2s، ≈3s و ≈4s زیر نمونه برداری شد. مجموعه داده هانوفر در ≈4 ثانیه نمونه برداری شد.

اثر مسیرهای چرخشی/بدون چرخش

بسته به شکل تقاطعی که از آن عبور می کنند، وسایل نقلیه می توانند مستقیم حرکت کنند، به چپ یا راست بپیچند. این بدان معنی است که در مجموعه داده ما مسیرهای مستقیم یا منحنی داریم. اثر چرخش در یک تقاطع به طور کلی بر رفتار رانندگی قبل و بعد از پیچ در مقایسه با عبور از طریق یک خط مستقیم تأثیر می گذارد، زیرا خودرو باید قبل از پیچ سرعت خود را کاهش دهد و پس از پیچ دوباره شتاب بگیرد. به همین دلیل، سایر مطالعات مرتبط، مسیرهای منحنی را از مجموعه داده حذف کرده اند [ 24 ، 27 ]]. با این حال، با حذف چنین مسیرهایی، داده های موجود برای آموزش و آزمایش طبقه بندی کننده را کاهش می دهیم. بنابراین، ما تأثیر استفاده از تمام مسیرهای موجود (همه ترکیب مسیرهای راست، چپ و مستقیم) یا مسیرهای منحصراً مستقیم را بر عملکرد طبقه‌بندی بررسی می‌کنیم ( بخش 3.3 ).

اثر تعداد مسیرها

ما حداقل تعداد مسیرهایی را که برای اعمال روش پیشنهادی مورد نیاز است در هر بازوی اتصال بررسی می‌کنیم ( بخش 2.2.2 ). علاوه بر این، بررسی می کنیم که آیا تعداد بهینه مسیرها در هر بازوی تقاطع وجود دارد که طبقه بندی کننده با آن بهترین عملکرد را دارد یا خیر. یعنی برای اینکه الگوهای استخراج شده به اندازه کافی توصیفی باشند، باید چند مسیر داشته باشیم.برای اهداف طبقه بندی؟ از یک طرف، با تنظیم حداقل تعداد مسیرها به عنوان شرط برای انتخاب بازوی اتصال برای آموزش/آزمایش، مجموعه داده را کوچک می کنیم: هر چه این عدد بیشتر باشد، بازوهای اتصال کمتری شرایط را برآورده می کنند، زیرا بیشتر اتصالات بازوها فقط مسیرهای کمی دارند. از سوی دیگر، خلاصه کردن رفتار حرکت جمعی تنها با استفاده از چند خط سیر می تواند منجر به نمایش نادرست رفتار واقعی حرکت شود. ما این جنبه از مسئله را با انجام آزمایش‌هایی بر روی حداقل n مسیری که یک بازوی اتصال باید در آزمون آموزشی گنجانده شود، بررسی می‌کنیم: (الف) با استفاده از تمام مسیرهایی که از بازوی اتصال عبور می‌کنند و (ب) با استفاده از دقیقاً nمسیرها برای محاسبه الگوهای بازوی اتصال.
بنابراین، در (الف)، فرض کنید ما حداقل تعداد مسیرها را به مترمنn=10، ما همه بازوهای اتصال را که کمتر از 10 مسیر عبور کرده اند از آموزش و آزمایش حذف می کنیم و الگوهای بازوهای باقی مانده را با استفاده از تمام مسیرهایی که از هر یک از آنها عبور می کنند محاسبه می کنیم. اگر یک بازوی تقاطع دارای 35 مسیر باشد، الگوها را بر اساس تمام 35 ردیابی محاسبه می کنیم. در (ب)، برعکس، با حذف بازوهای متقاطع با کمتر از 10 رد، الگوها را دقیقاً با استفاده از 10 مسیر محاسبه می کنیم (ما جدیدترین آنها را انتخاب کردیم).

2.3. قوانین دانش دامنه

جدول 3 ترکیبی از تنظیم کننده های ترافیک موجود در هر مجموعه داده را نشان می دهد. مجموعه داده Champaign دارای 350 اتصال سه طرفه است که 293 مورد از آنها با UN/SS (UN-UN-SS) کنترل می شوند، 33 مورد UN همه طرفه، 15 اتصال همه طرفه و 9 مورد TS تمام طرفه هستند. ترکیبات مشابهی در مجموعه داده شیکاگو یافت می شود. در هانوفر ترکیبی از UN، PS، TS، SS و YS وجود دارد. طبقه بندی، همانطور که قبلا توضیح داده شد، در سطح بازوی اتصال اجرا می شود، بنابراین پس از طبقه بندی، هر اتصال دارای یک برچسب پیش بینی شده برای هر بازوی نمونه برداری شده از مسیرها است. همانطور که  جدول 3 نشان می دهد، تنظیم کننده ها به طور تصادفی با یکدیگر ترکیب نمی شوند، اما قوانین دانش زیربنایی حوزه [ 26 ] وجود دارد که می تواند در مرحله پس از طبقه بندی برای اصلاح استفاده شود.با مقایسه برچسب های بازوهای پیش بینی شده در سطح اتصال، بازوها را به اشتباه طبقه بندی کرد. هو و همکاران [ 24 ] از قانون دانش دامنه دیگری در رابطه با T-junctions استفاده کنید (به A، B، و C برای انتهای چپ، راست و پایین اتصال اشاره کنید). اگر A و B UN هستند، C SS کنترل می شود، در غیر این صورت C دارای همان نوع A و B است. چنین قوانین دانش ساده ای توسط [ 24 ، 26 ] استفاده شده است (به بخش 1 مراجعه کنید )، اما بدون بررسی میزان مشارکت آنها. به دقت کلی، احتمالاً به این دلیل که هر دو فقط از یک قانون استفاده می کردند.
در تعریف قواعد دانش حوزه، احتمال پیش‌بینی‌ها را نیز لحاظ می‌کنیم تا فقط پیش‌بینی‌هایی با احتمال بالا در نظر گرفته شود. ما یک قدم جلوتر می رویم و پیش بینی بازوهای تقاطع متعلق به یک تقاطع را مقایسه می کنیم، هم برای تصحیح برچسب های طبقه بندی شده اشتباه و هم برای پیش بینی برچسب ها برای بازوهایی که هیچ داده ای برای پیش بینی برای آنها نداریم. در مورد دوم، ما پیش‌بینی‌هایی را برای بازوهای با داده‌های از دست رفته بر اساس پیش‌بینی بازوهای تقاطع همان تقاطع که داده‌هایی برای آن داریم، به عنوان مثال، برای یک تقاطع سه‌طرفه، اگر پیش‌بینی شود یک بازو TS با بالا باشد، انجام می‌دهیم. احتمال (> 0.80)، می توانیم استنباط کنیم که دو بازوی دیگر (بدون برچسب) نیز TS هستند.
قانون دیگری بیان می کند که اگر در یک تقاطع سه طرفه دو پیش بینی برای دو بازوی یک تقاطع وجود داشته باشد، یکی TS با احتمال 0.95 و دیگری SS با احتمال 0.79، می توانیم نتیجه بگیریم که پیش بینی SS اشتباه است، و بنابراین، ما SS را به TS تصحیح کنید و همچنین سومین بازوی بدون برچسب تقاطع را به عنوان TS علامت گذاری کنید، به طوری که تقاطع با قانون دانش دامنه مطابقت دارد که اگر یک بازو TS باشد، همه بازوهای دیگر تقاطع TS هستند . ما از 0.15 به عنوان آستانه تصحیح استفاده می کنیم، به عنوان مثال، تفاوت بین دو پیش بینی، به عنوان مثال، در اینجا 0.95 – 0.79 = 0.16، به طوری که تصحیح پایین ترین برچسب پیش بینی شده آغاز می شود.
بررسی های سازگاری مشابهی برای سایر ترکیبات تنظیم کننده انجام می شود. به دلیل محدودیت فضا و ماهیت شهودی قوانین دانش دامنه، از فهرست کردن سایر بررسی‌های سازگاری خودداری می‌کنیم.

2.4. تنظیمات طبقه بندی

دو طبقه‌بندی‌کننده مبتنی بر درخت برای طبقه‌بندی بازوهای تقاطع استفاده می‌شوند: Random Forest و Gradient Boosting. برای پیاده سازی ما از کتابخانه XGBoost [ 47 ] استفاده کردیم که اخیراً بر بسیاری از مسابقات Kaggle غالب شده است. تمامی وظایف برنامه نویسی در پایتون 3 پیاده سازی شده است.
به عنوان تنظیمات ویژگی مدل پیش‌فرض، ویژگی‌های استخراج‌شده از مسیرهای مستقیم را در نظر می‌گیریم (مسیرهایی را که در اتصالات می‌پیچند را حذف می‌کنیم). علاوه بر این، بازوهای اتصالی که با خط سیر کمتر از پنج عبور کرده اند، از آموزش و آزمایش حذف می شوند.

3. نتایج

در این بخش، ما تمام نتایج طبقه‌بندی آزمایش‌های مورد بحث در بخش 2.2 قبلی را فهرست می‌کنیم . ما ابتدا دقت مدل های یک دستی و تمام بازویی را ارائه می کنیم ( بخش 3.1 ). سپس بهترین مدل را تنظیم می کنیم و از آن برای تمام آزمایش های دیگر در مورد تأثیر تنظیمات مسیرهای مختلف بر عملکرد طبقه بندی استفاده می کنیم ( بخش 3.3 و  بخش 3.4 ).

3.1. مدل های تک بازو در مقابل تمام بازوها

جدول 4 دقت طبقه بندی تمامی مدل ها را نشان می دهد. می بینیم که طبقه بندی کننده Gradient Boosting (GB) تقریباً برای همه آزمایش ها به خوبی یا بهتر از Random Forest (RF) عمل می کند. فقط در مدل c-Dynamic برای مجموعه داده های شیکاگو و هانوفر، RF کمی بهتر از گیگابایت (دقت +0.1) عمل می کند.
با مقایسه مدل‌های یک بازویی با یکدیگر، مدل استاتیک از دقت بسیار پایین‌تری نسبت به مدل‌های دیگر برای همه مجموعه‌های داده برخوردار است. مدل هیبریدی بهترین دقت را دارد (0.95 در Champaign، 0.88 در هانوفر و 0.82 در شیکاگو) و مدل دینامیک بهتر از c-dynamic اما بدتر از هیبریدی عمل می کند.
با توجه به مدل‌های تمام بازو، مشاهده می‌کنیم که مدل استاتیک بسیار بهتر از مدل یک بازویی عمل می‌کند، اما فقط برای مجموعه داده شیکاگو می‌تواند از c-دینامیک بهتر عمل کند. در تمام آزمایشات دیگر مدل های دیگر دقت بهتری دارند. مدل c-dynamic دقت کمتری نسبت به مدل دینامیکی دارد. برای همه مجموعه‌های داده با استفاده از طبقه‌بندی‌کننده GB، مدل ترکیبی تمام استاتیک یکسان یا بهتر از مدل‌های هیبریدی و هیبریدی تمام دینامیک و بهتر از مدل‌های c-دینامیک، پویا و استاتیک عمل می‌کند. همین مشاهدات برای طبقه‌بندی کننده RF صادق است، به جز مجموعه داده هانوفر، که در آن مدل ترکیبی دقت 0.92 در مقایسه با مدل هیبریدی تمام استاتیک با دقت 0.91 دارد.
بنابراین، مدل تمام بازوی هیبریدی تمام استاتیک با طبقه‌بندی کننده GB برای همه مجموعه‌های داده (0.95 در Champaign و هانوفر و 0.91 در شیکاگو) بهتر عمل می‌کند و به همین دلیل این مدل را برای استفاده از آن برای آزمایش‌های بخش‌های زیر انتخاب می‌کنیم. . علاوه بر این، ما انتخاب ویژگی و تنظیم طبقه‌بندی کننده را انجام دادیم. در  شکل 10ما نمودارهایی را ارائه می دهیم که اهمیت ویژگی ها را نشان می دهد. جالب توجه است، مهم‌ترین ویژگی‌ها از مجموعه داده‌های مختلف، حتی بین مجموعه داده‌های Champaign و Chicago که دسته‌های تنظیم‌کننده ترافیک یکسانی دارند (UN، SS، TS) متفاوت است. به عنوان مثال، در Champaign ویژگی های مهم تری در رابطه با کاهش سرعت نسبت به شیکاگو وجود دارد، در حالی که در شیکاگو ویژگی های مهم بیشتر به صدک های سرعت و ویژگی های نقشه مربوط می شود. ویژگی های مهم مشترک برای همه مجموعه داده ها ویژگی های الگو هستند ( پ1،پ2،پ3، و پ4). نتایج طبقه بندی و ماتریس های سردرگمی برای سه مجموعه داده پس از انتخاب ویژگی و تنظیم در جدول 5 و شکل 11 ارائه شده است.
همانطور که در جدول 5 می بینیم ، انتخاب ویژگی و تنظیم طبقه بندی کننده دقت را 1٪ افزایش داده است، از 0.95 به 0.96 برای مجموعه داده های Champaign و Hanover، و از 0.91 به 0.92 برای مجموعه داده شیکاگو. در Champaign و Chicago، دسته علامت توقف (SS) کمی بدتر از دو دسته دیگر (F-Measure در Champaign: 0.90 (SS)، 0.97 (UN) و 0.93 (TS) و در شیکاگو: 0.84 (TS) پیش بینی می شود. SS)، 0.95 (UN) و 0.94 (TS)). در هانوفر، F-Measures هر کلاس برای سه کلاس مشابه است. این مشاهدات در ماتریس های سردرگمی در شکل 11 برجسته شده است ، که به صورت بصری کلاس های واقعی در مقابل پیش بینی شده را نشان می دهد. در همین شکل، نمودارهایی از نرخ مثبت کاذب (FPR) و نرخ مثبت واقعی (TPR) نیز وجود دارد. در شکل 11 می بینیمb,d,f که بالاترین FPR در سه مجموعه داده در کلاس‌های مختلف مشاهده می‌شود: UN در Champaign (0.09)، TS در شیکاگو (0.077)، و PS در هانوفر (0.048). علاوه بر این، بالاترین TPR در همان کلاس‌هایی مشاهده می‌شود که بالاترین FPRها: Champaign: 0.99 (UN)، شیکاگو: 0.93 (TS) و Hanover: 0.97 (PS).
عملکرد کمتر در شیکاگو (دقت 0.92) در مقایسه با Champaign و Hanover (0.96 و 0.96) را می توان با این واقعیت توضیح داد که مجموعه داده شیکاگو به طور قابل توجهی کوچکتر از سایر مجموعه داده ها است (154 تنظیم کننده در مقابل 633 (Champaign) و 566 (Hanover) ) که امکانات آموزشی را محدود می کند. علاوه بر این، همانطور که قبلا در بخش 2.1.2 ذکر شد ، نرخ نمونه برداری در شیکاگو کمتر از دو مجموعه داده دیگر است (میانگین 0.28 هرتز در مقابل 1 هرتز و 0.59 هرتز)، که ممکن است بر محاسبه محاسبه ویژگی (کوتاه مدت) تأثیر بگذارد. رویدادهای شناسایی شده).

3.2. آزمایش اثر نرخ نمونه برداری

جدول 6عملکرد طبقه‌بندی روش‌های TRR را در نرخ‌های نمونه‌گیری مختلف نشان می‌دهد. در مجموعه داده Champaign، می بینیم که عملکرد بین 1 و 2 ثانیه یا حدود 1-2٪ کاهش می یابد یا یکسان می ماند. بین 2 ثانیه و 3 ثانیه، دقت در اکثر روش‌های TRR یکسان باقی می‌ماند و دو مورد وجود دارد که عملکرد 1±% تغییر می‌کند (مدل‌های دینامیکی تمام بازو و مدل‌های تمام استاتیک هیبریدی). افت دقت بین 3 و 4 ثانیه بیشترین میزان را دارد که این تفاوت بین 1 تا 3 درصد متغیر است. با توجه به اپیزودهای توقف و کاهش سرعت شناسایی شده، به نظر می‌رسد که آنها تحت تأثیر نرخ نمونه‌گیری هستند: هر چه میزان نمونه‌گیری بیشتر باشد، رویدادهای بیشتری شناسایی می‌شوند. در مجموعه داده هانوفر، بین 2 ثانیه و 4 ثانیه، دقت یا حدود 1٪ کاهش می یابد یا ثابت می ماند. وقتی عملکرد بین شامپین و هانوفر را بین 2 و 4 ثانیه مقایسه می کنیم، می بینیم که در Champaign بین 2٪ تا 3٪ کاهش می یابد، در حالی که در هانوفر کاهش 0-1٪ وجود دارد. وقتی عملکرد بین Champaign و Chicago را در 4 ثانیه مقایسه می کنیم، تفاوت دقت بین 2٪ و 12٪ را مشاهده می کنیم که کمترین تفاوت در مدل هیبریدی تمام استاتیک مشاهده می شود.
یک نتیجه کلی از این آزمایش‌ها این است که نرخ نمونه‌گیری می‌تواند بر عملکرد طبقه‌بندی تأثیر بگذارد: در مجموعه داده Champaign، وقتی 1 ثانیه و 4 ثانیه مقایسه شدند، هیچ روشی تحت‌نمونه‌گیری فرعی بی‌تأثیر باقی نماند. با این حال، کاهش عملکرد به اندازه کافی بزرگ نیست که توضیح دهد چرا دقت در شیکاگو با Champaign (4 ثانیه) (2 تا 12٪) بسیار متفاوت است. اگر نرخ نمونه‌برداری تنها دلیل عملکرد پایین‌تر در مجموعه داده شیکاگو بود، آنگاه Champaign در 4 ثانیه عملکردی مشابه شیکاگو داشت، که اینطور نیست. همانطور که قبلا ذکر شد، شاید عملکرد کمتر در شیکاگو به دلیل اندازه مجموعه داده (تعداد تنظیم کننده ها) باشد که بر آموزش طبقه بندی کننده تأثیر می گذارد.

3.3. آزمایش اثر مدارهای چرخشی

در شکل 12 ، ما عملکرد طبقه‌بندی را برای سه مجموعه داده تحت تنظیمات پیمایش مختلف گزارش می‌کنیم: جهت عبور و تعداد مسیرها در هر بازوی تقاطع. در مورد اول، بررسی می‌کنیم که آیا در نظر گرفتن نمونه‌هایی که فقط مستقیم به جلو حرکت می‌کنند، بر طبقه‌بندی تأثیر مثبت می‌گذارد، با این فرض که رفتار چرخشی بر سرعت تأثیر می‌گذارد، بنابراین حذف مسیرهای منحنی می‌تواند سوگیری آنها را حذف کند. در مورد دوم، ما به دنبال این هستیم که آیا تعداد بهینه مسیرهایی وجود دارد که یک بازوی تقاطع باید در طول آموزش داشته باشد و بنابراین، تقاطع‌هایی با مسیرهای کمتر از این تعداد را از مجموعه داده‌های آموزشی حذف می‌کنیم.
ما به تمام تنظیمات چرخش ممکن و ترکیب آنها نگاه کردیم. با توجه به برچسب های روی محور افقی شکل 12 ، س_فقط به مسیرهای مستقیم اشاره دارد، r_به مسیرهایی که به راست می‌پیچند، ل_به مسیرهایی که به چپ میپیچند، س_r_به گردش مستقیم/راست اشاره دارد، س_ل_به گردش مستقیم/چپ، r_ل_به گردش به راست/چپ و س_r_ل_به مسیرهای راست / راست / چپ. عدد بعد از این پیشوندها به تعداد n مسیر مورد استفاده برای انتخاب بازوهای تقاطع (حداقل تعداد مسیرها در هر بازوی تقاطع) و برای محاسبه الگوهای حرکتی (یعنی الگوهای حرکت مشاهده شده در بازوی تقاطع با خلاصه کردن رفتار محاسبه می شود، اشاره دارد. حداقل n مسیری که از آن عبور می کند). همه تنظیمات چرخش با تعداد مسیرهای یکسانی آزمایش نمی‌شوند، زیرا برای هر تنظیم چرخش/تقاطع، ما نیاز داریم که مجموعه داده آزمایشی حاوی حداقل 7 بازوی اتصال در هر کلاس باشد. به عنوان مثال، در مجموعه داده Champaign ( شکل 12الف)، ما مسیرهای مستقیم را برای اعداد مختلف 3، 4، …، 20 آزمایش کردیم، زیرا برای حداقل تعداد مسیرهای برابر با 21، تعداد بازوهای اتصال در مجموعه آزمایشی (10 برابر اعتبار متقاطع) نمی تواند بیشتر باشد. بیش از 7 بازوهای اتصال کنترل شده (SS).
با توجه به تأثیر مسیرهای چرخشی بر عملکرد طبقه‌بندی، می‌بینیم که استفاده از ردپای راست، چپ یا راست/چپ عملکرد کمتری نسبت به استفاده از ردیابی مستقیم و ترکیبی از خطوط مستقیم و چرخشی دارد ( شکل 12 a,c). هنگام استفاده از ترکیبی از ردپای مستقیم و چرخشی، نمی‌توانیم یک اثر منفی قوی ببینیم، اما این را می‌توان با این واقعیت توضیح داد که به طور قابل‌توجهی گذرگاه‌های مستقیم بیشتر از چپ و راست در مجموعه داده وجود دارد (در Champaign 20514 مستقیم، 2619 سمت راست، و 2768 چپ؛ در هانوفر 19092 مستقیم، 3394 راست و 3073 چپ؛ در شیکاگو 12638 مستقیم، 2820 راست و 1301 چپ).
یک توضیح احتمالی برای عملکرد ضعیف طبقه‌بندی هنگام استفاده از مسیرهای چرخشی انحصاری (مثلاً در Champaign دقت 0.88 برای مسیرهای گردش به راست زمانی که بازوهای اتصال حداقل 5 مسیر دارند – r_5 را در شکل 12 a ببینید)، مجموعه داده کوچک‌تری است که برای آموزش در مقایسه با تنظیمات دیگر جدول 7تعداد بازوهای اتصال قطار/آزمایش را در هر نوع کنترل در مجموعه داده Champaign نشان می‌دهد، زمانی که هر بازو حداقل پنج مسیر داشته باشد. می‌بینیم که مجموعه‌های آموزشی زمانی تنظیم می‌شوند که فقط مسیرهای راست، چپ یا راست/چپ بسیار کوچک‌تر از مجموعه با مسیرهای مستقیم هستند. علاوه بر این، این واقعیت که ویژگی ها از تعداد کمی از مسیرها محاسبه می شوند (چون تعداد مسیرهای راست و چپ در هر بازوی اتصال کم است)، ممکن است عملکرد بد را توضیح دهد. بنابراین، یکی از دلایل عملکرد ضعیف ممکن است مربوط به خود مجموعه داده باشد (که بر محاسبه ویژگی و اندازه مجموعه داده آموزشی تأثیر می‌گذارد) و نه تنها به شرایطی که در اینجا در نظر می‌گیریم (راندن مستقیم از یک تقاطع یا پیچ).
مشاهده دیگر این است که در مجموعه داده Champaign عملکرد زمانی که فقط از مسیرهای مستقیم استفاده می شود بهتر از زمانی است که از مسیرهای مستقیم و چرخشی استفاده می شود. به عنوان مثال، با حداقل 5 مسیر مستقیم، دقت 96٪ و با حداقل 5 مسیر مستقیم / چرخشی، دقت 93٪ است ( شکل 12 a). در مجموعه داده هانوفر ( شکل 12ج)، به طور متوسط ​​عملکرد زمانی که فقط از مسیرهای مستقیم استفاده می شود، بهتر از زمانی است که از مسیرهای مستقیم و چرخشی استفاده می شود، اما تأثیر کمتر از مجموعه داده Champaign است. برای هر دو مجموعه داده، تفاوت در دقت بین استفاده از مسیرهای مستقیم و همه (مستقیم و منحنی) بین 1٪ و 3٪ است. بنابراین، در هر دو مجموعه داده، حذف مسیرهای منحنی تأثیر مثبتی بر عملکرد طبقه‌بندی دارد و تعداد بهینه مسیرهای مستقیم 5 است.
با این حال، در مجموعه داده شیکاگو، مشاهدات مشابهی وجود ندارد، به عنوان مثال، با حداقل 15 مسیر مستقیم، دقت 88٪ و با حداقل 15 مسیر مستقیم / چرخشی، دقت 94٪ است ( شکل 12).ب). اگرچه مانند دو مجموعه داده دیگر، تعداد کافی بازوهای متقاطع با مسیرهای چرخشی برای تمرین و آزمایش وجود ندارد، یک توضیح احتمالی برای افزایش اندکی عملکرد در هنگام استفاده از همه مسیرها این است که مجموعه داده های آموزشی در هنگام مسیرهای مستقیم / چرخشی بزرگتر می شود. نسبت به زمانی که فقط از مسیرهای مستقیم استفاده می شود استفاده می شود، بنابراین طبقه بندی کننده بهتر یاد می گیرد. به عنوان مثال، هنگامی که حداقل از 5 مسیر مستقیم استفاده می شود، مجموعه داده شامل 49 UN، 29 SS، و 76 TS است، در حالی که زمانی که حداقل 5 مسیر (مسیر چرخشی و مستقیم) استفاده می شود، مجموعه داده شامل 50 UN، 40 SS و 115 است. TS.
بنابراین، با قضاوت از دو مجموعه داده بزرگتر که نتایج ثابتی دارند، می‌توان نتیجه گرفت که مسیرهای منحنی در تقاطع‌ها بر طبقه‌بندی حدود 1 تا 3 درصد در دقت تأثیر می‌گذارند و بنابراین، برای آزمایش‌های بعدی فقط از مسیرهای مستقیم استفاده خواهیم کرد (حداقل تعداد مسیر در هر بازوی اتصال برابر با 5)، به استثنای تمام مسیرهای منحنی در تقاطع ها، مشابه آنچه Hu و همکارانش. [ 24 ، 27 ] در مطالعات خود انجام دهند.

3.4. آزمایش تأثیر تعداد مسیرها بر عملکرد طبقه‌بندی

تعداد مسیرهای مورد استفاده به عنوان حداقل نیاز برای محاسبه ویژگی های طبقه بندی، و همچنین برای انتخاب بازوهای اتصال برای آموزش و آزمایش، به نظر می رسد بر عملکرد تأثیر می گذارد. با مقایسه مورد استفاده از تعداد معینی از مسیرها، به عنوان مثال، زیرمجموعه ای از تمام مسیرهای عبور از یک بازوی اتصال، با مورد استفاده از تمام مسیرهای موجود در هر بازوی اتصال (همانطور که در اثر تعداد مسیرها توضیح داده شد)، مورد دوم به دست می آید. عملکرد بهتر به طور متوسط این نتیجه برای همه مجموعه داده ها صادق است ( شکل 12 را با شکل 13 مقایسه کنید) و معقول به نظر می رسد، از آنجایی که از مسیرهای بیشتری برای محاسبه ویژگی های طبقه بندی استفاده می شود (که مقادیر آماری ویژگی های فیزیکی هستند، همانطور که در بخش 2.2.2 توضیح داده شد )، دومی بهتر رفتار حرکت واقعی را منعکس می کند.
در مجموعه داده Champaign، از شکل 13 a می بینیم که تنها با 3 مسیر مستقیم در هر بازوی اتصال، می توانیم به 92 درصد دقت دست یابیم. افزایش تعداد مسیرها عملکرد طبقه بندی را نیز افزایش می دهد. بهترین نتیجه، 96 درصد، با 20 مسیر به دست می آید. با این حال، وقتی نتایج را با نتایج شکل 12 a مقایسه می کنیم، می بینیم که محدود کردن تعداد مسیرها در هر بازو عملکرد طبقه بندی پایین تری را به همراه دارد، به عنوان مثال، با حداقل 4 مسیر مستقیم در هر بازوی اتصال، دقت 96٪ است.
در مجموعه داده هانوفر، ما همچنین می‌توانیم از شکل 12 c ببینیم که وقتی از همه ردیابی‌های موجود استفاده می‌شود، عملکرد بهتر از استفاده از یک عدد مشخص است ( شکل 13 ج). برای دقت بالای 91 درصد، حداقل 7 اثر در هر بازوی اتصال مورد نیاز است ( شکل 13 ج). بهترین دقت (93%) با 9 مسیر به دست می آید. در مقابل، با اجازه دادن به استفاده از تمام مسیرهای موجود در هر بازو، با حداقل 3 ردیابی در هر بازو، دقت همیشه برابر یا بیشتر از 91٪ است و بهترین دقت 96٪ با حداقل 5 مسیر به دست می آید ( شکل 12 ج).
در مجموعه داده شیکاگو، همین نتیجه با دو مجموعه داده دیگر نیز مشاهده می شود. استفاده از تعداد معینی مسیر در هر بازو، دقت طبقه‌بندی کمتری نسبت به زمانی که تمام مسیرهای موجود استفاده می‌شود، می‌دهد ( شکل 13 ب در مقابل شکل 12 ب). با این حال، تنها با 3 مسیر مستقیم در هر بازو، دقت همیشه برابر یا بیشتر از 85٪ و تنها با 4 مسیر مستقیم برابر یا بیشتر از 86٪ است ( شکل 13 ب).
بنابراین، برای محاسبه ویژگی، حذف تعداد مسیرها به یک عدد معین، بر عملکرد طبقه‌بندی تأثیر منفی می‌گذارد. با این حال، با تنها 3 مسیر مستقیم در هر بازوی اتصال، دقت طبقه بندی برابر یا بیشتر از 85٪ در تمام مجموعه داده ها است (85٪ در شیکاگو، 89٪ در هانوفر، و 92٪ در Champaign). علاوه بر این، تنها با 5 مسیر مستقیم، دقت برابر یا بیشتر از 90٪ است (90٪ در شیکاگو و 92٪ در Champaign و Hanover).

3.5. استفاده از قوانین دانش دامنه

جدول 8 گزارش طبقه بندی را پس از اعمال بررسی قواعد دانش دامنه، همانطور که در بخش 2.3 توضیح داده شده است، نشان می دهد . شکل 14 همچنین ماتریس های سردرگمی را به همراه نمودارهای FPR/TPR برای سه مجموعه داده نشان می دهد. اولین مشاهدات جدول 8 این است که دقت در Champaign و Hanover 1٪ (از 96٪ به 97٪) و 3٪ در شیکاگو (از 92٪ به 94٪) افزایش می یابد. علاوه بر این، با مقایسه تعداد پیش بینی ها (مقایسه ستون پشتیبانی در جدول 5 و جدول 8)، می‌توانیم ببینیم که در Champaign 315 پیش‌بینی از بازوهایی با داده‌های از دست رفته داریم، به این معنی که نه تنها پیش‌بینی‌هایی انجام شده است که برابر با 50 درصد مجموعه داده اصلی بدون داده است (داده‌های اصلی: 633 بازو)، بلکه این پیش‌بینی‌ها درست هستند (دقت به 1 درصد افزایش یافته است). در شیکاگو، 47 پیش‌بینی در مورد سلاح‌هایی با داده‌های گمشده انجام شد که مربوط به 30.5 درصد از مجموعه داده اصلی است. به طور مشابه، در هانوفر، 152 تنظیم کننده از بازوهایی با داده های مفقود پیش بینی شد، که مربوط به 27٪ از مجموعه داده اصلی است.
از نظر FPRها، در Champaign، FPRها برای UN، SS، و TS به ترتیب: 3.6٪، 1.2٪، 0.7٪، و در شیکاگو 1.3٪، 1.9٪ و 6.5٪ است. در هانوفر FPR برای UN، SS و TS 1.3٪، 2٪ و 0.5٪ است. در مقایسه با FPRهای شکل 11 ، در Champaign، FPR برای سازمان ملل از 9٪ به 3.6٪ (60٪ کاهش)، در شیکاگو FPR برای TS از 7.7٪ به 6.5٪ (15.6٪) و برای SS از کاهش یافت. 3.2٪ به 1.8٪ (44٪ کاهش)، و در هانوفر FPR برای PS از 4.8٪ به 2٪ (58.3٪ کاهش) کاهش یافت. علاوه بر این، میانگین FPR (TPR) در کلاس های تنظیم کننده در Champaign از 3.5٪ (90.5٪) به 1.8٪ (96٪)، در شیکاگو از 4.3٪ (90.5٪) به 3.2٪ (93.2٪) کاهش می یابد (افزایش می یابد) در هانوفر از 2.6% (95.3%) به 1.3% (97.5%).
بنابراین، با اعمال قوانین دانش دامنه، افزایش دقت بین 1٪ تا 3٪ وجود دارد، اما مهمتر از آن، پیش بینی های دقیقی برای بازوهایی با داده های ناقص مربوط به 27-50٪ از داده های اصلی است. علاوه بر این، FPR کلاس با بالاترین FPR بین 15.6٪ و 60٪ کاهش می یابد (15.6٪ در شیکاگو، 60٪ در Champaign، و 58.3٪ در هانوفر)، تأیید پیشنهاد ما برای استفاده از قوانین دانش دامنه برای بازیابی سلاح های طبقه بندی نادرست و پیش بینی تنظیم کننده ها برای تسلیحات بدون داده

4. بحث

یافته های اصلی این مقاله پژوهشی به شرح زیر است:
1.
روش تشخیص قوانین ترافیک پیشنهاد شده در این مقاله، که داده‌های مسیرها و OSM را ترکیب می‌کند، می‌تواند نتایج دقیقی را برای مجموعه قوانین متشکل از تقاطع‌های کنترل‌شده UN، SS، PS و UN ارائه دهد: دقت 97% در Champaign و Hanover و 95% در مجموعه داده های کوچکتر شیکاگو.
2.
گنجاندن اطلاعات در بردار ویژگی از بازوهای تقاطع زمینه برای طبقه‌بندی مفید بود: مدل‌های همه‌بازویی بهتر از مدل‌های تک بازویی عمل کردند.
3.
نرخ نمونه برداری می تواند بر عملکرد طبقه بندی تأثیر بگذارد. مقدار کم هم بر مقادیر سرعت محاسبه شده از ردیابی GPS و هم بر قسمت های توقف و کاهش سرعت شناسایی شده تأثیر می گذارد. دقت مدل ترکیبی تمام استاتیک بین 1٪ و 2٪ کاهش یافت که فاصله نمونه برداری از 2 ثانیه به 4 ثانیه دو برابر شد.
4.
اثر منفی بر دقت، همانطور که توسط دو مجموعه داده بزرگتر تایید شده است، زمانی که از هر دو مسیر مستقیم و منحنی استفاده می شود، بین 1٪ و 3٪ بود. بنابراین، حذف مسیرهای منحنی تأثیر مثبتی بر عملکرد طبقه‌بندی دارد.
5.
تعداد بهینه مسیرهای مستقیم پنج است.
6.
حذف تعداد آهنگ ها به تعداد معینی بر عملکرد طبقه بندی تأثیر منفی می گذارد. با این حال، با تنها سه مسیر مستقیم در هر بازوی اتصال، دقت طبقه‌بندی در تمام مجموعه‌های داده برابر یا بیشتر از 85٪ است (85٪ در شیکاگو، 89٪ در هانوفر، و 92٪ در Champaign). تنها با پنج مسیر مستقیم، دقت برابر یا بیشتر از 90٪ است (90٪ در شیکاگو و 92٪ در Champaign و Hanover).
7.
با اعمال قوانین دانش دامنه، افزایش دقت بین 1% تا 3% وجود دارد، اما مهمتر از آن، پیش‌بینی‌های دقیقی برای سلاح‌های بدون داده می‌توان انجام داد که مربوط به 27 تا 50% داده‌های اصلی است. علاوه بر این، FPR کلاس با بالاترین FPR بین 15.6٪ تا 60٪ کاهش می یابد، بنابراین پیشنهاد ما برای استفاده از قوانین دانش دامنه هم برای بازیابی بازوهای طبقه بندی اشتباه و هم برای پیش بینی تنظیم کننده ها از بازوهای بدون داده، تأیید می شود.
به نظر ما جالب‌تر است که این مطالعه را به این موضوع بسط دهیم که چگونه طبقه‌بندی می‌تواند قوانین را با دقت بالا در داده‌های برچسب‌گذاری شده محدود پیش‌بینی کند. همانطور که در  بخش 2.1 بحث شد ، برچسب‌گذاری تقاطع‌ها یک کار زمان‌بر است، و اگرچه مجموعه داده‌های مسیر زیادی وجود دارد که می‌توان برای TRR از آنها استفاده کرد، نیاز به داده‌های برچسب‌گذاری شده برای آموزش و آزمایش، دومی را برای این منظور نامناسب می‌کند. یک ایده این است که روش‌های بدون نظارت را که در آن به داده‌های برچسب‌گذاری شده نیاز نیست، کاوش کنیم. ایده دوم این است که روش‌های نیمه‌نظارت‌شده را بررسی کنیم، مانند انتشار برچسب و خودآموزی، که در آن تنها داده‌های برچسب‌گذاری شده محدودی برای آموزش یک طبقه‌بندی‌کننده استفاده می‌شود. ایده سوم بررسی امکان انتقال یادگیری از یک شهر به شهر دیگر است، به عنوان مثال، آموزش یک طبقه‌بندی کننده با داده‌های برچسب‌گذاری شده از یک شهر X.و آزمایش در یک شهر Y ، با فرض اینکه داده های برچسب گذاری شده ای از شهر دوم وجود ندارد.
علاوه بر این، یک جنبه مهم از مشکلی که باید در نظر گرفته شود این است که آیا رویکرد پیشنهادی در شهرهای کوچکتر که رفتار رانندگی تحت تأثیر عواملی غیر از مقررات راهنمایی و رانندگی است، به همان اندازه خوب عمل می کند، به عنوان مثال، عابران پیاده که با علم به اینکه وسایل نقلیه در حال حرکت هستند. سرعت کم، تقاطع ها آزادانه تر.
علاوه بر این، آزمایش عملکرد مدل هیبریدی پیشنهادی با داده های OSM از دست رفته جالب خواهد بود. در سه مجموعه داده ای که ما آزمایش کردیم، اغلب داده های مربوط به سرعت در OSM وجود نداشت، اما عملکرد بالا باقی ماند. جالب است که بررسی کنیم که تحت چه شرایطی عملکرد داده های از دست رفته تا حدی تحت تأثیر قرار می گیرد که، برای مثال، مدل پویا نسبت به مدل ترکیبی ارجحیت دارد.
موضوع جالب دیگر برای بررسی این است که آیا تعداد مسیرهای مورد نیاز بین مکان‌هایی که توسط یک مقررات کنترل می‌شوند متفاوت است یا خیر. به عنوان مثال، تعداد مسیرهای مورد نیاز برای تقاطع هایی که توسط سیگنال توقف تنظیم می شوند، چه تغییری دارد؟ چنین تحلیلی را می توان با یافتن حداقل تعداد مسیرهای مورد نیاز که تنظیم را با احتمال زیاد در سطح بازوی تقاطع پیش بینی می کند (به طور جداگانه برای هر بازو) و سپس یافتن تغییر در تعداد مسیرها در بازوهای تقاطع همان مقررات انجام داد. در این مقاله، با اعمال تحلیل یکسان برای همه ، حداقل تعداد مسیرها (پنج) را پیدا کردیمبازوها، بدون یافتن تعداد بهینه مسیر در هر بازوی تقاطع. با این تحلیل توصیه شده، می‌توانیم ویژگی‌های تقاطع را شناسایی کنیم که مکان‌های خاص (و شاید کلاس‌هایی از مقررات) را با توجه به کنترل ترافیک آنها آسان‌تر طبقه‌بندی می‌کنند.
در نهایت، روشی که در آن تغییرپذیری چگالی مسیر بر طبقه‌بندی تأثیر می‌گذارد، یکی دیگر از پارامترهای مشکل TRR است که مستحق بررسی بیشتر است. از آنجایی که همه تقاطع‌ها ترافیک یکسانی را جذب نمی‌کنند، مجموعه داده‌ها نامنظم هستند، به عنوان مثال، یک بخش از شهر از ده‌ها مسیر و بخش‌های دیگر فقط از چند مسیر نمونه‌برداری می‌شود. این جنبه در حال حاضر هنگام تقسیم مجموعه داده ها به مجموعه های آموزشی و آزمایشی در نظر گرفته نمی شود. شاید تقسیم مجموعه داده با در نظر گرفتن این جنبه نتایج بهتری ارائه دهد.
در نتیجه، این مطالعه اهمیت استفاده از اطلاعات کم‌هزینه و کم‌هزینه را برای شناسایی تنظیم‌کننده‌های ترافیکی نشان می‌دهد که در صورت استفاده از فناوری استاندارد برای نقشه‌برداری، هزینه آن از نظر زمان و هزینه بسیار بیشتر است. مسیرها می توانند الگوهای حرکتی رانندگان را آشکار کنند، و فرضیه ما مبنی بر اینکه قوانین راهنمایی و رانندگی را می توان به روش مهندسی معکوس با استخراج الگوهای حرکتی اعمال شده توسط قوانین راهنمایی و رانندگی بازیابی کرد، تأیید شده است. توانایی پیش‌بینی طبقه‌بندی‌کننده زمانی دقیق‌تر می‌شود که اطلاعات استاتیک از شبکه جاده (OSM) با ویژگی‌های دینامیکی استخراج‌شده از مسیرها ادغام شود. این یافته ایده جمع سپاری قوانین ترافیکی بیشتری را ایجاد می کند که می توانند به نقشه ها اضافه شوند و توسط برنامه های کاربردی آگاه از مکان مورد سوء استفاده قرار گیرند.48 ] یک قدم فراتر از خدمات ناوبری شخصی و مسیریابی موجود بروید و ایده ارائه پیشنهادات مسیریابی به رانندگانی را که از گذرگاه‌های پیچیده اجتناب می‌کنند پیشنهاد کنید.در مناطق شهری یک گذرگاه پیچیده می تواند تقاطعی باشد که در آن شبکه جاده با خطوط دوچرخه و مسیرهای تراموا قطع می شود. به طور مشابه، یک گذرگاه پیچیده ممکن است یک پیچ به چپ در یک تقاطع باشد که توسط چراغ راهنمایی کنترل نمی شود. برعکس، یک تقاطع آسان ممکن است یک تقاطع کنترل شده با علامت توقف در همه جا باشد. چنین توصیه هایی ممکن است برای رانندگان بی تجربه یا رانندگانی که به هر دلیلی رانندگی راحت در محیط شهری ندارند مفید باشد. کنترل‌های ترافیک همچنین می‌توانند در زمینه پیچیدگی تقاطع بررسی شوند و در ارزیابی پیچیدگی تقاطع برای توصیه‌های مسیر شخصی‌سازی شده گنجانده شوند. بنابراین، نتایج این مطالعه می تواند برای تحقیقات بیشتر با هدف بهره مندی شهروندان شهرهای هوشمند دلگرم کننده باشد.

5. نتیجه گیری ها

در این مقاله، روش جدیدی برای شناسایی مقررات ترافیکی از مسیرهای GPS پیشنهاد شده است. اصلاحی از یک الگوریتم خوشه‌بندی معروف برای تشخیص رویدادهای توقف و کاهش سرعت ارائه شد. با شناسایی چنین رویدادهای رانندگی، تقاطع‌ها را به چهار کلاس ترافیکی دسته‌بندی می‌کنیم که همراه با سایر مقادیر آماری رویدادهای شناسایی‌شده و میانگین سرعت عبور وسیله نقلیه در این مکان‌ها، رفتار رانندگی در مکان‌های تنظیم‌شده را توصیف می‌کنند ( مدل طبقه‌بندی پویا ). اختلاط در مدل پویا ویژگی های استاتیک استخراج شده از OSM ( مدل استاتیک )، منجر به ترکیبی می شود.مدلی که نشان داده شد عملکرد طبقه بندی بهتری نسبت به دو مدل دیگر دارد. برای هر یک از سه مدل، دو نوع بردار ویژگی مورد آزمایش قرار گرفت، یکی که در آن فقط ویژگی‌های مرتبط با یک بازوی اتصال واحد استفاده می‌شود ( مدل یک بازویی ) و دیگری که در آن ویژگی‌های بازوهای اتصال همسایه همان اتصال برای طبقه‌بندی استفاده می‌شوند. یک بازو ( تمام بازومدل). مدل ترکیبی همه‌بازویی بهترین دقت طبقه‌بندی را در سه مجموعه داده مورد استفاده برای آزمایش روش، 94 درصد در کوچک‌ترین مجموعه داده و 97 درصد در دو مجموعه داده دیگر ارائه کرد. حداقل تعداد بهینه مسیرهای عبور از تقاطع ها پنج (مسیر مستقیم) بدست آمد. حذف مسیرهای منحنی از محاسبه ویژگی تأثیر مثبتی بر عملکرد طبقه‌بندی دارد. در نهایت، با اعمال مجموعه‌ای از قوانین دانش دامنه برای برچسب‌های پیش‌بینی‌شده، ما توانستیم هم بازوهای تقاطع طبقه‌بندی‌شده اشتباه را بازیابی کنیم و هم برچسب‌ها را از بازوهای بدون داده، که مربوط به 27 تا 50 درصد از مجموعه داده اصلی است، پیش‌بینی کنیم، در حالی که دقت طبقه‌بندی را بیشتر افزایش دادیم. 1-3٪. جهت‌های پژوهشی جدید بر اساس محدودیت‌های مطالعه پیشنهاد شد و در مورد ایده‌هایی که می‌تواند این موضوعات را بهتر روشن کند، بحث کرد.
این مقاله برای اهداف اطلاعاتی توسط تیم‌هایی از محققان از موسسات مختلف شناسایی شده در بالا، از جمله گروه تحقیقات کاربردی فناوری جهانی JPMorgan Chase Bank، NA تهیه شده است. وابسته ها نه JPMorgan Chase Bank، NA و نه هیچ یک از شرکت های وابسته به آن هیچ گونه ضمانت نامه یا ضمانت صریح یا ضمنی ارائه نمی کنند و هیچ یک از آنها هیچ مسئولیتی را در رابطه با این مقاله نمی پذیرند، از جمله، اما محدود به، کامل بودن، دقت، قابلیت اطمینان اطلاعات مندرج در اینجا و اثرات بالقوه قانونی، انطباق، مالیات یا حسابداری آن.

اختصارات

    در این نسخه از اختصارات زیر استفاده شده است:

TRR تشخیص مقررات ترافیکی
OSM نقشه خیابان باز
جی پی اس سیستم موقعیت یاب جهانی
SC جمع سپاری فضایی
CC جمع سپاری
DLSTM حافظه کوتاه مدت توزیع شده
ROC ویژگی عملکرد گیرنده
AUC ناحیه زیر منحنی ROC
CVAE رمزگذار خودکار متغیر مشروط
TRR تشخیص تنظیم کننده ترافیک
TS علائم راهنمایی و رانندگی
اس اس نشانه توقف، ایست
PS علامت اولویت
YS علامت بازده
RF جنگل تصادفی
گیگابایت افزایش گرادیان
FPR نرخ مثبت کاذب
TPR نرخ مثبت واقعی

پیوست اول

Ijgi 12 00004 i002aIjgi 12 00004 i002b

منابع

  1. Goodchild، M. شهروندان به عنوان حسگرها: دنیای جغرافیای داوطلبانه. ژئوژورنال 2007 ، 69 ، 211-221. [ Google Scholar ] [ CrossRef ]
  2. گممیدی، SRB; Xie، X. Pedersen, TB A Survey of Spatial Crowdsourcing. ACM Trans. سیستم پایگاه داده 2019 ، 44 ، 8. [ Google Scholar ] [ CrossRef ]
  3. هیپک، سی. داده‌های جغرافیایی جمع‌سپاری. ISPRS J. Photogramm. Remote Sens. 2010 , 65 , 550-557. [ Google Scholar ] [ CrossRef ]
  4. تانگ، جی. دنگ، م. هوانگ، جی. لیو، اچ. Chen, X. یک روش خودکار برای تشخیص و به روز رسانی تغییرات افزودنی در شبکه جاده با داده های مسیر GPS. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 411. [ Google Scholar ] [ CrossRef ]
  5. شان، ز. وو، اچ. سان، دبلیو. ژنگ، بی. COBWEB: یک سیستم به روز رسانی نقشه قوی با استفاده از مسیرهای GPS. در مجموعه مقالات کنفرانس مشترک بین المللی ACM در سال 2015 در محاسبات فراگیر و همه جا ؛ UbiComp’15; انجمن ماشین‌های محاسباتی: نیویورک، نیویورک، ایالات متحده آمریکا، 2015. ص 927-937. [ Google Scholar ] [ CrossRef ]
  6. فاکس، ا. کومار، BV; چن، جی. Bai, F. تشخیص چاله چند لاین از داده‌های حسگر خودروی نمونه‌برداری نشده جمع‌آوری‌شده. IEEE Trans. اوباش محاسبه کنید. 2017 ، 16 ، 3417-3430. [ Google Scholar ] [ CrossRef ]
  7. دستمزد، او. Sester، M. برآورد مشترک ناهمواری جاده از اندازه‌گیری‌های شتاب دوچرخه با منبع جمعیت. ISPRS Ann. فتوگرام از راه دور. حس اسپات. Inf. علمی 2021 ، V-4-2021 ، 89-96. [ Google Scholar ] [ CrossRef ]
  8. ویج، دی. Aggarwal، N. تشخیص وضعیت ترافیک مبتنی بر تلفن هوشمند با استفاده از تجزیه و تحلیل صوتی و جمع سپاری. Appl. آکوست. 2018 ، 138 ، 80-91. [ Google Scholar ] [ CrossRef ]
  9. مینسون، SE; بروکس، کارشناسی; گلنی، CL; موری، جی آر؛ Langbein، JO; اوون، SE; هیتون، TH; ایانوچی، RA; هشدار اولیه زلزله Hauser, DL Crowdsourced. علمی Adv. 2015 ، 1 ، 36. [ Google Scholar ] [ CrossRef ]
  10. سالپیترو، آر. بدوگنی، ال. دی فلیس، م. بونونی، ال. پارک اینجا! یک سیستم پارک هوشمند مبتنی بر حسگرهای تعبیه‌شده در گوشی‌های هوشمند و فناوری‌های ارتباطی کوتاه برد. در مجموعه مقالات دومین انجمن جهانی اینترنت اشیا (WF-IoT) IEEE 2015، میلان، ایتالیا، 14 تا 16 دسامبر 2015؛ ص 18-23. [ Google Scholar ]
  11. ژو، ایکس. Zhang, L. توابع جمع سپاری شهر زنده از داده های توییتر و Foursquare. کارتوگر. Geogr. Inf. علمی 2016 ، 43 ، 393-404. [ Google Scholar ] [ CrossRef ]
  12. گائو، آر. سان، اف. زینگ، دبلیو. تائو، دی. نیش، جی. Chai, H. CTTE: تخمین زمان سفر سفارشی از طریق Crowdsensing موبایل. IEEE Trans. هوشمند ترانسپ سیستم 2022 ، 23 ، 19335-19347. [ Google Scholar ] [ CrossRef ]
  13. لوفور، اس. لوژیر، سی. ایبانز-گوزمن، جی. Bessiere, P. مدل‌سازی صحنه‌های پویا در تقاطع‌های جاده‌ای بدون علامت. Inria Res. Rep. 2011 , RR-7604 . [ Google Scholar ]
  14. لفور، اس. لاژیر، سی. Ibanez-Guzmán، J. ارزیابی ریسک در تقاطع های جاده ای: مقایسه قصد و انتظار. در مجموعه مقالات سمپوزیوم وسایل نقلیه هوشمند (IV)، 2012 IEEE، مادرید، اسپانیا، 3 تا 7 ژوئن 2012. صص 165-171. [ Google Scholar ] [ CrossRef ]
  15. الشائب، س. استوانوویچ، آ. Effinger، JR بررسی اثرات شرایط عملیاتی مختلف بر مصرف سوخت و جریمه توقف در تقاطع‌های علامت‌دار. بین المللی J. Transp. علمی تکنولوژی 2021 ، 11 ، 690-710. [ Google Scholar ] [ CrossRef ]
  16. گستالدی، م. منگوزر، سی. روسی، آر. لوسیا، LD; Gecchele، G. ارزیابی اثرات آلودگی هوا یک کنترل سیگنال به تبدیل گردشی با استفاده از میکرو شبیه‌سازی. ترانسپ Res. Procedia 2014 ، 3 ، 1031-1040. [ Google Scholar ] [ CrossRef ]
  17. مشارکت کنندگان OpenStreetMap. 2020. در دسترس آنلاین: https://www.openstreetmap.org (در 17 اوت 2020 قابل دسترسی است).
  18. Mapscape. به روز رسانی افزایشی در دسترس آنلاین: https://www.mapscape.eu/telematics/incremental-updating.html (در 14 اوت 2019 قابل دسترسی است).
  19. زورلیدو، س. Sester, M. Traffic Regulator Detection and Identification from Crowdsourced Data-A Systematic Literature Review. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 491. [ Google Scholar ] [ CrossRef ]
  20. هوانگ، اس. لین، اچ. چانگ، سی. یک سیستم دوربین داخل خودرو برای تشخیص و تشخیص علائم راهنمایی و رانندگی. در مجموعه مقالات 2017 هفدهمین کنگره جهانی مشترک انجمن بین المللی سیستم های فازی و نهمین کنفرانس بین المللی محاسبات نرم و سیستم های هوشمند (IFSA-SCIS)، اوتسو، ژاپن، 27 تا 30 ژوئن 2017؛ صص 1-6. [ Google Scholar ]
  21. آردیانتو، اس. چن، سی. Hang, H. تشخیص علائم ترافیکی در زمان واقعی با استفاده از تقسیم بندی رنگ و SVM. در مجموعه مقالات کنفرانس بین المللی 2017 سیستم ها، سیگنال ها و پردازش تصویر (IWSSIP)، پوزنان، لهستان، 22 تا 24 مه 2017؛ صص 1-5. [ Google Scholar ]
  22. کوسونن، م. هنتونن، کی. جمعیت را تشویق کنید؟ تسهیل مشارکت کاربران در جمع سپاری ایده. بین المللی جی. تکنول. علامت. 2015 ، 10 ، 95-110. [ Google Scholar ] [ CrossRef ]
  23. بلالی، وی. گلپرور فرد، م. ارزیابی روش‌های تشخیص و طبقه‌بندی علائم ترافیکی چند طبقه برای مدیریت فهرست دارایی‌های جاده‌ای ایالات متحده. جی. کامپیوتر. مدنی مهندس 2016 , 30 , 04015022. [ Google Scholar ] [ CrossRef ]
  24. هو، اس. سو، ال. لیو، اچ. وانگ، اچ. عبدالظاهر، TF SmartRoad: سنجش جمعیت مبتنی بر گوشی هوشمند برای تشخیص و شناسایی تنظیم کننده ترافیک. ACM Trans. سناتور Netw. 2015 ، 11 ، 55:1-55:27. [ Google Scholar ] [ CrossRef ]
  25. مری، ک. Bettinger، P. مطالعه دقت GPS گوشی هوشمند در یک محیط شهری. PLoS ONE 2019 , 14 , e219890. [ Google Scholar ] [ CrossRef ]
  26. صارمی، ف. عبدالظاهر، TF ترکیب استنتاج مبتنی بر نقشه و سنجش جمعیت برای تشخیص تنظیم کننده های ترافیک. در مجموعه مقالات دوازدهمین کنفرانس بین المللی IEEE 2015 در مورد سیستم های حسگر و Ad Hoc موبایل، دالاس، TX، ایالات متحده، 19 تا 22 اکتبر 2015؛ صص 145-153. [ Google Scholar ]
  27. گلزه، ج. زورلیدو، س. Sester، M. تشخیص تنظیم کننده ترافیک با استفاده از مسیرهای GPS. جی. کارتوگر. Geogr. Inf. 2020 ، 70 ، 95-105. [ Google Scholar ] [ CrossRef ]
  28. منروکس، ی. گیلچر، آ. سنت پیر، جی. حامد، م. موستیره، اس. Orfila, O. تشخیص سیگنال ترافیک از پروفایل های سرعت GPS داخل خودرو با استفاده از تجزیه و تحلیل داده های عملکردی و یادگیری ماشین. بین المللی J. Data Sci. مقعدی 2020 ، 10 ، 101-119. [ Google Scholar ] [ CrossRef ]
  29. چنگ، اچ. زورلیدو، س. Sester, M. Traffic Control Recognition with Speed-Profiles: A Deep Learning Approach. ISPRS Int. J. Geo-Inf. 2020 ، 9 ، 652. [ Google Scholar ] [ CrossRef ]
  30. لیائو، ز. شیائو، اچ. لیو، اس. لیو، ی. یی، الف. ارزیابی تاثیر چراغ های راهنمایی از طریق مسیرهای وسیله نقلیه GPS. ISPRS Int. J. Geo-Inf. 2021 ، 10 ، 769. [ Google Scholar ] [ CrossRef ]
  31. زورلیدو، س. گلزه، ج. Sester, M. [Dataset] مجموعه داده مسیر GPS منطقه هانوفر، آلمان ; Institut für Kartographie und Geoinformatik: هانوفر، آلمان، 2022. [ Google Scholar ] [ CrossRef ]
  32. زورلیدو، س. گلزه، ج. Sester, M. [Dataset] Traffic Regulator Ground-truth Information of the City of Hannover, Germany ; Institut für Kartographie und Geoinformatik: هانوفر، آلمان، 2022. [ Google Scholar ] [ CrossRef ]
  33. احمد، م. کاراگیورگو، اس. Pfoser، D.; Wenk, C. مقایسه و ارزیابی الگوریتم‌های ساخت نقشه با استفاده از داده‌های ردیابی خودرو. GeoInformatica 2015 ، 19 ، 601-632. [ Google Scholar ] [ CrossRef ]
  34. زورلیدو، س. گلزه، ج. Sester, M. [Dataset] Traffic Regulator Ground-Truth Information for Chicago Trajectory Dataset ; Institut für Kartographie und Geoinformatik: هانوفر، آلمان، 2022. [ Google Scholar ] [ CrossRef ]
  35. داده های طبیعی LM ; انتشارات SAGE: Thousand Oaks, CA, USA, 2008; پ. 547. [ Google Scholar ] [ CrossRef ]
  36. نقشه کشی. Mapillary: یک پلت فرم تصویربرداری در سطح خیابان. 2022. در دسترس آنلاین: https://www.mapillary.com/ (دسترسی در 20 آوریل 2022).
  37. پالما، AT; بوگورنی، وی. کویجپرز، بی. Alvares, LO رویکردی مبتنی بر خوشه برای کشف مکان‌های جالب در مسیرها. در مجموعه مقالات سمپوزیوم ACM در سال 2008 در محاسبات کاربردی . SAC’08; ACM: نیویورک، نیویورک، ایالات متحده آمریکا، 2008; صص 863-868. [ Google Scholar ] [ CrossRef ]
  38. کومیتو، سی. فالکون، دی. تالیا، دی. استخراج الگوهای تحرک انسانی از داده های برچسب گذاری شده جغرافیایی اجتماعی. اوباش فراگیر. محاسبه کنید. 2016 ، 33 ، 91-107. [ Google Scholar ] [ CrossRef ]
  39. نیو، ایکس. وانگ، اس. Wu، CQ; لی، ی. وو، پی. ژو، جی. روی یک رویکرد کاوی مبتنی بر خوشه‌بندی با معناشناسی برچسب‌گذاری شده برای کشف مکان مهم. Inf. علمی 2021 ، 578 ، 37-63. [ Google Scholar ] [ CrossRef ]
  40. اسپاکاپیترا، اس. پدر و مادر، سی. دامیانی، ام.ال. de Macedo، JA; پورتو، اف. وانگنوت، سی. دیدگاه مفهومی در مسیرها. دانستن داده ها مهندس 2008 ، 65 ، 126-146. [ Google Scholar ] [ CrossRef ]
  41. کانگ، جی اچ. ولبورن، دبلیو. استوارت، بی. Borriello, G. استخراج مکان ها از ردیابی مکان ها. در مجموعه مقالات دومین کارگاه بین المللی ACM در مورد برنامه ها و خدمات تلفن همراه بی سیم در نقاط اتصال WLAN. WMASH’04. ACM: نیویورک، نیویورک، ایالات متحده آمریکا، 2004; صص 110-118. [ Google Scholar ] [ CrossRef ]
  42. فوئرهاک، یو. کونتزش، سی. Sester, M. یافتن مکان های جالب و الگوهای مشخصه در مسیرهای مکانی-زمانی. در مجموعه مقالات هشتمین سمپوزیوم بین المللی خدمات مکان محور ; Forschungsgruppe Kartographie: وین، اتریش، 2011. [ Google Scholar ]
  43. وو، تی. شن، اچ. کوین، جی. Xiang، L. استخراج توقف ها از مسیرهای مکانی-زمانی در ویژگی های متنی پویا. پایداری 2021 ، 13 ، 690. [ Google Scholar ] [ CrossRef ]
  44. استر، ام. کریگل، اچ پی؛ ساندر، جی. Xu, X. الگوریتم مبتنی بر چگالی برای کشف خوشه‌ها در پایگاه‌های داده فضایی بزرگ با نویز. در مجموعه مقالات دومین کنفرانس بین المللی کشف دانش و داده کاوی (KDD ’96)، پورتلند، اورگان، 2 تا 4 اوت 1996. صص 226-231. [ Google Scholar ]
  45. تانگ، ال. کان، ز. ژانگ، ایکس. یانگ، ایکس. هوانگ، اف. لی، کیو. تخمین زمان سفر در تقاطع ها بر اساس داده های بزرگ مسیر GPS مکانی-زمانی فرکانس پایین. کارتوگر. Geogr. Inf. علمی 2016 ، 43 ، 417-426. [ Google Scholar ] [ CrossRef ]
  46. کاریسی، ر. جووردانو، ای. پائو، جی. Gerla، M. افزایش در نقشه های دیجیتال خودرو از طریق جمع سپاری GPS. در مجموعه مقالات هشتمین کنفرانس بین‌المللی 2011 در مورد سیستم‌ها و خدمات شبکه بی‌سیم بر اساس تقاضا، باردونکیا، ایتالیا، 26-28 ژانویه 2011. ص 27-34. [ Google Scholar ] [ CrossRef ]
  47. پایتون XGBoost. کتابخانه پایتون XGBoost. 2022. در دسترس آنلاین: https://xgboost.readthedocs.io/en/stable/python/index.html (در 15 فوریه 2022 قابل دسترسی است).
  48. کریسپ، جی.ام. کلر، A. مسیرهای محاسباتی ناوبری اتومبیل که از عبور و مرور پیچیده جلوگیری می کنند. بین المللی جی. جئوگر. Inf. علمی 2015 ، 29 ، 1988-2000. [ Google Scholar ] [ CrossRef ]
شکل 1. طبقه بندی روش ها برای تشخیص تنظیم ترافیک از داده های GPS جمع آوری شده.
شکل 2. این شکل ها بازوهای تقاطع یک تقاطع سه راه ( a ) و یک چهار راه ( b ) را نشان می دهند.
شکل 3. سه مجموعه داده ای که در این مطالعه استفاده شده است.
شکل 4. رویدادهای توقف (نقاط قرمز) شناسایی شده از الگوریتم CB-SDoT در مسیرهای خودرو (خطوط آبی).
شکل 5. چهار الگوی حرکتی که عبور وسیله نقلیه از بازوی اتصال را توصیف می کند.
شکل 6. چهار الگوی حرکتی که عبور وسیله نقلیه از یک تقاطع را توصیف می کند: ( الف ) عبور بدون مانع، ( ب ) کاهش سرعت (خط نقطه چین) بدون توقف، ( ج ) یک بار توقف (نقطه قرمز)، و ( د ) توقف بیش از یک بار (در اینجا دو رویداد توقف با دو نقطه قرمز نشان داده شده است).
شکل 7. مراحل روش پیشنهادی برای تشخیص تنظیم ترافیک از مسیرهای GPS.
شکل 8. هر تقاطع (نقاط زرد) از بازوهای تقاطع تشکیل شده است که آن را به تقاطع های نزدیک (خطوط سفید) متصل می کند. ویژگی‌های طبقه‌بندی در هر بازو، در نیمی از فاصله‌ای از بخش جاده محاسبه می‌شوند که بازوی فعلی را به بازویی که قبلاً توسط مسیر بازدید شده است، متصل می‌کند (فلش‌های نقطه‌دار قرمز در ( a )). برای هر خط سیر (خطوط سیاه) در ( b ) که از بازوی تقاطع j-arm از غرب به شرق عبور می کند، رویدادهای توقف و کاهش سرعت در ناحیه نارنجی نشان داده شده در امتداد j-arm محاسبه می شوند.
شکل 9. تصویری از ویژگی های مربوط به فاصله مدل استاتیک در امتداد تقاطع شمالی-جنوبی یک تقاطع چهار طرفه (با رنگ قرمز نشان داده شده است).
شکل 10. اهمیت ویژگی برای سه مجموعه داده.
شکل 11. ماتریس های سردرگمی و نرخ های مثبت کاذب/درست برای سه مجموعه داده.
شکل 12. آزمایشات با تنظیمات مختلف چرخش (s_: مسیرهای مستقیم، r_: مسیرهای گردش به راست، l_: گردش به چپ، s_r_: گردش مستقیم و راست، s_l_: گردش مستقیم و چپ، r_l_: گردش به راست و چپ، s_r_l: مستقیم، مسیر گردش به راست و چپ).
شکل 13. آزمایش‌هایی با تعداد مسیرهای مختلف که در آن ویژگی‌های طبقه‌بندی با استفاده از تعداد معینی از مسیرها، به عنوان مثال، 3، 4، …، و نه همه مسیرهای عبور موجود محاسبه می‌شوند.
شکل 14. ماتریس های سردرگمی و نرخ های مثبت کاذب/درست برای سه مجموعه داده پس از اعمال بررسی سازگاری با استفاده از قوانین دانش دامنه.

بدون دیدگاه

دیدگاهتان را بنویسید