پیش‌بینی مسیر خودرو برای سیستم‌های ترافیکی هوشمند (ITS) ضروری است، زیرا می‌تواند به وسایل نقلیه خودران کمک کند تا مسیری ایمن و کارآمد را برنامه‌ریزی کنند. با این حال، هنوز هم یک کار چالش برانگیز است زیرا مطالعات موجود عمدتاً بر تعاملات فضایی وسایل نقلیه مجاور بدون توجه به وابستگی‌های زمانی متمرکز شده‌اند. در این مقاله، ما یک مدل رمزگذار-رمزگشا LSTM توجه مکانی-زمانی (STAM-LSTM)برای پیش‌بینی مسیرهای وسیله نقلیه پیشنهاد می‌کنیم. به طور خاص، مکانیسم توجه فضایی برای گرفتن روابط فضایی بین وسایل نقلیه همسایه و سپس به دست آوردن ویژگی فضایی جهانی استفاده می شود. در همین حال، مکانیسم توجه زمانی برای تشخیص اثرات مراحل مختلف زمانی تاریخی بر پیش‌بینی مسیر آینده طراحی شده است. علاوه بر این، ویژگی حرکت وسایل نقلیه برای آشکار کردن تأثیر اطلاعات پویا بر پیش‌بینی مسیر وسیله نقلیه استخراج می‌شود و با ویژگی‌های فضایی محلی و جهانی ترکیب می‌شود تا ویژگی‌های یکپارچه وسیله نقلیه هدف را در هر لحظه تاریخی نشان دهد. آزمایش‌ها بر روی مجموعه داده‌های مسیر بزرگراه عمومی-US-101 و I-80 در NGSIM- انجام شد و نتایج نشان می‌دهد که مدل ما به عملکرد پیش‌بینی پیشرفته‌ای دست می‌یابد.

کلید واژه ها:

پیش بینی مسیر ; مکانیسم های توجه مکانی-زمانی ؛ رانندگی مستقل ؛ LSTM

1. مقدمه

در سال های اخیر، رانندگی خودمختار یک زمینه در حال ظهور و در حال توسعه بوده است. این امر مستلزم آن است که وسایل نقلیه خودران بتوانند رفتارهای خود را در زمان واقعی در محیط های مختلف ترافیکی تنظیم کنند، مانند تغییر خطوط و کاهش سرعت برای جلوگیری از خطرات برخورد. پیش‌بینی دقیق مسیر یک گام مهم برای برآوردن الزامات فوق است. این به خودروهای هوشمند کمک می کند تا عوامل اطراف خود را بهتر درک کنند و در گام بعدی اقدامات ایمن و مؤثر انجام دهند. به طور سنتی، کارهای اولیه بیشتر از یک مدل دینامیکی ساده برای تولید مسیرهای آینده بر اساس موقعیت، سرعت و شتاب وسیله نقلیه مورد نظر، مانند سرعت ثابت (CV) [ 1 ] و مبتنی بر فیلتر کالمن (KF) [ 2 ] استفاده می‌کردند.] مدل ها. با این حال، این رویکردها فقط برای پیش‌بینی مسیر کوتاه‌مدت و سناریوهای ترافیکی نسبتاً ساده مناسب هستند، زیرا عمدتاً بر اطلاعات تاریخی فردی هر وسیله نقلیه تمرکز می‌کنند و تعاملات اجتماعی پیچیده بین وسایل نقلیه را نادیده می‌گیرند.
از آنجایی که روش‌های مبتنی بر یادگیری ماشینی می‌توانند به طور موثر تعاملات را ضبط کنند و روابط غیرخطی را از داده‌های مسیر دنیای واقعی بیاموزند، بسیاری از مطالعات [ 3 ، 4 ] آنها را برای وظایف پیش‌بینی مسیر وسیله نقلیه به کار برده‌اند، و نتایج تجربی نشان داده‌اند که این روش‌ها در مقایسه با مدل‌های سنتی، عملکرد بهتری دارند. به عنوان مثال، تران و همکاران. [ 5 ] یک مدل رگرسیون فرآیند گاوسی سه بعدی را اعمال کرد [ 6] برای شناسایی مانورهای وسایل نقلیه و استفاده از روش مونت کارلو برای ایجاد مسیرهای آینده. با این حال، بیشتر این مدل‌ها به شدت به ویژگی‌های دست ساز متکی هستند، که هدف آن ثبت تعاملات بین خودروها در صحنه‌های مورد انتظار است. بنابراین، دقت پیش‌بینی در سناریوهای ترافیکی نامشخص به طور قابل‌توجهی کاهش می‌یابد.
با توسعه سریع یادگیری عمیق، توانایی استخراج خودکار ویژگی ها با یادگیری داده های فراوان می تواند مشکل فوق را حل کند. به طور خاص، حافظه بلند مدت کوتاه مدت (LSTM) [ 7 ] موفقیت زیادی در گرفتن وابستگی های دوربرد برای تولید توالی یا وظایف پیش بینی نشان داده است [ 8 ]. بنابراین، چندین مطالعه [ 9 ، 10 ] از LSTM به عنوان شبکه ستون فقرات برای پیش‌بینی مسیرهای آتی عوامل استفاده کرده‌اند. به عنوان مثال، اللهی و همکاران. [ 11 ] مدل Social-LSTM را برای تولید مسیرهای عابر پیاده در صحنه‌های شلوغ پیشنهاد کرد و از یک شبکه کاملاً متصل برای اشتراک‌گذاری اطلاعات از یک LSTM استفاده کرد. به طور مشابه، دیو و همکاران. [ 12] لایه ادغام اجتماعی کانولوشنی را برای ثبت تعاملات فضایی وسایل نقلیه اطراف معرفی کرد و مسیرهای آینده وسایل نقلیه مبتنی بر مانور را ایجاد کرد. با این حال، این مدل‌ها هنوز محدودیت‌هایی دارند، زیرا استراتژی ادغام توسط مجاورت فضایی عوامل محدود شده است. برای پرداختن به این موضوع، بسیاری از آثار [ 13 ، 14 ، 15 ] مکانیسم توجه را برای محاسبه اهمیت نسبی عوامل مجاور به کار گرفته اند. با این حال، این رویکردها عمدتاً به تعاملات فضایی بین عوامل در یک مرحله زمانی واحد می‌پردازند و وابستگی‌های زمانی بین این ویژگی‌های مکانی محلی در سراسر مسیرهای تاریخی نادیده گرفته می‌شوند.
در این مقاله، ما یک مدل رمزگذار-رمزگشا LSTM (STAM-LSTM) برای پیش‌بینی مسیر خودرو پیشنهاد می‌کنیم. در مقایسه با روش‌های موجود، مدل ما می‌تواند به طور موثر تعاملات مکانی-زمانی و ویژگی‌های حرکتی وسیله نقلیه هدف را به تصویر بکشد. از اطلاعات ویژگی های جامع هر مرحله زمانی گذشته در مرحله رمزگذاری استفاده می کند و به طور انتخابی از ویژگی های ارزشمند مسیرهای تاریخی برای تولید مسیرهای آینده در مرحله رمزگشایی استفاده می کند. آثار اصلی این مقاله را می توان به شرح زیر خلاصه کرد:
  • ما از مکانیزم توجه فضایی برای اندازه گیری روابط فضایی وسایل نقلیه مجاور و به دست آوردن ویژگی فضایی جهانی وسیله نقلیه هدف استفاده می کنیم.
  • ما یک مکانیسم توجه زمانی را برای تخصیص وزن‌های مختلف به خروجی‌های رمزگذار معرفی می‌کنیم، که می‌تواند تأثیرات نسبی لحظات مختلف تاریخی را بر پیش‌بینی مسیر آینده ثبت کند.
  • ویژگی حرکت با استفاده از اطلاعات سرعت و شتاب استخراج می شود. در همین حال، ما آن را با ویژگی‌های فضایی محلی و جهانی در یک نمایش ویژگی جامع از وسیله نقلیه هدف تجمیع می‌کنیم.
  • آزمایش‌های گسترده روی مجموعه داده‌های NGSIM نشان می‌دهد که مدل ما می‌تواند دقت پیش‌بینی مسیر خودرو را بهبود بخشد و به عملکرد پیشرفته‌ای در متریک RMSE دست یابد.
ادامه این مقاله به شرح زیر سازماندهی شده است. در بخش 2 ، برخی از آثار مرتبط بررسی و به تفصیل مورد بحث قرار گرفته است. مدل STAM-LSTM پیشنهادی ما در بخش 3 توضیح داده شده است . سپس، محتویات و نتایج آزمایشات در بخش 4 ارائه شده است. در نهایت، نتیجه گیری در بخش 5 ارائه شده است .

2. آثار مرتبط

2.1. روش‌های کلاسیک برای پیش‌بینی مسیر

روش‌های کلاسیک پیش‌بینی مسیر وسیله نقلیه را می‌توان تقریباً به مدل‌های مبتنی بر فیزیک و مدل‌های مبتنی بر مانور تقسیم کرد [ 16 ]. حالت اول معمولاً به ویژگی های فیزیکی و دینامیکی وسیله نقلیه هدف برای پیش بینی مسیرهای آینده مانند سرعت ثابت (CV)، شتاب ثابت (CA) و مبتنی بر فیلتر کالمن بستگی دارد [ 2 ].] مدل ها. اگرچه این مدل‌ها برای پیش‌بینی مسیر کوتاه‌مدت (مثلاً کمتر از یک ثانیه) مناسب هستند، اما ممکن است در پیش‌بینی مسیرهای آینده ناشی از مانورهای رانندگان یا اقدامات وسایل نقلیه اطراف با مشکل مواجه شوند. بنابراین، دومی تأثیر مانورهای رانندگان (مثلاً گردش به چپ یا راست، مستقیم نگه داشتن) را در پیش‌بینی مسیر وسیله نقلیه در نظر می‌گیرد. ابتدا باید مانور خودرو را تشخیص دهد. این مرحله را می توان به عنوان یک مشکل طبقه بندی با استفاده از موقعیت های تاریخی و حالات حرکتی وسیله نقلیه هدف به عنوان ویژگی توصیف کرد. این طبقه‌بندی‌کننده معمولاً از مدل‌های مارکوف پنهان [ 3 ، 17 ]، پرسپترون‌های چند لایه (MLPs) [ 4 ]، شبکه‌های بیزی [ 18 ] استفاده می‌کند.] و ماشین بردار پشتیبانی (SVM) [ 19 ]. سپس، ماژول پیش‌بینی مسیر رگرسیون برای تولید مسیرهای مبتنی بر مانور وسایل نقلیه طراحی شده است که شامل مدل‌های مخلوط گاوسی [ 3 ]، روش‌های مونت کارلو [ 5 ] و برازش چند جمله‌ای [ 20 ] است. با این حال، عملکرد این روش ها به دلیل غفلت از تعاملات اجتماعی بین وسایل نقلیه اطراف محدود است.

2.2. روش‌های مبتنی بر LSTM برای پیش‌بینی مسیر

شبکه LSTM یکی از انواع شبکه‌های عصبی بازگشتی (RNNs) [ 21 ] است که نه تنها می‌تواند وابستگی‌های دوربرد در پردازش داده‌های توالی را ضبط کند، بلکه مشکلات ناپدید شدن و انفجار گرادیان را در طول فرآیند آموزش حل می‌کند [ 22 ]. بنابراین، شبکه‌های LSTM به طور گسترده برای وظایف توالی، مانند شناسایی فعالیت [ 23 ]، پیش‌بینی ترافیک [ 24 ] و پیش‌بینی مسیر [ 25 ، 26 ] استفاده شده‌اند. به عنوان مثال، آلچه و همکاران. [ 27] یک شبکه LSTM را برای پیش بینی مسیر آینده وسایل نقلیه در بزرگراه ها معرفی کرد. نتایج آن نشان داد که این شبکه نسبت به مدل های سنتی عملکرد بهتری دارد. با این حال، اطلاعات خودروهای همسایه را نادیده گرفت. بنابراین، دیو و همکاران. [ 28 ] یک مدل مانور LSTM (M-LSTM) پیشنهاد کرد که مسیرهای گذشته وسایل نقلیه همسایه را رمزگذاری می‌کند و با رمزگشایی بردار زمینه کدگذاری شده و بردار رمزگذاری مانور، پیش‌بینی‌های مسیر چندوجهی را خروجی می‌دهد. اگرچه M-LSTM تمام مسیرها را به عنوان ورودی این مدل در نظر می گیرد، اما نمی تواند تأثیر متفاوت همسایگان را بر وسیله نقلیه مورد نظر در نظر بگیرد. برای پرداختن به این موضوع، مدل CS-LSTM [ 12] از لایه ادغام اجتماعی کانولوشن برای تولید یک تانسور اجتماعی استفاده کرد که شامل تعاملات فضایی وسایل نقلیه اطراف در همان صحنه است. به طور مشابه، ژائو و همکاران. [ 10 ] یک مدل همجوشی تانسور چند عاملی (MATF) را پیشنهاد کرد، که در آن لایه کاملاً پیچشی برای یادگیری تعاملات اجتماعی بین وسایل نقلیه چندگانه و زمینه صحنه معرفی شد. با این حال، این روش‌ها فقط به ویژگی فضایی آخرین مرحله زمانی مربوط می‌شوند و از ارتباط زمانی این تعاملات فضایی غفلت می‌کنند. بنابراین، مدل STAM-LSTM ما ویژگی جامع وسایل نقلیه را از ابعاد مکانی و زمانی استخراج می‌کند، که به طور موثر تأثیر وابستگی‌های زمانی را بر تولید مسیرهای آینده وسایل نقلیه نشان می‌دهد.

2.3. روش‌های مبتنی بر توجه برای پیش‌بینی مسیر

مکانیسم توجه برای اولین بار در [ 29 ] برای وظایف ترجمه ماشینی پیشنهاد شد، که می تواند به طور موثر توضیح پذیری مدل را بهبود بخشد. با الهام از این ایده، مدل‌های مبتنی بر توجه به طور گسترده در زمینه‌های مختلف، مانند تولید تصویر [ 30 ]، سیستم‌های توصیه [ 31 ] و پیش‌بینی توالی [ 32 ] استفاده شده‌اند. از آنجایی که یک مسئله پیش‌بینی مسیر یک کار سری زمانی معمولی است، برخی از آثار [ 33 ، 34 ] مکانیسم توجه را برای اختصاص وزن‌های مناسب به حالت‌های پنهان LSTM معرفی کرده‌اند که بردار ویژگی لحظات مختلف در مسیرهای تاریخی را نشان می‌دهند. اخیراً مکانیسم توجه چند سر بر اساس ترانسفورماتور [35 ] معماری که به طور گسترده در بسیاری از زمینه ها مورد استفاده قرار گرفته است. از جمله مسعود و همکاران. [ 14 ] از مکانیسم توجه چند سر برای ارزیابی اهمیت نسبی بین وسایل نقلیه مجاور استفاده کرد و انواع مختلفی از روابط اجتماعی را استخراج کرد. برعکس، وو و همکاران. [ 36 ] مکانیسم توجه چند سر را برای ثبت همبستگی زمانی پیچیده هر عامل به طور مستقل اعمال کرد. اخیراً، با انگیزه این واقعیت که شبکه کانولوشن گراف (GCN) [ 37 ] می تواند تأثیر نسبی و روابط فضایی بالقوه در سناریوهای ترافیک را به تصویر بکشد، شبکه توجه گراف (GAT) [ 38 ] در پیش بینی مسیر استفاده شده است [ 39 ] ، 40 ، 41]، استخراج تعامل فضایی بین عوامل همسایه با اختصاص اهمیت متفاوت به همسایگان اطراف عامل هدف. در این مقاله، ما یک لایه توجه فضایی بر اساس GAT طراحی می‌کنیم تا تعاملات اجتماعی بین وسایل نقلیه را استخراج کنیم و از یک لایه توجه زمانی برای گرفتن روابط زمانی مطابق با مکانیسم خودتوجه استفاده کنیم [ 42 ].

3. روش ها

3.1. تعریف مشکل

در این مقاله، وظیفه پیش‌بینی مسیر وسیله نقلیه را می‌توان به عنوان پیش‌بینی مسیرهای آینده وسیله نقلیه هدف با استفاده از مسیرهای تاریخی وسیله نقلیه هدف و همسایگان آن در یک صحنه فرمول‌بندی کرد. برای سهولت در مدل‌سازی این مشکل، ابتدا چند نماد را معرفی می‌کنیم.

مسیرهای گذشته i- امین وسیله نقلیه از زمان 1�=1به =تیs�=����را می توان توسط

ایکسمن{پ1من،پ2من، ،پتیsمن}��={��1,��2,…,������}

جایی که،

پتیمن(ایکستیمن،yتیمن،vتیمن،آتیمن)���=(���,���,���,���)

بردار حالت وسیله نقلیه i در مرحله زمانی t است که شامل مختصات موقعیت است (ایکستیمن،yتیمن)(���,���)، سرعت vتیمن���، و شتاب آتیمن���.

مسیرهای آینده وسیله نقلیه i را می توان به صورت بیان کرد

Yمن{oتیs1من،oتیs2من، ،oتیs+تیdمن}��={������+1,������+2,…,������+�����}

جایی که

oتی˜من(ایکستی˜من،yتی˜من)���˜=(���˜,���˜)

مختصات پیش بینی شده وسیله نقلیه i در مرحله زمانی استتی˜=تیs،تیs، .تیs+تیd�˜=����+1,����+2,…����+�����، تیd�����طول زمانی مسیرهای وسیله نقلیه در آینده است.

3.2. مدل کلی

شکل 1معماری مدل STAM-LSTM پیشنهادی را نشان می دهد که از دو ماژول اصلی تشکیل شده است: ماژول استخراج ویژگی و ماژول رمزگذار-رمزگشا مبتنی بر توجه. در ماژول استخراج ویژگی، لایه توجه فضایی (SA) برای استخراج ویژگی فضایی جهانی وسایل نقلیه طراحی شده است. علاوه بر این، لایه تجمع ویژگی (FAL) برای تولید یک نمایش جامع از ویژگی وسیله نقلیه مورد نظر با استفاده از ویژگی‌های فضایی محلی و جهانی و ویژگی حرکت استفاده می‌شود. ماژول رمزگذار-رمزگشا مبتنی بر توجه را می توان بیشتر به سه جزء تقسیم کرد، به عنوان مثال، ماژول رمزگذار، لایه توجه زمانی، و ماژول رمزگشا. ماژول رمزگذار ویژگی تجمیع مسیرهای تاریخی را به یک تانسور حالت پنهان با ابعاد بالا رمزگذاری می کند. جمن��. ماژول رمزگشا بردار زمینه وزنی و نویز تصادفی r را به عنوان ورودی برای پیش بینی مسیرهای آینده وسیله نقلیه مورد نظر می گیرد.

3.3. ماژول استخراج ویژگی

ابتدا مختصات مکان را جاسازی می کنیم (ایکستیمن،yتیمن)(���,���)وارد فضایی با ابعاد بالا توسط:

هتیمنΓ (ایکستیمن،yتیمن;دبلیوه)���=�(���,���;��)

جایی که Γ ⋅ )�(·)تابع جاسازی با است yu���������غیر خطی بودن، دبلیوهآر×D1��∈�2×�1ماتریس وزن این تابع است و D1�1ابعاد این ویژگی است. هتیمن���نشان دهنده ویژگی فضایی محلی i -امین وسیله نقلیه در مرحله زمانی t است.

با توجه به اثرات عوامل اطراف بر رفتار وسایل نقلیه در شبکه های جاده ای و این واقعیت که هر وسیله نقلیه می تواند به طور انتزاعی به عنوان یک گره نمودار نمایش داده شود [ 43 ]، ما یک لایه توجه فضایی را معرفی می کنیم تا روابط تعاملی مختلف بین وسایل نقلیه همسایه را بر اساس GAT [ 38 ].

همانطور که در شکل 2 نشان داده شده است ، ما این ویژگی های فضایی محلی را در نظر می گیریم {هتی1،هتی2… ,هتیn}{�1�,�2�,…,���}به عنوان ورودی این لایه، جایی که n تعداد وسایل نقلیه است. سپس وزن توجه را محاسبه می کنیم αتیمن ، ج��,��برای نشان دادن اهمیت نسبی جفت وسیله نقلیه من ، ج )(�,�)به شرح زیر است:

αتیمن ، ج=exp(LeakyRelu(aT[WsetiWsetj]))nj=1exp(LeakyRelu(aT[WsetiWsetj]))��,��=���(���������(��[�����⨁�����]))∑�=1����(���������(��[�����⨁�����]))

که در آن ⨁ عملیات الحاق را نشان می دهد. Wس��پارامتر وزن است که ویژگی فضایی محلی را تغییر می دهد هتیj���به فضایی با ابعاد بالا آتی��بردار وزن یک شبکه پیشخور منفرد است که برای محاسبه ضرایب توجه استفاده خواهد شد. yu���������یک تابع فعال سازی غیر خطی است و شیب ورودی منفی آن 0.1 تنظیم شده است. p���نشان دهنده تابع نمایی است که هدایت می کند fx�������عادی سازی

پس از به دست آوردن ضرایب توجه، می توانیم آنها را با ویژگی های فضایی محلی برای محاسبه ادغام کنیم Eتیمن���، که به معنای ویژگی فضایی جهانی وسیله نقلیه i در مرحله زمانی t است. توسط:

Eتیمنϕ (1nαتیمن ، جهتیj)���=�(∑�=1���,�����)

جایی که ϕ ⋅ )�(·)یک تابع فعال سازی غیر خطی است.

ثانیا، ادبیات [ 44 ] گزارش کرده است که پویایی نسبی نیز برای نشان دادن اثرات اجتماعی وسایل نقلیه در صحنه های رانندگی با سرعت بالا مهم است. علاوه بر این، ما معتقدیم که هر وسیله نقلیه رفتارهای خود را (به عنوان مثال، شتاب یا کاهش سرعت، تغییر جهت) با توجه به فعل و انفعالات فضایی جهانی، که شامل تأثیرات مختلف وسایل نقلیه اطراف بر روی عملکرد بعدی خود است، تنظیم می کند. بنابراین، ویژگی حرکت را استخراج کردیم مترتیمن���وسیله نقلیه مورد نظر با استفاده از اطلاعات سرعت و شتاب.

مترتیمنΘ (vتیمن،آتیمن;دبلیومتر)���=�(���,���;��)

جایی که Θ ⋅ )�(·)یک شبکه کاملا متصل است، دبلیومترآر×D2��∈�2×�2پارامتر شبکه است و D2�2بعد فضای ویژگی حرکت است.

در نهایت، ویژگی فضایی جهانی و ویژگی حرکت به عنوان ورودی های لایه تجمع ویژگی تعریف می شوند. در این میان ویژگی فضایی محلی یکی دیگر از ورودی هاست که خروجی این لایه را قادر می سازد اطلاعات محلی را در بر بگیرد. نمایش ویژگی تجمیع شده zتیمن���وسیله نقلیه i در گام تاریخی t به عنوان معادله ( 9 ) توصیف می شود.

zتیمن[Eتیمنهتیمن] ⨁مترتیمن���=[���⨀���]⨁���

که در آن ⨀ نشان دهنده ضرب عنصر است.

3.4. ماژول رمزگذار – رمزگشا مبتنی بر توجه

در این مقاله، ما یک شبکه LSTM را به عنوان استخراج کننده ویژگی ماژول رمزگذار-رمزگشا انتخاب می کنیم. همانطور که در شکل 3 نشان داده شده است ، حالت پنهان h توسط دروازه فراموشی f ، دروازه ورودی i ، دروازه خروجی o و حالت سلول c کنترل می شود. عملکرد سلول LSTM را می توان به صورت زیر بیان کرد:

fتیσ(دبلیوایکسfایکستی+دبلیوfساعت– 1+دبلیوج جج– 1+بf)��=�(�����+�ℎ�ℎ�−1+�����−1+��)
منتیσ(دبلیوایکسمنایکستی+دبلیومنساعت– 1+دبلیوج منج– 1+بمن)��=�(�����+�ℎ�ℎ�−1+�����−1+��)
جتی=fتیج– 1+منتییک ساعت ( _ _دبلیوایکسجایکستی+دبلیوcساعت– 1+بج)��=����−1+�����ℎ(�����+�ℎ�ℎ�−1+��)
oتیσ(دبلیوایکسoایکستی+دبلیوساعت _ساعت– 1+دبلیوoجتی+بo)�تی=�(دبلیوایکس�ایکستی+دبلیوساعت�ساعتتی-1+دبلیوج�جتی+ب�)
ساعتتی=oتییک ساعت ( _ _جتی)ℎ�=�����ℎ(��)

جایی که ایکستی��بردار ورودی است و دبلیو�*و ب�*به ترتیب ماتریس وزن و بردار بایاس را نشان می دهند. σ()�(·)هست sigmoid�������عملکرد فعال سازی

3.4.1. ماژول رمزگذار

رمزگذار LSTM ویژگی تجمیع شده را می گیرد ztمن���وسیله نقلیه i در مرحله زمانی t به عنوان ورودی و آن را به نمایش حالت پنهان این رمزگذار تبدیل می کند ساعتتیcℎ�,���تی. می توان آن را به صورت زیر تعریف کرد:

ساعتتیcEنسیال استیم(ساعت– 1c،zتیمن;دبلیوc)ساعتمن،ه�جتی=�نسی_�استیم(ساعتمن،ه�جتی-1،�منتی;دبلیوه�ج)

جایی که دبلیوcآر(D1+D2) ×Dcدبلیوه�ج∈آر(�1+�2)×�ه�جماتریس وزن این شبکه LSTM است و بین تمام وسایل نقلیه مشترک است و Dc�ه�جبعد شبکه LSTM است.

3.4.2. لایه توجه زمانی
به طور سنتی، رمزگشا مستقیماً خروجی رمزگذار را در آخرین مرحله زمانی به عنوان ورودی می گیرد و با استفاده از این بردار کدگذاری شده، مسیرهای آینده را تولید می کند. با این حال، حرکت وسایل نقلیه از اقدامات متوالی در صحنه های دنیای واقعی تشکیل شده است و وضعیت فعلی به تأثیر جامع همه اقدامات قبلی بستگی دارد. به عبارت دیگر، ویژگی هر مرحله زمانی در مسیرهای گذشته نقش متفاوتی در پیش‌بینی مسیر آینده دارد. بنابراین، ما یک لایه توجه زمانی را برای اندازه‌گیری تأثیرات نابرابر لحظات مختلف در مسیرهای تاریخی معرفی می‌کنیم.

ابتدا استفاده می کنیم اچمناچمنبرای نشان دادن دنباله های بافت زمانی وسیله نقلیه i ، که می تواند به شرح زیر باشد

اچمن{ساعت1c،ساعت2c… ,ساعتتیsc}اچمن={ساعتمن،ه�ج1،ساعتمن،ه�ج2،…،ساعتمن،ه�جتی�بس}

جایی که ساعتتیcساعتمن،ه�جتیبا معادله ( 15 ) به دست می آید که نشان دهنده حالت پنهان وسیله نقلیه i در مرحله زمانی t است.

سپس، همانطور که در شکل 4 نشان داده شده است ، می گیریم اچمناچمنبه عنوان ورودی لایه توجه زمانی و بردار وزن توجه را محاسبه کنید βمن�منبه شرح زیر است:

βمنf(دبلیوتی(اچمن)تی) )�من=س��تیمترآایکس(تیآ�ساعت(دبلیوتی(اچمن)تی))

جایی که تی·تیبه معنی جابجایی، hتیآ�ساعتیک تابع فعال سازی است و دبلیوتیدبلیوتیماتریس وزن است. بردار وزن βمن�منشامل اثرات مختلف اطلاعات تاریخی از بعد زمانی است و این وزن های محاسبه شده به دلیل fxس��تیمترآایکسعملکرد.

در نهایت، بردار بافت زمانی وزنی جمنجمنوسیله نقلیه من می توانم محاسبه کنم

جمن=βمناچمنجمن=�مناچمن
3.4.3. ماژول رمزگشا

رمزگشا LSTM و لایه پیش بینی برای تولید مسیرهای آینده وسیله نقلیه مورد نظر اعمال می شوند. در مرحله اول، رمزگشا بردار زمینه زمانی را به هم متصل می کند جمنجمنو یک نویز تصادفی r ، که می تواند استحکام پیش بینی مسیر را افزایش دهد. لایه پیش بینی از حالت پنهان استفاده می کند ساعتتی˜من ، دcساعتمن،دهجتی˜از این رمزگشا برای تولید مختصات پیش بینی شده oتی˜من�منتی˜وسیله نقلیه i در مرحله زمانی تی˜تی˜. سپس، نتایج oتی˜من�منتی˜آخرین مرحله زمانی برای تولید نتایج پیش‌بینی به این رمزگشا وارد می‌شود oتی˜1من�منتی˜+1.

ساعتتی˜من ، دcEسیال استیم(ساعتتی˜– 1من ، دc،جمن⨁ ;دبلیودc)ساعتمن،دهجتی˜=��سی_�استیم(ساعتمن،دهجتی˜-1،جمن⨁�;دبلیودهج)
oتی˜منΨ (ساعتتی˜من ، دc;دبلیوo)�منتی˜=�(ساعتمن،دهجتی˜;دبلیو�)

جایی که دبلیودcآر(Dc+Dr) ×Dدcدبلیودهج∈آر(�ه�ج+��)×�دهجپارامترهای آموخته شده هستند و Dدc�دهجابعاد این شبکه LSTM است، Ψ ⋅ )�(·)یک شبکه کاملا متصل است و دبلیوoآرDدc× 2دبلیو�∈آر�دهج×2ماتریس وزن این شبکه است.

3.5. عملکرد از دست دادن

در این مقاله از کوچکترین مقدار فاصله بین مختصات پیش بینی شده استفاده می کنیم oتیمن ، d�من،پ�هدتیو مختصات را مشاهده کرد oتیمن ، e�من،تی�توهتیوسیله نقلیه i در مرحله زمانی t برای محاسبه تلفات. تابع ضرر برای آموزش را می توان به صورت زیر نوشت:

Ln=1ن∗ تی1ن=تیs1تیs+تیd∥∥oتیمن ، doتیمن ، e∥∥22�تی�آمن�=1ن∗تی∑من=1ن∑تی=تی�بس+1تی�بس+تیپ�هد�من،پ�هدتی-�من،تی�توهتی22

که در آن N اندازه مجموعه قطارها است. تی=تیdتی=تیپ�هدطول مسیر آینده است.

4. آزمایش ها و نتایج

4.1. مجموعه داده ها

در این بخش، ما استفاده از مدل STAM-LSTM پیشنهادی را در مجموعه داده مسیر وسایل نقلیه عمومی در شبیه‌سازی نسل بعدی (NGSIM) نشان می‌دهیم که شامل دو زیر مجموعه است که به ترتیب از بزرگراه US-101 و I-80 عبور می‌کنند. در هر زیر مجموعه، مسیر تمام وسایل نقلیه در فرکانس 10 هرتز در مجموع 45 دقیقه ثبت شد. علاوه بر این، هر مجموعه داده 45 دقیقه ای به سه زیربخش 15 دقیقه ای تحت شرایط ترافیکی ملایم، متوسط ​​و شلوغ تقسیم می شود.
برای مقایسه با خطوط مبنا، از همان تنظیمات آزمایشی در [ 12 ] پیروی می کنیم تا مسیرهای خام را به بخش های 8 ثانیه تقسیم کنیم، که در آن از مسیرهای تاریخی 3 ثانیه اول برای پیش بینی مسیرهای وسیله نقلیه در 5 ثانیه بعدی استفاده می کنیم. مجموعه داده های مسیر پردازش شده به طور تصادفی تقسیم می شوند، که در آن 70٪ از داده ها به عنوان مجموعه آموزشی انتخاب می شوند و 30٪ باقی مانده از داده ها برای تأیید و آزمایش استفاده می شوند.

4.2. معیارهای

در این مقاله، ریشه میانگین مربعات خطا (RMSE) را به عنوان معیاری برای ارزیابی عملکرد پیش‌بینی مدل STAM-LSTM انتخاب می‌کنیم. هرچه مقدار RMSE کوچکتر باشد، فاصله بین مسیر پیش بینی شده و مسیر حقیقت زمین کمتر است. RMSE به صورت محاسبه می شود

MاسE=1م1م(ایکستیمنایکس˜تیمن)2+(yتیمنy˜تیمن)2————————–⎷آرماس�=1م∑من=1م(ایکسمنتی-ایکس˜منتی)2+(�منتی-�˜منتی)2

که در آن M به معنای تعداد کل مجموعه داده های آزمایشی است. ( ایکستیمن،yتیمنایکسمنتی،�منتی) و ( ایکس˜تیمن،y˜تیمنایکس˜منتی،�˜منتی) به ترتیب مختصات حقیقت زمین و مختصات پیش بینی شده وسیله نقلیه i در مرحله زمانی t هستند. T افق پیش بینی است و در آزمایش ما از 1 تا 5 متغیر است.

4.3. جزئیات پیاده سازی

در طول فرآیند آموزش، ما بعد رمزگذار LSTM را تنظیم کردیم ( Dc�ه�ج) رمزگشا LSTM ( Dدc�دهج، ویژگی فضایی محلی ( D1�1، ویژگی حرکت ( D2�2و نویز تصادفی ( Dr��) به ترتیب به 64، 128، 32، 32 و 8 می رسد. اندازه دسته روی 128 تنظیم شده است و Adam [ 45 ] بهینه‌ساز اتخاذ شده است. نرخ یادگیری 0.0001 تنظیم شده است. کل مدل با چارچوب PyTorch و بر روی یک پردازنده گرافیکی NVIDIA GTX 1080Ti انجام شده است.

4.4. مطالعه ابلیشن

این بخش یک مطالعه فرسایشی را توصیف می کند که برای تجزیه و تحلیل اجزای مدل STAM-LSTM ما، از جمله لایه توجه فضایی (SA)، لایه توجه زمانی (TA) و ویژگی حرکت (MF) انجام شد. برای اثبات تأثیر بلوک‌های SA، TA و MF، ما دو نوع SA-LSTM (بدون TA) و STA-LSTM (بدون MF) و مدل STAM-LSTM خود را به ترتیب روی مجموعه داده‌های NGSIM آزمایش کردیم. در همین حال، ریشه میانگین مربعات خطا (RMSE) برای ارزیابی این مدل ها استفاده می شود. با توجه به نتایج کمی در جدول 1ما می‌توانیم مشاهده کنیم که مدل SA-LSTM عملکرد پیش‌بینی را در مقایسه با مدل V-LSTM که فقط از مسیرهای تاریخی وسیله نقلیه مورد نظر استفاده می‌کند، به‌ویژه در پیش‌بینی مسیر بلندمدت، بسیار بهبود بخشیده است. این نشان می دهد که اطلاعات در مورد عوامل اطراف برای بهبود عملکرد در کار پیش بینی وسیله نقلیه-مسیر مفید است و ماژول SA می تواند به طور موثر تعاملات فضایی بین وسایل نقلیه مجاور را استخراج کند. علاوه بر این، ثابت می کند که شبکه توجه گراف (GAT) برای گرفتن رابطه اجتماعی بین وسایل نقلیه در بزرگراه مناسب است. سپس، مدل STA-LSTM می‌تواند دقت پیش‌بینی را بیشتر بهبود بخشد، که نشان می‌دهد که ماژول TA می‌تواند ارتباط زمانی وسایل نقلیه را ثبت کند و وزن مناسب را به مهرهای زمانی مختلف مسیرهای تاریخی اختصاص دهد. در نهایت، مدل STAM-LSTM ما، که شامل SA، TA و MF است، عملکرد بهتری را به دست آورده است. مقدار RMSE از 1 تا 5 ثانیه به ترتیب 23.21٪، 15.04٪، 13.51٪، 9.89٪ و 8.95٪ کاهش می یابد که نشان می دهد اطلاعات دینامیکی یک ویژگی مؤثر در پیش بینی مسیر وسیله نقلیه است و می تواند بهتر نشان دهنده چندگانه باشد. ویژگی های مودال وسایل نقلیه تحت سناریوهای مختلف ترافیکی

4.5. خطوط پایه

  • سرعت ثابت (CV) [ 1 ] : این مدل از فیلتر کالمن با سرعت ثابت برای پیش بینی مسیر قطعی هر وسیله نقلیه استفاده می کند.
  • Vanilla-LSTM (V-LSTM): این مدل بر اساس مدل رمزگذار-رمزگشا LSTM است که فقط از مسیرهای گذشته وسیله نقلیه مورد نظر برای پیش بینی مسیرهای آینده استفاده می کند.
  • Maneuver-LSTM (M-LSTM) [ 28 ]: این مدل از رمزگذار برای رمزگذاری مسیرهای تاریخی وسیله نقلیه هدف و همسایگان آن استفاده می کند و رمزگشا پیش بینی های مسیر چندوجهی را با توجه به خروجی رمزگذار و مانور تولید می کند. بردار رمزگذاری
  • Social-LSTM (S-LSTM) [ 11 ]: این مدل از شبکه کاملاً متصل به عنوان لایه ادغام اجتماعی برای به اشتراک گذاری اطلاعات استفاده می کند و مسیر آینده تک وجهی را تولید می کند.
  • Convolutional Social LSTM (CS-LSTM) [ 12 ]: این مدل از ادغام اجتماعی کانولوشنی برای به تصویر کشیدن تعاملات فضایی استفاده می کند، و ماژول رمزگذار-رمزگشا برای تولید توزیع های مسیر چندوجهی وسایل نقلیه استفاده می شود.
  • همجوشی تانسور چند عاملی (MATF) [ 10 ]: این مدل یک تانسور چند عاملی را استخراج می کند که شامل زمینه صحنه و مسیرهای تاریخی چندین وسیله نقلیه است. سپس، شبکه GAN برای پیش بینی مسیرهای آینده عوامل استفاده می شود.
  • توجه چند سر LSTM (MHA-LSTM) [ 14 ]: این مدل مکانیسم توجه چند سر را برای ثبت تعاملات مکانی-زمانی با مرتبه بالا اعمال می کند.
  • MHA-LSTM(+f): این مدل اطلاعات سرعت، شتاب و کلاس را به عنوان ویژگی های اضافی بر اساس مدل MHA-LSTM می گیرد.

4.6. آنالیز کمی

نتایج مقایسه ما با برخی روش های موجود در جدول 2 نشان داده شده است. همه مدل‌ها بر روی مجموعه داده NGSIM آزمایش شدند و با متریک RMSE ارزیابی شدند. با توجه به نتایج کمی، ابتدا می توان مشاهده کرد که مدل های مبتنی بر یادگیری عمیق بهتر از مدل CV عمل کردند، که نشان می دهد یادگیری عمیق متناسب با وظیفه پیش بینی مسیر مدل است. در این میان، این روش ها با در نظر گرفتن تأثیر خودروهای اطراف بهتر از مدل V-LSTM هستند. این نشان می دهد که اطلاعات مربوط به عوامل همسایه برای بهبود عملکرد برای پیش بینی مسیر وسیله نقلیه مفید است. ثانیاً، این روش‌های تعاملی (S-LSTM، CS-LSTM، MATF، MHA-LSTM، MHA-LSTM(+f)، STAM-LSTM) عملکرد پیش‌بینی بهتری نسبت به مدل‌های غیر تعاملی (V-LSTM، M-LSTM) دارند. ، که نشان می دهد که تعاملات اجتماعی بین وسایل نقلیه برای ایجاد مسیر دقیق تر وسیله نقلیه ضروری است. در میان آنها، مدل‌های مبتنی بر توجه (MHA-LSTM، MHA-LSTM(+f)، STAM-LSTM) دارای مقادیر RMSE کمتری در مقایسه با مدل‌های دیگر با استفاده از طرح ادغام (S-LSTM، CS-LSTM، و MATF) هستند، که نشان می‌دهد که مکانیسم توجه برای استخراج روابط اجتماعی بین وسایل نقلیه در بزرگراه مناسب تر است. ثالثاً، ما متوجه می شویم که اطلاعات اضافی (سرعت و شتاب) ویژگی های مؤثری را ارائه می دهد و می تواند برای نشان دادن بهتر وضعیت جامع وسایل نقلیه در کار پیش بینی مسیر مفید باشد. مدل‌ها (MHA-LSTM(+f) و STAM-LSTM) بهتر از روش‌های دیگر بدون این نوع اطلاعات عمل می‌کنند. نشان می دهد که مکانیسم توجه برای استخراج روابط اجتماعی بین وسایل نقلیه در بزرگراه مناسب تر است. ثالثاً، ما متوجه می شویم که اطلاعات اضافی (سرعت و شتاب) ویژگی های مؤثری را ارائه می دهد و می تواند برای نشان دادن بهتر وضعیت جامع وسایل نقلیه در کار پیش بینی مسیر مفید باشد. مدل‌ها (MHA-LSTM(+f) و STAM-LSTM) بهتر از روش‌های دیگر بدون این نوع اطلاعات عمل می‌کنند. نشان می دهد که مکانیسم توجه برای استخراج روابط اجتماعی بین وسایل نقلیه در بزرگراه مناسب تر است. ثالثاً، ما متوجه می شویم که اطلاعات اضافی (سرعت و شتاب) ویژگی های مؤثری را ارائه می دهد و می تواند برای نشان دادن بهتر وضعیت جامع وسایل نقلیه در کار پیش بینی مسیر مفید باشد. مدل‌ها (MHA-LSTM(+f) و STAM-LSTM) بهتر از روش‌های دیگر بدون این نوع اطلاعات عمل می‌کنند.
در نهایت، در مقایسه با روش پیشرفته MHA-LSTM(+f)، مدل ما مقدار RMSE کمی بالاتر در 1 ثانیه دارد. ما فکر می‌کنیم که نویز تصادفی عدم قطعیت را به مدل وارد می‌کند و بر پیش‌بینی مسیر کوتاه‌مدت تأثیر می‌گذارد. با این حال، STAM-LSTM ما می‌تواند به دقت پیش‌بینی بالاتری در افق‌های پیش‌بینی 2 تا 5 ثانیه دست یابد. دلایل را می توان به صورت زیر خلاصه کرد:
  • مکانیسم توجه فضایی می‌تواند تعاملات فضایی بهتری بین وسایل نقلیه همسایه استخراج کند، و مکانیسم مبتنی بر نمودار برای گرفتن رابطه اجتماعی در پیش‌بینی مسیر وسیله نقلیه مناسب است.
  • مکانیسم توجه زمانی می‌تواند تأثیرات مختلف مراحل زمانی مختلف را به‌طور مؤثری ثبت کند و وزن مناسبی را به نمایش ویژگی مربوطه که توسط رمزگذار آموخته شده است، اختصاص دهد. بنابراین، رمزگشا می‌تواند از اطلاعات ارزشمندتری برای تولید مسیرهای آینده وسایل نقلیه، به‌ویژه در پیش‌بینی مسیر بلندمدت استفاده کند.

4.7. تحلیل کیفی

در این بخش، چندین مسیر پیش‌بینی‌شده را تحت سناریوهای ترافیکی ملایم، متوسط ​​و شلوغ تجسم می‌کنیم تا عملکرد پیش‌بینی مدل پیشنهادی خود را به‌طور کیفی نشان دهیم. تمام نتایج از مجموعه داده NGSIM نمونه برداری شده است. همانطور که در شکل 5 نشان داده شده است ، ماشین زرد ماشین هدف و ماشین های خاکستری وسایل نقلیه همسایه آن هستند. خطوط آبی نشان دهنده مسیرهای تاریخی هر وسیله نقلیه است. خطوط قرمز مسیرهای حقیقت زمین و خطوط سبز مسیرهای پیش بینی شده بر اساس مدل هستند. به طور کلی، مدل STAM-LSTM ما می تواند به طور موثر الگوی حرکت وسایل نقلیه را در شرایط مختلف ترافیکی یاد بگیرد.
همانطور که در شکل 5 الف نشان داده شده است، وسایل نقلیه با سرعت بالا در یک سناریوی ترافیک ملایم رانندگی می کنند. مسیرهای پیش بینی شده تقریباً مشابه حقیقت زمینی است. در شرایط ترافیکی متوسط ​​( شکل 5 ب)، خودروها به دلیل همسایگان اطراف نسبتاً کند حرکت می کنند، در حالی که در ترافیک شلوغ، حرکت وسایل نقلیه پیچیده تر است. مسیرهای پیش‌بینی‌شده در 3 ثانیه اول نزدیک به مسیرهای حقیقت زمین هستند، و مدل ما می‌تواند روند مسیر وسیله نقلیه را برای طولانی‌مدت (4 و 5 ثانیه)، همانطور که در شکل 5 ج نشان داده شده است، یاد بگیرد. خودروها در شرایط ترافیکی فوق در حال حفظ خطوط هستند. برای شهادت عملکرد پیش بینی در سناریوهای دشوارتر، همانطور که در شکل 5 نشان داده شده استd، مدل ما می تواند قصد تغییر خطوط را پیش بینی کند و در حدود 2 ثانیه اول دقت بالایی داشته باشد.

5. نتیجه گیری ها

در این مقاله، ما یک مدل STAM-LSTM برای پیش‌بینی مسیر وسیله نقلیه پیشنهاد کرده‌ایم که می‌تواند به طور موثر ویژگی‌های مکانی-زمانی و نمایش ویژگی حرکت را استخراج کند. با روش ما، مکانیسم توجه فضایی برای مدل‌سازی تعاملات اجتماعی بین وسیله نقلیه هدف و همسایگان اطراف استفاده می‌شود. مکانیسم توجه زمانی طراحی شده است تا با تعیین وزن مناسب به مراحل مختلف زمانی تاریخی، ارتباط زمانی را به تصویر بکشد. علاوه بر این، ما اطلاعات دینامیکی (سرعت و شتاب) را به بردارهای ویژگی اضافه می کنیم که برای استخراج ویژگی های چند وجهی بهتر وسایل نقلیه و پیش بینی مسیر دقیق تر مفید است. آزمایش‌های گسترده بر روی مجموعه داده‌های عمومی نشان می‌دهد که مدل ما عملکرد پیش‌بینی بهتری در مقایسه با روش‌های پیشرفته دارد.
در کار آینده، مایلیم عملکرد پیش‌بینی مدل خود را در سناریوهای ترافیکی پیچیده‌تر، مانند دوربرگردان، تأیید کنیم. علاوه بر این، شبکه عصبی گراف را برای نمایش ساختار توپولوژی در بین تمام وسایل نقلیه و کاهش پیچیدگی کل مدل اعمال خواهیم کرد.

منابع

  1. اشنایدر، ن. Gavrila، DM پیش‌بینی مسیر عابر پیاده با فیلترهای بیزی بازگشتی: یک مطالعه تطبیقی. در مجموعه مقالات کنفرانس آلمان در مورد شناسایی الگوها، زاربروکن، آلمان، 3-6 سپتامبر 2013. صص 174-183. [ Google Scholar ]
  2. الناگر، ع. پیش بینی اجسام متحرک در محیط های پویا با استفاده از فیلترهای کالمن. در مجموعه مقالات سمپوزیوم بین المللی IEEE در سال 2001 در مورد هوش محاسباتی در رباتیک و اتوماسیون (شماره گربه 01EX515)، Banff، AB، کانادا، 29 ژوئیه تا 1 اوت 2001. صص 414-419. [ Google Scholar ]
  3. دیو، ن. رنگش، ع. Trivedi، MM وسایل نقلیه اطراف چگونه حرکت می کنند؟ یک چارچوب یکپارچه برای طبقه بندی مانور و پیش بینی حرکت IEEE Trans. هوشمند وه 2018 ، 3 ، 129-140. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  4. یون، اس. Kum, D. رویکرد پرسپترون چند لایه برای پیش‌بینی حرکت جانبی وسایل نقلیه اطراف برای وسایل نقلیه خودمختار. در مجموعه مقالات سمپوزیوم وسایل نقلیه هوشمند IEEE 2016 (IV)، گوتنبرگ، سوئد، 19 تا 22 ژوئن 2016؛ ص 1307–1312. [ Google Scholar ]
  5. تران، کیو. فرل، جی. تشخیص مانور آنلاین و پیش‌بینی مسیر چندوجهی برای کمک تقاطع با استفاده از رگرسیون ناپارامتریک. در مجموعه مقالات سمپوزیوم وسایل نقلیه هوشمند IEEE 2014، دیربورن، MI، ایالات متحده آمریکا، 8 تا 11 ژوئن 2014. ص 918-923. [ Google Scholar ]
  6. ویلیامز، CK; راسموسن، فرآیندهای گاوسی CE برای یادگیری ماشینی ؛ مطبوعات MIT: کمبریج، MA، ایالات متحده آمریکا، 2006; جلد 2. [ Google Scholar ]
  7. هوکرایتر، اس. Schmidhuber, J. حافظه کوتاه مدت طولانی. محاسبات عصبی 1997 ، 9 ، 1735-1780. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  8. تانگ، جی. شو، ایکس. یان، آر. Zhang، L. گراف LSTM محدود برای شناسایی فعالیت گروهی. IEEE Trans. الگوی مقعدی ماخ هوشمند 2019 ، 44 ، 636-647. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  9. شو، اچ. Huynh، DQ; رینولدز، ام. SS-LSTM: یک مدل LSTM سلسله مراتبی برای پیش بینی مسیر عابر پیاده. در مجموعه مقالات کنفرانس زمستانی IEEE 2018 در مورد کاربردهای بینایی کامپیوتری (WACV)، دریاچه تاهو، NV، ایالات متحده، 12 تا 15 مارس 2018؛ صص 1186–1194. [ Google Scholar ]
  10. ژائو، تی. خو، ی. مونفورت، ام. چوی، دبلیو. بیکر، سی. ژائو، ی. وانگ، ی. وو، YN ترکیب تانسور چند عاملی برای پیش‌بینی مسیر متنی. در مجموعه مقالات کنفرانس IEEE/CVF در مورد دید کامپیوتری و تشخیص الگو، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 16 تا 17 ژوئن 2019؛ ص 12126–12134. [ Google Scholar ]
  11. الهی، ع. گوئل، ک. راماناتان، وی. Robicquet، A. فی فی، ال. Savarese, S. Social lstm: پیش بینی مسیر انسان در فضاهای شلوغ. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، لاس وگاس، NV، ایالات متحده آمریکا، 27-30 ژوئن 2016. ص 961-971. [ Google Scholar ]
  12. دیو، ن. Trivedi، MM گردآوری اجتماعی کانولوشن برای پیش‌بینی مسیر خودرو. در مجموعه مقالات کنفرانس IEEE در کارگاه های آموزشی بینایی کامپیوتری و تشخیص الگو، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 23 ژوئن 2018؛ ص 1468-1476. [ Google Scholar ]
  13. مسعود، ک. یحیوی، آی. وروست-بلندت، ا. نشاشیبی، ف. تجمیع اجتماعی غیر محلی برای پیش‌بینی مسیر خودرو. در مجموعه مقالات سمپوزیوم وسایل نقلیه هوشمند IEEE 2019 (IV)، پاریس، فرانسه، 9 تا 12 ژوئن 2019؛ ص 975-980. [ Google Scholar ]
  14. مسعود، ک. یحیوی، آی. وروست-بلندت، ا. نشاشیبی، ف. پیش بینی مسیر وسیله نقلیه مبتنی بر توجه. IEEE Trans. هوشمند وه 2020 ، 6 ، 175-185. [ Google Scholar ] [ CrossRef ]
  15. پنگ، ی. ژانگ، جی. شی، ج. خو، بی. ژنگ، L. SRAI-LSTM: یک LSTM مبتنی بر توجه مبتنی بر تعامل برای پیش‌بینی مسیر انسانی. محاسبات عصبی 2021 ، 490 ، 258-268. [ Google Scholar ] [ CrossRef ]
  16. لفور، اس. واسکز، دی. Laugier, C. نظرسنجی در مورد پیش‌بینی حرکت و ارزیابی ریسک برای وسایل نقلیه هوشمند. ROBOMECH J. 2014 ، 1 ، 1. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  17. فرل، جی. استوبینگ، اچ. Huss, SA; استیلر، سی. ارزیابی مانور پیش‌بینی‌کننده برای افزایش داده‌های تحرک خودرو به x. در مجموعه مقالات سمپوزیوم وسایل نقلیه هوشمند IEEE 2012، مادرید، اسپانیا، 3 تا 7 ژوئن 2012. صص 558-564. [ Google Scholar ]
  18. شرایر، ام. ویلرت، وی. آدامی، جی بیزیان، پیش‌بینی مسیر بلندمدت و ارزیابی بحرانی برای سیستم‌های کمک راننده مبتنی بر مانور. در مجموعه مقالات هفدهمین کنفرانس بین المللی ieee در مورد سیستم های حمل و نقل هوشمند (ITSC)، چینگدائو، چین، 8 تا 11 اکتبر 2014. صص 334-341. [ Google Scholar ]
  19. Aoude، GS; Desaraju، VR; استفنز، LH; چگونه، طبقه بندی رفتار راننده JP در تقاطع ها و اعتبار سنجی در مجموعه داده های طبیعی بزرگ. IEEE Trans. هوشمند ترانسپ سیستم 2012 ، 13 ، 724-736. [ Google Scholar ] [ CrossRef ]
  20. هوئنو، ا. بونیفیت، پ. شرفاوی، وی. Yao, W. پیش‌بینی مسیر وسیله نقلیه بر اساس مدل حرکت و تشخیص مانور. در مجموعه مقالات کنفرانس بین المللی IEEE/RSJ 2013 در مورد ربات ها و سیستم های هوشمند، توکیو، ژاپن، 3 تا 7 نوامبر 2013. صص 4363-4369. [ Google Scholar ]
  21. Pineda، FJ تعمیم انتشار پس‌انداز به شبکه‌های عصبی مکرر. فیزیک کشیش لِت 1987 , 59 , 2229. [ Google Scholar ] [ CrossRef ]
  22. پاسکانو، آر. میکولوف، تی. Bengio، Y. در مورد دشواری آموزش شبکه های عصبی بازگشتی. در مجموعه مقالات کنفرانس بین المللی یادگیری ماشین، آتلانتا، GA، ایالات متحده آمریکا، 17-19 ژوئن 2013. ص 1310–1318. [ Google Scholar ]
  23. دوناهو، جی. آن هندریکس، ال. گواداراما، اس. رورباخ، م. ونوگوپالان، اس. سانکو، ک. دارل، تی. شبکه های کانولوشنال مکرر طولانی مدت برای تشخیص و توصیف بصری. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، بوستون، MA، ایالات متحده آمریکا، 7 تا 12 ژوئن 2015. صص 2625–2634. [ Google Scholar ]
  24. یائو، اچ. تانگ، ایکس. وی، اچ. ژنگ، جی. لی، زی. بازبینی شباهت مکانی-زمانی: یک چارچوب یادگیری عمیق برای پیش‌بینی ترافیک. در مجموعه مقالات کنفرانس AAAI در مورد هوش مصنوعی، هونولولو، HI، ایالات متحده، 27 ژانویه تا 1 فوریه 2019؛ جلد 33، ص 5668–5675. [ Google Scholar ]
  25. پارک، SH; کیم، بی. کانگ، سی ام. چانگ، سی سی; Choi، JW پیش بینی ترتیب به دنباله مسیر وسیله نقلیه از طریق معماری رمزگذار-رمزگشا LSTM. در مجموعه مقالات سمپوزیوم وسایل نقلیه هوشمند IEEE 2018 (IV)، چانگشو، چین، 26 تا 30 ژوئن 2018؛ صفحات 1672-1678. [ Google Scholar ]
  26. ژائو، ایکس. چن، ی. گوا، جی. ژائو، دی. یک مدل توجه مکانی-زمانی برای پیش‌بینی مسیر انسان. IEEE CAA J. Autom. گناه 2020 ، 7 ، 965-974. [ Google Scholar ] [ CrossRef ]
  27. آلچه، اف. de La Fortelle، A. یک شبکه LSTM برای پیش‌بینی مسیر بزرگراه. در مجموعه مقالات بیستمین کنفرانس بین المللی IEEE 2017 در مورد سیستم های حمل و نقل هوشمند (ITSC)، یوکوهاما، ژاپن، 16 تا 19 اکتبر 2017؛ صص 353-359. [ Google Scholar ]
  28. دیو، ن. Trivedi، MM پیش‌بینی مسیر چندوجهی وسایل نقلیه اطراف با lstms مبتنی بر مانور. در مجموعه مقالات سمپوزیوم وسایل نقلیه هوشمند IEEE 2018 (IV)، چانگشو، چین، 26 تا 30 ژوئن 2018؛ صص 1179–1184. [ Google Scholar ]
  29. بهداناو، د. چو، ک. Bengio، Y. ترجمه ماشینی عصبی با یادگیری مشترک تراز و ترجمه. arXiv 2014 ، arXiv:1409.0473. [ Google Scholar ]
  30. گرگور، ک. دانیهلکا، آی. گریوز، ا. رزنده، دی. Wierstra, D. Draw: یک شبکه عصبی بازگشتی برای تولید تصویر. در مجموعه مقالات کنفرانس بین المللی یادگیری ماشین، لیل، فرانسه، 7 تا 9 ژوئیه 2015. ص 1462-1471. [ Google Scholar ]
  31. ژو، جی. زو، ایکس. آهنگ، سی. فن، ی. زو، اچ. ما، ایکس. یان، ی. جین، جی. لی، اچ. Gai, K. شبکه بهره عمیق برای پیش‌بینی نرخ کلیک. در مجموعه مقالات بیست و چهارمین کنفرانس بین المللی ACM SIGKDD در زمینه کشف دانش و داده کاوی، لندن، بریتانیا، 19 تا 23 اوت 2018؛ صص 1059-1068. [ Google Scholar ]
  32. شیائو، ی. یین، اچ. ژانگ، ی. چی، اچ. ژانگ، ی. Liu, Z. یک شبکه Conv-LSTM مبتنی بر توجه دو مرحله ای برای همبستگی مکانی-زمانی و پیش بینی سری های زمانی چند متغیره. بین المللی جی. اینتل. سیستم 2021 ، 36 ، 2036–2057. [ Google Scholar ] [ CrossRef ]
  33. چن، ک. آهنگ، X. رن، ایکس. مدل‌سازی تعامل اجتماعی و قصد برای پیش‌بینی مسیر عابر پیاده. فیزیک آمار مکانیک. Appl. 2021 , 570 , 125790. [ Google Scholar ] [ CrossRef ]
  34. وانگ، آر. کوی، ی. آهنگ، X. چن، ک. Fang, H. شبکه عصبی کانولوشن مبتنی بر چند اطلاعات با مکانیسم توجه برای پیش‌بینی مسیر عابر پیاده. تصویر Vis. محاسبه کنید. 2021 ، 107 ، 104110. [ Google Scholar ] [ CrossRef ]
  35. واسوانی، ع. Shazeer, N. پارمار، ن. Uszkoreit، J. جونز، ال. گومز، AN; قیصر، Ł. Polosukhin، I. توجه شما تمام چیزی است که نیاز دارید. در مجموعه مقالات پیشرفت‌ها در سیستم‌های پردازش اطلاعات عصبی، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 4 تا 9 دسامبر 2017؛ صفحات 5998–6008. [ Google Scholar ]
  36. وو، ی. چن، جی. لی، ز. ژانگ، ال. شیونگ، ال. لیو، ز. Knoll، A. HSTA: یک مدل توجه مکانی-زمانی سلسله مراتبی برای پیش‌بینی مسیر. IEEE Trans. وه تکنولوژی 2021 ، 70 ، 11295-11307. [ Google Scholar ] [ CrossRef ]
  37. Kipf، TN; Welling, M. طبقه بندی نیمه نظارت شده با شبکه های کانولوشن گراف. arXiv 2016 , arXiv:1609.02907. [ Google Scholar ]
  38. ولیچکوویچ، پ. کوکورول، جی. کازانووا، آ. رومرو، آ. لیو، پی. Bengio، Y. گراف شبکه های توجه. arXiv 2017 , arXiv:1710.10903. [ Google Scholar ]
  39. خو، ی. رن، دی. لی، ام. چن، ی. فن، م. شیا، اچ. ربات IEEE. خودکار Lett. 2021 ، 6 ، 1574-1581. [ Google Scholar ] [ CrossRef ]
  40. یانگ، جی. سان، ایکس. وانگ، آر جی. Xue، LX PTPGC: پیش‌بینی مسیر عابر پیاده توسط شبکه توجه گراف با ConvLSTM. ربات. Auton. سیستم 2022 ، 148 ، 103931. [ Google Scholar ] [ CrossRef ]
  41. کوساراجو، وی. صادقیان، ع. مارتین-مارتین، آر. رید، آی. رضاتوفیقی، ش. Savarese, S. Social-bigat: پیش بینی مسیر چندوجهی با استفاده از شبکه های توجه دوچرخه و گراف. arXiv 2019 , arXiv:1907.03395. [ Google Scholar ]
  42. لین، ز. فنگ، ام. سانتوس، CND؛ یو، م. شیانگ، بی. ژو، بی. Bengio، Y. تعبیه جملات خودآگاهی ساختاریافته. arXiv 2017 , arXiv:1703.03130. [ Google Scholar ]
  43. چن، جی. چن، جی. لی، ز. وو، ی. نول، الف. شبکه‌های کانولوشنال گراف مبتنی بر توجه برای پیش‌بینی مسیر. در مجموعه مقالات ششمین کنفرانس بین المللی IEEE 2021 در مورد رباتیک و مکاترونیک پیشرفته (ICARM)، چونگ کینگ، چین، 3 تا 5 ژوئیه 2021؛ صص 852-857. [ Google Scholar ]
  44. دینگ، دبلیو. چن، جی. شن، اس. پیش بینی رفتارهای وسیله نقلیه در یک افق گسترده با استفاده از شبکه تعامل رفتار. در مجموعه مقالات کنفرانس بین المللی رباتیک و اتوماسیون 2019 (ICRA)، مونترال، QC، کانادا، 20 تا 24 مه 2019؛ صص 8634–8640. [ Google Scholar ]
  45. Kingma، DP; Ba, J. Adam: روشی برای بهینه سازی تصادفی. arXiv 2014 ، arXiv:1412.6980. [ Google Scholar ]
شکل 1. معماری مدل STAM-LSTM پیشنهادی.
شکل 2. تصویر لایه توجه فضایی.
شکل 3. ساختار واحد LSTM.
شکل 4. تصویر لایه توجه زمانی.
شکل 5. نتایج پیش بینی تجسم شده تحت سناریوهای مختلف ترافیک. مسیر تاریخی، مسیر زمین-حقیقت و مسیر پیش بینی شده به ترتیب با خطوط آبی، قرمز و سبز نشان داده می شوند.

1 نظر

دیدگاهتان را بنویسید