یک مدل ترکیبی GLM برای پیش‌بینی جریان مسافری فضایی-زمانی مترو در سطح شهر

چکیده

پیش‌بینی دقیق جریان کوتاه‌مدت مسافران مترو در سطح شهر برای مدیریت شهری و برنامه‌ریزی حمل‌ونقل ضروری است. اخیراً تعداد فزاینده‌ای از محققین از مدل‌های یادگیری عمیق برای پیش‌بینی جریان مسافر استفاده کرده‌اند. با این وجود، به دلیل وابستگی مکانی پیچیده به شبکه مترو و الگوهای ترافیکی متغیر با زمان، این کار هنوز چالش برانگیز است. بنابراین، ما یک معماری یادگیری عمیق جدید را پیشنهاد می‌کنیم که شبکه‌های توجه گراف (GAT) را با شبکه‌های حافظه کوتاه‌مدت (LSTM) ترکیب می‌کند که GLM ترکیبی (هیبرید G AT و L STM M ) نامیده می‌شود.odel). مدل پیشنهادی وابستگی مکانی را از طریق لایه‌های توجه نمودار می‌گیرد و وابستگی زمانی را از طریق لایه‌های LSTM می‌آموزد. علاوه بر این، برخی از عوامل خارجی تعبیه شده است. ما GLM هیبریدی را با پیش‌بینی جریان مسافران مترو در شانگهای چین آزمایش کردیم. نتایج با پیش‌بینی‌های برخی از مدل‌های مبتنی بر داده‌های معمولی مقایسه می‌شوند. GLM ترکیبی کوچکترین خطای ریشه میانگین مربع (RMSE) و میانگین درصد مطلق خطا (MAPE) را در بازه های زمانی مختلف (TIs) دریافت می کند، که برتری مدل پیشنهادی را نشان می دهد. به طور خاص، در TI 10 دقیقه، GLM هیبریدی حدود 6 تا 30 درصد پیشرفت های اضافی را از نظر RMSE به ارمغان می آورد. ما همچنین حساسیت مدل به پارامترهای آن را بررسی می کنیم که به کاربرد این مدل کمک می کند.

کلید واژه ها:

یادگیری عمیق ؛ پیش بینی کوتاه مدت جریان مسافر ; شبکه توجه گراف ; شبکه حافظه کوتاه مدت بلند مدت ؛ مدل هیبریدی

1. مقدمه

مردم به طور مداوم با فضای شهری از طریق فعالیت‌های مکانی-زمانی مختلف، مانند سوار شدن به مترو، رانندگی و پیاده‌روی در تعامل هستند [ 1 ]. در عصر کلان داده، تکثیر سریع حسگرهای موبایل و فناوری‌های اینترنت به طور مداوم حجم بسیار زیادی از داده‌های مکانی-زمانی را تولید می‌کند که فرصت‌های بی‌سابقه‌ای را برای ساخت سیستم‌های حمل و نقل هوشمند (ITS) ارائه می‌دهد. به طور خاص، پیش‌بینی کوتاه‌مدت جریان مسافران مترو بخش مهمی از ITS است. پیش‌بینی دقیق جریان مسافر می‌تواند به مدیران شهری کمک کند تا رفتارهای سفر را تنظیم کنند، ازدحام مسافران را کاهش دهند و کیفیت خدمات سیستم مترو را افزایش دهند [ 2 ]]. از دیدگاه گسترده‌تر، پیش‌بینی جریان مسافر در مترو به بهینه‌سازی کارایی ترافیک از طریق کاهش عدم تعادل ظرفیت حمل‌ونقل در سراسر شهر کمک می‌کند. بنابراین، توسعه یک چارچوب موثر برای پیش‌بینی جریان مسافر در شبکه مترو در سطح شهر ضروری است.

به دلیل ارزش عملی زیادی که دارد، پیش بینی جریان مسافر به طور گسترده مورد بررسی قرار گرفته است. راه حل های موجود را می توان به سه دسته طبقه بندی کرد: روش های آماری، روش های یادگیری ماشین (ML) [ 3] و روش های یادگیری عمیق (DL). روش های آماری ساده هستند اما نمی توانند ویژگی های غیر خطی را ثبت کنند. روش‌های ML معایب روش‌های آماری را بهبود می‌بخشند، اما هنوز قادر به پردازش داده‌های خام مکانی-زمانی نیستند. هنگام ساخت یک مدل مبتنی بر ML، استخراج کننده های ویژگی به مهندسی دقیق و دانش دامنه قابل توجهی نیاز دارند تا داده های خام را به یک نمایش داخلی مناسب تبدیل کنند. این روش مهندسی ویژگی نامیده می شود. با توجه به کلان داده، روش مهندسی ویژگی به ویژه چالش برانگیز است. در مقایسه با روش‌های ML، روش‌های DL می‌توانند به طور خودکار مهندسی ویژگی را ایجاد کنند و ورودی خام را برای پیش‌بینی سرتاسر بپذیرند، که می‌تواند کاراکترهای غیرخطی پیچیده‌تری را بیاموزد و توانایی تعمیم بهتری به دست آورد. روش های DL پرکاربردترین راه حل برای پیش بینی جریان مسافر هستند.4 ، 5 ]. علاوه بر این، به دلیل توانایی CNN ها در استخراج وابستگی فضایی ، به یک گرایش محبوب برای بهره برداری از RNN ها در ترکیب با شبکه های عصبی کانولوشن (CNN) برای پیش بینی جریان ترافیک [ 6 ، 7 ] تبدیل شده است. با این حال، CNN ها برای ساختار فضایی در فضای اقلیدسی طراحی شده اند (به عنوان مثال، تصاویر دو بعدی و شبکه های منظم)، بنابراین نمی توانند ساختار توپولوژیکی پیچیده یک شبکه مترو را به طور کامل تطبیق دهند. با هدف این مشکل، مدل‌سازی نمودار بر روی داده‌های مکانی-زمانی در کانون توجه قرار گرفته است. چندین کار شبکه های عصبی نمودار (GNN) را برای گرفتن همبستگی فضایی توپولوژیکی مطالعه کرده اند [ 8 ، 9 ، 10]. با این حال، رویکردهای مبتنی بر ساختار گراف موجود هنوز دارای شکاف‌های زیر هستند:

بیشتر رویکردهای مبتنی بر ساختار گراف مبتنی بر شبکه متعارف گراف (GCN) [ 11 ] است که در حوزه طیفی عمل می‌کند. به دلیل استفاده از ماتریس لاپلاسی، GCN نیاز به متقارن بودن شبکه دارد. با این حال، همیشه برخی از شبکه های نامتقارن در یک شهر وجود دارد. شبکه در شهری که ساختار نمودار آن نامتقارن است را می توان به عنوان یک شبکه نامتقارن تعریف کرد. به عنوان مثال، یک شبکه راه با خیابان های یک طرفه و دو طرفه را می توان به عنوان یک شبکه نامتقارن توصیف کرد. در این مورد نمی توان از ساختار مبتنی بر GCN استفاده کرد.
اکثر روش های مبتنی بر ساختار گراف، بهبود ماتریس مجاور را نادیده می گیرند. به عبارت دیگر، آنها فقط به تأثیر گره های مجاور اهمیت می دهند اما گره هایی را که کمی دورتر قرار دارند نادیده می گیرند.
برخی از مدل‌های مبتنی بر ساختار نمودار فقط وابستگی مکانی را دریافت می‌کنند اما وابستگی زمانی و عوامل خارجی را نادیده می‌گیرند.

برای غلبه بر مسائل ذکر شده در بالا، ما یک مدل DL ترکیبی برای پیش‌بینی کوتاه‌مدت جریان مسافران مترو با ادغام شبکه‌های توجه نمودار (GATs) و شبکه‌های حافظه کوتاه‌مدت (LSTM) پیشنهاد می‌کنیم. مدل پیشنهادی GLM ترکیبی (هیبرید G AT و L STM M مدل) نامیده می شود. الهام گرفته از

[ 12 ]، ما GAT را برای حل این مشکل معرفی می کنیم که GCN نمی تواند برای شبکه های نامتقارن در یک شهر اعمال شود. GAT وابستگی فضایی گره‌های مجاور را با محاسبه ضریب توجه گراف بین گره‌ها، که برای نمودارهای نامتقارن مفید است، ضبط می‌کند. علاوه بر GAT، ما شبکه‌های LSTM را برای مدل‌سازی وابستگی زمانی جریان مسافران مترو ترکیب می‌کنیم. عوامل خارجی مربوط به جریان مسافران مترو شامل شرایط آب و هوایی، کیفیت هوا، آخر هفته ها، تعطیلات و رویدادها و غیره است. ما این عوامل را به یک لایه LSTM دیگر اضافه می کنیم تا دقت کل مدل را بهبود ببخشیم. سهم اصلی این مقاله به شرح زیر است:

ما یک مدل مبتنی بر ساختار گراف ترکیبی برای پیش‌بینی جریان کوتاه‌مدت مسافران مترو پیشنهاد می‌کنیم. ساختار GAT در مدل پیشنهادی می‌تواند وابستگی توپولوژیکی پیچیده را به تصویر بکشد. علاوه بر این، GAT تمرکز بیشتری روی گره ها می گذارد، به این معنی که می تواند این مشکل را حل کند که GCN نمی تواند در شبکه های نامتقارن استفاده شود. علاوه بر این، ماتریس مجاور را در ساختار GAT برای مدل‌سازی گره‌هایی که کمی دورتر قرار دارند، بهبود می‌دهیم.
ما یک چارچوب جدید برای مدل‌سازی مشترک وابستگی‌های زمانی، زمانی و خارجی دینامیکی در داده‌های حجم جریان مترو می‌سازیم. به طور خاص، لایه‌های مبتنی بر ساختار گراف را بر اساس GAT، لایه‌های بازگشتی بر اساس LSTM و یک لایه خروجی مبتنی بر شبکه‌های عصبی کاملاً متصل در مدل پیشنهادی پشته می‌کنیم.
ما آزمایش‌های گسترده‌ای را با استفاده از مجموعه داده ترافیک دنیای واقعی انجام می‌دهیم. نتایج نشان می‌دهد که GLM ترکیبی خطای پیش‌بینی را تقریباً 6 تا 10 درصد در مقایسه با بهترین خط پایه کاهش می‌دهد.
انگیزه پشت GLM هیبریدی پیش بینی موثر و دقیق جریان کوتاه مدت مسافران مترو در شهرها است که می تواند به مدیران شهری برای بهبود کارایی ترافیک کمک کند. پیش بینی جریان مسافر انواع برنامه های هوشمند را امکان پذیر می کند. این می تواند به شهروندان در برنامه ریزی مسیرها و برنامه ریزی زمان حرکت کمک کند. علاوه بر این، GLM ترکیبی فرصت‌های جدیدی را برای تکنیک‌های هوش مصنوعی (AI) در ساخت ITS به ارمغان می‌آورد که برای ساخت شهرهای هوشمند در عصر جدید مفید است.

بقیه این مقاله به شرح زیر سازماندهی شده است. در بخش 2 ، کار مرتبط را مرور می کنیم، روش های مورد استفاده و محدودیت های آنها را مورد بحث قرار می دهیم. بخش 3 مشکلات پیش‌بینی و نظریه‌های مربوطه را شرح می‌دهد. بخش 4 ساختار GLM هیبریدی را معرفی می کند. بخش 5 تجزیه و تحلیل مورد و نتایج مربوطه را نشان می دهد. بخش 6 دستاوردها و محدودیت های این مطالعه و همچنین کارهای آینده را خلاصه می کند.

2. کارهای مرتبط

پیش‌بینی جریان مسافر یکی از موضوعات مهم تحقیقاتی در سیستم‌های اطلاعات جغرافیایی است. تحقیقات گسترده ای برای حل این مشکل انجام شده است. روش‌های موجود را می‌توان به سه نوع کلی دسته‌بندی کرد: روش‌های آماری، روش‌های یادگیری ماشینی و روش‌های یادگیری عمیق.

2.1. روش های آماری

روش های آماری مقادیر آینده را بر اساس مقادیر مشاهده شده قبلی از طریق تحلیل سری زمانی [ 9 ] پیش بینی می کنند. از آنجایی که داده های جریان مسافر نوعی داده سری زمانی هستند، استفاده از روش های آماری برای حل کار پیش بینی امکان پذیر است. روش های آماری شامل مدل میانگین متحرک یکپارچه اتورگرسیو (ARIMA) [ 13 ] و تغییرات آن [ 14 ، 15 ]، مدل رگرسیون لجستیک [ 16 ]، فیلتر کالمن [ 17 ] و غیره است. لیو [ 13 ] از مدلی مبتنی بر ARIMA استفاده کرد. برای پیش بینی ترافیک ریلی و دریافت نتایج برتر از یک شبکه پس انتشار (BP). دینگ [ 18] مدل‌های ARIMA و GRACH را برای پیش‌بینی نوسانات دینامیکی سواری کوتاه‌مدت مترو، یکپارچه کرد. لیانگ [ 19 ] رویکرد فیلتر کالمن و K-نزدیکترین همسایه (KNN) را برای مدیریت روندهای مختلف تغییرات در داده های جریان مسافر ترکیب کرد.

این روش ها به خوبی می توانند ویژگی های خطی را به تصویر بکشند اما ممکن است ویژگی های غیرخطی جریان مسافر را نادیده بگیرند. با این حال، جریان مسافر اغلب تحت تأثیر عوامل مختلفی قرار می گیرد. اگر داده ها پایدار نباشند، عملکرد پیش بینی روش های آماری ممکن است به طور قابل توجهی بدتر شود.

2.2. روش های یادگیری ماشینی

روش‌های ML می‌توانند روابط غیرخطی پیچیده بین داده‌های ورودی و خروجی را ترسیم کنند، که می‌تواند مسئله روش‌های آماری را برطرف کند. ماشین بردار پشتیبان (SVM) [ 20 ] یکی از پرکاربردترین مدل های ML است. می تواند بین دقت پیش بینی و توانایی تعمیم بر اساس اصل حداقل سازی ریسک ساختاری مصالحه ایجاد کند [ 21 ]. ژانگ [ 22 ] از SVM برای پیش بینی جریان ترافیک استفاده کرد که نتایج بهتری نسبت به مدل های رگرسیون خطی به دست آورد. مدل‌های ترکیبی مبتنی بر SVR نیز به طور گسترده مورد استفاده قرار گرفته‌اند [ 23 ، 24 ]. لی [ 25] مدل میانگین متحرک یکپارچه یکپارچه اتورگرسیوی فصلی (SARIMA) و SVM را برای ایجاد یک مدل پیش‌بینی جریان ترافیک یکپارچه کرد. Cao [ 26 ] پارامتر مدل SVM را با استفاده از بهینه سازی ازدحام جزئی (PSO) برای پیش بینی جریان ترافیک بهبود بخشید. وانگ [ 21 ] یک مدل آنلاین SVM برای ثبت ویژگی‌های تناوبی و غیرخطی سواری کوتاه‌مدت مترو پیشنهاد کرد که ویژگی‌های ورودی را از طریق مدل SARIMA استخراج می‌کند و پارامترها را از طریق PSO بهینه می‌کند. برخی دیگر از مدل‌های ML مانند شبکه‌های بیزی، جنگل‌های تصادفی (RFs)، شبکه‌های عصبی BP، KNN و غیره نیز در پیش‌بینی جریان ترافیک استفاده می‌شوند. Roos [ 27 ] یک شبکه بیزی برای پیش بینی جریان ترافیک پیشنهاد کرد که می تواند در داده های ناقص استفاده شود. لیو [ 28] روش‌های RF را برای پیش‌بینی جریان مسافر ترکیب کرد، که تمرکز بیشتری بر ترکیب ویژگی‌های ورودی دارد. Zhang [ 29 ] تجزیه و تحلیل مؤلفه اصلی (PCA) و شبکه های BP خطا را برای پیش بینی جریان مسافر اتوبوس، که سرعت همگرایی را افزایش می دهد، ترکیب کرد. Bai [ 30 ] از روش های KNN پیشرفته با در نظر گرفتن ضریب روند و فاکتور فاصله زمانی جریان مسافر استفاده کرد که عملکرد بهتری نسبت به شبکه BP و روش اصلی KNN دارد.

روش‌های ML دقت پیش‌بینی جریان مسافران مترو را تا حد زیادی بهبود بخشید. با این حال، عملکرد روش های ML به شدت به ویژگی های طراحی شده به صورت دستی بستگی دارد. بنابراین، بدست آوردن بهترین نتایج برای پیش‌بینی جریان مسافر به دلیل داده‌های مکانی-زمانی پیچیده و عظیم، دشوار است. امروزه به ندرت می توان از یک مدل ML برای پیش بینی جریان مسافر استفاده کرد.

2.3. روش های یادگیری عمیق

با توجه به پیچیدگی داده‌های مکانی-زمانی، بیشتر متون پیشرفته از روش‌های DL برای پیش‌بینی جریان مسافر استفاده می‌کنند. در مقایسه با روش‌های ML، روش‌های DL می‌توانند به طور خودکار ویژگی‌های ضروری را از داده‌های خام استخراج کنند و آنها را با توجه به تغییرات ورودی‌ها قوی کنند [ 31 ].

RNN ها [ 32 ] در برخورد با اطلاعات توالی پیچیده خوب هستند. از آنجایی که جریان مسافر نوعی داده سری زمانی است، RNN ها و جانشینان آنها مانند شبکه های حافظه کوتاه مدت بلند مدت (LSTM) [ 33 ] و واحدهای بازگشتی دروازه ای (GRU) [ 34 ] معمولاً در کار پیش بینی استفاده می شوند. ژائو [ 35 ] یک مدل پیش‌بینی ترافیک مبتنی بر شبکه‌های حافظه کوتاه‌مدت (LSTM) پیشنهاد کرد و به عملکرد خوبی دست یافت. Zhang [ 36 ] از یک روش مبتنی بر GRU برای پیش بینی جریان ترافیک شهری استفاده کرد. بعدها، HAN [ 37 ] بهینه ساز LSTM را بهبود بخشید و نتایج بهتری نسبت به LSTM داشت. لین [ 38] از جنگل تصادفی (RF) برای محاسبه اهمیت ویژگی استفاده کرد و از LSTM برای پیش‌بینی جریان مسافران مترو استفاده کرد. با این حال، مدل‌های ذکر شده در بالا فقط وابستگی زمانی را دریافت می‌کنند، اما از وابستگی مکانی غفلت می‌کنند، به طوری که نمی‌توانند عملکرد را برای کل شبکه‌ها بهینه کنند.

CNN ها [ 39 ] در اصل برای داده هایی با شبکه های معمولی، مانند تصاویر، طراحی شده اند. برخی از کارها از CNN برای شناسایی وابستگی فضایی با فیلترها یا هسته های مختلف محلی استفاده می کنند. Zhang [ 40 ] داده‌های جریان مکانی-زمانی را در شبکه‌های منظم وارد کرد و مدلی مبتنی بر CNN به نام DeepST پیشنهاد کرد که شامل سه قطعه است که زمان اخیر، تاریخ نزدیک و تاریخ دور را نشان می‌دهد. این یک نقطه عطف در پیش بینی جریان مسافر است. از آن زمان به بعد، مدل های مبتنی بر CNN در پیش بینی جریان مسافر غالب شدند. Zhang [ 41 ] به ادغام واحد باقیمانده برای پیشنهاد ST-ResNet ادامه داد. شبکه‌های باقیمانده می‌توانند عمق مدل را برای گرفتن کاراکترهایی با فواصل طولانی‌تر و ساختارهای پیچیده‌تر افزایش دهند. یو [ 42] یک شبکه سه بعدی CNN برای دستیابی به پیش بینی در مقیاس بزرگ در جریان ترافیک طراحی کرد. برای درک وابستگی مکانی-زمانی، محققان از RNN ها در ترکیب با شبکه های مبتنی بر CNN برای پیش بینی جریان مسافر استفاده می کنند. رن [ 7 ] ResNet و LSTM را برای تشکیل یک مدل ترکیبی، HIDLST، ترکیب کرد که نتایج بهتری نسبت به ST-ResNet دارد. Qiao [ 6 ] از CNN و LSTM یک بعدی برای پیش بینی جریان استفاده کرد.

با این حال، مدل‌های مبتنی بر CNN باید بر روی داده‌های شبکه منظم انجام شوند، به این معنی که نمی‌تواند رابطه توپولوژیکی نامنظم داده‌های اقلیدسی را ثبت کند. رابطه توپولوژیک اغلب در زیرساخت های ترافیکی مانند ایستگاه ها، خطوط مترو، جاده ها و غیره وجود دارد. بنابراین باید اطلاعات توپولوژیکی شبکه های ترافیکی را در نظر بگیریم. با توسعه تئوری گراف [ 11 ، 43 ، 44 ]، می توان از یک ساختار نمودار برای پیش بینی جریان مسافر استفاده کرد. Yu [ 45 ] از GCN برای گرفتن رابطه فضایی استفاده کرد و از پیچیدگی CNN یک بعدی برای کشف رابطه زمانی استفاده کرد. مدل STGCN پیشنهادی با استفاده از مجموعه داده‌های PEMS و Beijing تأیید شد. ژائو [ 46] مدل شبکه کانولوشن گراف زمانی (T-GCN) را پیشنهاد کرد، که شبکه کانولوشن گراف (GCN) را با GRU برای پیش‌بینی ترافیک ترکیب می‌کند. Zhang [ 47 ] از GCN و 3D-CNN برای مدلسازی جریان مسافر استفاده کرد. Ye [ 10 ] سه ماتریس فضایی برای استخراج وابستگی فضایی یک همسایه با فواصل مختلف طراحی کرد. با این حال، به دلیل استفاده از GCN، این مدل ها فقط در شبکه های نامتقارن قابل استفاده هستند. بر اساس مکانیسم توجه، Guo [ 8 ] یک مدل شبکه کانولوشنال مکانی-زمانی (ASTGCN) پیشنهاد کرد که می‌تواند به طور موثر وابستگی مکانی-زمانی پویا در داده‌های ترافیک را به تصویر بکشد. ژانگ [ 48] ResNet، GCN و توجه LSTM را برای ساخت یک مدل هیبریدی، ResLSTM، ترکیب کرد که نتایج خوبی در پیش‌بینی جریان مسافران مترو در پکن به دست آورده است. با این حال، این مدل ها از بهبود ماتریس مجاور غفلت می کنند.

2.4. خلاصه

روش های آماری و روش های ML را می توان برای پیش بینی جریان مسافران مترو استفاده کرد. با این حال، هر دو نوع مدل نمی‌توانند ورودی‌های خام را برای پیش‌بینی بپذیرند. بنابراین، به‌دلیل پیچیدگی و تصادفی بودن داده‌های مکانی-زمانی، دستیابی به دقت پیش‌بینی بالاتر دشوار است.

در میان روش‌های DL، مدل مبتنی بر ساختار گراف، نقطه داغ در مورد پیش‌بینی جریان مسافر است. اگرچه ادبیات فعلی پیشرفت را در وظایف داده شده نشان می دهد، تعدادی از شکاف های دانش وجود دارد که باید مورد توجه قرار گیرد، که (1) مدل های مبتنی بر GCN نیاز به متقارن بودن ساختار شبکه دارند، بنابراین برای شبکه های نامتقارن قابل استفاده نیستند. شهرستان؛ (2) بیشتر روش‌های مبتنی بر ساختار گراف فقط به تأثیر گره‌های مجاور اهمیت می‌دهند، اما گره‌هایی را که کمی دورتر قرار دارند نادیده می‌گیرند. و (3) برخی از مدل‌های مبتنی بر ساختار نمودار فقط وابستگی مکانی را دریافت می‌کنند اما وابستگی زمانی و عوامل خارجی را نادیده می‌گیرند.

مدل ما از GAT [ 12 ] الهام گرفته شده است ، که می تواند وابستگی فضایی توپولوژیکی شبکه های نامتقارن را مدل کند. با هدف حل مشکلات فوق، ما GLM ترکیبی را برای استخراج وابستگی مکانی-زمانی و وابستگی خارجی به طور یکپارچه پیشنهاد کردیم.

3. مقدماتی

3.1. تعریف مشکل

هدف تحقیق مدل‌سازی یکپارچه وابستگی مکانی و زمانی داده‌های جریان مسافران مترو است. وابستگی مکانی به تأثیر بین ایستگاه‌های مترو اشاره دارد، در حالی که وابستگی زمانی به تأثیر جریان تاریخی مسافران مترو در نقطه زمانی فعلی اشاره دارد. علاوه بر این، جریان مسافران مترو تحت تأثیر برخی عوامل خارجی مانند شرایط آب و هوایی، دما، تعطیلات، کیفیت هوا و غیره قرار می‌گیرد. برای مثال، مردم تمایل دارند در یک روز بارانی به جای بیرون رفتن برای شام در خانه بمانند.

بنابراین، مسئله پیش‌بینی فضایی-زمانی جریان مسافران مترو را می‌توان به عنوان یک معادله در نظر گرفت، هدف =

F_{p r e d i c t i o n} (I_{S}, I_{T}, I_{E}, W)

، جایی که Target جریان مسافر هدف در زمان t است،

F_{p r e d i c t i o n}

مدلی است که برای مقابله با مشکل استفاده می شود،

I_{S}

ورودی مربوط به وابستگی فضایی را ارائه می دهد،

I_{T}

ورودی وابستگی زمانی را ارائه می دهد،

I_{E}

عامل خارجی تأثیرگذار بر گردش مسافران مترو است و

W

پارامترهایی را که باید یاد بگیرند را نشان می دهد. کل فرآیند پیش بینی در شکل 1 نشان داده شده است . هدف ما این است که از جریان تاریخی مسافر برای پیش بینی جریان مسافر در مترو در یک لحظه خاص استفاده کنیم.

داده های ورودی از سه بخش از داده های جریان تاریخی، الگوهای نزدیک، روزانه و هفتگی به دست می آیند. الگوی نزدیک به زمان اخیر اشاره دارد. الگوهای روزانه و هفتگی جریان مسافر تاریخی را همزمان با زمان هدف، اما در دوره های روزانه یا هفتگی نشان می دهند [ 7 ]. اگر بازه زمانی هدف 7:00 صبح تا 7:10 صبح روز شنبه باشد، الگوی بسته به زمان نزدیک به 7:00 صبح اشاره دارد، مانند 6:50 صبح، 6:40 صبح، 6:30 صبح و غیره. الگوی روزانه به 7:00 تا 7:10 صبح هر روز برای روزهای قبل اشاره دارد. الگوی هفتگی زمان بین 7:00 تا 7:10 صبح هر شنبه هفته های قبل است.

داده های ورودی الگوهای نزدیک، روزانه و هفتگی را می توان به صورت معادلات (1) – (3) توصیف کرد.

من سی = (من t - 1 ، من t - 2, \dots, من t - c) ،

(1)

من D = (من t - 1 \cdot n ، من t - 2 \cdot n, \dots, من t - d \cdot n) ،

(2)

من دبلیو = (من t - 1 \cdot 7 \cdot n ، من t - 2 \cdot 7 \cdot n, \dots, من t - w \cdot 7 \cdot n) ،

(3)

جایی که $I_{t}$ نشان دهنده جریان مسافر در زمان هدف t است. $I_{C}$ ، $I_{D}$ و $I_{W}$ نشان دهنده جریان تاریخی مسافر در الگوهای بسته، روزانه و هفتگی است. تعداد بازه های زمانی را در نظر بگیرید $I_{C}$ ، $I_{D}$ ، و $I_{W}$ c و d و w هستند. علاوه بر این، تعداد کل بازه زمانی یک روز n است.

3.2. اصل GAT

شبکه های توجه نمودار (GAT) توسط پیشنهاد شد

[ 12 ]، که می تواند بر روی داده های ساختار یافته گراف عمل کند. GAT یک مکانیسم توجه را در ساختار گراف معرفی می‌کند و لایه‌های خودتوجهی پوشانده را اعمال می‌کند که می‌توانند اهمیت متفاوتی را به گره‌های مختلف در یک محله بدون عملیات ماتریس پرهزینه نسبت دهند [ 49 ]. علاوه بر این، یک ساختار گراف به عنوان یک ماسک به مدل تزریق می شود. به این ترتیب نه عملیات ماتریس مورد نیاز است و نه کل ساختار گراف. بنابراین، می‌توانیم GAT را برای گراف‌های ناقص، گراف‌های جهت‌دار، گراف‌های نامتقارن و نمودارهای پویا اعمال کنیم. ساختار نمودار یکی از سازمان‌های معمول داده‌های مترو در سطح شهر است. بنابراین، می‌توانیم GAT را برای پیش‌بینی جریان مسافران مترو در سطح شهر اعمال کنیم.

با استفاده از GAT، اولین گام ساخت یک ساختار گراف است $G (V, E)$ ، جایی که $V$ گره، یعنی ایستگاه مترو است. و $E$ خط اتصال، یعنی خط مترو بین دو ایستگاه همسایه است. سپس باید یک لایه بلوک بسازیم تا شبکه های توجه گراف را بسازیم (با چیدن این لایه). ورودی ها ویژگی گره ها هستند که به جریان مسافری هر ایستگاه مترو اشاره دارد. می توان آن را چنین توصیف کرد خطای پردازش ریاضی ریاضی ] پردازش ریاضی پردازش ریاضی [ خطای ] [ خطای پردازش ریاضی، ، که در آن N تعداد گره ها و F ویژگی هر گره است. این لایه مجموعه ای از ویژگی های جدید را تولید می کند ، به عنوان خروجی، که در آن ویژگی های خروجی را نشان می دهد. یک تبدیل خطی مشترک برای هر گره اعمال می شود که توسط یک ماتریس وزن پارامتری می شود. . سپس یک مکانیسم خودتوجه مشترک را روی گره ها انجام می دهیم که با علامت گذاری شده است . هدف آن محاسبه ضرایب توجه است ، جایی که $e_{i j}$ اهمیت را نشان می دهد $j$ به $i$ . بعداً باید ماسکی را بر اساس ساختار نمودار تزریق کنیم، به این معنی که فقط محاسبات را انجام می دهیم $j \in N_{i}$ ، جایی که $N_{i}$ همسایگی گره است $i$ (همانطور که در شکل 2 نشان داده شده است ، ما فقط تاثیر گره 1، 7، 5، 6 را بر گره 3 محاسبه می کنیم). در نهایت، می‌توانیم LeakyRelu را برای محاسبه اعمال کنیم. ضریب توجه را می توان به صورت زیر نشان داد:

(4)

که در آن ^T نشان دهنده حمل و نقل و $| |$ عملیات الحاق است.

برای تثبیت فرآیند یادگیری توجه به خود، نویسنده مکانیسم خود را برای به کارگیری توجه چند سر گسترش داد. ویژگی ها به هم متصل هستند و خروجی کاراکتر ویژگی به صورت زیر است:

(5)

جایی که $| |$ نشان دهنده الحاق، $α_{i j}^{k}$ ضرایب توجه نرمال شده هستند که توسط مکانیسم توجه k-امین محاسبه می شوند و $W^{k}$ ماتریس وزن تبدیل خطی ورودی مربوطه است [ 12 ]. به طور خاص، اگر توجه چند سر را روی لایه پیش‌بینی نهایی شبکه انجام دهیم، از میانگین‌گیری در لایه‌ها به جای الحاق استفاده می‌کنیم. این فرآیند در شکل 3 نشان داده شده است که شامل سه سر است. هدف ما محاسبه ضریب توجه گراف گره 2،3 و 4 به گره 1 در تصویر است.

ضرایب توجه تمام گره های همسایه را محاسبه کرده و با جمع آنها ضریب توجه نهایی گره را بدست می آوریم. به این ترتیب، می توان تأثیر بین گره ها را به دست آورد و وابستگی فضایی جریان مسافر را به دقت به دست آورد.

3.3. اصل LSTM

شبکه های حافظه کوتاه مدت (LSTM) توسط Hochreiter و Schmidhuber [ 50 ] پیشنهاد شدند. این یک نوع شبکه عصبی بازگشتی (RNN) است. هدف LSTM مدل‌سازی ویژگی‌های دورتر سری‌های زمانی است. LSTM می تواند مشکلات انفجار و ناپدید شدن گرادیان را در RNN های سنتی حل کند. LSTM از سه بخش تشکیل شده است، یک لایه ورودی، یک لایه پنهان بازگشتی و یک لایه خروجی. متفاوت از RNN های سنتی، لایه پنهان مکرر LSTM حاوی یک بلوک حافظه ویژه است که ساختار هسته آن در شکل 4 نشان داده شده است . بلوک حافظه حاوی سلول های حافظه با اتصال خود است که وضعیت زمانی شبکه را در هر مرحله زمانی ذخیره می کند [ 51 ]]. حالت موقت توسط سه گیت کنترل می شود: دروازه فراموشی، دروازه ورودی و دروازه خروجی. دروازه ورودی برای محافظت از محتویات حافظه از ورودی های نامربوط است. دروازه فراموشی فراموش کردن یک پیام بی فایده است. دروازه خروجی برای صادرات خروجی است.

در شکل 4 ،

X_{t}

ورودی نقطه زمانی فعلی است،

h_{t}

خروجی لایه پنهان است،

h_{t - 1}

لایه پنهان خروجی بازه زمانی قبلی است،

C

حالت ورودی سلول است،

C_{t}

حالت خروجی سلول است و

C_{t - 1}

حالت خروجی بازه زمانی قبلی است. ضرایب دروازه ورودی، دروازه فراموشی و دروازه خروجی در LSTM را می توان در معادلات (6) – (8) زیر محاسبه کرد.

دروازه ورودی:

$من تی = σ (دبلیو x i \cdot ایکس تی + دبلیو h من \cdot ساعت t - 1 + ب من) ،$

(6)
دروازه فراموش:

$f تی = σ (دبلیو x f \cdot ایکس تی + دبلیو h f \cdot ساعت t - 1 + ب f) ،$

(7)
دروازه خروجی:

$o تی = σ (دبلیو x o \cdot ایکس تی + دبلیو ساعت_\cdot ساعت t - 1 + ب o) ،$

(8)

جایی که

W_{x i}

W_{x f}

، و

W_{x o}

پارامترهای وزن قابل یادگیری هستند که متصل می شوند

X_{t}

با گیت ورودی، گیت فراموشی و گیت خروجی.

W_{h i}

W_{h f}

، و

W_{h o}

پارامترهای وزن متصل هستند

h_{t - 1}

با سه دروازه

b_{i}

b_{f}

، و

b_{o}

پارامترهای افست قابل یادگیری هستند.

σ

تابع سیگموئید است:

\frac{1}{1 + \exp (- x)}

وضعیت ورودی سلول به صورت زیر است:

C = t a n h (دبلیو x C \cdot ایکس تی + دبلیو h C \cdot ساعت t - 1 + ب سی) ،

(9)

جایی که $W_{x C}$ یک پارامتر وزن اتصال است $X_{t}$ با ورودی ها، $W_{h C}$ ماتریس پارامتر اتصال است $h_{t - 1}$ با ورودی های سلولی، $b_{C}$ پارامترهای افست یادگیری است و tanh تابع مماس است.

وضعیت خروجی سلول به شرح زیر است:

سی تی = f تی \cdot سی t - 1 + من تی \cdot C ،

(10)

جایی که $i_{t}$ ، $f_{t}$ ، $C_{t}$ ، $C_{t - 1}$ ، و $C$ همان ابعاد را به اشتراک بگذارید

خروجی لایه پنهان به صورت زیر است:

ساعت تی = o تی \cdot یک ساعت (_ _سی تی) .

(11)

به طور خلاصه، LSTM می تواند اطلاعات مورد نیاز را “به خاطر بیاورد” و اطلاعات بی فایده را “فراموش کند”. بنابراین، LSTM دارای توانایی قوی برای پردازش یک سری زمانی با وابستگی زمانی طولانی تر است. استفاده از LSTM برای پیش‌بینی جریان مسافران مترو می‌تواند وابستگی زمانی داده‌ها را ثبت کند، که به دقت مدل پیش‌بینی کمک می‌کند.

4. توسعه مدل

پیش‌بینی جریان مسافران مترو در سطح شهر یک مشکل مدل‌سازی مکانی-زمانی معمولی است. بنابراین، ما یک مدل ترکیبی از GAT و LSTM را پیشنهاد می‌کنیم که GLM ترکیبی نامیده می‌شود. علاوه بر این، مدل پیشنهادی از یک الگوی چند زمانه تشکیل شده است. با GAT، مدل ترکیبی می تواند با مشکلات توپولوژیکی بهتر از مدل های دیگر مقابله کند. این مدل از پنج بخش، شاخه های 1-5 تشکیل شده است. شاخه های 1-3 از ساختار GAT برای به تصویر کشیدن وابستگی فضایی در الگوهای نزدیک، روزانه و هفتگی استفاده می کنند. شاخه 4 از LSTM برای ثبت وابستگی زمانی از طریق الگوهای بسته، روزانه و هفتگی استفاده می کند. شعبه 5تأثیر عوامل خارجی را نشان می دهد. علاوه بر این، یک لایه LSTM برای به دست آوردن داده های خروجی استفاده می شود. معماری مدل دقیق در شکل 5 ارائه شده است .

4.1. شاخه های 1-3: وابستگی فضایی

تأثیر جریان تاریخی مسافر را می توان به سه الگو تقسیم کرد: الگوی نزدیک، الگوی روزانه و الگوی هفتگی. ما سه الگو را به عنوان سه قسمت می گیریم که برای آموزش به GAT ارسال می شود. به دو دلیل این سه الگو را از هم جدا می کنیم. از یک طرف، اگر سه بخش را به عنوان یک ورودی در نظر بگیریم، داده های موجود در GAT ممکن است مقدار زیادی داشته باشند. بنابراین، روند آموزش ممکن است بسیار کند باشد. از سوی دیگر، همبستگی فضایی بین سه الگو قوی نیست، بنابراین نیازی به آموزش آنها با هم نیست. ساختار GAT در مدل ما می تواند کاراکترهای توپولوژیکی جریان مسافر را به تصویر بکشد و می تواند در شبکه های نامتقارن استفاده شود. هر ساختار GAT در شاخه های 1 تا 3 شامل دو لایه توجه گراف است. رابطه توپولوژیکی بین گره ها برای ساخت ماتریس مجاورت که به عنوان یک لایه ماسک در نظر گرفته می شود استفاده می شود. ما از ماسک برای ثبت روابط توپولوژیکی بین ایستگاه های مترو استفاده می کنیم. برای مشاهده همبستگی‌های ایستگاه‌های مترو، ماتریس سنتی مجاور را بهبود دادیم. در ماتریس مجاور سنتی، اگر دو گره را بتوان با خطوط به هم متصل کرد، 1 را در ماتریس قرار می دهیم. با این حال، ما می‌خواهیم همبستگی فضایی برخی از گره‌ها را که کمی دورتر قرار دارند برای پیش‌بینی بهتر ضبط کنیم. برای این منظور، 4،3،2، و 1 را به ترتیب به عنوان وزن گره های نزدیک، کمتر نزدیک، بسیار کمتر نزدیک، و گره های بیشتر تنظیم می کنیم. علاوه بر این، اگر گره ها با چندین یال به هم متصل شوند، 0.5 به وزن هر یال اضافه می کنیم. انجام این کار همچنین می تواند پیش بینی شبکه مترو در مقیاس بزرگ را تسهیل کند. ما از ماسک برای ثبت روابط توپولوژیکی بین ایستگاه های مترو استفاده می کنیم. برای مشاهده همبستگی‌های ایستگاه‌های مترو، ماتریس سنتی مجاور را بهبود دادیم. در ماتریس مجاور سنتی، اگر دو گره را بتوان با خطوط به هم متصل کرد، 1 را در ماتریس قرار می دهیم. با این حال، ما می‌خواهیم همبستگی فضایی برخی از گره‌ها را که کمی دورتر قرار دارند برای پیش‌بینی بهتر ضبط کنیم. برای این منظور، 4،3،2، و 1 را به ترتیب به عنوان وزن گره های نزدیک، کمتر نزدیک، بسیار کمتر نزدیک، و گره های بیشتر تنظیم می کنیم. علاوه بر این، اگر گره ها با چندین یال به هم متصل شوند، 0.5 به وزن هر یال اضافه می کنیم. انجام این کار همچنین می تواند پیش بینی شبکه مترو در مقیاس بزرگ را تسهیل کند. ما از ماسک برای ثبت روابط توپولوژیکی بین ایستگاه های مترو استفاده می کنیم. برای مشاهده همبستگی‌های ایستگاه‌های مترو، ماتریس سنتی مجاور را بهبود دادیم. در ماتریس مجاور سنتی، اگر دو گره را بتوان با خطوط به هم متصل کرد، 1 را در ماتریس قرار می دهیم. با این حال، ما می‌خواهیم همبستگی فضایی برخی از گره‌ها را که کمی دورتر قرار دارند برای پیش‌بینی بهتر ضبط کنیم. برای این منظور، 4،3،2، و 1 را به ترتیب به عنوان وزن گره های نزدیک، کمتر نزدیک، بسیار کمتر نزدیک، و گره های بیشتر تنظیم می کنیم. علاوه بر این، اگر گره ها با چندین یال به هم متصل شوند، 0.5 به وزن هر یال اضافه می کنیم. انجام این کار همچنین می تواند پیش بینی شبکه مترو در مقیاس بزرگ را تسهیل کند. ما ماتریس مجاور سنتی را بهبود دادیم. در ماتریس مجاور سنتی، اگر دو گره را بتوان با خطوط به هم متصل کرد، 1 را در ماتریس قرار می دهیم. با این حال، ما می‌خواهیم همبستگی فضایی برخی از گره‌ها را که کمی دورتر قرار دارند برای پیش‌بینی بهتر ضبط کنیم. برای این منظور، 4،3،2، و 1 را به ترتیب به عنوان وزن گره های نزدیک، کمتر نزدیک، بسیار کمتر نزدیک، و گره های بیشتر تنظیم می کنیم. علاوه بر این، اگر گره ها با چندین یال به هم متصل شوند، 0.5 به وزن هر یال اضافه می کنیم. انجام این کار همچنین می تواند پیش بینی شبکه مترو در مقیاس بزرگ را تسهیل کند. ما ماتریس مجاور سنتی را بهبود دادیم. در ماتریس مجاور سنتی، اگر دو گره را بتوان با خطوط به هم متصل کرد، 1 را در ماتریس قرار می دهیم. با این حال، ما می‌خواهیم همبستگی فضایی برخی از گره‌ها را که کمی دورتر قرار دارند برای پیش‌بینی بهتر ضبط کنیم. برای این منظور، 4،3،2، و 1 را به ترتیب به عنوان وزن گره های نزدیک، کمتر نزدیک، بسیار کمتر نزدیک، و گره های بیشتر تنظیم می کنیم. علاوه بر این، اگر گره ها با چندین یال به هم متصل شوند، 0.5 به وزن هر یال اضافه می کنیم. انجام این کار همچنین می تواند پیش بینی شبکه مترو در مقیاس بزرگ را تسهیل کند. و 1 به عنوان وزن نزدیکترین گره ها، به ترتیب کمتر نزدیک، بسیار کمتر نزدیک، و گره های بیشتر. علاوه بر این، اگر گره ها با چندین یال به هم متصل شوند، 0.5 به وزن هر یال اضافه می کنیم. انجام این کار همچنین می تواند پیش بینی شبکه مترو در مقیاس بزرگ را تسهیل کند. و 1 به عنوان وزن نزدیکترین گره ها، به ترتیب کمتر نزدیک، بسیار کمتر نزدیک، و گره های بیشتر. علاوه بر این، اگر گره ها با چندین یال به هم متصل شوند، 0.5 به وزن هر یال اضافه می کنیم. انجام این کار همچنین می تواند پیش بینی شبکه مترو در مقیاس بزرگ را تسهیل کند.

4.2. شاخه 4: وابستگی زمانی

یکی دیگر از ویژگی های آشکار جریان مسافری مترو، وابستگی زمانی آن است که به تأثیر جریان تاریخی مسافر بر زمان فعلی اشاره دارد. سه جنبه آشکار همبستگی زمانی وجود دارد: مجاورت، روند و تناوب. مجاورت به معنای تأثیر نزدیکترین فواصل زمانی است. روند به معنای روند کلی در یک دوره زمانی است. دوره‌ای بودن تأثیر زمان طولانی‌تری است. در مدل ما، فواصل زمانی الگوهای بسته، روزانه و هفتگی ادغام شده و به LSTM ارسال می شود. LSTM یک RNN ویژه است که از ساختارهای دروازه برای تعیین ضرورت اطلاعات استفاده می کند. LSTM مشکلات انفجار گرادیان و ناپدید شدن گرادیان RNN های سنتی را حل می کند و آن را برای گرفتن کاراکترهای فاصله زمانی بسیار طولانی تری در دسترس قرار می دهد. در GLM هیبریدی، یک LSTM دو لایه برای توالی جریان مسافران مترو استفاده می شود. سپس داده ها صاف می شوند و به طور کامل با 578 نورون متصل می شوند. از طریق شعبه 4 می توان وابستگی زمانی را به دست آورد و تناوب کلی جریان مسافران مترو را مطالعه کرد.

4.3. شاخه 5: نفوذ خارجی

جدای از عوامل مکانی و زمانی، برخی عوامل خارجی نیز ممکن است بر پیش‌بینی جریان مسافران مترو تأثیر بگذارند. به عنوان مثال، مردم تمایل دارند در طوفان های شن یا روزهای بسیار آلوده در خانه بمانند. رویدادهای مهم، مانند روز ملی، ممکن است باعث شود گردش مسافران مترو به اوج جدیدی برسد. عوامل خارجی مراجع ضروری برای افراد برای برنامه ریزی برنامه های سفر خود هستند. در حال حاضر تنها چند مدل عوامل خارجی را وارد مدل پیش‌بینی می‌کنند و توجه کمی به کیفیت هوا دارند. مدل ما 11 عامل خارجی را انتخاب می کند که می توان آنها را به سه دسته تقسیم کرد: شرایط آب و هوایی (حداکثر درجه حرارت، حداقل دما و روز بارانی یا غیر بارانی)، کیفیت هوا (AQI، PM2.5، PM10، NO ₂ ، CO، O ₃ ، و SO ₂و رویدادها (خواه روز تعطیل باشد یا نه). ما از سری زمانی این عوامل برای تحلیل تاثیر خارجی استفاده می کنیم. داده های خارجی هر ساعت ثبت می شوند و نمونه هایی در جدول 1 نشان داده شده است.

توجه داشته باشید که داده های خارجی هر ساعت ثبت می شوند. با این حال، فاصله زمانی در آزمایش ما 10 دقیقه است، یعنی یک روز شامل 144 بازه زمانی و یک ساعت شامل 6 بازه زمانی است. بنابراین، 6 بازه، داده های ثبت شده مشابهی را در یک ساعت به اشتراک می گذارند. به عنوان مثال، داده های وضعیت آب و هوا از ساعت 6:00 تا 6:10، داده های ثبت شده را از ساعت 6:00 تا 7:00 به اشتراک می گذارد، همانطور که در ردیف اول جدول 1 نشان داده شده است.

ما داده های خارجی را عادی کردیم تا همه مقادیر در یک محدوده قرار گیرند. ما رمزگذاری یکباره را روی مقادیر بولی مانند Holiday و RainyDay انجام دادیم. سپس داده های پردازش شده به لایه های LSTM انباشته ارسال شد. ما یک LSTM سه لایه ساختیم و هر لایه 256 نورون دارد. در نهایت، خروجی های شاخه 5 و خروجی های 4 شاخه قبلی برای آموزش در قسمت فیوژن فیوژن قرار داده شد.

4.4. ویژگی فیوژن

از آنجایی که داده های خروجی از پنج شاخه به شکل یکسان هستند، می توانیم پنج قسمت را با هم ترکیب کنیم. با این حال، تأثیر بخش های مختلف متفاوت است. ما از روش مبتنی بر ماتریس پارامتریک استفاده می کنیم که عملکرد آن در زیر نشان داده شده است.

F u s i o n = σ (دبلیو 1 \circ O 1 + دبلیو 2 \circ O 2 + دبلیو 3 \circ O 3 + دبلیو 4 \circ O 4 + دبلیو 5 \circ O 5) ،

(12)

جایی که $F u s i o n$ هدف پیش بینی پس از همجوشی است، $\circ$ محصول هادامارد را ارائه می دهد، $O_{1}$ ، $O_{2}$ ، $O_{3}$ ، $O_{4}$ ، و $O_{5}$ خروجی های پنج شاخه هستند و $W_{1}$ ، $W_{2}$ ، $W_{3}$ ، $W_{4}$ ، و $W_{5}$ اوزان قابل یادگیری مربوطه هستند. سپس نتایج پس از همجوشی توسط تابع فعالسازی σ (یعنی ReLU) فعال می شوند. یک لایه LSTM با 64 نورون پس از همجوشی ویژگی اعمال شد. خروجی LSTM متعاقباً مسطح شد و به طور کامل با 578 نورون متصل شد تا خروجی‌های نهایی تولید شود.

4.5. آموزش مدل

برای آموزش GLM هیبریدی، خطای میانگین مربع (MSE) به عنوان تابع ضرر استفاده می شود. همانطور که در رابطه (13) نشان داده شده است، $y_{i}$ ارزش زمین موجود است، مقدار پیش بینی شده است و $n$ تعداد نمونه است. داده های اصلی به سه بخش تقسیم شدند، یک مجموعه داده آموزشی: یک مجموعه داده اعتبار سنجی، و یک مجموعه داده آزمایشی. ما از مجموعه داده آموزشی برای آموزش به صورت دسته ای استفاده می کنیم و ضرر به ازای هر دسته محاسبه می شود. علاوه بر این، ما از Adam به عنوان یک بهینه ساز هنگام آموزش انتشار مجدد استفاده می کنیم. عموماً آدام در انتخاب فراپارامترها نسبتاً قوی در نظر گرفته می‌شود، اگرچه گاهی اوقات نرخ یادگیری باید از پیش‌فرض پیشنهادی تغییر کند [ 52 ] (ص 309). پس از به حداقل رساندن تلفات، تمام پارامترهای قابل آموزش آموزش داده می شوند.

(13)

5. مطالعه موردی

5.1. داده های آزمایشی

داده‌های جریان مسافران مترو مورد استفاده در این مطالعه از داده‌های کارت هوشمند (SCD) سیستم متروی شانگهای، چین جمع‌آوری شد. منطقه مورد مطالعه و خطوط مترو مربوطه در شکل 6 نشان داده شده است. بازه زمانی داده ها بین 1 آوریل تا 30 آوریل 2015 است. در این مدت، روزانه حدود 9 میلیون پرونده کارت وجود داشت که 289 ایستگاه مترو را پوشش می داد. بخش هایی از داده های اصلی در جدول 2 نشان داده شده است. توضیحات فیلد مربوطه در جدول 3 نشان داده شده است.

با توجه به تجربه زندگی، می توانیم ورودی و خروجی مسافران مترو را از داده های اصلی بدست آوریم. فیلد شکل کلیدی است برای تشخیص جریان ورودی یا خروجی. ردیف 1 در جدول 2 را به عنوان مثال در نظر بگیرید که رکورد خروج مسافر است. ظاهراً شکل صفر نشان‌دهنده جریان ورودی است، در حالی که شکلی که غیرصفر باشد جریان خروجی است.

سپس تعریفی از فاصله زمانی (TI) برای شمارش جریان مسافر ارائه می کنیم. ما به ترتیب 10 دقیقه، 15 دقیقه، 20 دقیقه و 30 دقیقه را به عنوان TI انتخاب می کنیم. اگر TI 10 دقیقه باشد، باید جریان مسافر را هر 10 دقیقه بشماریم. سپس یک روز دارای 144 برش زمانی است. اما ساعت 6:40 صبح تا 11 شب را با توجه به فعالیت های انسانی به عنوان دوره مطالعه انتخاب کردیم. بنابراین، 98 برش زمانی در یک روز وجود داشت.

مجموعه آموزشی شامل مشاهدات از 1 تا 23 آوریل 2015 است. مجموعه اعتبارسنجی از 24 تا 25 آوریل 2015 (شامل یک روز کاری و یک روز غیر کاری) است. ما پنج روز گذشته، 26 تا 30 آوریل 2015، را به عنوان دوره آزمایشی انتخاب کردیم که شامل چهار روز کاری و یک روز غیرکاری است.

5.2. معیارهای ارزیابی

برای اندازه گیری عملکرد مدل های مختلف پیش بینی جریان، ما خطای ریشه میانگین مربع (RMSE) و میانگین درصد مطلق خطا (MAPE) را به عنوان معیارهای ارزیابی انتخاب کردیم. آنها از طریق مقادیر پیش بینی و مقادیر زمین موجود محاسبه می شوند. تعاریف دو معیار در معادلات (14) و (15) نشان داده شده است. از تعریف، می توان فهمید که هر چه مقدار کمتر باشد، مدل بهتر عمل می کند.

(14)

(15)

جایی که $y_{i}$ ارزش زمین موجود است، مقدار پیش بینی شده است و $n$ تعداد نمونه است.

5.3. تنظیمات محیطی و آموزشی

آزمایش ها عمدتاً بر روی یک پلتفرم GPU با کارت گرافیک NVIDIA GeForce GTX1050 Ti اجرا شدند که اطلاعات دقیق آن در جدول 4 نشان داده شده است . کتابخانه های پایتون، از جمله scikit-learn، Keras، و TensorFlow برای ساخت مدل ما استفاده شدند.

روش تنظیم پارامترها برای پیش بینی DL مهم است. در اینجا فقط تنظیمات نهایی ذکر شده است که ثابت شده است پارامترهای بهینه هستند. روش تنظیم دقیق در بخش 5.6 ارائه خواهد شد. در آزمایش‌های ما، تعداد فواصل زمانی برای الگوهای نزدیک، روزانه و هفتگی به‌صورت c=7، d=1، و w=1 تنظیم شد. لایه اول دارای 6 نورون خروجی بود، در حالی که لایه دوم دارای 2 بود. برای آموزش بهتر، سر توجه را 12 تنظیم کردیم. برای جلوگیری از برازش بیش از حد، لایه‌های حذفی بین دو لایه توجه گراف اضافه شدند. نرخ ترک تحصیل 0.6 تعیین شد. برای شاخه 4، ما دو لایه LSTM را با 600 نورون روی هم قرار دادیم. یک لایه کاملاً متصل متشکل از 578 نورون در پایان اعمال شد. برای ثبت تأثیر عوامل خارجی، ما از یک LSTM 3 لایه با 256 نورون استفاده کردیم. برای بخش فیوژن ویژگی، یک لایه LSTM و یک لایه کاملا متصل متشکل از 64 و 578 نورون به ترتیب اعمال شد.

ما مدل هیبریدی GLM را با به حداقل رساندن MSE برای 200 دوره با اندازه دسته ای هفت آموزش دادیم. ما همچنین از تکنیک های Early Stop برای جلوگیری از برازش بیش از حد استفاده کردیم. نرخ یادگیری اولیه در 5 × ^10-4 ، با نرخ فروپاشی 0.95 پس از هر 20 دوره تنظیم شد. از دست دادن آموزش و افت اعتبار پس از 200 دوره پایدار می شود، که نشان دهنده استحکام مدل پیشنهادی است.

5.4. مدل های پایه

ما GLM ترکیبی را با 10 مدل پایه زیر (شامل یک روش آماری، دو روش ML و هفت روش DL) برای ارزیابی عملکرد مقایسه می‌کنیم. برای مقایسه منصفانه، همه این مدل ها داده های نزدیک، روزانه و هفتگی را به عنوان ورودی می گیرند. بهینه ساز Adam برای همه مدل ها استفاده می شود. توضیحات این مدل های پایه به شرح زیر است. اختصارات مربوط به مدل های پایه در جدول 5 نشان داده شده است.

LR: رگرسیون خطی (LR) [ 53 ] یک مدل آماری است که برای دریافت رابطه بین یک پاسخ و یک متغیر توضیحی دیگر استفاده می شود. بر این اساس، از آن برای انجام پیش بینی های آینده استفاده می شود [ 54 ].
KNN: رگرسیون K-نزدیکترین همسایه (KNN) [ 55 ] یک روش متداول در رگرسیون ناپارامتریک است. ما همچنین از PCA برای انتخاب اجزای اصلی قبل از وارد کردن داده ها در KNN استفاده می کنیم.
RSVR: یک روش معمولی یادگیری ماشین [ 20 ]. هسته SVR در scikit-learn به عنوان یک تابع پایه شعاعی (RSVR) تنظیم شده است.
LSTM: شبکه های حافظه کوتاه مدت (LSTM) [ 50 ]. LSTM نوع خاصی از RNN است که قادر به یادگیری وابستگی های زمانی طولانی مدت است. این مدل از دو لایه LSTM روی هم و یک لایه کاملا متصل تشکیل شده است.
CNN: یک شبکه عصبی کانولوشنال (CNN) [ 56 ]، که جریان مسافری مبتنی بر شبکه مترو را به یک تصویر دو بعدی تبدیل می کند. محور عمودی نشان دهنده ایستگاه های مترو، محور افقی نشان دهنده زمان است.
ResNet: یک مدل ترکیب شده با CNN و ResUnit (ResNet) [ 41 ]. یک بار در زمینه ترافیک استفاده شده است. با این حال، ما عوامل خارجی را در مطالعه خود قرار نمی دهیم.
STGCN: مدلی که CNN ها را به داده های غیر اقلیدسی تعمیم می دهد که در حوزه طیفی با تبدیل فوریه گراف استفاده می شود. در مطالعه خود، ما از شبکه‌های متداول نمودار مکانی-زمانی (STGCN) پیشنهاد شده توسط Han [ 57 ] به عنوان یک مدل پایه استفاده می‌کنیم.
GAT: شبکه های توجه نمودار (GAT) [ 12 ]. GAT نوعی شبکه عصبی گراف است که می تواند روابط توپولوژیکی گره ها را تجزیه و تحلیل کند. دو لایه توجه گراف در مدل استفاده شده است.
GLM_NoE: ما شعبه 5 را در GLM ترکیبی حذف می کنیم.
GLM_NoIA: ما فقط از ماتریس مجاور سنتی به عنوان لایه ماسک در مقایسه با GLM هیبریدی استفاده می کنیم.

5.5. نتایج و بحث

5.5.1. عملکرد پیش بینی شبکه های مختلف

مشابه GLM هیبریدی، ما فراپارامترها را برای 10 مدل پایه دیگر تنظیم کردیم و فراپارامترهای بهینه را ثبت کردیم. نتایج نهایی در جدول 6 نشان داده شده است. MAPE ها از داده هایی که مقدار واقعی آنها صفر نیست محاسبه می شود. در جدول 6 ، FN _CNN تعداد نورون های پنهان یک لایه CNN را نشان می دهد. D _CNN به تعداد لایه های پنهان در CNN اشاره دارد. F و D در سایر مدل های پایه معانی مشابهی دارند. L _C ، L _D و L _W به ترتیب طول الگوهای بسته، روزانه و هفتگی را نشان می دهند. K به معنای تعداد سرهای توجه است. هسته _SVRبه نوع هسته در الگوریتم SVM اشاره دارد. Neighbor به معنی تعداد گره هایی است که یک کلاس شامل می شود. Ks اندازه هسته پیچیدگی نمودار است _.برای مشاهده بیشتر عملکرد پیش‌بینی به روشی شهودی‌تر، تصاویر نواری RMSE و MAPE را برای همه مدل‌ها در شکل 7 ترسیم می‌کنیم .

همانطور که در جدول 6 و شکل 7 نشان داده شده است، GLM هیبریدی با کمترین RMSR و MAPE از اکثر روش های اصلی در داده های متروی شانگهای بهتر عمل می کند. در مقایسه با CNN، ResNet و GAT، GLM ترکیبی کاهش آشکاری در RMSE و MAPE نشان می‌دهد. به طور خاص، در مقایسه با CNN، GLM ترکیبی کاهش نسبی 34.11٪ در RMSE و 25.57٪ کاهش نسبی در MAPE دارد. در مقایسه با ResNet، GLM هیبریدی دارای 31.58 درصد کاهش نسبی در RMSE و 24.07 درصد کاهش نسبی در MAPE است. در مقایسه با GAT، GLM هیبریدی 29.04 درصد کاهش نسبی در RMSE و 19.54 درصد کاهش نسبی در MAPE دارد. علاوه بر این، GLM هیبریدی نیز بهتر از LSTM عمل می کند. در مقایسه با LSTM، GLM هیبریدی کاهش RMSE 13.37٪ و کاهش MAPE 9.15٪ را نشان می دهد. ما CNN، ResNet و GAT را به عنوان Group1 و LSTM را به عنوان Group2 در نظر می گیریم. دلیل برتری GLM هیبریدی نسبت به گروه 1 و گروه 2 این است که هر دو گروه 1 یا گروه 2 فقط وابستگی مکانی یا زمانی را نشان می دهند. با این حال، GML ترکیبی مزیت GAT و LSTM را برای گرفتن وابستگی مکانی-زمانی ترکیب می کند.

در مرحله بعد، عملکرد مدل‌های مختلف، مدل‌های آماری، مدل‌های ML و مدل‌های DL را با هم مقایسه کردیم. مدل آماری، LR، بدتر از مدل‌های ML و مدل‌های DL عمل می‌کند. در میان مدل‌های DL، متوجه می‌شویم که بیشتر مدل‌های مربوط به وابستگی فضایی نتایج بدتری نسبت به مدل‌های مبتنی بر شبکه‌های عصبی مکرر دارند. CNN و LSTM را به عنوان مثال در نظر بگیرید: LSTM کاهش RMSE 23.87٪ و کاهش MAPE 18.07٪ در مقایسه با CNN را نشان می دهد. دلیل ممکن است این باشد که گرفتن وابستگی مکانی نسبت به وابستگی زمانی برای پیش‌بینی شبکه مترو در سطح شهر دشوارتر است. در مورد روش های ML، KNN و RSVR، آنها بدتر از مدل DL در رابطه با وابستگی زمانی، مانند LSTM عمل می کنند. با این حال، آنها نتایج بهتری نسبت به مدل‌های DL در مورد وابستگی فضایی، مانند CNN، ResNet، دریافت می‌کنند. و GAT. در مقایسه با KNN، GLM هیبریدی 23.94 درصد کاهش نسبی در RMSE و 11.29 درصد کاهش نسبی در MAPE دارد. علاوه بر این، GLM ترکیبی کاهش 16.59٪ در RMSE و کاهش 1.3٪ در MAPE در مقایسه با RSVR نشان می دهد. به طور کلی، GLM هیبریدی به یک معنا بهتر از مدل های ML عمل می کند.

در مقایسه با مدل‌های مبتنی بر شطرنجی، مانند CNN و ResNet، مدل‌های مبتنی بر ساختار نمودار دارای RMSE و MAPE کوچک‌تری هستند. در مقایسه با ResNet، STGCN 26.83% کاهش نسبی در RMSE و 23.11% کاهش نسبی در MAPE دارد. در مقایسه با CNN، GAT 7.05 درصد کاهش نسبی در RMSE و 7.50 درصد کاهش نسبی در MAPE دارد. به طور کلی، RMSE های مدل مبتنی بر شطرنجی بزرگتر از 40 است، در حالی که GLM هیبریدی تنها 31.42 دریافت می کند. MAPE های مدل مبتنی بر شطرنجی بزرگتر از 12 است، در حالی که مدل هیبریدی GLM تنها 9.43 دریافت می کند. از نتایج، نتیجه می‌گیریم که مدل مبتنی بر ساختار نمودار می‌تواند وابستگی فضایی نامنظم را بهتر از مدل‌های مبتنی بر شطرنجی برای پیش‌بینی جریان مسافران مترو در سطح شهر دریافت کند.

سپس، GLM هیبریدی را با STGCN مقایسه کردیم و متوجه شدیم که GLM هیبریدی کمی بهتر عمل می کند. GLM ترکیبی کاهش نسبی 6.49٪ در RMSE و 10.87٪ کاهش نسبی در MAPE دارد، عمدتاً به این دلیل که جزء GAT در GLM ترکیبی، ماتریس مجاور اصلی را برای جبران مشکل ماتریس نامتقارن STGCN بهبود می بخشد.

در نهایت، ما سهم بهبود ماتریس مجاور و عوامل خارجی را مورد بحث قرار می‌دهیم. همانطور که در جدول 6 نشان داده شده است ، GLM هیبریدی دارای 8.74% کاهش نسبی در RMSE و 3.06% کاهش نسبی در MAPE در مقایسه با GLM_NoIA است که نشان دهنده مزایای ماتریس مجاور بهبود یافته است. علاوه بر این، GLM هیبریدی عوامل خارجی را تعبیه کرده است که مدل را کمی بهبود می بخشد. ما می توانیم از نتایج یاد بگیریم که GLM هیبریدی کاهش RMSE 3.74٪ و کاهش MAPE 3.94٪ در مقایسه با GLM_NoE نشان می دهد.

به طور خلاصه، با ادغام GAT و LSTM، GLM هیبریدی می‌تواند وابستگی مکانی-زمانی را بهتر از چندین مدل موجود دریافت کند.

5.5.2. نتایج پیش بینی یک ایستگاه مترو خاص

با توجه به نتایج RMSE و MAPE مدل‌های مختلف، ما چهار مدل را انتخاب کردیم که عملکرد نسبتاً خوبی داشتند، یعنی STGCN، RSVR، LSTM و GLM. ما قصد داریم در مورد این مدل ها به طور مفصل صحبت کنیم. ما ایستگاه مترو میدان مردم را به عنوان نمونه انتخاب کردیم، زیرا یکی از شلوغ ترین ایستگاه های شانگهای است و در مرکز شهر قرار دارد.

شکل 8 و شکل 9 نتایج پیش بینی ورودی و خروجی مسافر در هر 10 دقیقه در ایستگاه مترو میدان مردم در 4 روز کاری و 1 روز غیرکاری است. ما 6:40 صبح تا 11:00 شب را به عنوان بازه زمانی تعیین کردیم. تناوب گردش مسافران مترو در روز کاری را به راحتی می توانیم در شکل 8 و شکل 9 پیدا کنیم. ایستگاه میدان مردم یک منطقه کاری معمولی است. بنابراین، ساعات شلوغی در ساعت 5 بعد از ظهر هر روز کاری (فاصله زمانی حدود 161، 271، 361 و 455 در شکل 8 است)، که زمان ترک کار است. در مورد حجم خروجی، ساعات شلوغی ساعت 9 صبح هر روز کاری است (فاصله زمانی حدود 113، 209، 308، و 410 در شکل 9 است.) که یک ساعت اداری است. در مورد عملکرد، مقادیر پیش‌بینی‌شده مدل‌های هیبریدی GLM، RSVR، LSTM و STGCN به خوبی با مقادیر واقعی مطابقت دارد. به طور خاص، در جعبه‌های قرمز شکل 8 ، می‌توانیم GLM هیبریدی را پیدا کنیم که کاراکترهای حجم ورودی را در ساعات شلوغی با دقت بیشتری نسبت به سه مدل دیگر می‌گیرد. با این حال، GLM هیبریدی در پیش بینی حجم خروجی در ساعات غیر شلوغ کمی بدتر عمل می کند که در شکل 9 قابل مشاهده است.

در شکل 10 ، نتایج پیش بینی روزهای غیر کاری و روزهای کاری را به طور خاص ترسیم می کنیم. 98 برش زمانی در یک روز وجود دارد. همانطور که در شکل 10 a,c نشان داده شده است، حجم جریان مسافر در روزهای غیر کاری متغیرتر است و بنابراین نتایج پیش بینی کمی بدتر است. با مقایسه کلی توانایی های پیش بینی روزهای غیر کاری، GLM هیبریدی کمی بدتر از سه مدل دیگر عمل می کند. با این حال، GLM هیبریدی نسبت به مدل‌های STGCN، LSTM و RSVR هنگام پیش‌بینی در روزهای کاری برتر است، که در شکل 10 b,d قابل مشاهده است. مدل GLM در ساعات شلوغی روزهای کاری (فاصله زمانی 50 تا 70 در شکل 10) بسیار بهتر از سه مدل دیگر می تواند ارزش زمین را تطبیق دهد .b، فاصله زمانی 10 تا 20، و 60 تا 80 در شکل 10 d، دایره قرمز را در شکل 10 b,d ببینید). با این حال، توانایی GLM هیبریدی برای گرفتن کاراکترها در ساعات غیر شلوغ روز کاری گاهی بدتر از مدل STGCN است (به کادر قرمز در شکل 10 ب مراجعه کنید). ما دلیل را کم بودن جریان مسافر در ساعات غیر شلوغی می‌دانیم که منجر به جریان کمتر در ساختارهای نمودار می‌شود.

برای بررسی بیشتر توانایی GLM هیبریدی برای پیش‌بینی در ساعات شلوغی یک روز کاری، RMSE را بین ساعات شلوغی و ساعات غیرعجله در همه ایستگاه‌ها واجد شرایط ارزیابی کردیم. نتایج در مقایسه با بهترین STGCN پایه در جدول 7 نشان داده شده است.

همانطور که در جدول 7 نشان داده شده است ، RMSEهای GLM هیبریدی به طور قابل توجهی کوچکتر از STGCN در ساعات شلوغی در یک روز کاری هستند. برای ورودی مسافران، GLM هیبریدی 8.62 درصد کاهش نسبی در RMSE دارد. برای خروج مسافران، GLM هیبریدی در مقایسه با STGCN 10.06 درصد بهبود بیشتری به همراه دارد. در حالی که در ساعات غیر شلوغی، RMSE های این دو مدل نسبتا نزدیک هستند. برای خروج مسافران، GLM هیبریدی حتی عملکرد بدتری دارد. نتایج نشان می‌دهد که توانایی هیبرید برای پیش‌بینی در ساعات شلوغی یک روز کاری بهتر از بهترین STGCN پایه است. توجه داشته باشید که RMSE ها در ساعات شلوغی به دلیل تردد مسافر بیشتر نسبت به ساعات غیر پیک بیشتر است.

به طور خلاصه، نتایج پیش‌بینی هیبریدی GLM در ساعات شلوغی دقیق‌تر از مدل‌های STGCN، LSTM و RSVR است. با این حال، توانایی پیش بینی GLM هیبریدی در ساعات غیر شلوغی کمی بدتر از STGCN است. به طور کلی، توانایی پیش‌بینی کلی GLM هیبریدی نسبت به STGCN، LSTM و RSVR برتری دارد.

5.5.3. پیش بینی عملکرد در TI های مختلف

برای تأیید استحکام GLM هیبریدی، ما نتایج پیش‌بینی را از بازه‌های زمانی مختلف (TIs) مقایسه کردیم. ما به ترتیب 10 دقیقه، 15 دقیقه، 20 دقیقه و 30 دقیقه را به عنوان TI انتخاب کردیم. از شکل 11 و جدول 8می‌توان مشاهده کرد که دقت پیش‌بینی با افزایش TI کاهش می‌یابد که از تعداد کمتر نمونه‌ها در داده‌های آموزشی ناشی می‌شود. هنگامی که TI ثابت شود، GLM هیبریدی در مقایسه با 9 مدل پایه دیگر، کوچکترین RMSE را دریافت می کند. با این حال، MAPE GLM هیبریدی همیشه کوچکترین نیست. در TI 15 دقیقه و 20 دقیقه، KNN و RSVR نسبت به GLM هیبریدی MPEهای کوچکتری دریافت می کنند. در TI 30 دقیقه، MAPE های RSVR و LSTM کوچکتر از GLM هیبریدی هستند. اگرچه MAPE برخی از مدل ها نسبتاً کوچک است، GLM هیبریدی هنوز RMSE بسیار کوچکتری دارد. دلیل ممکن است این باشد که توانایی پیش‌بینی ساعات شلوغی GLM هیبریدی در مقایسه با برخی از مدل‌های پایه بهتر است در حالی که توانایی پیش‌بینی آن در ساعات غیر شلوغی گاهی اوقات بد است. در مورد یک TI واحد، نتیجه گیری در بخش 5.5.1 انجام شدقابل اثبات هم هست به عنوان مثال TI 30 دقیقه را در نظر بگیرید، GLM ترکیبی کاهش RMSE 43.27٪ و کاهش MAPE 14.11٪ در مقایسه با CNN نشان می دهد. در مقایسه با LSTM، GLM هیبریدی 15.87 درصد کاهش نسبی در RMSE دارد. نتایج برتری مدل مکانی-زمانی را تأیید می‌کند. مدل مبتنی بر ساختار نمودار، GAT، کاهش RMSE 2.50٪ و کاهش MAPE 3.82٪ را در مقایسه با مدل مبتنی بر شطرنجی، ResNet نشان می دهد. GLM هیبریدی دارای 10.97 درصد کاهش نسبی در RMSE و 2.99 درصد کاهش نسبی در MAPE در مقایسه با STGCN است. دلیل ممکن است بهبود GAT در هنگام استفاده از ماتریس نامتقارن باشد. همانطور که در جدول 8 نشان داده شده است ، GLM_NoIA و GLM_NoE کمی بدتر از GLM ترکیبی عمل می کنند که اثربخشی عوامل مجاور و خارجی بهبود یافته را نشان می دهد. همانطور که در نشان داده شده استشکل 12 ، نتایج پیش‌بینی GLM هیبریدی با مقادیر واقعی در TIهای مختلف، به‌ویژه در دوره اوج، به خوبی مطابقت دارد. توجه داشته باشید که نتایج TI 10 دقیقه در شکل 8 و شکل 9 نشان داده شده است. بنابراین، می‌توان نتیجه گرفت که GLM هیبریدی در مجموع از سایر مدل‌های پایه در TIهای مختلف بهتر عمل می‌کند، که استحکام و دقت بالای GLM هیبریدی را نشان می‌دهد.

5.6. تنظیم پارامترها

روش تنظیم پارامترها یک فرآیند ضروری برای آموزش مدل های DL است. این بخش بر روند تعدیل برخی از عوامل معمولی تمرکز دارد.

5.6.1. طول الگوهای ورودی مختلف

ما در اینجا تأثیر طول‌های ورودی مختلف سه الگو، یعنی الگوهای بسته، روزانه و هفتگی را تأیید می‌کنیم. نتایج در شکل 13 نشان داده شده است. ما به ترتیب c، d و w را به عنوان طول ورودی الگوهای بسته، روزانه و هفتگی تعریف می کنیم. شکل 13 a نتایج اثر نزدیکی زمانی را نشان می دهد که d و w به صورت 1 ثابت هستند اما c تغییر می کند. ما می توانیم یاد بگیریم که RMSE و MAPE زمانی که c 0 باشد بسیار بزرگ هستند، به این معنی که الگوی بسته بسیار مهم است. بهترین عملکرد زمانی ظاهر می شود که c 7 باشد. شکل 13b نتایج اثر دوره روزانه را نشان می دهد که c به عنوان 7 و w به عنوان 1 تنظیم شده است اما d از 0 تا 6 تغییر می کند. می توانیم مشاهده کنیم که RMSE و MAPE ابتدا کاهش می یابد و سپس با افزایش d افزایش می یابد. d بهینه 1 است. شکل 13 c نتایج اثر دوره هفتگی را نشان می دهد که c به عنوان 7 و d به عنوان 1 تنظیم شده است اما w از 0 تا 2 تغییر می کند. از شکل 13 c، متوجه می شویم که RMSE و افزایش MAPE زمانی که w بزرگتر از 1 باشد، به این معنی که وضعیت ساعت 7 صبح دو هفته گذشته ارتباط نزدیکی با ساعت 7 صبح این هفته ندارد. پس از تنظیم، می توان نتیجه گرفت که بهتر است از برخی الگوهای زمانی استفاده کنیم، اما روند بلندمدت ممکن است موثر یا حتی بی فایده نباشد.

5.6.2. تعداد لایه های پنهان

ما نه آزمایش را برای کشف عمق بهینه برای GLM هیبریدی انجام دادیم. ما عمق لایه‌های توجه گراف و لایه‌های LSTM را به‌طور جداگانه بررسی می‌کنیم که با D _GAT و D _{LSTM مشخص می‌شوند} . اول، با D _LSTM = 1، D _GAT از یک تا سه متغیر است. سپس D _LSTM به همین ترتیب به صورت 2 و 3 تنظیم می شود. نتایج در شکل 14 نشان داده شده است. به طور کلی، RMSE و MAPE مدل ابتدا کاهش می یابد و سپس افزایش می یابد، که نشان می دهد شبکه عمیق تر اغلب نتایج بهتری برای گرفتن کاراکترهای بیشتر دارد. با این حال، اگر شبکه ها خیلی عمیق باشند، آموزش ممکن است سخت شود، که منجر به افزایش RMSE و MAPE می شود. _{به طور خاص، اگر D LSTM} بین 1 و 2 باشد، RMSE نسبتاً پایین است. زمانی که D _LSTM 3 شود، RMSE افزایش می یابد، که نشان می دهد LSTM عمیق تر در مدل بدتر عمل می کند. در مورد D _GAT ، RMSE و MAPE نسبتاً بزرگ هستند وقتی D _GAT به صورت 1 و 3 تنظیم شود. در نهایت، D _LSTM بهینه و D _GAT 2 و 2 هستند.

5.6.3. تعداد واحدهای عصبی پنهان

FN _LSTM و FN _GAT تعداد واحدهای پنهان در LSTM و GAT را به طور نسبی نشان می دهند. برای آزمایش LSTM، FN _{GAT GAT} 2 لایه به صورت 32 و 2 ثابت شد و FN _LSTM بین 32، 64، 128، 256، 512،576، 600 و 640 متغیر است. به همین ترتیب، برای آزمایش GAT، FN _LSTM ثابت شد. به عنوان 600، و FN _GAT در اولین لایه GAT بین 6، 12، 16، 32، 64، 128، و 256 متغیر است. نتایج تأثیر واحدهای عصبی مختلف پنهان در شکل 15 نشان داده شده است. شکل 15 a نتیجه تغییر FN _LSTM است. _{با تغییر FN LSTM} ، MAPE نسبتاً پایدار است. با این حال، FN بیشتر_LSTM منجر به کاهش RMSE تا یک سطح معین می شود. نقطه عطف FN _LSTM حدود 600 است. بنابراین، FN _LSTM بهینه 600 است. شکل 15 b نتیجه تغییر FN _GAT است. RMSE ها و MAPE ها در هنگام تغییر FN _GAT بسیار پایدار هستند . با این حال، FN _GAT = 32 نتیجه برتری دارد. به طور خلاصه، مدل بهترین دقت پیش‌بینی را زمانی نشان می‌دهد که FN _LSTM 600 و FN _GAT 32 باشد.

6. نتیجه گیری و کار آینده

در این مقاله، ما بر روی یک مسئله ارزشمند و به طور گسترده مطالعه شده، پیش‌بینی جریان مسافران مترو تمرکز می‌کنیم که هدف آن پیش‌بینی موثر و دقیق جریان مسافر در فواصل زمانی آینده برای یک منطقه خاص است. ما استدلال می‌کنیم که کارهای موجود، کاربرد شبکه‌های نامتقارن در یک شهر را نادیده می‌گیرند و این واقعیت را از دست می‌دهند که همسایگان بیشتر نیز ممکن است تأثیری داشته باشند. علاوه بر این، برخی از آنها اثرات عوامل خارجی مانند آب و هوا، کیفیت هوا و غیره را تجزیه و تحلیل نمی کنند.

برای پرداختن به این مسائل، ما یک روش جدید، GLM ترکیبی، برای پیش‌بینی جریان مسافران مترو در سطح شهر با ادغام دو روش DL، LSTM و GAT، پیشنهاد می‌کنیم. با استفاده از GAT می توان از مدل پیشنهادی در شبکه های نامتقارن استفاده کرد. به منظور بررسی تأثیر برخی گره‌ها که کمی بیشتر قرار دارند، ماتریس مجاور را با اعمال وزن‌های مختلف به برخی از همسایگان دیگر بهبود می‌دهیم. علاوه بر این، ساختارهای LSTM برای جذب وابستگی زمانی و تأثیر خارجی اتخاذ می‌شوند که می‌تواند کل مدل را بهبود بخشد. ما مدل پیشنهادی را از طریق یک مطالعه موردی که شامل پیش‌بینی جریان مسافران مترو در سطح شهر در شانگهای، چین به مدت پنج روز بود، آزمایش کردیم. نتایج تجربی نشان می دهد که GLM ترکیبی به طور قابل توجهی از چندین مدل پایه، یعنی LR، KNN، RSVR، LSTM، CNN، ResNet، GAT و STGCN بهتر عمل می کند. مقایسه دقیق بین GLM هیبریدی و STGCN نشان می دهد که GLM هیبریدی عملکرد بالاتری بین 6 تا 10 درصد برای TI های مختلف ارائه می دهد. برای ساعات شلوغی در یک روز کاری، GLM هیبریدی با حقایق زمینی بهتر مطابقت دارد، که ممکن است برای مدیران شهری برای انجام برنامه‌های مؤثر مفیدتر باشد. نتایج پیش‌بینی دقیق همچنین می‌تواند مرجعی برای برنامه سفر افراد باشد.

با این حال، برخی از محدودیت ها هنوز وجود دارد. اولاً، خطاهای پیش‌بینی GLM هیبریدی نسبتاً بزرگتر از STGCN برای ساعات غیر عجله در یک روز کاری است. ثانیا، بازه زمانی مجموعه داده‌های اعتبارسنجی فقط یک ماه را پوشش می‌دهد، که ممکن است برخی از عوامل خارجی زمانی مانند فصل‌ها را نادیده بگیرد. ثالثاً، ما یک پیش‌بینی تک مرحله‌ای را اعمال می‌کنیم [ 58] در مطالعه ما، که ممکن است باعث تجمع خطا شود. در آینده، ما قصد داریم به این محدودیت‌ها بپردازیم تا همبستگی‌ها را برای پیش‌بینی با کیفیت بالاتر کشف کنیم. ما بیشتر ویژگی های خارجی و پیش بینی چند مرحله ای را برای بهبود مدل بررسی خواهیم کرد. ما همچنین قصد داریم کاربرد GLM ترکیبی را در مجموعه داده های بسیار طولانی تر یا انواع دیگر جریان ها، مانند جریان دوچرخه، جریان جمعیت و جریان ترافیک در TI های مختلف بررسی کنیم. در نهایت، از نظر مدل‌های DL، برخی از مزایای GAT مانند گرفتن کاراکترهای دو طرفه خطوط ترافیک، مدل‌سازی نمودارهای پویا و مدل‌سازی نمودارهای چندگانه باید بیشتر مورد مطالعه قرار گیرد.

منابع

زو، دی. هوانگ، ز. شی، ال. وو، ال. لیو، ی. استنباط الگوهای تعامل فضایی از عکس های فوری متوالی توزیع های فضایی. بین المللی جی. جئوگر. Inf. علمی 2018 ، 32 ، 783-805. [ Google Scholar ] [ CrossRef ]
وی، ی. چن، MC پیش بینی جریان کوتاه مدت مسافران مترو با تجزیه حالت تجربی و شبکه های عصبی. ترانسپ Res. قسمت C Emerg. تکنولوژی 2012 ، 21 ، 148-162. [ Google Scholar ] [ CrossRef ]
دهل، دی. کائور، آر. جونجا، ام. یادگیری ماشینی: مروری بر الگوریتم ها و کاربردهای آن. در مجموعه مقالات ICRIC 2019، چم، سوئیس، 2019؛ صص 47-63. [ Google Scholar ]
شا، س. لی، جی. ژانگ، ک. یانگ، ز. وی، ز. لی، ایکس. زو، ایکس. پیش‌بینی چرخش جریان مسافران مترو مبتنی بر RNN. دسترسی IEEE 2020 ، 8 ، 15232–15240. [ Google Scholar ] [ CrossRef ]
یانگ، دی. یانگ، اچ. وانگ، پی. لی، اس. پیش‌بینی جریان ترافیک چند مرحله‌ای با استفاده از شبکه عصبی مکرر. در مجموعه مقالات کنفرانس های بین المللی IEEE 2019 در مورد محاسبات و ارتباطات همه جا حاضر (IUCC) و علم داده و هوش محاسباتی (DSCI) و محاسبات هوشمند، شبکه و خدمات (SmartCNS)، شنیانگ، چین، 21 تا 23 اکتبر 2019؛ ص 803-808. [ Google Scholar ]
کیائو، ی. وانگ، ی. مک.؛ یانگ، جی. پیش‌بینی کوتاه‌مدت جریان ترافیک بر اساس ساختار شبکه عصبی 1DCNN-LSTM. مد. فیزیک Lett. B 2020 , 35 , 2150042. [ Google Scholar ] [ CrossRef ]
رن، YB; چن، HF; هان، ی. چنگ، تی. ژانگ، ی. چن، جی. یک مدل یادگیری عمیق ترکیبی یکپارچه برای پیش‌بینی حجم‌های جریان مکانی-زمانی در سطح شهر. بین المللی جی. جئوگر. Inf. علمی 2020 ، 34 ، 802-823. [ Google Scholar ] [ CrossRef ]
گوا، اس. لین، ی. فنگ، ن. آهنگ، سی. Wan, H. شبکه‌های کانولوشنال نمودار مکانی-زمانی مبتنی بر توجه برای پیش‌بینی جریان ترافیک. در مجموعه مقالات کنفرانس AAAI در مورد هوش مصنوعی، هونولولو، HI، ایالات متحده، 27 ژانویه تا 1 فوریه 2019؛ جلد 33، ص 922–929. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
Lv، M. هنگ، ز. چن، ال. چن، تی. زو، تی. جی، S. شبکه کانولوشن چند گرافی زمانی برای پیش‌بینی جریان ترافیک. IEEE Trans. هوشمند ترانسپ 2020 ، 1-12. [ Google Scholar ] [ CrossRef ]
بله، جی. ژائو، جی. بله، ک. Xu, C. Multi-STGCnet: چارچوب مکانی-زمانی مبتنی بر پیچیدگی نمودار برای پیش‌بینی جریان مسافران مترو. در مجموعه مقالات کنفرانس مشترک بین المللی 2020 در مورد شبکه های عصبی (IJCNN)، گلاسکو، بریتانیا، 19 تا 24 ژوئیه 2020؛ صص 1-8. [ Google Scholar ]
دیفرارد، ام. برسون، ایکس. Vandergheynst، P. شبکه‌های عصبی کانولوشنال روی نمودارها با فیلتر کردن طیفی سریع محلی. در مجموعه مقالات سی امین کنفرانس بین المللی سیستم های پردازش اطلاعات عصبی، بارسلون، اسپانیا، 5 تا 10 دسامبر 2016. صص 3844–3852. [ Google Scholar ]
ولیکوویچ، پی. کوکورول، جی. کازانووا، آ. رومرو، آ. لیو، پی. Bengio، Y. گراف شبکه های توجه. arXiv 2017 , arXiv:1710.10903. [ Google Scholar ]
لیو، سی. لیو، اس. تیان، ی. Sun، QL; Tang, YY تحقیق در مورد پیش‌بینی جریان ترافیک ریلی بر اساس مدل ARIMA. J. Phys. Conf. سر. 2021 ، 1792 ، 012065. [ Google Scholar ] [ CrossRef ]
چنگ، تی. وانگ، جی. هاورث، جی. هایدکر، بی. چاو، الف. یک ماتریس وزن فضایی پویا و میانگین متحرک یکپارچه خودرگرسیون زمان-فضای موضعی برای مدلسازی شبکه. Geogr. مقعدی 2014 ، 46 ، 75-97. [ Google Scholar ] [ CrossRef ]
میلنکوویچ، م. شوادلنکا، ال. ملیچار، وی. بویوویچ، ن. رویکرد مدل‌سازی Avramović، Z. SARIMA برای پیش‌بینی جریان مسافر راه‌آهن. ترانسپ ویلنیوس 2018 ، 33 ، 1113-1120. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
اسمیت، BL; ویلیامز، بی.ام. کیت اسوالد، آر. مقایسه مدل های پارامتریک و ناپارامتریک برای پیش بینی جریان ترافیک. ترانسپ Res. قسمت C Emerg. تکنولوژی 2002 ، 10 ، 303-321. [ Google Scholar ] [ CrossRef ]
جیائو، پی. لی، آر. سان، تی. هو، ز. ابراهیم، الف. سه مدل اصلاح شده فیلتر کالمن برای پیش بینی جریان مسافری ترانزیت ریلی کوتاه مدت. ریاضی. مشکل مهندس 2016 , 2016 , 9717582. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
دینگ، سی. دوان، جی. ژانگ، ی. وو، ایکس. یو، جی. استفاده از رویکرد مدل‌سازی ARIMA-GARCH برای بهبود حسابداری پیش‌بینی کوتاه‌مدت سواری مترو برای نوسانات پویا. IEEE Trans. هوشمند ترانسپ 2018 ، 19 ، 1054-1064. [ Google Scholar ] [ CrossRef ]
لیانگ، اس. ما، م. او هست.؛ ژانگ، اچ. پیش‌بینی جریان مسافر کوتاه‌مدت در حمل‌ونقل عمومی شهری: فیلتر کالمن ترکیبی K-نزدیک‌ترین همسایه. دسترسی IEEE 2019 ، 7 ، 120937–120949. [ Google Scholar ] [ CrossRef ]
Suthaharan, S. Machine Vector Support. در مدل‌ها و الگوریتم‌های یادگیری ماشین برای طبقه‌بندی کلان داده‌ها: تفکر با مثال‌هایی برای یادگیری مؤثر . Suthaharan, S., Ed. Springer: Boston, MA, USA, 2016; ص 207-235. [ Google Scholar ] [ CrossRef ]
وانگ، ایکس. ژانگ، ن. ژانگ، ی. Shi, Z. پیش بینی کوتاه مدت سواری مترو با مدل آنلاین ماشین بردار پشتیبان. J. Adv. ترانسپ 2018 ، 2018 ، 3189238. [ Google Scholar ] [ CrossRef ]
ژانگ، ی. لیو، ی. پیش‌بینی ترافیک با استفاده از ماشین‌های بردار پشتیبان حداقل مربعات. Transportmetrica 2009 ، 5 ، 193-213. [ Google Scholar ] [ CrossRef ]
Sun، YX; لنگ، بی. Guan، W. پیش‌بینی جریان مسافر کوتاه مدت موجک-SVM در سیستم متروی پکن. محاسبات عصبی 2015 ، 166 ، 109-121. [ Google Scholar ] [ CrossRef ]
چن، QA; لی، WQ; Zhao, JH استفاده از Ls-Svm برای پیش بینی جریان مسافر کوتاه مدت. ترانسپ ویلنیوس 2011 ، 26 ، 5-10. [ Google Scholar ] [ CrossRef ]
لی، دبلیو. سویی، ال. ژو، ام. دونگ، اچ. پیش‌بینی کوتاه‌مدت جریان مسافر برای حمل و نقل ریلی شهری بر اساس داده‌های چند منبعی. Eurasip. جی. وایرل. اشتراک. شبکه 2021 ، 2021 ، 9. [ Google Scholar ] [ CrossRef ]
کائو، سی. Xu, J. پیش بینی جریان ترافیک کوتاه مدت بر اساس PSO-SVM. در مجموعه مقالات اولین کنفرانس بین المللی مهندسی حمل و نقل، چنگدو، چین، 22 تا 24 ژوئیه 2007. صص 167-172. [ Google Scholar ]
روس، جی. بونوی، اس. گاوین، جی. پیش بینی جریان مسافری راه آهن شهری کوتاه مدت: رویکرد شبکه بیزی پویا. در مجموعه مقالات پانزدهمین کنفرانس بین‌المللی IEEE در مورد یادگیری ماشین و کاربردها (ICMLA)، آناهیم، کالیفرنیا، ایالات متحده آمریکا، 18 تا 20 دسامبر 2016؛ ص 1034-1039. [ Google Scholar ]
لیو، ال. چن، R.-C.; ژائو، کیو. Zhu, S. استفاده از ترکیب چند مرحله ای از ویژگی های ورودی به جنگل تصادفی برای بهبود پیش بینی جریان مسافر MRT. J. محیط. هوشمند اومانیز. محاسبه کنید. 2019 ، 10 ، 4515-4532. [ Google Scholar ] [ CrossRef ]
ژانگ، اس. لیو، ز. شن، اف. وانگ، اس. یانگ، ایکس. مدل پیش‌بینی جریان مسافران اتوبوس بر اساس شبکه‌های عصبی. J. Phys. Conf. سر. 2020 , 1656 , 012002. [ Google Scholar ] [ CrossRef ]
بای، جی. او، م. Shuai، C. پیش‌بینی جریان مسافر کوتاه‌مدت در حمل‌ونقل ریلی شهری بر اساس رویکرد K-نزدیک‌ترین همسایه پیشرفته. CICTP 2019 ، 2019 ، 1695–1706. [ Google Scholar ]
پل، اس. سینگ، ال. مروری بر پیشرفت در یادگیری عمیق. در مجموعه مقالات کارگاه IEEE 2015 در مورد هوش محاسباتی: نظریه ها، کاربردها و جهت گیری های آینده (WCI)، کانپور، هند، 14 تا 17 دسامبر 2015. صص 1-6. [ Google Scholar ]
کانر، جی تی. مارتین، RD; اطلس، LE شبکه های عصبی بازگشتی و پیش بینی سری های زمانی قوی. IEEE Trans. شبکه عصبی 1994 ، 5 ، 240-254. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
ژانگ، جی ال. چن، اف. شن، Q. شبکه LSTM مبتنی بر خوشه برای پیش بینی جریان کوتاه مدت مسافر در حمل و نقل ریلی شهری. دسترسی IEEE 2019 ، 7 ، 147653–147671. [ Google Scholar ] [ CrossRef ]
چو، ک. Merrienboer، BV; گلچهره، سی. با هداناو، دی. بوگارس، اف. شونک، اچ. Bengio، Y. بازنمایی عبارت یادگیری با استفاده از رمزگذار-رمزگشا RNN برای ترجمه ماشینی آماری. arXiv 2014 ، arXiv:1406.1078. [ Google Scholar ]
ژائو، ز. چن، دبلیو. وو، ایکس. چن، کامپیوتر; شبکه لیو، جی. LSTM: یک رویکرد یادگیری عمیق برای پیش بینی ترافیک کوتاه مدت. IET Intel. ترانسپ سیستم 2017 ، 11 ، 68-75. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
ژانگ، دی. کابوکا، MR ترکیب داده های وضعیت آب و هوا برای پیش بینی جریان ترافیک: یک رویکرد یادگیری عمیق مبتنی بر GRU. IET Intel. ترانسپ سیستم 2018 ، 12 ، 578-585. [ Google Scholar ] [ CrossRef ]
هان، ی. وانگ، سی. رن، ی. وانگ، اس. ژنگ، اچ. چن، جی. پیش‌بینی کوتاه‌مدت جریان مسافر اتوبوس بر اساس شبکه LSTM بهینه‌سازی ترکیبی. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 366. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
لین، اس. تیان، اچ. پیش‌بینی جریان مسافران کوتاه‌مدت مترو بر اساس جنگل تصادفی و LSTM. در مجموعه مقالات چهارمین کنفرانس فناوری اطلاعات، شبکه، کنترل الکترونیک و اتوماسیون IEEE 2020 (ITNEC)، چونگ کینگ، چین، 12 تا 14 ژوئن 2020؛ صص 2520–2526. [ Google Scholar ]
کریژفسکی، آ. سوتسکور، آی. هینتون، GE ImageNet طبقه بندی با شبکه های عصبی پیچیده عمیق. اشتراک. ACM 2012 ، 25 ، 1097-1105. [ Google Scholar ]
ژانگ، جی. ژنگ، ی. چی، دی. لی، آر. یی، X. مدل پیش‌بینی مبتنی بر DNN برای داده‌های مکانی-زمانی. در مجموعه مقالات بیست و چهارمین کنفرانس بین المللی ACM SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی، برلینگیم، کالیفرنیا، ایالات متحده، 31 اکتبر تا 3 نوامبر 2016؛ پ. 92. [ Google Scholar ]
ژانگ، جی بی. ژنگ، ی. Qi، DK; لی، RY; یی، XW; لی، TR پیش‌بینی جریان‌های جمعیتی در سطح شهر با استفاده از شبکه‌های باقیمانده عمیق مکانی-زمانی. آرتیف. هوشمند 2018 ، 259 ، 147-166. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
یو، اف. وی، دی. ژانگ، اس. Shao, Y. پیش‌بینی دقیق مبتنی بر CNN سه بعدی برای جریان ترافیک در مقیاس بزرگ. در مجموعه مقالات چهارمین کنفرانس بین المللی 2019 مهندسی حمل و نقل هوشمند (ICITE)، سنگاپور، 5 تا 7 سپتامبر 2019؛ صص 99-103. [ Google Scholar ]
برونا، جی. زارمبا، دبلیو. اسلم، آ. Lecun، Y. شبکه های طیفی و شبکه های محلی متصل روی نمودارها. arXiv 2013 , arXiv:1312.6203. [ Google Scholar ]
Kipf، TN; Welling, M. طبقه بندی نیمه نظارت شده با شبکه های کانولوشن گراف. arXiv 2016 , arXiv:1609.02907. [ Google Scholar ]
یو، بی. یین، اچ. Zhu, Z. شبکه‌های کانولوشنال نمودار فضایی-زمانی: یک چارچوب یادگیری عمیق برای پیش‌بینی ترافیک. arXiv 2017 , arXiv:1709.04875. [ Google Scholar ]
ژائو، ال. آهنگ، ی. ژانگ، سی. لیو، ی. وانگ، پی. لین، تی. دنگ، م. Li، H. T-GCN: یک شبکه کانولوشنال نمودار زمانی برای پیش بینی ترافیک. IEEE Trans. هوشمند ترانسپ 2020 ، 21 ، 3848-3858. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
ژانگ، جی ال. چن، اف. گوا، YA; شبکه کانولوشنال چند گرافی Li، XH برای پیش بینی کوتاه مدت جریان مسافر در حمل و نقل ریلی شهری. IET Intel. ترانسپ سیستم 2020 ، 14 ، 1210-1217. [ Google Scholar ] [ CrossRef ]
ژانگ، جی. چن، اف. کوی، ز. گوا، ی. Zhu, Y. معماری یادگیری عمیق برای پیش بینی جریان مسافر کوتاه مدت در حمل و نقل ریلی شهری. IEEE Trans. هوشمند ترانسپ 2020 ، 1-11. [ Google Scholar ] [ CrossRef ]
هوانگ، ی. بی، اچ. لی، ز. مائو، تی. وانگ، ز. STGAT: مدل‌سازی تعاملات مکانی-زمانی برای پیش‌بینی مسیر انسانی. در مجموعه مقالات کنفرانس بین المللی IEEE/CVF 2019 در بینایی کامپیوتر (ICCV)، سئول، کره، 27 اکتبر تا 2 نوامبر 2019؛ ص 6271-6280. [ Google Scholar ]
هوکرایتر، اس. اشمیدهابر، جی. حافظه کوتاه مدت طولانی. محاسبات عصبی 1997 ، 9 ، 1735-1780. [ Google Scholar ] [ CrossRef ] [ PubMed ]
دالدال، ن. سنگور، ا. پولات، ک. کومرت، Z. یک سیستم دمودولاسیون جدید برای سیگنال های مدولاسیون دیجیتال باند پایه بر اساس مدل حافظه کوتاه مدت عمیق عمیق. Appl. آکوست. 2020 , 166 , 107346. [ Google Scholar ] [ CrossRef ]
دوست خوب، من. بنژیو، ی. کورویل، آ. Bengio، Y. یادگیری عمیق ; مطبوعات MIT: کمبریج، بریتانیا، 2016; جلد 1. [ Google Scholar ]
Ober, PB مقدمه ای بر تحلیل رگرسیون خطی. JR Stat. Soc. 2010 ، 40 ، 2775-2776. [ Google Scholar ] [ CrossRef ]
خو، ی. لی، دی. ترکیب توجه به نمودار و معماری‌های تکرارشونده برای پیش‌بینی تقاضای تاکسی در سطح شهر. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 414. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
ژانگ، ال. لیو، کیو. یانگ، دبلیو. وی، ن. دونگ، دی. یک مدل K-نزدیک‌ترین همسایه بهبود یافته برای پیش‌بینی کوتاه‌مدت جریان ترافیک. Procedia Soc. رفتار علمی 2013 ، 96 ، 653-662. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
ما، ایکس. دای، ز. او، ز. ما، جی. وانگ، ی. Wang, Y. ترافیک یادگیری به عنوان تصاویر: یک شبکه عصبی پیچیده عمیق برای پیش بینی سرعت شبکه حمل و نقل در مقیاس بزرگ. Sensors 2017 , 17 , 818. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
هان، ی. وانگ، SK; رن، YB; وانگ، سی. گائو، پی. چن، جی. پیش‌بینی جریان مسافری کوتاه‌مدت در سطح ایستگاه در یک شبکه مترو در سطح شهر با استفاده از شبکه‌های عصبی کانولوشنال نمودار فضایی-زمانی. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 243. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
Landassuri-Moreno، VM; Bustillo-Hernández، CL; کارباخال هرناندز، جی جی. فرناندز، LPS پیش‌بینی تک مرحله‌ای و چند مرحله‌ای جلوتر با شبکه‌های عصبی مصنوعی تکاملی. در مجموعه مقالات پیشرفت در تشخیص الگو، تجزیه و تحلیل تصویر، دید کامپیوتری و کاربردها، هاوانا، کوبا، 20-23 نوامبر 2013. صص 65-72. [ Google Scholar ]