1. مقدمه
مردم به طور مداوم با فضای شهری از طریق فعالیتهای مکانی-زمانی مختلف، مانند سوار شدن به مترو، رانندگی و پیادهروی در تعامل هستند [ 1 ]. در عصر کلان داده، تکثیر سریع حسگرهای موبایل و فناوریهای اینترنت به طور مداوم حجم بسیار زیادی از دادههای مکانی-زمانی را تولید میکند که فرصتهای بیسابقهای را برای ساخت سیستمهای حمل و نقل هوشمند (ITS) ارائه میدهد. به طور خاص، پیشبینی کوتاهمدت جریان مسافران مترو بخش مهمی از ITS است. پیشبینی دقیق جریان مسافر میتواند به مدیران شهری کمک کند تا رفتارهای سفر را تنظیم کنند، ازدحام مسافران را کاهش دهند و کیفیت خدمات سیستم مترو را افزایش دهند [ 2 ]]. از دیدگاه گستردهتر، پیشبینی جریان مسافر در مترو به بهینهسازی کارایی ترافیک از طریق کاهش عدم تعادل ظرفیت حملونقل در سراسر شهر کمک میکند. بنابراین، توسعه یک چارچوب موثر برای پیشبینی جریان مسافر در شبکه مترو در سطح شهر ضروری است.
به دلیل ارزش عملی زیادی که دارد، پیش بینی جریان مسافر به طور گسترده مورد بررسی قرار گرفته است. راه حل های موجود را می توان به سه دسته طبقه بندی کرد: روش های آماری، روش های یادگیری ماشین (ML) [ 3] و روش های یادگیری عمیق (DL). روش های آماری ساده هستند اما نمی توانند ویژگی های غیر خطی را ثبت کنند. روشهای ML معایب روشهای آماری را بهبود میبخشند، اما هنوز قادر به پردازش دادههای خام مکانی-زمانی نیستند. هنگام ساخت یک مدل مبتنی بر ML، استخراج کننده های ویژگی به مهندسی دقیق و دانش دامنه قابل توجهی نیاز دارند تا داده های خام را به یک نمایش داخلی مناسب تبدیل کنند. این روش مهندسی ویژگی نامیده می شود. با توجه به کلان داده، روش مهندسی ویژگی به ویژه چالش برانگیز است. در مقایسه با روشهای ML، روشهای DL میتوانند به طور خودکار مهندسی ویژگی را ایجاد کنند و ورودی خام را برای پیشبینی سرتاسر بپذیرند، که میتواند کاراکترهای غیرخطی پیچیدهتری را بیاموزد و توانایی تعمیم بهتری به دست آورد. روش های DL پرکاربردترین راه حل برای پیش بینی جریان مسافر هستند.4 ، 5 ]. علاوه بر این، به دلیل توانایی CNN ها در استخراج وابستگی فضایی ، به یک گرایش محبوب برای بهره برداری از RNN ها در ترکیب با شبکه های عصبی کانولوشن (CNN) برای پیش بینی جریان ترافیک [ 6 ، 7 ] تبدیل شده است. با این حال، CNN ها برای ساختار فضایی در فضای اقلیدسی طراحی شده اند (به عنوان مثال، تصاویر دو بعدی و شبکه های منظم)، بنابراین نمی توانند ساختار توپولوژیکی پیچیده یک شبکه مترو را به طور کامل تطبیق دهند. با هدف این مشکل، مدلسازی نمودار بر روی دادههای مکانی-زمانی در کانون توجه قرار گرفته است. چندین کار شبکه های عصبی نمودار (GNN) را برای گرفتن همبستگی فضایی توپولوژیکی مطالعه کرده اند [ 8 ، 9 ، 10]. با این حال، رویکردهای مبتنی بر ساختار گراف موجود هنوز دارای شکافهای زیر هستند:
-
بیشتر رویکردهای مبتنی بر ساختار گراف مبتنی بر شبکه متعارف گراف (GCN) [ 11 ] است که در حوزه طیفی عمل میکند. به دلیل استفاده از ماتریس لاپلاسی، GCN نیاز به متقارن بودن شبکه دارد. با این حال، همیشه برخی از شبکه های نامتقارن در یک شهر وجود دارد. شبکه در شهری که ساختار نمودار آن نامتقارن است را می توان به عنوان یک شبکه نامتقارن تعریف کرد. به عنوان مثال، یک شبکه راه با خیابان های یک طرفه و دو طرفه را می توان به عنوان یک شبکه نامتقارن توصیف کرد. در این مورد نمی توان از ساختار مبتنی بر GCN استفاده کرد.
-
اکثر روش های مبتنی بر ساختار گراف، بهبود ماتریس مجاور را نادیده می گیرند. به عبارت دیگر، آنها فقط به تأثیر گره های مجاور اهمیت می دهند اما گره هایی را که کمی دورتر قرار دارند نادیده می گیرند.
-
برخی از مدلهای مبتنی بر ساختار نمودار فقط وابستگی مکانی را دریافت میکنند اما وابستگی زمانی و عوامل خارجی را نادیده میگیرند.
برای غلبه بر مسائل ذکر شده در بالا، ما یک مدل DL ترکیبی برای پیشبینی کوتاهمدت جریان مسافران مترو با ادغام شبکههای توجه نمودار (GATs) و شبکههای حافظه کوتاهمدت (LSTM) پیشنهاد میکنیم. مدل پیشنهادی GLM ترکیبی (هیبرید G AT و L STM M مدل) نامیده می شود. الهام گرفته از [ خطای پردازش ریاضی ] پتر ولیجˇکوویج’[ 12 ]، ما GAT را برای حل این مشکل معرفی می کنیم که GCN نمی تواند برای شبکه های نامتقارن در یک شهر اعمال شود. GAT وابستگی فضایی گرههای مجاور را با محاسبه ضریب توجه گراف بین گرهها، که برای نمودارهای نامتقارن مفید است، ضبط میکند. علاوه بر GAT، ما شبکههای LSTM را برای مدلسازی وابستگی زمانی جریان مسافران مترو ترکیب میکنیم. عوامل خارجی مربوط به جریان مسافران مترو شامل شرایط آب و هوایی، کیفیت هوا، آخر هفته ها، تعطیلات و رویدادها و غیره است. ما این عوامل را به یک لایه LSTM دیگر اضافه می کنیم تا دقت کل مدل را بهبود ببخشیم. سهم اصلی این مقاله به شرح زیر است:
-
ما یک مدل مبتنی بر ساختار گراف ترکیبی برای پیشبینی جریان کوتاهمدت مسافران مترو پیشنهاد میکنیم. ساختار GAT در مدل پیشنهادی میتواند وابستگی توپولوژیکی پیچیده را به تصویر بکشد. علاوه بر این، GAT تمرکز بیشتری روی گره ها می گذارد، به این معنی که می تواند این مشکل را حل کند که GCN نمی تواند در شبکه های نامتقارن استفاده شود. علاوه بر این، ماتریس مجاور را در ساختار GAT برای مدلسازی گرههایی که کمی دورتر قرار دارند، بهبود میدهیم.
-
ما یک چارچوب جدید برای مدلسازی مشترک وابستگیهای زمانی، زمانی و خارجی دینامیکی در دادههای حجم جریان مترو میسازیم. به طور خاص، لایههای مبتنی بر ساختار گراف را بر اساس GAT، لایههای بازگشتی بر اساس LSTM و یک لایه خروجی مبتنی بر شبکههای عصبی کاملاً متصل در مدل پیشنهادی پشته میکنیم.
-
ما آزمایشهای گستردهای را با استفاده از مجموعه داده ترافیک دنیای واقعی انجام میدهیم. نتایج نشان میدهد که GLM ترکیبی خطای پیشبینی را تقریباً 6 تا 10 درصد در مقایسه با بهترین خط پایه کاهش میدهد.
-
انگیزه پشت GLM هیبریدی پیش بینی موثر و دقیق جریان کوتاه مدت مسافران مترو در شهرها است که می تواند به مدیران شهری برای بهبود کارایی ترافیک کمک کند. پیش بینی جریان مسافر انواع برنامه های هوشمند را امکان پذیر می کند. این می تواند به شهروندان در برنامه ریزی مسیرها و برنامه ریزی زمان حرکت کمک کند. علاوه بر این، GLM ترکیبی فرصتهای جدیدی را برای تکنیکهای هوش مصنوعی (AI) در ساخت ITS به ارمغان میآورد که برای ساخت شهرهای هوشمند در عصر جدید مفید است.
بقیه این مقاله به شرح زیر سازماندهی شده است. در بخش 2 ، کار مرتبط را مرور می کنیم، روش های مورد استفاده و محدودیت های آنها را مورد بحث قرار می دهیم. بخش 3 مشکلات پیشبینی و نظریههای مربوطه را شرح میدهد. بخش 4 ساختار GLM هیبریدی را معرفی می کند. بخش 5 تجزیه و تحلیل مورد و نتایج مربوطه را نشان می دهد. بخش 6 دستاوردها و محدودیت های این مطالعه و همچنین کارهای آینده را خلاصه می کند.
2. کارهای مرتبط
پیشبینی جریان مسافر یکی از موضوعات مهم تحقیقاتی در سیستمهای اطلاعات جغرافیایی است. تحقیقات گسترده ای برای حل این مشکل انجام شده است. روشهای موجود را میتوان به سه نوع کلی دستهبندی کرد: روشهای آماری، روشهای یادگیری ماشینی و روشهای یادگیری عمیق.
2.1. روش های آماری
روش های آماری مقادیر آینده را بر اساس مقادیر مشاهده شده قبلی از طریق تحلیل سری زمانی [ 9 ] پیش بینی می کنند. از آنجایی که داده های جریان مسافر نوعی داده سری زمانی هستند، استفاده از روش های آماری برای حل کار پیش بینی امکان پذیر است. روش های آماری شامل مدل میانگین متحرک یکپارچه اتورگرسیو (ARIMA) [ 13 ] و تغییرات آن [ 14 ، 15 ]، مدل رگرسیون لجستیک [ 16 ]، فیلتر کالمن [ 17 ] و غیره است. لیو [ 13 ] از مدلی مبتنی بر ARIMA استفاده کرد. برای پیش بینی ترافیک ریلی و دریافت نتایج برتر از یک شبکه پس انتشار (BP). دینگ [ 18] مدلهای ARIMA و GRACH را برای پیشبینی نوسانات دینامیکی سواری کوتاهمدت مترو، یکپارچه کرد. لیانگ [ 19 ] رویکرد فیلتر کالمن و K-نزدیکترین همسایه (KNN) را برای مدیریت روندهای مختلف تغییرات در داده های جریان مسافر ترکیب کرد.
این روش ها به خوبی می توانند ویژگی های خطی را به تصویر بکشند اما ممکن است ویژگی های غیرخطی جریان مسافر را نادیده بگیرند. با این حال، جریان مسافر اغلب تحت تأثیر عوامل مختلفی قرار می گیرد. اگر داده ها پایدار نباشند، عملکرد پیش بینی روش های آماری ممکن است به طور قابل توجهی بدتر شود.
2.2. روش های یادگیری ماشینی
روشهای ML میتوانند روابط غیرخطی پیچیده بین دادههای ورودی و خروجی را ترسیم کنند، که میتواند مسئله روشهای آماری را برطرف کند. ماشین بردار پشتیبان (SVM) [ 20 ] یکی از پرکاربردترین مدل های ML است. می تواند بین دقت پیش بینی و توانایی تعمیم بر اساس اصل حداقل سازی ریسک ساختاری مصالحه ایجاد کند [ 21 ]. ژانگ [ 22 ] از SVM برای پیش بینی جریان ترافیک استفاده کرد که نتایج بهتری نسبت به مدل های رگرسیون خطی به دست آورد. مدلهای ترکیبی مبتنی بر SVR نیز به طور گسترده مورد استفاده قرار گرفتهاند [ 23 ، 24 ]. لی [ 25] مدل میانگین متحرک یکپارچه یکپارچه اتورگرسیوی فصلی (SARIMA) و SVM را برای ایجاد یک مدل پیشبینی جریان ترافیک یکپارچه کرد. Cao [ 26 ] پارامتر مدل SVM را با استفاده از بهینه سازی ازدحام جزئی (PSO) برای پیش بینی جریان ترافیک بهبود بخشید. وانگ [ 21 ] یک مدل آنلاین SVM برای ثبت ویژگیهای تناوبی و غیرخطی سواری کوتاهمدت مترو پیشنهاد کرد که ویژگیهای ورودی را از طریق مدل SARIMA استخراج میکند و پارامترها را از طریق PSO بهینه میکند. برخی دیگر از مدلهای ML مانند شبکههای بیزی، جنگلهای تصادفی (RFs)، شبکههای عصبی BP، KNN و غیره نیز در پیشبینی جریان ترافیک استفاده میشوند. Roos [ 27 ] یک شبکه بیزی برای پیش بینی جریان ترافیک پیشنهاد کرد که می تواند در داده های ناقص استفاده شود. لیو [ 28] روشهای RF را برای پیشبینی جریان مسافر ترکیب کرد، که تمرکز بیشتری بر ترکیب ویژگیهای ورودی دارد. Zhang [ 29 ] تجزیه و تحلیل مؤلفه اصلی (PCA) و شبکه های BP خطا را برای پیش بینی جریان مسافر اتوبوس، که سرعت همگرایی را افزایش می دهد، ترکیب کرد. Bai [ 30 ] از روش های KNN پیشرفته با در نظر گرفتن ضریب روند و فاکتور فاصله زمانی جریان مسافر استفاده کرد که عملکرد بهتری نسبت به شبکه BP و روش اصلی KNN دارد.
روشهای ML دقت پیشبینی جریان مسافران مترو را تا حد زیادی بهبود بخشید. با این حال، عملکرد روش های ML به شدت به ویژگی های طراحی شده به صورت دستی بستگی دارد. بنابراین، بدست آوردن بهترین نتایج برای پیشبینی جریان مسافر به دلیل دادههای مکانی-زمانی پیچیده و عظیم، دشوار است. امروزه به ندرت می توان از یک مدل ML برای پیش بینی جریان مسافر استفاده کرد.
2.3. روش های یادگیری عمیق
با توجه به پیچیدگی دادههای مکانی-زمانی، بیشتر متون پیشرفته از روشهای DL برای پیشبینی جریان مسافر استفاده میکنند. در مقایسه با روشهای ML، روشهای DL میتوانند به طور خودکار ویژگیهای ضروری را از دادههای خام استخراج کنند و آنها را با توجه به تغییرات ورودیها قوی کنند [ 31 ].
RNN ها [ 32 ] در برخورد با اطلاعات توالی پیچیده خوب هستند. از آنجایی که جریان مسافر نوعی داده سری زمانی است، RNN ها و جانشینان آنها مانند شبکه های حافظه کوتاه مدت بلند مدت (LSTM) [ 33 ] و واحدهای بازگشتی دروازه ای (GRU) [ 34 ] معمولاً در کار پیش بینی استفاده می شوند. ژائو [ 35 ] یک مدل پیشبینی ترافیک مبتنی بر شبکههای حافظه کوتاهمدت (LSTM) پیشنهاد کرد و به عملکرد خوبی دست یافت. Zhang [ 36 ] از یک روش مبتنی بر GRU برای پیش بینی جریان ترافیک شهری استفاده کرد. بعدها، HAN [ 37 ] بهینه ساز LSTM را بهبود بخشید و نتایج بهتری نسبت به LSTM داشت. لین [ 38] از جنگل تصادفی (RF) برای محاسبه اهمیت ویژگی استفاده کرد و از LSTM برای پیشبینی جریان مسافران مترو استفاده کرد. با این حال، مدلهای ذکر شده در بالا فقط وابستگی زمانی را دریافت میکنند، اما از وابستگی مکانی غفلت میکنند، به طوری که نمیتوانند عملکرد را برای کل شبکهها بهینه کنند.
CNN ها [ 39 ] در اصل برای داده هایی با شبکه های معمولی، مانند تصاویر، طراحی شده اند. برخی از کارها از CNN برای شناسایی وابستگی فضایی با فیلترها یا هسته های مختلف محلی استفاده می کنند. Zhang [ 40 ] دادههای جریان مکانی-زمانی را در شبکههای منظم وارد کرد و مدلی مبتنی بر CNN به نام DeepST پیشنهاد کرد که شامل سه قطعه است که زمان اخیر، تاریخ نزدیک و تاریخ دور را نشان میدهد. این یک نقطه عطف در پیش بینی جریان مسافر است. از آن زمان به بعد، مدل های مبتنی بر CNN در پیش بینی جریان مسافر غالب شدند. Zhang [ 41 ] به ادغام واحد باقیمانده برای پیشنهاد ST-ResNet ادامه داد. شبکههای باقیمانده میتوانند عمق مدل را برای گرفتن کاراکترهایی با فواصل طولانیتر و ساختارهای پیچیدهتر افزایش دهند. یو [ 42] یک شبکه سه بعدی CNN برای دستیابی به پیش بینی در مقیاس بزرگ در جریان ترافیک طراحی کرد. برای درک وابستگی مکانی-زمانی، محققان از RNN ها در ترکیب با شبکه های مبتنی بر CNN برای پیش بینی جریان مسافر استفاده می کنند. رن [ 7 ] ResNet و LSTM را برای تشکیل یک مدل ترکیبی، HIDLST، ترکیب کرد که نتایج بهتری نسبت به ST-ResNet دارد. Qiao [ 6 ] از CNN و LSTM یک بعدی برای پیش بینی جریان استفاده کرد.
با این حال، مدلهای مبتنی بر CNN باید بر روی دادههای شبکه منظم انجام شوند، به این معنی که نمیتواند رابطه توپولوژیکی نامنظم دادههای اقلیدسی را ثبت کند. رابطه توپولوژیک اغلب در زیرساخت های ترافیکی مانند ایستگاه ها، خطوط مترو، جاده ها و غیره وجود دارد. بنابراین باید اطلاعات توپولوژیکی شبکه های ترافیکی را در نظر بگیریم. با توسعه تئوری گراف [ 11 ، 43 ، 44 ]، می توان از یک ساختار نمودار برای پیش بینی جریان مسافر استفاده کرد. Yu [ 45 ] از GCN برای گرفتن رابطه فضایی استفاده کرد و از پیچیدگی CNN یک بعدی برای کشف رابطه زمانی استفاده کرد. مدل STGCN پیشنهادی با استفاده از مجموعه دادههای PEMS و Beijing تأیید شد. ژائو [ 46] مدل شبکه کانولوشن گراف زمانی (T-GCN) را پیشنهاد کرد، که شبکه کانولوشن گراف (GCN) را با GRU برای پیشبینی ترافیک ترکیب میکند. Zhang [ 47 ] از GCN و 3D-CNN برای مدلسازی جریان مسافر استفاده کرد. Ye [ 10 ] سه ماتریس فضایی برای استخراج وابستگی فضایی یک همسایه با فواصل مختلف طراحی کرد. با این حال، به دلیل استفاده از GCN، این مدل ها فقط در شبکه های نامتقارن قابل استفاده هستند. بر اساس مکانیسم توجه، Guo [ 8 ] یک مدل شبکه کانولوشنال مکانی-زمانی (ASTGCN) پیشنهاد کرد که میتواند به طور موثر وابستگی مکانی-زمانی پویا در دادههای ترافیک را به تصویر بکشد. ژانگ [ 48] ResNet، GCN و توجه LSTM را برای ساخت یک مدل هیبریدی، ResLSTM، ترکیب کرد که نتایج خوبی در پیشبینی جریان مسافران مترو در پکن به دست آورده است. با این حال، این مدل ها از بهبود ماتریس مجاور غفلت می کنند.
2.4. خلاصه
روش های آماری و روش های ML را می توان برای پیش بینی جریان مسافران مترو استفاده کرد. با این حال، هر دو نوع مدل نمیتوانند ورودیهای خام را برای پیشبینی بپذیرند. بنابراین، بهدلیل پیچیدگی و تصادفی بودن دادههای مکانی-زمانی، دستیابی به دقت پیشبینی بالاتر دشوار است.
در میان روشهای DL، مدل مبتنی بر ساختار گراف، نقطه داغ در مورد پیشبینی جریان مسافر است. اگرچه ادبیات فعلی پیشرفت را در وظایف داده شده نشان می دهد، تعدادی از شکاف های دانش وجود دارد که باید مورد توجه قرار گیرد، که (1) مدل های مبتنی بر GCN نیاز به متقارن بودن ساختار شبکه دارند، بنابراین برای شبکه های نامتقارن قابل استفاده نیستند. شهرستان؛ (2) بیشتر روشهای مبتنی بر ساختار گراف فقط به تأثیر گرههای مجاور اهمیت میدهند، اما گرههایی را که کمی دورتر قرار دارند نادیده میگیرند. و (3) برخی از مدلهای مبتنی بر ساختار نمودار فقط وابستگی مکانی را دریافت میکنند اما وابستگی زمانی و عوامل خارجی را نادیده میگیرند.
مدل ما از GAT [ 12 ] الهام گرفته شده است ، که می تواند وابستگی فضایی توپولوژیکی شبکه های نامتقارن را مدل کند. با هدف حل مشکلات فوق، ما GLM ترکیبی را برای استخراج وابستگی مکانی-زمانی و وابستگی خارجی به طور یکپارچه پیشنهاد کردیم.
3. مقدماتی
3.1. تعریف مشکل
هدف تحقیق مدلسازی یکپارچه وابستگی مکانی و زمانی دادههای جریان مسافران مترو است. وابستگی مکانی به تأثیر بین ایستگاههای مترو اشاره دارد، در حالی که وابستگی زمانی به تأثیر جریان تاریخی مسافران مترو در نقطه زمانی فعلی اشاره دارد. علاوه بر این، جریان مسافران مترو تحت تأثیر برخی عوامل خارجی مانند شرایط آب و هوایی، دما، تعطیلات، کیفیت هوا و غیره قرار میگیرد. برای مثال، مردم تمایل دارند در یک روز بارانی به جای بیرون رفتن برای شام در خانه بمانند.
بنابراین، مسئله پیشبینی فضایی-زمانی جریان مسافران مترو را میتوان به عنوان یک معادله در نظر گرفت، هدف = افp r e d i c t i o n(مناس،منتی،منE، W )افپ�هدمنجتیمن��(مناس،منتی،منE،دبلیو)، جایی که Target جریان مسافر هدف در زمان t است، افp r e d i c t i o nافپ�هدمنجتیمن��مدلی است که برای مقابله با مشکل استفاده می شود، مناسمناسورودی مربوط به وابستگی فضایی را ارائه می دهد، منتیمنتیورودی وابستگی زمانی را ارائه می دهد، منEمن�عامل خارجی تأثیرگذار بر گردش مسافران مترو است و دبلیودبلیوپارامترهایی را که باید یاد بگیرند را نشان می دهد. کل فرآیند پیش بینی در شکل 1 نشان داده شده است . هدف ما این است که از جریان تاریخی مسافر برای پیش بینی جریان مسافر در مترو در یک لحظه خاص استفاده کنیم.
داده های ورودی از سه بخش از داده های جریان تاریخی، الگوهای نزدیک، روزانه و هفتگی به دست می آیند. الگوی نزدیک به زمان اخیر اشاره دارد. الگوهای روزانه و هفتگی جریان مسافر تاریخی را همزمان با زمان هدف، اما در دوره های روزانه یا هفتگی نشان می دهند [ 7 ]. اگر بازه زمانی هدف 7:00 صبح تا 7:10 صبح روز شنبه باشد، الگوی بسته به زمان نزدیک به 7:00 صبح اشاره دارد، مانند 6:50 صبح، 6:40 صبح، 6:30 صبح و غیره. الگوی روزانه به 7:00 تا 7:10 صبح هر روز برای روزهای قبل اشاره دارد. الگوی هفتگی زمان بین 7:00 تا 7:10 صبح هر شنبه هفته های قبل است.
داده های ورودی الگوهای نزدیک، روزانه و هفتگی را می توان به صورت معادلات (1) – (3) توصیف کرد.
جایی که منتیمنتینشان دهنده جریان مسافر در زمان هدف t است. منسیمنسی، منDمن�و مندبلیومندبلیونشان دهنده جریان تاریخی مسافر در الگوهای بسته، روزانه و هفتگی است. تعداد بازه های زمانی را در نظر بگیرید منسیمنسی، منDمن�، و مندبلیومندبلیوc و d و w هستند. علاوه بر این، تعداد کل بازه زمانی یک روز n است.
3.2. اصل GAT
شبکه های توجه نمودار (GAT) توسط پیشنهاد شد [ خطای پردازش ریاضی ]پتر ولیجˇکوویج’[ 12 ]، که می تواند بر روی داده های ساختار یافته گراف عمل کند. GAT یک مکانیسم توجه را در ساختار گراف معرفی میکند و لایههای خودتوجهی پوشانده را اعمال میکند که میتوانند اهمیت متفاوتی را به گرههای مختلف در یک محله بدون عملیات ماتریس پرهزینه نسبت دهند [ 49 ]. علاوه بر این، یک ساختار گراف به عنوان یک ماسک به مدل تزریق می شود. به این ترتیب نه عملیات ماتریس مورد نیاز است و نه کل ساختار گراف. بنابراین، میتوانیم GAT را برای گرافهای ناقص، گرافهای جهتدار، گرافهای نامتقارن و نمودارهای پویا اعمال کنیم. ساختار نمودار یکی از سازمانهای معمول دادههای مترو در سطح شهر است. بنابراین، میتوانیم GAT را برای پیشبینی جریان مسافران مترو در سطح شهر اعمال کنیم.
با استفاده از GAT، اولین گام ساخت یک ساختار گراف است G ( V , E )جی(�،�)، جایی که V�گره، یعنی ایستگاه مترو است. و E�خط اتصال، یعنی خط مترو بین دو ایستگاه همسایه است. سپس باید یک لایه بلوک بسازیم تا شبکه های توجه گراف را بسازیم (با چیدن این لایه). ورودی ها ویژگی گره ها هستند که به جریان مسافری هر ایستگاه مترو اشاره دارد. می توان آن را چنین توصیف کرد [ خطای پردازش ریاضی ] ساعت={ساعت→1،ساعت→2،…،ساعت→ن}[ ℎ→�∈��خطای پردازش ریاضی ] [ خطای پردازش ℎ′={ℎ→1′,ℎ→2′,…,ℎ→�′}ریاضی ] [ خطای ℎ→�′∈��′پردازش ریاضی ] [ خطای �′پردازش ریاضی ] �∈��′×�[ خطای پردازش ���=�(�ℎ→�,�ℎ→�)ریاضی �:��′×��′→�] [ خطای پردازش ریاضی، ، که در آن N تعداد گره ها و F ویژگی هر گره است. این لایه مجموعه ای از ویژگی های جدید را تولید می کند ، به عنوان خروجی، که در آن ویژگی های خروجی را نشان می دهد. یک تبدیل خطی مشترک برای هر گره اعمال می شود که توسط یک ماتریس وزن پارامتری می شود. . سپس یک مکانیسم خودتوجه مشترک را روی گره ها انجام می دهیم که با علامت گذاری شده است . هدف آن محاسبه ضرایب توجه است ، جایی که همن جهمن�اهمیت را نشان می دهد j�به منمن. بعداً باید ماسکی را بر اساس ساختار نمودار تزریق کنیم، به این معنی که فقط محاسبات را انجام می دهیم j ∈نمن�∈نمن، جایی که نمننمنهمسایگی گره است منمن(همانطور که در شکل 2 نشان داده شده است ، ما فقط تاثیر گره 1، 7، 5، 6 را بر گره 3 محاسبه می کنیم). در نهایت، میتوانیم LeakyRelu را برای محاسبه اعمال کنیم. ضریب توجه را می توان به صورت زیر نشان داد:
که در آن T نشان دهنده حمل و نقل و | |||عملیات الحاق است.
برای تثبیت فرآیند یادگیری توجه به خود، نویسنده مکانیسم خود را برای به کارگیری توجه چند سر گسترش داد. ویژگی ها به هم متصل هستند و خروجی کاراکتر ویژگی به صورت زیر است:
جایی که | |||نشان دهنده الحاق، αکمن ج�من�کضرایب توجه نرمال شده هستند که توسط مکانیسم توجه k-امین محاسبه می شوند و دبلیوکدبلیوکماتریس وزن تبدیل خطی ورودی مربوطه است [ 12 ]. به طور خاص، اگر توجه چند سر را روی لایه پیشبینی نهایی شبکه انجام دهیم، از میانگینگیری در لایهها به جای الحاق استفاده میکنیم. این فرآیند در شکل 3 نشان داده شده است که شامل سه سر است. هدف ما محاسبه ضریب توجه گراف گره 2،3 و 4 به گره 1 در تصویر است.
ضرایب توجه تمام گره های همسایه را محاسبه کرده و با جمع آنها ضریب توجه نهایی گره را بدست می آوریم. به این ترتیب، می توان تأثیر بین گره ها را به دست آورد و وابستگی فضایی جریان مسافر را به دقت به دست آورد.
3.3. اصل LSTM
شبکه های حافظه کوتاه مدت (LSTM) توسط Hochreiter و Schmidhuber [ 50 ] پیشنهاد شدند. این یک نوع شبکه عصبی بازگشتی (RNN) است. هدف LSTM مدلسازی ویژگیهای دورتر سریهای زمانی است. LSTM می تواند مشکلات انفجار و ناپدید شدن گرادیان را در RNN های سنتی حل کند. LSTM از سه بخش تشکیل شده است، یک لایه ورودی، یک لایه پنهان بازگشتی و یک لایه خروجی. متفاوت از RNN های سنتی، لایه پنهان مکرر LSTM حاوی یک بلوک حافظه ویژه است که ساختار هسته آن در شکل 4 نشان داده شده است . بلوک حافظه حاوی سلول های حافظه با اتصال خود است که وضعیت زمانی شبکه را در هر مرحله زمانی ذخیره می کند [ 51 ]]. حالت موقت توسط سه گیت کنترل می شود: دروازه فراموشی، دروازه ورودی و دروازه خروجی. دروازه ورودی برای محافظت از محتویات حافظه از ورودی های نامربوط است. دروازه فراموشی فراموش کردن یک پیام بی فایده است. دروازه خروجی برای صادرات خروجی است.
در شکل 4 ، ایکستیایکستیورودی نقطه زمانی فعلی است، ساعتتیساعتتیخروجی لایه پنهان است، ساعتt – 1ساعتتی-1لایه پنهان خروجی بازه زمانی قبلی است، سیسیحالت ورودی سلول است، سیتیسیتیحالت خروجی سلول است و سیt – 1سیتی-1حالت خروجی بازه زمانی قبلی است. ضرایب دروازه ورودی، دروازه فراموشی و دروازه خروجی در LSTM را می توان در معادلات (6) – (8) زیر محاسبه کرد.
جایی که دبلیوx i���، دبلیوx f���، و دبلیوx o���پارامترهای وزن قابل یادگیری هستند که متصل می شوند ایکستی��با گیت ورودی، گیت فراموشی و گیت خروجی. دبلیوh من�ℎ�، دبلیوh f�ℎ�، و دبلیوساعت _�ℎ�پارامترهای وزن متصل هستند ساعتt – 1ℎ�−1با سه دروازه بمن��، بf��، و بo��پارامترهای افست قابل یادگیری هستند. σ�تابع سیگموئید است: 11 + e x p ( − x )11+exp(−�).
وضعیت ورودی سلول به صورت زیر است:
جایی که دبلیوx Cدبلیوایکسسییک پارامتر وزن اتصال است ایکستیایکستیبا ورودی ها، دبلیوh Cدبلیوساعتسیماتریس پارامتر اتصال است ساعتt – 1ساعتتی-1با ورودی های سلولی، بسیبسیپارامترهای افست یادگیری است و tanh تابع مماس است.
وضعیت خروجی سلول به شرح زیر است:
جایی که منتیمنتی، fتی�تی، سیتیسیتی، سیt – 1سیتی-1، و سیسیهمان ابعاد را به اشتراک بگذارید
خروجی لایه پنهان به صورت زیر است:
به طور خلاصه، LSTM می تواند اطلاعات مورد نیاز را “به خاطر بیاورد” و اطلاعات بی فایده را “فراموش کند”. بنابراین، LSTM دارای توانایی قوی برای پردازش یک سری زمانی با وابستگی زمانی طولانی تر است. استفاده از LSTM برای پیشبینی جریان مسافران مترو میتواند وابستگی زمانی دادهها را ثبت کند، که به دقت مدل پیشبینی کمک میکند.
4. توسعه مدل
پیشبینی جریان مسافران مترو در سطح شهر یک مشکل مدلسازی مکانی-زمانی معمولی است. بنابراین، ما یک مدل ترکیبی از GAT و LSTM را پیشنهاد میکنیم که GLM ترکیبی نامیده میشود. علاوه بر این، مدل پیشنهادی از یک الگوی چند زمانه تشکیل شده است. با GAT، مدل ترکیبی می تواند با مشکلات توپولوژیکی بهتر از مدل های دیگر مقابله کند. این مدل از پنج بخش، شاخه های 1-5 تشکیل شده است. شاخه های 1-3 از ساختار GAT برای به تصویر کشیدن وابستگی فضایی در الگوهای نزدیک، روزانه و هفتگی استفاده می کنند. شاخه 4 از LSTM برای ثبت وابستگی زمانی از طریق الگوهای بسته، روزانه و هفتگی استفاده می کند. شعبه 5تأثیر عوامل خارجی را نشان می دهد. علاوه بر این، یک لایه LSTM برای به دست آوردن داده های خروجی استفاده می شود. معماری مدل دقیق در شکل 5 ارائه شده است .
4.1. شاخه های 1-3: وابستگی فضایی
تأثیر جریان تاریخی مسافر را می توان به سه الگو تقسیم کرد: الگوی نزدیک، الگوی روزانه و الگوی هفتگی. ما سه الگو را به عنوان سه قسمت می گیریم که برای آموزش به GAT ارسال می شود. به دو دلیل این سه الگو را از هم جدا می کنیم. از یک طرف، اگر سه بخش را به عنوان یک ورودی در نظر بگیریم، داده های موجود در GAT ممکن است مقدار زیادی داشته باشند. بنابراین، روند آموزش ممکن است بسیار کند باشد. از سوی دیگر، همبستگی فضایی بین سه الگو قوی نیست، بنابراین نیازی به آموزش آنها با هم نیست. ساختار GAT در مدل ما می تواند کاراکترهای توپولوژیکی جریان مسافر را به تصویر بکشد و می تواند در شبکه های نامتقارن استفاده شود. هر ساختار GAT در شاخه های 1 تا 3 شامل دو لایه توجه گراف است. رابطه توپولوژیکی بین گره ها برای ساخت ماتریس مجاورت که به عنوان یک لایه ماسک در نظر گرفته می شود استفاده می شود. ما از ماسک برای ثبت روابط توپولوژیکی بین ایستگاه های مترو استفاده می کنیم. برای مشاهده همبستگیهای ایستگاههای مترو، ماتریس سنتی مجاور را بهبود دادیم. در ماتریس مجاور سنتی، اگر دو گره را بتوان با خطوط به هم متصل کرد، 1 را در ماتریس قرار می دهیم. با این حال، ما میخواهیم همبستگی فضایی برخی از گرهها را که کمی دورتر قرار دارند برای پیشبینی بهتر ضبط کنیم. برای این منظور، 4،3،2، و 1 را به ترتیب به عنوان وزن گره های نزدیک، کمتر نزدیک، بسیار کمتر نزدیک، و گره های بیشتر تنظیم می کنیم. علاوه بر این، اگر گره ها با چندین یال به هم متصل شوند، 0.5 به وزن هر یال اضافه می کنیم. انجام این کار همچنین می تواند پیش بینی شبکه مترو در مقیاس بزرگ را تسهیل کند. ما از ماسک برای ثبت روابط توپولوژیکی بین ایستگاه های مترو استفاده می کنیم. برای مشاهده همبستگیهای ایستگاههای مترو، ماتریس سنتی مجاور را بهبود دادیم. در ماتریس مجاور سنتی، اگر دو گره را بتوان با خطوط به هم متصل کرد، 1 را در ماتریس قرار می دهیم. با این حال، ما میخواهیم همبستگی فضایی برخی از گرهها را که کمی دورتر قرار دارند برای پیشبینی بهتر ضبط کنیم. برای این منظور، 4،3،2، و 1 را به ترتیب به عنوان وزن گره های نزدیک، کمتر نزدیک، بسیار کمتر نزدیک، و گره های بیشتر تنظیم می کنیم. علاوه بر این، اگر گره ها با چندین یال به هم متصل شوند، 0.5 به وزن هر یال اضافه می کنیم. انجام این کار همچنین می تواند پیش بینی شبکه مترو در مقیاس بزرگ را تسهیل کند. ما از ماسک برای ثبت روابط توپولوژیکی بین ایستگاه های مترو استفاده می کنیم. برای مشاهده همبستگیهای ایستگاههای مترو، ماتریس سنتی مجاور را بهبود دادیم. در ماتریس مجاور سنتی، اگر دو گره را بتوان با خطوط به هم متصل کرد، 1 را در ماتریس قرار می دهیم. با این حال، ما میخواهیم همبستگی فضایی برخی از گرهها را که کمی دورتر قرار دارند برای پیشبینی بهتر ضبط کنیم. برای این منظور، 4،3،2، و 1 را به ترتیب به عنوان وزن گره های نزدیک، کمتر نزدیک، بسیار کمتر نزدیک، و گره های بیشتر تنظیم می کنیم. علاوه بر این، اگر گره ها با چندین یال به هم متصل شوند، 0.5 به وزن هر یال اضافه می کنیم. انجام این کار همچنین می تواند پیش بینی شبکه مترو در مقیاس بزرگ را تسهیل کند. ما ماتریس مجاور سنتی را بهبود دادیم. در ماتریس مجاور سنتی، اگر دو گره را بتوان با خطوط به هم متصل کرد، 1 را در ماتریس قرار می دهیم. با این حال، ما میخواهیم همبستگی فضایی برخی از گرهها را که کمی دورتر قرار دارند برای پیشبینی بهتر ضبط کنیم. برای این منظور، 4،3،2، و 1 را به ترتیب به عنوان وزن گره های نزدیک، کمتر نزدیک، بسیار کمتر نزدیک، و گره های بیشتر تنظیم می کنیم. علاوه بر این، اگر گره ها با چندین یال به هم متصل شوند، 0.5 به وزن هر یال اضافه می کنیم. انجام این کار همچنین می تواند پیش بینی شبکه مترو در مقیاس بزرگ را تسهیل کند. ما ماتریس مجاور سنتی را بهبود دادیم. در ماتریس مجاور سنتی، اگر دو گره را بتوان با خطوط به هم متصل کرد، 1 را در ماتریس قرار می دهیم. با این حال، ما میخواهیم همبستگی فضایی برخی از گرهها را که کمی دورتر قرار دارند برای پیشبینی بهتر ضبط کنیم. برای این منظور، 4،3،2، و 1 را به ترتیب به عنوان وزن گره های نزدیک، کمتر نزدیک، بسیار کمتر نزدیک، و گره های بیشتر تنظیم می کنیم. علاوه بر این، اگر گره ها با چندین یال به هم متصل شوند، 0.5 به وزن هر یال اضافه می کنیم. انجام این کار همچنین می تواند پیش بینی شبکه مترو در مقیاس بزرگ را تسهیل کند. و 1 به عنوان وزن نزدیکترین گره ها، به ترتیب کمتر نزدیک، بسیار کمتر نزدیک، و گره های بیشتر. علاوه بر این، اگر گره ها با چندین یال به هم متصل شوند، 0.5 به وزن هر یال اضافه می کنیم. انجام این کار همچنین می تواند پیش بینی شبکه مترو در مقیاس بزرگ را تسهیل کند. و 1 به عنوان وزن نزدیکترین گره ها، به ترتیب کمتر نزدیک، بسیار کمتر نزدیک، و گره های بیشتر. علاوه بر این، اگر گره ها با چندین یال به هم متصل شوند، 0.5 به وزن هر یال اضافه می کنیم. انجام این کار همچنین می تواند پیش بینی شبکه مترو در مقیاس بزرگ را تسهیل کند.
4.2. شاخه 4: وابستگی زمانی
یکی دیگر از ویژگی های آشکار جریان مسافری مترو، وابستگی زمانی آن است که به تأثیر جریان تاریخی مسافر بر زمان فعلی اشاره دارد. سه جنبه آشکار همبستگی زمانی وجود دارد: مجاورت، روند و تناوب. مجاورت به معنای تأثیر نزدیکترین فواصل زمانی است. روند به معنای روند کلی در یک دوره زمانی است. دورهای بودن تأثیر زمان طولانیتری است. در مدل ما، فواصل زمانی الگوهای بسته، روزانه و هفتگی ادغام شده و به LSTM ارسال می شود. LSTM یک RNN ویژه است که از ساختارهای دروازه برای تعیین ضرورت اطلاعات استفاده می کند. LSTM مشکلات انفجار گرادیان و ناپدید شدن گرادیان RNN های سنتی را حل می کند و آن را برای گرفتن کاراکترهای فاصله زمانی بسیار طولانی تری در دسترس قرار می دهد. در GLM هیبریدی، یک LSTM دو لایه برای توالی جریان مسافران مترو استفاده می شود. سپس داده ها صاف می شوند و به طور کامل با 578 نورون متصل می شوند. از طریق شعبه 4 می توان وابستگی زمانی را به دست آورد و تناوب کلی جریان مسافران مترو را مطالعه کرد.
4.3. شاخه 5: نفوذ خارجی
جدای از عوامل مکانی و زمانی، برخی عوامل خارجی نیز ممکن است بر پیشبینی جریان مسافران مترو تأثیر بگذارند. به عنوان مثال، مردم تمایل دارند در طوفان های شن یا روزهای بسیار آلوده در خانه بمانند. رویدادهای مهم، مانند روز ملی، ممکن است باعث شود گردش مسافران مترو به اوج جدیدی برسد. عوامل خارجی مراجع ضروری برای افراد برای برنامه ریزی برنامه های سفر خود هستند. در حال حاضر تنها چند مدل عوامل خارجی را وارد مدل پیشبینی میکنند و توجه کمی به کیفیت هوا دارند. مدل ما 11 عامل خارجی را انتخاب می کند که می توان آنها را به سه دسته تقسیم کرد: شرایط آب و هوایی (حداکثر درجه حرارت، حداقل دما و روز بارانی یا غیر بارانی)، کیفیت هوا (AQI، PM2.5، PM10، NO 2 ، CO، O 3 ، و SO 2و رویدادها (خواه روز تعطیل باشد یا نه). ما از سری زمانی این عوامل برای تحلیل تاثیر خارجی استفاده می کنیم. داده های خارجی هر ساعت ثبت می شوند و نمونه هایی در جدول 1 نشان داده شده است.
توجه داشته باشید که داده های خارجی هر ساعت ثبت می شوند. با این حال، فاصله زمانی در آزمایش ما 10 دقیقه است، یعنی یک روز شامل 144 بازه زمانی و یک ساعت شامل 6 بازه زمانی است. بنابراین، 6 بازه، داده های ثبت شده مشابهی را در یک ساعت به اشتراک می گذارند. به عنوان مثال، داده های وضعیت آب و هوا از ساعت 6:00 تا 6:10، داده های ثبت شده را از ساعت 6:00 تا 7:00 به اشتراک می گذارد، همانطور که در ردیف اول جدول 1 نشان داده شده است.
ما داده های خارجی را عادی کردیم تا همه مقادیر در یک محدوده قرار گیرند. ما رمزگذاری یکباره را روی مقادیر بولی مانند Holiday و RainyDay انجام دادیم. سپس داده های پردازش شده به لایه های LSTM انباشته ارسال شد. ما یک LSTM سه لایه ساختیم و هر لایه 256 نورون دارد. در نهایت، خروجی های شاخه 5 و خروجی های 4 شاخه قبلی برای آموزش در قسمت فیوژن فیوژن قرار داده شد.
4.4. ویژگی فیوژن
از آنجایی که داده های خروجی از پنج شاخه به شکل یکسان هستند، می توانیم پنج قسمت را با هم ترکیب کنیم. با این حال، تأثیر بخش های مختلف متفاوت است. ما از روش مبتنی بر ماتریس پارامتریک استفاده می کنیم که عملکرد آن در زیر نشان داده شده است.
جایی که F u s i o nافتوسمن��هدف پیش بینی پس از همجوشی است، ∘∘محصول هادامارد را ارائه می دهد، O1�1، O2�2، O3�3، O4�4، و O5�5خروجی های پنج شاخه هستند و دبلیو1دبلیو1، دبلیو2دبلیو2، دبلیو3دبلیو3، دبلیو4دبلیو4، و دبلیو5دبلیو5اوزان قابل یادگیری مربوطه هستند. سپس نتایج پس از همجوشی توسط تابع فعالسازی σ (یعنی ReLU) فعال می شوند. یک لایه LSTM با 64 نورون پس از همجوشی ویژگی اعمال شد. خروجی LSTM متعاقباً مسطح شد و به طور کامل با 578 نورون متصل شد تا خروجیهای نهایی تولید شود.
4.5. آموزش مدل
برای آموزش GLM هیبریدی، خطای میانگین مربع (MSE) به عنوان تابع ضرر استفاده می شود. همانطور که در رابطه (13) نشان داده شده است، yمن�منارزش زمین موجود است، [ خطای پردازش ریاضی ]�^منمقدار پیش بینی شده است و n�تعداد نمونه است. داده های اصلی به سه بخش تقسیم شدند، یک مجموعه داده آموزشی: یک مجموعه داده اعتبار سنجی، و یک مجموعه داده آزمایشی. ما از مجموعه داده آموزشی برای آموزش به صورت دسته ای استفاده می کنیم و ضرر به ازای هر دسته محاسبه می شود. علاوه بر این، ما از Adam به عنوان یک بهینه ساز هنگام آموزش انتشار مجدد استفاده می کنیم. عموماً آدام در انتخاب فراپارامترها نسبتاً قوی در نظر گرفته میشود، اگرچه گاهی اوقات نرخ یادگیری باید از پیشفرض پیشنهادی تغییر کند [ 52 ] (ص 309). پس از به حداقل رساندن تلفات، تمام پارامترهای قابل آموزش آموزش داده می شوند.
5. مطالعه موردی
5.1. داده های آزمایشی
دادههای جریان مسافران مترو مورد استفاده در این مطالعه از دادههای کارت هوشمند (SCD) سیستم متروی شانگهای، چین جمعآوری شد. منطقه مورد مطالعه و خطوط مترو مربوطه در شکل 6 نشان داده شده است. بازه زمانی داده ها بین 1 آوریل تا 30 آوریل 2015 است. در این مدت، روزانه حدود 9 میلیون پرونده کارت وجود داشت که 289 ایستگاه مترو را پوشش می داد. بخش هایی از داده های اصلی در جدول 2 نشان داده شده است. توضیحات فیلد مربوطه در جدول 3 نشان داده شده است.
با توجه به تجربه زندگی، می توانیم ورودی و خروجی مسافران مترو را از داده های اصلی بدست آوریم. فیلد شکل کلیدی است برای تشخیص جریان ورودی یا خروجی. ردیف 1 در جدول 2 را به عنوان مثال در نظر بگیرید که رکورد خروج مسافر است. ظاهراً شکل صفر نشاندهنده جریان ورودی است، در حالی که شکلی که غیرصفر باشد جریان خروجی است.
سپس تعریفی از فاصله زمانی (TI) برای شمارش جریان مسافر ارائه می کنیم. ما به ترتیب 10 دقیقه، 15 دقیقه، 20 دقیقه و 30 دقیقه را به عنوان TI انتخاب می کنیم. اگر TI 10 دقیقه باشد، باید جریان مسافر را هر 10 دقیقه بشماریم. سپس یک روز دارای 144 برش زمانی است. اما ساعت 6:40 صبح تا 11 شب را با توجه به فعالیت های انسانی به عنوان دوره مطالعه انتخاب کردیم. بنابراین، 98 برش زمانی در یک روز وجود داشت.
مجموعه آموزشی شامل مشاهدات از 1 تا 23 آوریل 2015 است. مجموعه اعتبارسنجی از 24 تا 25 آوریل 2015 (شامل یک روز کاری و یک روز غیر کاری) است. ما پنج روز گذشته، 26 تا 30 آوریل 2015، را به عنوان دوره آزمایشی انتخاب کردیم که شامل چهار روز کاری و یک روز غیرکاری است.
5.2. معیارهای ارزیابی
برای اندازه گیری عملکرد مدل های مختلف پیش بینی جریان، ما خطای ریشه میانگین مربع (RMSE) و میانگین درصد مطلق خطا (MAPE) را به عنوان معیارهای ارزیابی انتخاب کردیم. آنها از طریق مقادیر پیش بینی و مقادیر زمین موجود محاسبه می شوند. تعاریف دو معیار در معادلات (14) و (15) نشان داده شده است. از تعریف، می توان فهمید که هر چه مقدار کمتر باشد، مدل بهتر عمل می کند.
جایی که yمن�منارزش زمین موجود است، [ خطای پردازش ریاضی ]�^منمقدار پیش بینی شده است و n�تعداد نمونه است.
5.3. تنظیمات محیطی و آموزشی
آزمایش ها عمدتاً بر روی یک پلتفرم GPU با کارت گرافیک NVIDIA GeForce GTX1050 Ti اجرا شدند که اطلاعات دقیق آن در جدول 4 نشان داده شده است . کتابخانه های پایتون، از جمله scikit-learn، Keras، و TensorFlow برای ساخت مدل ما استفاده شدند.
روش تنظیم پارامترها برای پیش بینی DL مهم است. در اینجا فقط تنظیمات نهایی ذکر شده است که ثابت شده است پارامترهای بهینه هستند. روش تنظیم دقیق در بخش 5.6 ارائه خواهد شد. در آزمایشهای ما، تعداد فواصل زمانی برای الگوهای نزدیک، روزانه و هفتگی بهصورت c=7، d=1، و w=1 تنظیم شد. لایه اول دارای 6 نورون خروجی بود، در حالی که لایه دوم دارای 2 بود. برای آموزش بهتر، سر توجه را 12 تنظیم کردیم. برای جلوگیری از برازش بیش از حد، لایههای حذفی بین دو لایه توجه گراف اضافه شدند. نرخ ترک تحصیل 0.6 تعیین شد. برای شاخه 4، ما دو لایه LSTM را با 600 نورون روی هم قرار دادیم. یک لایه کاملاً متصل متشکل از 578 نورون در پایان اعمال شد. برای ثبت تأثیر عوامل خارجی، ما از یک LSTM 3 لایه با 256 نورون استفاده کردیم. برای بخش فیوژن ویژگی، یک لایه LSTM و یک لایه کاملا متصل متشکل از 64 و 578 نورون به ترتیب اعمال شد.
ما مدل هیبریدی GLM را با به حداقل رساندن MSE برای 200 دوره با اندازه دسته ای هفت آموزش دادیم. ما همچنین از تکنیک های Early Stop برای جلوگیری از برازش بیش از حد استفاده کردیم. نرخ یادگیری اولیه در 5 × 10-4 ، با نرخ فروپاشی 0.95 پس از هر 20 دوره تنظیم شد. از دست دادن آموزش و افت اعتبار پس از 200 دوره پایدار می شود، که نشان دهنده استحکام مدل پیشنهادی است.
5.4. مدل های پایه
ما GLM ترکیبی را با 10 مدل پایه زیر (شامل یک روش آماری، دو روش ML و هفت روش DL) برای ارزیابی عملکرد مقایسه میکنیم. برای مقایسه منصفانه، همه این مدل ها داده های نزدیک، روزانه و هفتگی را به عنوان ورودی می گیرند. بهینه ساز Adam برای همه مدل ها استفاده می شود. توضیحات این مدل های پایه به شرح زیر است. اختصارات مربوط به مدل های پایه در جدول 5 نشان داده شده است.
-
LR: رگرسیون خطی (LR) [ 53 ] یک مدل آماری است که برای دریافت رابطه بین یک پاسخ و یک متغیر توضیحی دیگر استفاده می شود. بر این اساس، از آن برای انجام پیش بینی های آینده استفاده می شود [ 54 ].
-
KNN: رگرسیون K-نزدیکترین همسایه (KNN) [ 55 ] یک روش متداول در رگرسیون ناپارامتریک است. ما همچنین از PCA برای انتخاب اجزای اصلی قبل از وارد کردن داده ها در KNN استفاده می کنیم.
-
RSVR: یک روش معمولی یادگیری ماشین [ 20 ]. هسته SVR در scikit-learn به عنوان یک تابع پایه شعاعی (RSVR) تنظیم شده است.
-
LSTM: شبکه های حافظه کوتاه مدت (LSTM) [ 50 ]. LSTM نوع خاصی از RNN است که قادر به یادگیری وابستگی های زمانی طولانی مدت است. این مدل از دو لایه LSTM روی هم و یک لایه کاملا متصل تشکیل شده است.
-
CNN: یک شبکه عصبی کانولوشنال (CNN) [ 56 ]، که جریان مسافری مبتنی بر شبکه مترو را به یک تصویر دو بعدی تبدیل می کند. محور عمودی نشان دهنده ایستگاه های مترو، محور افقی نشان دهنده زمان است.
-
ResNet: یک مدل ترکیب شده با CNN و ResUnit (ResNet) [ 41 ]. یک بار در زمینه ترافیک استفاده شده است. با این حال، ما عوامل خارجی را در مطالعه خود قرار نمی دهیم.
-
STGCN: مدلی که CNN ها را به داده های غیر اقلیدسی تعمیم می دهد که در حوزه طیفی با تبدیل فوریه گراف استفاده می شود. در مطالعه خود، ما از شبکههای متداول نمودار مکانی-زمانی (STGCN) پیشنهاد شده توسط Han [ 57 ] به عنوان یک مدل پایه استفاده میکنیم.
-
GAT: شبکه های توجه نمودار (GAT) [ 12 ]. GAT نوعی شبکه عصبی گراف است که می تواند روابط توپولوژیکی گره ها را تجزیه و تحلیل کند. دو لایه توجه گراف در مدل استفاده شده است.
-
GLM_NoE: ما شعبه 5 را در GLM ترکیبی حذف می کنیم.
-
GLM_NoIA: ما فقط از ماتریس مجاور سنتی به عنوان لایه ماسک در مقایسه با GLM هیبریدی استفاده می کنیم.
5.5. نتایج و بحث
5.5.1. عملکرد پیش بینی شبکه های مختلف
مشابه GLM هیبریدی، ما فراپارامترها را برای 10 مدل پایه دیگر تنظیم کردیم و فراپارامترهای بهینه را ثبت کردیم. نتایج نهایی در جدول 6 نشان داده شده است. MAPE ها از داده هایی که مقدار واقعی آنها صفر نیست محاسبه می شود. در جدول 6 ، FN CNN تعداد نورون های پنهان یک لایه CNN را نشان می دهد. D CNN به تعداد لایه های پنهان در CNN اشاره دارد. F و D در سایر مدل های پایه معانی مشابهی دارند. L C ، L D و L W به ترتیب طول الگوهای بسته، روزانه و هفتگی را نشان می دهند. K به معنای تعداد سرهای توجه است. هسته SVRبه نوع هسته در الگوریتم SVM اشاره دارد. Neighbor به معنی تعداد گره هایی است که یک کلاس شامل می شود. Ks اندازه هسته پیچیدگی نمودار است . برای مشاهده بیشتر عملکرد پیشبینی به روشی شهودیتر، تصاویر نواری RMSE و MAPE را برای همه مدلها در شکل 7 ترسیم میکنیم .
همانطور که در جدول 6 و شکل 7 نشان داده شده است، GLM هیبریدی با کمترین RMSR و MAPE از اکثر روش های اصلی در داده های متروی شانگهای بهتر عمل می کند. در مقایسه با CNN، ResNet و GAT، GLM ترکیبی کاهش آشکاری در RMSE و MAPE نشان میدهد. به طور خاص، در مقایسه با CNN، GLM ترکیبی کاهش نسبی 34.11٪ در RMSE و 25.57٪ کاهش نسبی در MAPE دارد. در مقایسه با ResNet، GLM هیبریدی دارای 31.58 درصد کاهش نسبی در RMSE و 24.07 درصد کاهش نسبی در MAPE است. در مقایسه با GAT، GLM هیبریدی 29.04 درصد کاهش نسبی در RMSE و 19.54 درصد کاهش نسبی در MAPE دارد. علاوه بر این، GLM هیبریدی نیز بهتر از LSTM عمل می کند. در مقایسه با LSTM، GLM هیبریدی کاهش RMSE 13.37٪ و کاهش MAPE 9.15٪ را نشان می دهد. ما CNN، ResNet و GAT را به عنوان Group1 و LSTM را به عنوان Group2 در نظر می گیریم. دلیل برتری GLM هیبریدی نسبت به گروه 1 و گروه 2 این است که هر دو گروه 1 یا گروه 2 فقط وابستگی مکانی یا زمانی را نشان می دهند. با این حال، GML ترکیبی مزیت GAT و LSTM را برای گرفتن وابستگی مکانی-زمانی ترکیب می کند.
در مرحله بعد، عملکرد مدلهای مختلف، مدلهای آماری، مدلهای ML و مدلهای DL را با هم مقایسه کردیم. مدل آماری، LR، بدتر از مدلهای ML و مدلهای DL عمل میکند. در میان مدلهای DL، متوجه میشویم که بیشتر مدلهای مربوط به وابستگی فضایی نتایج بدتری نسبت به مدلهای مبتنی بر شبکههای عصبی مکرر دارند. CNN و LSTM را به عنوان مثال در نظر بگیرید: LSTM کاهش RMSE 23.87٪ و کاهش MAPE 18.07٪ در مقایسه با CNN را نشان می دهد. دلیل ممکن است این باشد که گرفتن وابستگی مکانی نسبت به وابستگی زمانی برای پیشبینی شبکه مترو در سطح شهر دشوارتر است. در مورد روش های ML، KNN و RSVR، آنها بدتر از مدل DL در رابطه با وابستگی زمانی، مانند LSTM عمل می کنند. با این حال، آنها نتایج بهتری نسبت به مدلهای DL در مورد وابستگی فضایی، مانند CNN، ResNet، دریافت میکنند. و GAT. در مقایسه با KNN، GLM هیبریدی 23.94 درصد کاهش نسبی در RMSE و 11.29 درصد کاهش نسبی در MAPE دارد. علاوه بر این، GLM ترکیبی کاهش 16.59٪ در RMSE و کاهش 1.3٪ در MAPE در مقایسه با RSVR نشان می دهد. به طور کلی، GLM هیبریدی به یک معنا بهتر از مدل های ML عمل می کند.
در مقایسه با مدلهای مبتنی بر شطرنجی، مانند CNN و ResNet، مدلهای مبتنی بر ساختار نمودار دارای RMSE و MAPE کوچکتری هستند. در مقایسه با ResNet، STGCN 26.83% کاهش نسبی در RMSE و 23.11% کاهش نسبی در MAPE دارد. در مقایسه با CNN، GAT 7.05 درصد کاهش نسبی در RMSE و 7.50 درصد کاهش نسبی در MAPE دارد. به طور کلی، RMSE های مدل مبتنی بر شطرنجی بزرگتر از 40 است، در حالی که GLM هیبریدی تنها 31.42 دریافت می کند. MAPE های مدل مبتنی بر شطرنجی بزرگتر از 12 است، در حالی که مدل هیبریدی GLM تنها 9.43 دریافت می کند. از نتایج، نتیجه میگیریم که مدل مبتنی بر ساختار نمودار میتواند وابستگی فضایی نامنظم را بهتر از مدلهای مبتنی بر شطرنجی برای پیشبینی جریان مسافران مترو در سطح شهر دریافت کند.
سپس، GLM هیبریدی را با STGCN مقایسه کردیم و متوجه شدیم که GLM هیبریدی کمی بهتر عمل می کند. GLM ترکیبی کاهش نسبی 6.49٪ در RMSE و 10.87٪ کاهش نسبی در MAPE دارد، عمدتاً به این دلیل که جزء GAT در GLM ترکیبی، ماتریس مجاور اصلی را برای جبران مشکل ماتریس نامتقارن STGCN بهبود می بخشد.
در نهایت، ما سهم بهبود ماتریس مجاور و عوامل خارجی را مورد بحث قرار میدهیم. همانطور که در جدول 6 نشان داده شده است ، GLM هیبریدی دارای 8.74% کاهش نسبی در RMSE و 3.06% کاهش نسبی در MAPE در مقایسه با GLM_NoIA است که نشان دهنده مزایای ماتریس مجاور بهبود یافته است. علاوه بر این، GLM هیبریدی عوامل خارجی را تعبیه کرده است که مدل را کمی بهبود می بخشد. ما می توانیم از نتایج یاد بگیریم که GLM هیبریدی کاهش RMSE 3.74٪ و کاهش MAPE 3.94٪ در مقایسه با GLM_NoE نشان می دهد.
به طور خلاصه، با ادغام GAT و LSTM، GLM هیبریدی میتواند وابستگی مکانی-زمانی را بهتر از چندین مدل موجود دریافت کند.
5.5.2. نتایج پیش بینی یک ایستگاه مترو خاص
با توجه به نتایج RMSE و MAPE مدلهای مختلف، ما چهار مدل را انتخاب کردیم که عملکرد نسبتاً خوبی داشتند، یعنی STGCN، RSVR، LSTM و GLM. ما قصد داریم در مورد این مدل ها به طور مفصل صحبت کنیم. ما ایستگاه مترو میدان مردم را به عنوان نمونه انتخاب کردیم، زیرا یکی از شلوغ ترین ایستگاه های شانگهای است و در مرکز شهر قرار دارد.
شکل 8 و شکل 9 نتایج پیش بینی ورودی و خروجی مسافر در هر 10 دقیقه در ایستگاه مترو میدان مردم در 4 روز کاری و 1 روز غیرکاری است. ما 6:40 صبح تا 11:00 شب را به عنوان بازه زمانی تعیین کردیم. تناوب گردش مسافران مترو در روز کاری را به راحتی می توانیم در شکل 8 و شکل 9 پیدا کنیم. ایستگاه میدان مردم یک منطقه کاری معمولی است. بنابراین، ساعات شلوغی در ساعت 5 بعد از ظهر هر روز کاری (فاصله زمانی حدود 161، 271، 361 و 455 در شکل 8 است)، که زمان ترک کار است. در مورد حجم خروجی، ساعات شلوغی ساعت 9 صبح هر روز کاری است (فاصله زمانی حدود 113، 209، 308، و 410 در شکل 9 است.) که یک ساعت اداری است. در مورد عملکرد، مقادیر پیشبینیشده مدلهای هیبریدی GLM، RSVR، LSTM و STGCN به خوبی با مقادیر واقعی مطابقت دارد. به طور خاص، در جعبههای قرمز شکل 8 ، میتوانیم GLM هیبریدی را پیدا کنیم که کاراکترهای حجم ورودی را در ساعات شلوغی با دقت بیشتری نسبت به سه مدل دیگر میگیرد. با این حال، GLM هیبریدی در پیش بینی حجم خروجی در ساعات غیر شلوغ کمی بدتر عمل می کند که در شکل 9 قابل مشاهده است.
در شکل 10 ، نتایج پیش بینی روزهای غیر کاری و روزهای کاری را به طور خاص ترسیم می کنیم. 98 برش زمانی در یک روز وجود دارد. همانطور که در شکل 10 a,c نشان داده شده است، حجم جریان مسافر در روزهای غیر کاری متغیرتر است و بنابراین نتایج پیش بینی کمی بدتر است. با مقایسه کلی توانایی های پیش بینی روزهای غیر کاری، GLM هیبریدی کمی بدتر از سه مدل دیگر عمل می کند. با این حال، GLM هیبریدی نسبت به مدلهای STGCN، LSTM و RSVR هنگام پیشبینی در روزهای کاری برتر است، که در شکل 10 b,d قابل مشاهده است. مدل GLM در ساعات شلوغی روزهای کاری (فاصله زمانی 50 تا 70 در شکل 10) بسیار بهتر از سه مدل دیگر می تواند ارزش زمین را تطبیق دهد .b، فاصله زمانی 10 تا 20، و 60 تا 80 در شکل 10 d، دایره قرمز را در شکل 10 b,d ببینید). با این حال، توانایی GLM هیبریدی برای گرفتن کاراکترها در ساعات غیر شلوغ روز کاری گاهی بدتر از مدل STGCN است (به کادر قرمز در شکل 10 ب مراجعه کنید). ما دلیل را کم بودن جریان مسافر در ساعات غیر شلوغی میدانیم که منجر به جریان کمتر در ساختارهای نمودار میشود.
برای بررسی بیشتر توانایی GLM هیبریدی برای پیشبینی در ساعات شلوغی یک روز کاری، RMSE را بین ساعات شلوغی و ساعات غیرعجله در همه ایستگاهها واجد شرایط ارزیابی کردیم. نتایج در مقایسه با بهترین STGCN پایه در جدول 7 نشان داده شده است.
همانطور که در جدول 7 نشان داده شده است ، RMSEهای GLM هیبریدی به طور قابل توجهی کوچکتر از STGCN در ساعات شلوغی در یک روز کاری هستند. برای ورودی مسافران، GLM هیبریدی 8.62 درصد کاهش نسبی در RMSE دارد. برای خروج مسافران، GLM هیبریدی در مقایسه با STGCN 10.06 درصد بهبود بیشتری به همراه دارد. در حالی که در ساعات غیر شلوغی، RMSE های این دو مدل نسبتا نزدیک هستند. برای خروج مسافران، GLM هیبریدی حتی عملکرد بدتری دارد. نتایج نشان میدهد که توانایی هیبرید برای پیشبینی در ساعات شلوغی یک روز کاری بهتر از بهترین STGCN پایه است. توجه داشته باشید که RMSE ها در ساعات شلوغی به دلیل تردد مسافر بیشتر نسبت به ساعات غیر پیک بیشتر است.
به طور خلاصه، نتایج پیشبینی هیبریدی GLM در ساعات شلوغی دقیقتر از مدلهای STGCN، LSTM و RSVR است. با این حال، توانایی پیش بینی GLM هیبریدی در ساعات غیر شلوغی کمی بدتر از STGCN است. به طور کلی، توانایی پیشبینی کلی GLM هیبریدی نسبت به STGCN، LSTM و RSVR برتری دارد.
5.5.3. پیش بینی عملکرد در TI های مختلف
برای تأیید استحکام GLM هیبریدی، ما نتایج پیشبینی را از بازههای زمانی مختلف (TIs) مقایسه کردیم. ما به ترتیب 10 دقیقه، 15 دقیقه، 20 دقیقه و 30 دقیقه را به عنوان TI انتخاب کردیم. از شکل 11 و جدول 8میتوان مشاهده کرد که دقت پیشبینی با افزایش TI کاهش مییابد که از تعداد کمتر نمونهها در دادههای آموزشی ناشی میشود. هنگامی که TI ثابت شود، GLM هیبریدی در مقایسه با 9 مدل پایه دیگر، کوچکترین RMSE را دریافت می کند. با این حال، MAPE GLM هیبریدی همیشه کوچکترین نیست. در TI 15 دقیقه و 20 دقیقه، KNN و RSVR نسبت به GLM هیبریدی MPEهای کوچکتری دریافت می کنند. در TI 30 دقیقه، MAPE های RSVR و LSTM کوچکتر از GLM هیبریدی هستند. اگرچه MAPE برخی از مدل ها نسبتاً کوچک است، GLM هیبریدی هنوز RMSE بسیار کوچکتری دارد. دلیل ممکن است این باشد که توانایی پیشبینی ساعات شلوغی GLM هیبریدی در مقایسه با برخی از مدلهای پایه بهتر است در حالی که توانایی پیشبینی آن در ساعات غیر شلوغی گاهی اوقات بد است. در مورد یک TI واحد، نتیجه گیری در بخش 5.5.1 انجام شدقابل اثبات هم هست به عنوان مثال TI 30 دقیقه را در نظر بگیرید، GLM ترکیبی کاهش RMSE 43.27٪ و کاهش MAPE 14.11٪ در مقایسه با CNN نشان می دهد. در مقایسه با LSTM، GLM هیبریدی 15.87 درصد کاهش نسبی در RMSE دارد. نتایج برتری مدل مکانی-زمانی را تأیید میکند. مدل مبتنی بر ساختار نمودار، GAT، کاهش RMSE 2.50٪ و کاهش MAPE 3.82٪ را در مقایسه با مدل مبتنی بر شطرنجی، ResNet نشان می دهد. GLM هیبریدی دارای 10.97 درصد کاهش نسبی در RMSE و 2.99 درصد کاهش نسبی در MAPE در مقایسه با STGCN است. دلیل ممکن است بهبود GAT در هنگام استفاده از ماتریس نامتقارن باشد. همانطور که در جدول 8 نشان داده شده است ، GLM_NoIA و GLM_NoE کمی بدتر از GLM ترکیبی عمل می کنند که اثربخشی عوامل مجاور و خارجی بهبود یافته را نشان می دهد. همانطور که در نشان داده شده استشکل 12 ، نتایج پیشبینی GLM هیبریدی با مقادیر واقعی در TIهای مختلف، بهویژه در دوره اوج، به خوبی مطابقت دارد. توجه داشته باشید که نتایج TI 10 دقیقه در شکل 8 و شکل 9 نشان داده شده است. بنابراین، میتوان نتیجه گرفت که GLM هیبریدی در مجموع از سایر مدلهای پایه در TIهای مختلف بهتر عمل میکند، که استحکام و دقت بالای GLM هیبریدی را نشان میدهد.
5.6. تنظیم پارامترها
روش تنظیم پارامترها یک فرآیند ضروری برای آموزش مدل های DL است. این بخش بر روند تعدیل برخی از عوامل معمولی تمرکز دارد.
5.6.1. طول الگوهای ورودی مختلف
ما در اینجا تأثیر طولهای ورودی مختلف سه الگو، یعنی الگوهای بسته، روزانه و هفتگی را تأیید میکنیم. نتایج در شکل 13 نشان داده شده است. ما به ترتیب c، d و w را به عنوان طول ورودی الگوهای بسته، روزانه و هفتگی تعریف می کنیم. شکل 13 a نتایج اثر نزدیکی زمانی را نشان می دهد که d و w به صورت 1 ثابت هستند اما c تغییر می کند. ما می توانیم یاد بگیریم که RMSE و MAPE زمانی که c 0 باشد بسیار بزرگ هستند، به این معنی که الگوی بسته بسیار مهم است. بهترین عملکرد زمانی ظاهر می شود که c 7 باشد. شکل 13b نتایج اثر دوره روزانه را نشان می دهد که c به عنوان 7 و w به عنوان 1 تنظیم شده است اما d از 0 تا 6 تغییر می کند. می توانیم مشاهده کنیم که RMSE و MAPE ابتدا کاهش می یابد و سپس با افزایش d افزایش می یابد. d بهینه 1 است. شکل 13 c نتایج اثر دوره هفتگی را نشان می دهد که c به عنوان 7 و d به عنوان 1 تنظیم شده است اما w از 0 تا 2 تغییر می کند. از شکل 13 c، متوجه می شویم که RMSE و افزایش MAPE زمانی که w بزرگتر از 1 باشد، به این معنی که وضعیت ساعت 7 صبح دو هفته گذشته ارتباط نزدیکی با ساعت 7 صبح این هفته ندارد. پس از تنظیم، می توان نتیجه گرفت که بهتر است از برخی الگوهای زمانی استفاده کنیم، اما روند بلندمدت ممکن است موثر یا حتی بی فایده نباشد.
5.6.2. تعداد لایه های پنهان
ما نه آزمایش را برای کشف عمق بهینه برای GLM هیبریدی انجام دادیم. ما عمق لایههای توجه گراف و لایههای LSTM را بهطور جداگانه بررسی میکنیم که با D GAT و D LSTM مشخص میشوند . اول، با D LSTM = 1، D GAT از یک تا سه متغیر است. سپس D LSTM به همین ترتیب به صورت 2 و 3 تنظیم می شود. نتایج در شکل 14 نشان داده شده است. به طور کلی، RMSE و MAPE مدل ابتدا کاهش می یابد و سپس افزایش می یابد، که نشان می دهد شبکه عمیق تر اغلب نتایج بهتری برای گرفتن کاراکترهای بیشتر دارد. با این حال، اگر شبکه ها خیلی عمیق باشند، آموزش ممکن است سخت شود، که منجر به افزایش RMSE و MAPE می شود. به طور خاص، اگر D LSTM بین 1 و 2 باشد، RMSE نسبتاً پایین است. زمانی که D LSTM 3 شود، RMSE افزایش می یابد، که نشان می دهد LSTM عمیق تر در مدل بدتر عمل می کند. در مورد D GAT ، RMSE و MAPE نسبتاً بزرگ هستند وقتی D GAT به صورت 1 و 3 تنظیم شود. در نهایت، D LSTM بهینه و D GAT 2 و 2 هستند.
5.6.3. تعداد واحدهای عصبی پنهان
FN LSTM و FN GAT تعداد واحدهای پنهان در LSTM و GAT را به طور نسبی نشان می دهند. برای آزمایش LSTM، FN GAT GAT 2 لایه به صورت 32 و 2 ثابت شد و FN LSTM بین 32، 64، 128، 256، 512،576، 600 و 640 متغیر است. به همین ترتیب، برای آزمایش GAT، FN LSTM ثابت شد. به عنوان 600، و FN GAT در اولین لایه GAT بین 6، 12، 16، 32، 64، 128، و 256 متغیر است. نتایج تأثیر واحدهای عصبی مختلف پنهان در شکل 15 نشان داده شده است. شکل 15 a نتیجه تغییر FN LSTM است. با تغییر FN LSTM ، MAPE نسبتاً پایدار است. با این حال، FN بیشترLSTM منجر به کاهش RMSE تا یک سطح معین می شود. نقطه عطف FN LSTM حدود 600 است. بنابراین، FN LSTM بهینه 600 است. شکل 15 b نتیجه تغییر FN GAT است. RMSE ها و MAPE ها در هنگام تغییر FN GAT بسیار پایدار هستند . با این حال، FN GAT = 32 نتیجه برتری دارد. به طور خلاصه، مدل بهترین دقت پیشبینی را زمانی نشان میدهد که FN LSTM 600 و FN GAT 32 باشد.
6. نتیجه گیری و کار آینده
در این مقاله، ما بر روی یک مسئله ارزشمند و به طور گسترده مطالعه شده، پیشبینی جریان مسافران مترو تمرکز میکنیم که هدف آن پیشبینی موثر و دقیق جریان مسافر در فواصل زمانی آینده برای یک منطقه خاص است. ما استدلال میکنیم که کارهای موجود، کاربرد شبکههای نامتقارن در یک شهر را نادیده میگیرند و این واقعیت را از دست میدهند که همسایگان بیشتر نیز ممکن است تأثیری داشته باشند. علاوه بر این، برخی از آنها اثرات عوامل خارجی مانند آب و هوا، کیفیت هوا و غیره را تجزیه و تحلیل نمی کنند.
برای پرداختن به این مسائل، ما یک روش جدید، GLM ترکیبی، برای پیشبینی جریان مسافران مترو در سطح شهر با ادغام دو روش DL، LSTM و GAT، پیشنهاد میکنیم. با استفاده از GAT می توان از مدل پیشنهادی در شبکه های نامتقارن استفاده کرد. به منظور بررسی تأثیر برخی گرهها که کمی بیشتر قرار دارند، ماتریس مجاور را با اعمال وزنهای مختلف به برخی از همسایگان دیگر بهبود میدهیم. علاوه بر این، ساختارهای LSTM برای جذب وابستگی زمانی و تأثیر خارجی اتخاذ میشوند که میتواند کل مدل را بهبود بخشد. ما مدل پیشنهادی را از طریق یک مطالعه موردی که شامل پیشبینی جریان مسافران مترو در سطح شهر در شانگهای، چین به مدت پنج روز بود، آزمایش کردیم. نتایج تجربی نشان می دهد که GLM ترکیبی به طور قابل توجهی از چندین مدل پایه، یعنی LR، KNN، RSVR، LSTM، CNN، ResNet، GAT و STGCN بهتر عمل می کند. مقایسه دقیق بین GLM هیبریدی و STGCN نشان می دهد که GLM هیبریدی عملکرد بالاتری بین 6 تا 10 درصد برای TI های مختلف ارائه می دهد. برای ساعات شلوغی در یک روز کاری، GLM هیبریدی با حقایق زمینی بهتر مطابقت دارد، که ممکن است برای مدیران شهری برای انجام برنامههای مؤثر مفیدتر باشد. نتایج پیشبینی دقیق همچنین میتواند مرجعی برای برنامه سفر افراد باشد.
با این حال، برخی از محدودیت ها هنوز وجود دارد. اولاً، خطاهای پیشبینی GLM هیبریدی نسبتاً بزرگتر از STGCN برای ساعات غیر عجله در یک روز کاری است. ثانیا، بازه زمانی مجموعه دادههای اعتبارسنجی فقط یک ماه را پوشش میدهد، که ممکن است برخی از عوامل خارجی زمانی مانند فصلها را نادیده بگیرد. ثالثاً، ما یک پیشبینی تک مرحلهای را اعمال میکنیم [ 58] در مطالعه ما، که ممکن است باعث تجمع خطا شود. در آینده، ما قصد داریم به این محدودیتها بپردازیم تا همبستگیها را برای پیشبینی با کیفیت بالاتر کشف کنیم. ما بیشتر ویژگی های خارجی و پیش بینی چند مرحله ای را برای بهبود مدل بررسی خواهیم کرد. ما همچنین قصد داریم کاربرد GLM ترکیبی را در مجموعه داده های بسیار طولانی تر یا انواع دیگر جریان ها، مانند جریان دوچرخه، جریان جمعیت و جریان ترافیک در TI های مختلف بررسی کنیم. در نهایت، از نظر مدلهای DL، برخی از مزایای GAT مانند گرفتن کاراکترهای دو طرفه خطوط ترافیک، مدلسازی نمودارهای پویا و مدلسازی نمودارهای چندگانه باید بیشتر مورد مطالعه قرار گیرد.
بدون دیدگاه