پیش‌بینی دقیق جریان مسافران مترو برای مدیریت عملیات و برنامه‌ریزی خطوط بسیار مهم است. همچنین می تواند ساخت سیستم های حمل و نقل هوشمند (ITS) را ارتقا دهد. با توجه به ویژگی‌های مکانی پیچیده و الگوهای ترافیکی متغیر با زمان شبکه‌های مترو، کار پیش‌بینی هنوز چالش برانگیز است. بنابراین، یک مدل شبکه عصبی ترکیبی، GCTN (شبکه عصبی کانولوشنال و جامع زمانی)، پیشنهاد شده است. این مدل شبکه ترانسفورماتور و شبکه حافظه کوتاه مدت بلند مدت (LSTM) را برای دریافت وابستگی زمانی جهانی و محلی ترکیب می کند. علاوه بر این، از یک شبکه کانولوشن گراف (GCN) برای ثبت ویژگی‌های فضایی شبکه مترو استفاده می‌کند. به خاطر ثبات و دقت برای پیش‌بینی بلندمدت جریان مسافر، ما نفوذ خود ایستگاه و ایستگاه جهانی را افزایش می دهیم و شبکه های عصبی کانولوشنال (CNN) و ترانسفورماتور را ترکیب می کنیم. مدل توسط داده‌های جریان مسافر در مترو شانگهای تأیید می‌شود. در مقایسه با برخی از روش‌های مبتنی بر داده‌های معمولی، نتایج نشان می‌دهد که مدل پیشنهادی دقت پیش‌بینی را در بازه‌های زمانی مختلف بهبود می‌بخشد و در پایداری و استحکام پیش‌بینی برتری نشان می‌دهد. علاوه بر این، این مدل در مقدار پیک و دوره ای که جریان مسافر به سرعت تغییر می کند، عملکرد بهتری دارد. نتایج نشان می‌دهد که مدل پیشنهادی دقت پیش‌بینی را در بازه‌های زمانی مختلف بهبود می‌بخشد و در پایداری و استحکام پیش‌بینی برتری نشان می‌دهد. علاوه بر این، این مدل در مقدار پیک و دوره ای که جریان مسافر به سرعت تغییر می کند، عملکرد بهتری دارد. نتایج نشان می‌دهد که مدل پیشنهادی دقت پیش‌بینی را در بازه‌های زمانی مختلف بهبود می‌بخشد و در پایداری و استحکام پیش‌بینی برتری نشان می‌دهد. علاوه بر این، این مدل در مقدار پیک و دوره ای که جریان مسافر به سرعت تغییر می کند، عملکرد بهتری دارد.

کلید واژه ها:

یادگیری عمیق ؛ پیش بینی جریان مسافر ; مدل هیبریدی ; وابستگی مکانی – زمانی

1. مقدمه

تا سال 2050، از هر 10 نفر، 7 نفر در شهرها زندگی خواهند کرد [ 1 ]. با افزایش جمعیت شهری، حمل و نقل شهری به سرعت در حال گسترش است، که چالش های جدیدی را برای توسعه پایدار شهرها ایجاد می کند. در مقایسه با وسایل نقلیه شخصی، حمل و نقل ریلی شهری می تواند مصرف انرژی مرتبط با حمل و نقل، هزینه های سفر، تراکم ترافیک و آلودگی محیط زیست را کاهش دهد. در همین حال، مطالعات نشان می دهد که رشد مالکیت خودرو در شهرهایی با شدت حمل و نقل ریلی شهری نسبتاً کند است [ 2 ].]. بنابراین مترو، اتوبوس و سایر امکانات حمل و نقل عمومی نقش مهم تری در تحقق توسعه پایدار شهرها دارند. در این میان، سیستم حمل و نقل مترو به دلیل جریان ترافیک زیاد، سرعت عملیات سریع و مساحت کف کوچک، اقدام مهمی برای از بین بردن قید و بندهای ترافیک شهری، کاهش تراکم ترافیک شهری و ایجاد یک سیستم حمل و نقل سه بعدی شهری است [ 3 ]. ]. علاوه بر این، مترو آلاینده های کمتری منتشر می کند و در مصرف انرژی صرفه جویی می کند که می تواند به توسعه سبز و سالم شهر کمک کند.
بنابراین، یک سیستم حمل و نقل مترو به موقع و موثر بسیار حیاتی است. برای جلوگیری از ازدحام ترافیک یا فلج ترافیک ناشی از منابع ناکافی مترو، می‌توانیم از پیش‌بینی جریان مسافر برای تخصیص مؤثر منابع ترافیکی استفاده کنیم. در همین حال، با پذیرش گسترده فناوری آگاه از مکان، داده‌های مکانی-زمانی شهری (مانند داده‌های کارت اتوبوس، داده‌های کشیدن کارت مترو، GPS موبایل و غیره) فراوان می‌شوند [ 4 ]. بنابراین می توان جریان مسافر را استخراج کرد که در مطالعه الگوهای فعالیت انسان مفید است. پیش‌بینی هوشمند جریان مسافر بر اساس داده‌های بزرگ نیز می‌تواند توسعه سیستم حمل‌ونقل هوشمند (ITS) را تسهیل کند [ 5 ]]. به طور خلاصه، ایجاد یک چارچوب یادگیری عمیق برای پیش‌بینی جریان مسافران مترو، دست یافتنی و ضروری است.
با توجه به ارزش عملی زیاد و چالش پیش بینی جریان مسافران مترو، محققان انرژی خود را بیشتر به تحقیق در مورد پیش بینی جریان ترافیک اختصاص می دهند. روش‌های پیش‌بینی جریان مسافر را می‌توان عمدتاً به روش‌های آماری، روش‌های یادگیری ماشین (ML) و روش‌های یادگیری عمیق (DL) طبقه‌بندی کرد.
روش‌های آماری پارامترها را از طریق پردازش داده‌های اصلی تعیین می‌کنند و پیش‌بینی ترافیک را با توجه به تابع رگرسیون [ 6 ]، مانند مدل میانگین متحرک انتگرالی اتورگرسیو (ARIMA) [ 7 ، 8 ] و تغییرات آن [ 9 ، 10 ] محقق می‌کنند. ، 11 ] و مدل فیلتر کالمن [ 12 ، 13 ، 14]. آنها به راحتی می توانند ویژگی های خطی داده ها را محاسبه و ضبط کنند. با این حال، آنها بر فرضیات ثابت تکیه می کنند و می توانند تا حد زیادی تحت تأثیر داده های ترافیکی نوسان قرار گیرند. علاوه بر این، انعکاس ویژگی های غیرخطی و پیچیده جریان ترافیک دشوار است.
روش‌های یادگیری ماشینی می‌توانند ویژگی‌های غیرخطی و قوانین آماری داده‌های ترافیکی را از طریق مشاهدات تاریخی کافی به دست آورند، که می‌تواند مشکل روش‌های آماری، مانند رگرسیون بردار پشتیبان (SVR) را حل کند [ 15 ، 16 ، 17 ]، مدل k-نزدیکترین همسایه (KNN) [ 18 ، 19 ، 20 ]، مدل بیزی [ 21 ، 22 ]، ماشین بردار پشتیبان (SVM) [ 23 ، 24 ، 25 ]، و مدل منطق فازی [ 26 ، 27 ]]. آنها دقت پیش بینی جریان مترو را بهبود می بخشند، اما دستیابی به نتایج خوب در شبکه های پیچیده با گره های متعدد برای آنها دشوار است. آنها عمدتاً بر مهندسی ویژگی های دستی پیچیده تکیه می کنند، که منجر به عدم استحکام برای مدل سازی داده های عظیم می شود، و آنها قادر به پردازش داده های خام مکانی و زمانی نیستند [ 28 ]. بنابراین، برای روش‌های یادگیری ماشینی دشوار است که بهترین نتایج پیش‌بینی را بر اساس داده‌های مکانی و زمانی فراوان به دست آورند.
روش های یادگیری عمیق می توانند به طور خودکار مهندسی ویژگی را ایجاد کنند و بیان ویژگی را بهبود بخشند. علاوه بر این، مدل‌های یادگیری عمیق دارای مزایایی در گرفتن الگوهای غیرخطی و پیچیده هستند که می‌تواند به آنها در دستیابی به نتایج دقیق‌تر کمک کند. در حال حاضر، روش‌های یادگیری عمیق که معمولاً در پیش‌بینی جریان ترافیک مکانی-زمانی استفاده می‌شوند، مانند شبکه عصبی بازگشتی (RNN) [ 29 ، 30 ، 31 ]، شبکه عصبی کانولوشن (CNN) [ 32 ]، شبکه عصبی نموداری (GNN) [ 33 ، 34 ] و غیره. پیش‌بینی جریان ترافیک اساساً به مشاهدات تاریخی بستگی دارد. بنابراین، وابستگی زمانی یک بخش ضروری است. با این حال، برخی از مدل های یادگیری عمیق [ 35، 36 ] فقط وابستگی زمانی جریان مسافر را در نظر بگیرید و وابستگی مکانی را نادیده بگیرید. به این ترتیب پیش بینی ترافیک از عوامل مکانی مانند جاده ها و ایستگاه ها جدا می شود. با ادغام وابستگی فضایی، می‌توانیم دقت مدل را بیشتر بهبود بخشیم. بنابراین، برخی از مطالعات [ 37 ، 38 ، 39 ، 40 ] با هدف کاستی‌های مدل واحد در پیش‌بینی جریان مسافر، CNN را برای مدل‌سازی وابستگی فضایی معرفی می‌کنند و آن را با مدل RNN [ 41 ] و مدل‌های متغیر آن [ 42 ] ترکیب می‌کنند. ، 43]. با این حال، به دلیل ویژگی‌های غیراقلیدسی و متغیر زمانی شبکه مترو، برای CNN دشوار است که رابطه توپولوژیکی فضایی پیچیده را توصیف کند. بنابراین، برخی از مدل‌های یادگیری عمیق [ 44 ، 45 ، 46 ] شبکه عصبی کانولوشن گراف (GCN) [ 47 ، 48 ] را برای بهبود ضبط ویژگی‌های مکانی-زمانی در جریان مسافر معرفی می‌کنند. در عین حال، مدل‌های RNN محدودیت‌هایی برای گرفتن وابستگی زمانی دارند. مدل توجه [ 49 ] می‌تواند ویژگی‌های مکانی-زمانی جهانی و پویا را به تصویر بکشد، که برای پیش‌بینی مفید است. برخی از مدل های یادگیری عمیق [ 50 ، 51 ، 52، 53 ] مدل توجه را در زمینه پیش بینی جریان ترافیک معرفی می کند.
پیشرفت زیادی در این کار حاصل شده است. با این حال، برخی از شکاف های دانش هنوز وجود دارد. روش های آماری برای به دست آوردن ویژگی های پیچیده دشوار است. روش های یادگیری ماشینی به شدت به ویژگی های طراحی شده به صورت دستی بستگی دارد. در مورد روش های یادگیری عمیق، مدل های موجود هنوز دارای شکاف های زیر هستند:
(1)
اکثر روش‌های مبتنی بر GCN از پیشرفت‌های ماتریس مجاور در پیش‌بینی جریان مسافران مترو چشم‌پوشی می‌کنند. اولاً، آنها تأثیر فضایی واردات و صادرات ایستگاه های مترو را نادیده می گیرند. ثانیاً، آنها تأثیر ایستگاه های جهانی بر ایستگاه های خاص را نادیده می گیرند.
(2)
اکثر روش ها بر اساس یک مدل واحد برای گرفتن وابستگی زمانی هستند، مانند مدل RNN و تغییرات آن، یا مدل ترانسفورماتور [ 54 ]. با این حال، این مدل‌ها هنوز محدودیت‌هایی در گرفتن تمام ویژگی‌های زمانی دارند. مدل RNN و تغییرات آن فقط بر روی ثبت ویژگی‌های زمانی محلی تمرکز دارد، در حالی که مدل ترانسفورماتور فقط بر ضبط ویژگی‌های زمانی جهانی تمرکز دارد.
(3)
پیش‌بینی ترافیک معمولاً به دو مقیاس طبقه‌بندی می‌شود که کوتاه‌مدت (≤30 دقیقه) و بلندمدت (≥30 دقیقه) [ 44 ، 53 ] است. در حال حاضر، پیش‌بینی جریان مسافران مترو عمدتاً یک پیش‌بینی کوتاه‌مدت است. با این حال، پیش‌بینی جریان درازمدت نیز بسیار مهم است که می‌تواند آمادگی کافی برای برنامه‌ریزی عملیات را فراهم کند.
به طور خلاصه، برای حل مشکلات فوق و پیش بینی بهتر جریان مسافران مترو، GCTN پیشنهاد شده است. می تواند به طور جامع وابستگی مکانی و زمانی محلی و جهانی را مدل کند. به طور خاص، ویژگی های اصلی از طریق انتشار ویژگی های جریان مسافر توسط یک CNN به دست می آید. ما معتقدیم که مدل‌سازی ویژگی‌های زمانی کاملاً بر اساس ویژگی‌های فضایی ثبت‌شده، بخشی از ویژگی‌های جریان مسافر را نادیده می‌گیرد. بنابراین، ویژگی‌های اصلی و ویژگی‌های ثبت شده توسط GCN به عنوان پایه‌ای برای گرفتن ویژگی‌های زمانی ترکیب می‌شوند. بعدها، ویژگی های حاوی ویژگی های اصلی و فضایی به LSTM و Transformer وارد شدند. LSTM می‌تواند ویژگی‌های زمانی محلی را به تصویر بکشد، و Transformer می‌تواند ویژگی‌های زمانی جهانی را ثبت کند. ما ویژگی های زمانی محلی و جهانی را برای به دست آوردن ویژگی های زمانی جامع ادغام می کنیم. سپس، برای مدل‌سازی وابستگی مکانی-زمانی، و تعادل تأثیر مکانی و زمانی، ویژگی‌های مکانی را به ویژگی‌های زمانی جامع ترکیب کردیم. بنابراین، ما فکر می‌کنیم که این مدل می‌تواند دقت و ثبات پیش‌بینی بلندمدت را بهبود بخشد.
پس از بررسی داده های جریان مسافران مترو، داده های جریان مسافران مترو را به سه الگوی بسته، روزانه و هفتگی تقسیم می کنیم. این مقاله چندین روش همجوشی را برای کشف تأثیر نزدیک‌ترین همسایه و بخش‌های تناوبی امتحان می‌کند. در مقایسه با مدل فعلی پیش‌بینی جریان مسافران مترو، مدل ترکیبی پیشنهادی در این مقاله دارای مزایای زیر است:
  • از طریق بهبود در ماتریس مجاور و GCN، بیان ساختار فضایی در شبکه مترو آشکارتر است. علاوه بر این، ما می‌توانیم ویژگی ایستگاه و تأثیر ایستگاه‌های جهانی را بهتر توصیف کنیم، که جذب ویژگی‌های فضایی را بهبود می‌بخشد.
  • مدلسازی جامع وابستگی مکانی-زمانی ما یک ساختار بلوک مکانی-زمانی طراحی می‌کنیم، و هدف این است که ویژگی‌های استخراج‌شده توسط شبکه را به‌طور یکپارچه مدل‌سازی کنیم.
  • یک بهبود در مدل ترانسفورماتور انجام شده است. CNN برای استخراج و ترکیب ویژگی های میانی اضافه شده است که می تواند به تجزیه و تحلیل بهتر داده های سری زمانی مترو کمک کند.
  • انگیزه پشت GCTN پیش بینی دقیق جریان طولانی مدت مسافران مترو است. پیش‌بینی جریان مسافر می‌تواند به اعزام مترو کمک کند و می‌تواند به شهروندان در برنامه‌ریزی مسیرها و زمان‌بندی زمان کمک کند. علاوه بر این، می تواند به کاهش فشار ترافیک و ساختن شهری سالم، سبز و پایدار کمک کند.
بقیه این مقاله به شرح زیر سازماندهی شده است. در بخش 2 ، بیان ریاضی مسئله پیش‌بینی را شرح می‌دهیم. سپس، معماری مدل را در بخش 3 معرفی می کنیم . در بخش 4 ، نتایج را در تجزیه و تحلیل موردی نشان می‌دهیم و عوامل تأثیرگذار نتایج پیش‌بینی را مورد بحث قرار می‌دهیم. در نهایت، در بخش 5 ، نتایج و محدودیت‌های این مقاله را خلاصه می‌کنیم و جهت تحقیقات آینده را بررسی می‌کنیم.

2. تعریف مسئله

پیش‌بینی جریان مسافران مترو یک مشکل پیش‌بینی مکانی و زمانی است. اول از همه، ساختار فضایی در مترو را می توان به عنوان یک ساختار نمودار بیان کرد، جی=V، E، آ. Vمجموعه ای از گره های N است که ایستگاه های مترو را نشان می دهد. Eلبه بین ایستگاه های مترو است. علاوه بر این، آ∈ آرن×نماتریس مجاور بر اساس اتصال و فاصله اقلیدسی بین ایستگاه های مترو است. علاوه بر این، جریان مسافری مترو نه تنها تحت تأثیر ساختار فضایی شبکه مترو، بلکه تحت تأثیر جریان مسافر در دوره‌های تاریخی قرار می‌گیرد. بنابراین، مسئله پیش‌بینی را می‌توان با رابطه زیر (1) بیان کرد:

هدف=افپیش بینی ایکس، جی، دبلیو،

جایی که هدف∈آرن×تی”×2جریان پیش‌بینی‌شده مسافران مترو ایستگاه‌های N در زمان T است. را ایکس∈آرن×تی×2جریان تاریخی مسافران مترو در N ایستگاه در زمان T است. را هدفو ایکسهر دو شامل حجم ورودی و حجم خروجی هستند. افپیش بینی مدل یادگیری عمیق است. جیساختار نمودار شبکه مترو است و دبلیوپارامتر قابل یادگیری است.

در این مقاله، جریان تاریخی مترو به سه الگوی (بسته، روزانه و هفتگی) تقسیم شده است. الگوی بسته نشان دهنده زمان اخیر است، در حالی که الگوهای روزانه و هفتگی نشان دهنده وضعیت تاریخی جریان مسافر در زمان مورد نظر در روزها یا هفته های مختلف است. به عنوان مثال، اگر جریان مسافر را در برش زمانی بعدی پیش بینی کنیم. الگوهای نزدیک داده های هدف، چند برش زمانی قبلی قبل از زمان هدف هستند. الگوهای روزانه برش های زمانی همزمان در چند روز قبل هستند. علاوه بر این، الگوهای هفتگی، برش های زمانی در همان زمان در چند هفته قبل هستند. الگوهای مختلف به مطالعه تأثیر برش های زمانی دوره ای بر جریان مسافران مترو در زمان هدف کمک می کند. فرآیند پیش بینی در شکل 1 نشان داده شده است.
این مقاله یک مدل شبکه عصبی ترکیبی GCTN (گراف شبکه عصبی کانولوشن و جامع زمانی) را برای حل مشکل پیش‌بینی در جریان مسافران مترو ایجاد می‌کند. علاوه بر گرفتن وابستگی مکانی-زمانی، مدل پیشنهادی همبستگی بین ایستگاه‌ها را با مراحل زمانی مختلف برای تقویت پیش‌بینی جریان مسافر درازمدت در نظر می‌گیرد.
در حال حاضر، روش متداول پیش‌بینی بلندمدت، پیش‌بینی چند مرحله‌ای خودرگرسیون است. با این حال، خطای پیش‌بینی‌شده گسترش می‌یابد و به تدریج در پیش‌بینی چند مرحله‌ای خودرگرسیون انباشته می‌شود. بنابراین، ما مستقیماً وابستگی زمانی بلندمدت را از داده‌های تاریخی مدل می‌کنیم، که برای پیش‌بینی جریان‌های هدف چندگانه استفاده می‌شود. در همین حال، برای جلوگیری از انتشار خطا، ما آموزش موازی را از طریق از دست دادن مشترک چندین مرحله زمانی انجام می‌دهیم که ممکن است به یک پیش‌بینی چند مرحله‌ای دقیق‌تر دست یابد. مدل توسط داده‌های جریان مسافر در بازه‌های زمانی 10 دقیقه، 20 دقیقه و 30 دقیقه آزمایش و تأیید می‌شود.

3. توسعه مدل

در این بخش، یک شبکه عصبی مبتنی بر نمودار برای مقابله با ویژگی‌های توپولوژیکی و تحقق یک پیش‌بینی بلندمدت جریان مسافران مترو استفاده می‌شود. ما یک بررسی مختصر از معماری مدل GCTN و مکانیسم مربوطه ارائه خواهیم کرد.

3.1. معماری کلی

همانطور که در شکل 2 نشان داده شده است، ما یک بلوک فضایی-زمانی طراحی کردیم که شامل GCN، شبکه حافظه کوتاه مدت دو طرفه (Bi-LSTM) و مدل های ترانسفورماتور است. مدل GCN با یادگیری خودکار اطلاعات ویژگی ها و اطلاعات ساختاری ایستگاه ها، ویژگی های فضایی شبکه مترو را به تصویر می کشد. مسیر اجزای ورودی و خروجی در مدل Bi-LSTM بر یادگیری وابستگی‌های زمانی تأثیر می‌گذارد. هر چه مسیر طولانی‌تر باشد، یادگیری مؤثر وابستگی‌های دوربرد دشوارتر می‌شود [ 54]. بنابراین، مدل Bi-LSTM برای گرفتن ویژگی های زمانی محلی استفاده می شود. مدل ترانسفورماتور، بر اساس مکانیسم توجه به خود، می تواند زمینه جهانی را برای گرفتن وابستگی های دوربرد مدل کند. بنابراین، مدل ترانسفورماتور برای ثبت ویژگی های زمانی جهانی استفاده می شود. برای مدل‌سازی جامع وابستگی‌های مکانی-زمانی، یک بلوک مکانی-زمانی طراحی می‌کنیم. این می تواند ویژگی های فضایی و زمانی را استخراج و ترکیب کند. علاوه بر این، عمق مدل را می‌توان با انباشتن بلوک‌های مکانی-زمانی افزایش داد که در مدل‌سازی وابستگی‌های مکانی-زمانی عمیق مفید است. سپس، ویژگی‌های پردازش شده توسط بلوک‌های مکانی-زمانی در مقادیر خروجی پیش‌بینی‌شده از طریق دو لایه کانولوشنال 1 × 1 تجمیع می‌شوند. در شکل 2 ، ایکسمنnپتوتیویژگی اصلی جریان مسافر برای انتشار مشخصه از طریق یک لایه CNN است. این ایکسoتوتیپتوتیویژگی جریان مسافر پس از استخراج ویژگی و ادغام از طریق یک بلوک مکانی-زمانی است. این Yoتوتیپتوتیشبیه است به ایکسoتوتیپتوتیو زمانی که تعداد بلوک های مکانی-زمانی یک باشد، Yoتوتیپتوتی=ایکسoتوتیپتوتی. این Yپrهدمنجتیمنonجریان پیش بینی شده مسافران مترو است.

3.2. مدلسازی وابستگی فضایی

یک مشکل اساسی در پیش‌بینی جریان مسافران مترو، وابستگی فضایی پیچیده شبکه مترو است. CNN معمولاً برای پردازش داده‌های ساختار اقلیدسی و به دست آوردن ویژگی‌های مکانی محلی استفاده می‌شود. با این حال، شبکه مترو یک ساختار نموداری در فضا است و دارای ویژگی های توپولوژیکی پیچیده است. در همین حال، پردازش داده‌های ساختار غیراقلیدسی برای CNN دشوار است. در نتیجه، CNN نمی تواند به طور موثر ویژگی های فضایی توپولوژیکی در شبکه های مترو را استخراج کند. GCN می تواند به طور همزمان یک پیش بینی سرتاسر ویژگی های گره و اطلاعات ساختار را انجام دهد. می‌تواند اطلاعات گره‌های مجاور را جمع‌آوری کند تا ویژگی‌های گره‌ها را در شبکه‌های گراف به دست آورد که بر اساس وزن قابل یادگیری و نمودار از پیش تعریف‌شده است. علاوه بر این، برای GCN مناسب است تا ویژگی های فضایی گره ها و نمودارها را با توپولوژی دلخواه به تصویر بکشد. بنابراین، GCN می تواند ویژگی های فضایی در شبکه های مترو را به تصویر بکشد. از طریق GCN می توان رابطه فضایی بین ایستگاه های شبکه مترو برقرار کرد. علاوه بر این، بیان دقیق ویژگی های فضایی تحقق می یابد. چگونه مدل GCN ویژگی های فضایی بین ایستگاه ها را به تصویر می کشد را می توان در نشان دادشکل 3 و معادله (4).

برای افزایش دقت و ثبات پیش‌بینی، ماتریس مجاور سنتی را بهبود می‌بخشیم. در ایستگاه مترو واردات و صادرات زیادی وجود دارد و واردات و صادرات مختلف ممکن است به هم نزدیک نباشد. مردم تمایل دارند مسیر واردات یا صادرات را به محل یا مقصد خود نزدیکتر کنند. علاوه بر این، تعداد متفاوت واردات و صادرات در ایستگاه‌های مترو ممکن است تأثیرات متفاوتی بر جریان مسافران مترو داشته باشد. بنابراین تاثیر فضایی واردات و صادرات بر ایستگاه قابل تامل است. ما واردات و صادرات در ایستگاه مترو را به عنوان بخشی از ویژگی برای ساخت ماتریس مجاور در نظر می گیریم. به عبارت دیگر، ماتریس هویت با ماتریس مورب جایگزین می شود که واردات و صادرات را در ماتریس مجاور مترو ترکیب می کند. از این رو، ویژگی های خود ایستگاه افزایش یافته است. ابتدا تعداد واردات و صادرات را با توجه به مقادیر حداکثر و حداقل استاندارد می کنیم. ثانیاً، ما یک ماتریس مورب کاملاً بر اساس تعداد نرمال شده واردات و صادرات می سازیم. ما یک ماتریس مجاور ایجاد می کنیم که نشان دهنده اتصال و فاصله اقلیدسی بین ایستگاه ها است. پس از آن، ماتریس مجاور، ماتریس مورب و ماتریس هویت را با هم ترکیب می کنیم. در نهایت، خود حلقه‌های ماتریس مجاور ساخته می‌شوند که در رابطه (2) نشان داده شده است. ما یک ماتریس مجاور ایجاد می کنیم که نشان دهنده اتصال و فاصله اقلیدسی بین ایستگاه ها است. پس از آن، ماتریس مجاور، ماتریس مورب و ماتریس هویت را با هم ترکیب می کنیم. در نهایت، خود حلقه‌های ماتریس مجاور ساخته می‌شوند که در رابطه (2) نشان داده شده است. ما یک ماتریس مجاور ایجاد می کنیم که نشان دهنده اتصال و فاصله اقلیدسی بین ایستگاه ها است. پس از آن، ماتریس مجاور، ماتریس مورب و ماتریس هویت را با هم ترکیب می کنیم. در نهایت، خود حلقه‌های ماتریس مجاور ساخته می‌شوند که در رابطه (2) نشان داده شده است.

آ˜=آ+منn+منه،

جایی که آ˜ماتریس مجاور را با حلقه های خود نشان می دهد. A نشان دهنده ماتریس مجاور است که بر اساس اتصال و فاصله اقلیدسی ایجاد شده است. منnیک ماتریس هویت است و منهیک ماتریس مورب است که از مقدار نرمال شده واردات و صادرات ساخته شده است.

در GCN، اطلاعات گره های مجاور با ماتریس مجاور از پیش تعریف شده تجمیع می شود. پس از آن، ویژگی های فضایی بین گره ها با وزن آموخته شده به دست می آید. مدل GCN را می توان از طریق پشته لایه های کانولوشن گراف ایجاد کرد. ما ویژگی های گره آگاه از ساختار را از تقریب چند جمله ای Chebyshev یاد می گیریم که می تواند وابستگی فضایی را مدل کند. داده های تاریخی هستند ایکسمنnپتوتی∈آرتی×ن×اف، جایی که T نشان دهنده مراحل زمانی ویژگی های ورودی، N نشان دهنده تعداد گره ها، و F نشان دهنده تعداد ویژگی های ورودی است. ویژگی های فضایی گرفته شده عبارتند از ایکسس∈آرتی×ن×اف”، که در آن F ′ تعداد ویژگی های خروجی را نشان می دهد که می تواند با معادله (3) زیر نمایش داده شود:

ایکسس=σ∑ک=0کθکتیکL˜ایکسمنnپتوتی،

که σ یک تابع فعال سازی غیر خطی است و ما از تابع ReLu() استفاده می کنیم. k مرتبه چندجمله ای های چبیشف است تیک، و می توانیم آن را به عنوان اندازه میدان پذیرنده در هسته کانولوشن در نظر بگیریم. θکپارامتر وزن قابل یادگیری است. ماتریس لاپلاسی مقیاس شده است L˜=2L/λمترآایکس-منnبرای چند جمله ای چبیشف، که در آن ماتریس نرمال شده لاپلاسی L با تعریف شده است L=منn-D-1/2آ˜D-1/2، و λمترآایکسحداکثر مقادیر ویژه ماتریس L است. D ماتریس درجه است. در این مقاله از عناصر مورب سنتز شده توسط آ˜برای نشان دادن ماتریس درجه، یعنی Dمنمن=∑jآ˜منj، من، j=1،…،ن.

جریان مسافران ایستگاه های مجاور بر مسافران ایستگاه فعلی تأثیر می گذارد. در این میان، تأثیر ایستگاه های جهانی بر ایستگاه خاص و ایستگاه های مجاور آن قابل تامل است. ما مکانیسم توجه محصول نقطه ای را به شبکه کانولوشن گراف چبیشف اضافه کردیم. عملگر لاپلاسی مقیاس‌پذیر در عملیات محصول نقطه‌ای برای جهانی‌سازی ویژگی‌های فضایی بین ایستگاه‌ها استفاده می‌شود، که ممکن است تأثیر ایستگاه‌های جهانی را بر روی یک ایستگاه خاص و ایستگاه‌های مجاور آن افزایش دهد.

از آنجایی که حجم جریان ورودی و خروجی در پیش‌بینی جریان مسافران مترو وجود دارد، ما انتشار با ابعاد بالا از ویژگی‌های جریان را از طریق CNN انجام می‌دهیم. لایه کانولوشن نمودار چبیشف باید اصلاح شود. اصلاح در معادله (4) نشان داده شده است:

ایکسس=σ∑من=1f∑ک=0کθک،منتیکاسL˜ایکسمنnپتوتی

که در آن، f تعداد کانال های ویژه است. S عملیات توجه محصول نقطه ای را در عملگر لاپلاسی نشان می دهد.

3.3. مدل سازی وابستگی زمانی

عوامل مهم مؤثر بر وابستگی زمانی شامل نزدیکی، روند و تناوب برش های زمانی است. مجاورت به تأثیر بازه های زمانی مجاور اشاره دارد، روند به روند کلی در طول مدتی اشاره دارد، و دوره تناوب تأثیر زمان طولانی تری است [ 28 ]. در این مقاله ما انواع روش های ترکیبی را بر اساس الگوهای نزدیک، روزانه و هفتگی امتحان می کنیم. ما ویژگی های زمانی را با استفاده از ترکیب الگوهای زمانی و ویژگی های مکانی می گیریم. ما ویژگی ها را به ترتیب در LSTM و Transformer وارد می کنیم و هدف این است که ویژگی های زمانی محلی و جهانی را به تصویر بکشیم. علاوه بر این، ما سپس دو نوع ویژگی زمانی را با هم ترکیب می کنیم تا ویژگی های زمانی جامع نهایی را به دست آوریم.
در مقایسه با شبکه RNN سنتی، LSTM مشکل ناپدید شدن گرادیان ناشی از کاهش تدریجی فرآیند انتشار پس‌از گرادیان را حل می‌کند و می‌تواند یک شبکه عصبی عمیق‌تر بسازد [ 42 ]. در عین حال، در مقایسه با RNN و GRU سنتی، LSTM خطاهای کمتری در پیش‌بینی جریان دارد [ 30 ].
جریان مترو یک مرحله زمانی خاص تحت تأثیر اطلاعات گذشته و همچنین اطلاعات آینده است. بنابراین، ما از شبکه Bi-LSTM برای ثبت تأثیر جریان مسافر در گام‌های زمانی جلو و عقب بر روی گام زمانی فعلی استفاده می‌کنیم. ممکن است ویژگی های زمانی محلی را افزایش دهد و ویژگی های زمانی محلی را قابل توجه تر کند. شبکه Bi-LSTM ترکیبی از LSTM جلو و LSTM عقب است و اجزای اصلی آن شامل لایه ورودی، لایه پنهان بازگشتی و لایه خروجی است. نمودار شماتیک Bi-LSTM در شکل 4 نشان داده شده است .
Bi-LSTM برای مدل‌سازی وابستگی زمانی به ساختار لایه پنهان مکرر منحصربه‌فرد خود متکی است. هسته لایه پنهان مکرر آن یک بلوک حافظه حاوی واحدهای حافظه با اتصال خود است که برای ذخیره وضعیت زمانی شبکه در هر مرحله زمانی استفاده می شود [ 55 ]. حالت زمانی توسط سه دروازه کنترل می شود. دروازه ورودی برای دور نگه داشتن محتوای حافظه از ورودی های نامربوط استفاده می شود. دروازه فراموشی برای فراموش کردن اطلاعات بی فایده و گیت خروجی برای انتقال خروجی ها استفاده می شود. واحد هسته Bi-LSTM در شکل 5 نشان داده شده است .
شبکه LSTM می تواند به به دست آوردن اطلاعات زمانی محلی کمک کند. با این حال، در مسئله پیش‌بینی ترافیک، ویژگی‌های اطلاعات زمانی به بیش از برش‌های زمانی مجاور بستگی دارد. با توجه به توانایی شبکه ترانسفورماتور برای گرفتن وابستگی زمانی جهانی، ما ویژگی ها را به شبکه Transformer وارد می کنیم تا وابستگی های زمانی جهانی را مدل کنیم.
شبکه ترانسفورماتور شامل یک لایه جاسازی موقعیت، لایه خودتوجهی چند سر، لایه شبکه عصبی پیشخور و لایه نرمال سازی دسته ای است. در یک ترانسفورماتور، مکانیسم توجه به خود مبتنی بر میانگین وزنی عملکرد ویژگی های ورودی می تواند به طور انعطاف پذیر و سازگار بر روی مناطق مختلف تمرکز کند و ویژگی های بیشتری را به تصویر بکشد. با این حال، عملیات کانولوشن سنتی از یک تابع تجمع در میدان گیرنده محلی با توجه به وزن‌های کانولوشنی استفاده می‌کند و آنها در کل نقشه ویژگی به اشتراک گذاشته می‌شوند. با توجه به ویژگی‌های متفاوت و مکمل خود توجهی و پیچیدگی، ادغام این ماژول‌ها ممکن است از دو پارادایم بهره مند شود. برای افزایش پایداری پیش‌بینی چند مرحله‌ای و کاهش انباشت خطا، این مقاله سعی می کند یک لایه کانولوشنال 1 × 1 در مقابل لایه توجه چند سر اضافه کند تا ویژگی های میانی را استخراج کند. سپس، با افزودن یک کانولوشنال 1 × 1 بعد از لایه توجه چند سر، ویژگی‌های زمانی جهانی را مجدداً استفاده و تجمیع می‌کنیم. ساختار Conv-Transformer در نشان داده شده استشکل 6 . در شکل 6 ، ایکسنشان دهنده ویژگی های ورودی، و Yویژگی های خروجی را نشان می دهد.
در ترانسفورماتور، جریان در یک مرحله زمانی خاص را می توان از طریق یک مکانیسم توجه به خود با تمام جریان های دیگر متصل کرد. با این حال، مکانیسم توجه در لایه ترانسفورماتور هنگام ثبت ویژگی‌های زمانی، با گره‌های مکان مختلف به طور مساوی رفتار می‌کند، که رابطه موقعیت نسبی در سری‌های زمانی را نادیده می‌گیرد. بنابراین، یک لایه جاسازی شده برای برچسب گذاری موقعیت های نسبی گره های مختلف مورد نیاز است. در این مقاله از لایه embedding ارائه شده توسط PyTorch برای تعبیه روابط موقعیتی استفاده می کنیم.

هسته ترانسفورماتور مکانیسم توجه است. ورودی مکانیسم توجه شامل پرس و جوها، کلیدها و بردارهای مقادیر است. علاوه بر این، سه بردار با ضرب ویژگی تعبیه شده به دست می آیند ایکس^با ماتریس اولیه تصادفی دبلیوq، دبلیوک، و دبلیوvبه ترتیب که در رابطه (5) نشان داده شده است. ویژگی تعبیه شده ایکس^توسط داده های ورودی و لایه جاسازی موقعیت به دست می آید. ما بیشتر ویژگی‌های تعبیه‌شده توسط CNN را ترکیب و استخراج می‌کنیم. سپس، حاصل ضرب نقطه ای کوئری ها و کلیدهای داده شده را محاسبه می کنیم. ما به تقسیم حاصل ضرب نقطه بر اختلاف مربع ابعاد کلیدها ادامه می دهیم. سپس، عملیات محصول نقطه ای با مقادیر برای یادگیری وابستگی زمانی دو طرفه انجام می شود. در نهایت، از طریق تابعی که در معادله (5) نشان داده شده است، می‌توان امتیاز توجه سایر موقعیت‌ها را به دست آورد:

س=ایکس^دبلیوqک=ایکس^دبلیوکV=ایکس^دبلیوvآتیتیهnتیمنonس،ک،V=اسofتیمترآایکسسکتیدکV،

که در آن Q ، K ، و V نشان دهنده پرس و جوها، کلیدها و مقادیر برای تمام نقاط زمانی هستند. کتینشان دهنده ماتریس انتقال از ک. دکابعاد کلیدها را نشان می دهد. ما از مکانیسم توجه به خود استفاده می کنیم، Q = K = V  ∈آرتی×دک. در مورد توجه چند سر مورد استفاده در این مقاله، Q ، K و V با توجه به تعداد سرهای توجه از طریق لایه خطی تبدیل می شوند. سپس بعد تانسور تغییر شکل می دهد. تانسورها به ترتیب محاسبه می شوند و سپس برای به دست آوردن ویژگی های نهایی جمع می شوند. این فرآیند در رابطه (6) نشان داده شده است:

متولتیمنآتیتیهnتیمنonس،ک،V=سیonجآتیه(اسofتیمترآایکس(س1ک1تید1کV1)،… اسofتیمترآایکس(سnکnتیدnکVn))دبلیوO،

که در آن n تعداد سرهای توجه و دبلیوOیک طرح خروجی خطی دیگر است. سn، Vn، و کnپرس و جوها، مقادیر و کلیدهایی هستند که توسط ماتریس های طرح ریزی سر توجه n به دست می آیند. پس از استخراج ویژگی ها از طریق مکانیسم توجه چند سر، ویژگی هایی که بیشتر از طریق CNN جمع می شوند به شبکه عصبی پیشخور وارد می شوند. سپس، ویژگی های زمانی جهانی را می توان پس از انتقال به لایه نرمال سازی دسته ای از طریق شبکه عصبی پیشخور بدست آورد.

3.4. ترکیب ویژگی زمانی و لایه پیش بینی

ویژگی‌های زمانی محلی که توسط Bi-LSTM و ویژگی‌های زمانی جهانی گرفته‌شده توسط ترانسفورماتور گرفته شده‌اند، از طریق مکانیزم دروازه با هم ترکیب می‌شوند. دروازه در معادله (7) نشان داده شده است.

g=سمنgمترoمندfلYل+fgYg

که در آن g دروازه ای است برای تجمیع ویژگی های زمانی محلی و جهانی، سیگموئید()یک تابع فعال است. fلو fgپیش بینی های خطی هستند که داده های ورودی را به یک بردار 1 بعدی تبدیل می کنند. Yلخروجی Bi-LSTM است و Ygخروجی ترانسفورماتور است. ویژگی های زمانی جامع Yجبا وزن دهی به دست می آیند Yلو Ygبا دروازه g ، که در معادله (8) نشان داده شده است.

Yج=gYل+(1-g)Yg

پس از به دست آوردن ویژگی های زمانی جامع اولین بلوک مکانی-زمانی، ویژگی های زمانی جامع را با ویژگی های مکانی به دست آمده ترکیب می کنیم. علاوه بر این، ویژگی های ذوب شده را در بلوک فضایی-زمانی بعدی وارد می کنیم. پس از به دست آوردن ویژگی های مکانی-زمانی نهایی، مقدار پیش بینی نهایی را از طریق دو لایه CNN بدست می آوریم. ما ویژگی‌های با ابعاد بالا منتشر شده را با CNN در ابعاد ویژگی مورد نیاز ترکیب و صاف می‌کنیم. ویژگی‌های ابعادی بالا به ویژگی‌های ورودی و خروجی مسطح می‌شوند. در همین حال، داده ها به گام های زمانی هدف پیش بینی شده مسطح می شوند که در معادله (9) نشان داده شده است.

Y=تبدیلتبدیلایکس

Y و X به ترتیب خروجی و ورودی GCTN هستند.

4. مطالعه موردی

4.1. مجموعه داده ها و معیارهای ارزیابی

داده‌های جریان مسافران مترو مورد استفاده در این مطالعه از داده‌های کارت هوشمند (SCD) سیستم متروی شانگهای، چین است. منطقه مورد مطالعه و خطوط مترو مربوطه در شکل 7 نشان داده شده است. تفسیر میدانی و نمونه هایی از داده های اصلی در جدول 1 نشان داده شده است.

دامنه داده ها از 7 آوریل تا 30 آوریل 2015 است. در این مدت، روزانه حدود 9 میلیون کارت ثبت شده است که 289 ایستگاه مترو را پوشش می دهد. با توجه به عادات فعالیت عمومی مردم، این مقاله ساعت 5:30 تا 23:00 را به عنوان دوره تحقیق انتخاب می کند. علاوه بر این، ما 10 دقیقه، 20 دقیقه و 30 دقیقه را به عنوان فواصل زمانی برای شمارش جریان مسافر در نظر می گیریم. به عنوان مثال 10 دقیقه را در نظر بگیرید، داده ها در 23 روز را می توان به 2415 برش زمانی تقسیم کرد. داده ها به یک مجموعه آموزشی، یک مجموعه تایید و یک مجموعه تست با توجه به نسبت 6:2:2 تقسیم می شوند. ما از میانگین خطای مطلق (MAE)، ریشه میانگین مربع خطا (RMSE) و میانگین وزنی درصد مطلق خطا (WMAPE) برای تحلیل کمی و ارزیابی عملکرد پیش‌بینی مدل‌های مختلف استفاده می‌کنیم. معیارهای ارزیابی در معادله (10) نشان داده شده است.

MAE=1n∑من=1ny^من-yمنRMSE=1n∑من=1ny^من-yمن2WMAPE=∑من=1nyمن∑j=1nyjy^من-yمنyمن

جایی که y^منمقدار پیش بینی شده است، yمنارزش واقعی است، nتعداد کل برش های زمانی است و منیک برش زمانی خاص است.

4.2. پارامترهای محیط و مدل

این آزمایش بر روی یک پلت فرم GPU با کارت گرافیک NVIDIA GeForce GTX3080 اجرا می شود. ما از چندین کتابخانه پایتون برای ساخت مدل استفاده می کنیم، از جمله scikit-learn و PyTorch.

پس از آزمایش های آزمایشی فراوان و تنظیم پارامترها، پارامترهای بهینه مدل نهایی در بازه های زمانی 10 دقیقه، 20 دقیقه و 30 دقیقه مشابه هستند. مجموعه داده را با 20 دقیقه Tis به عنوان مثال در نظر می گیریم. ما از MSE به عنوان تابع ضرر استفاده می کنیم و فرآیند محاسبه در معادله (11) نشان داده شده است. ما همچنین از تکنیک توقف زودهنگام برای جلوگیری از برازش بیش از حد استفاده کردیم. این مدل برای 1000 تکرار آموزش داده شده است و معمولاً در حدود 600 تکرار متوقف می شود. تعداد بلوک‌های فضایی-زمانی به عنوان یک، و اندازه دسته‌ای به عنوان 45 تنظیم شده است. هد توجه چهار و کانال‌های ویژگی روی 64 تنظیم شده‌اند. تعداد لایه‌های GCN، LSTM و Transformer همگی به عنوان یک تنظیم شده‌اند. فواصل زمانی الگوهای بسته، روزانه و هفتگی در داده های ورودی 1:1:1 است. کانال ورودی شامل ورودی و خروجی است.−3 ، و بهینه ساز Adam پذیرفته شده است.

MSE=1n∑من=1nyمن-y^من2،
و سپس، روش چرخش پیکربندی‌های مدل، شامل تعداد سرهای توجه، تعداد کانال‌های ویژگی، و ترتیب چندجمله‌ای Chebyshev را که در شکل 8 نشان داده شده‌اند، معرفی می‌کنیم. ما همچنین اثربخشی بلوک های مکانی-زمانی را مطالعه می کنیم که در جدول 2 نشان داده شده است .
در شکل 8 ، WMAPE با پیکربندی های مدل های مختلف کمی تغییر می کند. تغییر در MAE نیز نسبتاً کوچک است. RMSE تغییر آشکارتری دارد. وقتی سر توجه کمتر از چهار باشد، RMSE روند نزولی دارد. وقتی سر توجه بزرگتر از چهار باشد، MAE و RMSE روند صعودی دارند. از نظر کانال های ویژه، MAE و RMSE هر دو روند نزولی و سپس صعودی دارند و نقطه عطف 64 است. در دستورات چبیشف، RMSE روند نزولی و سپس صعودی دارد و چرخش زمانی رخ می دهد که ترتیب نزدیک به سه.
در جدول 2 ، می توان دریافت که مدل با دو بلوک مکانی-زمانی عملکرد RMSE را بهبود می بخشد. با این حال، عملکرد MAE کاهش یافته است. این بدان معناست که عملکرد پیش‌بینی در دوره جریان کم مسافر کاهش می‌یابد، اما توانایی گرفتن مقدار اوج بیشتر بهبود می‌یابد. مقدار اوج برای اعزام مترو بسیار مهم است. در نتیجه، برهم نهی بلوک های مکانی-زمانی مفید است.
در همین حال، به منظور بررسی پیش‌بینی جریان مسافران مترو توسط حالت‌های ترکیبی زمانی مختلف، ما 11 مجموعه داده حالت ترکیبی زمانی مختلف ساختیم و آنها را آزمایش کردیم. جایی که H نشان دهنده الگوهای نزدیک است، D نشان دهنده الگوهای روزانه، و W نشان دهنده الگوهای هفتگی است. نتایج RMSE در شکل 9 نشان داده شده است.
در شکل 9، می توانیم دریابیم که عملکرد پیش بینی زمانی بدترین است که فقط داده های ورودی الگوهای نزدیک وجود داشته باشد. ما چهار نوع داده ورودی را امتحان می کنیم که فقط شامل الگوهای نزدیک است. با افزایش الگوهای نزدیک، عملکرد پیش‌بینی بهبود می‌یابد. با این حال، با افزایش تعداد الگوهای نزدیک در مجموعه داده، عملکرد پیش‌بینی همیشه بهتر نمی‌شود. وقتی الگوی بسته با الگوی روزانه یا الگوی هفتگی ترکیب شود، عملکرد پیش‌بینی به طور قابل توجهی بهبود می‌یابد. وقتی سه نوع الگو با هم ترکیب شوند، عملکرد پیش‌بینی بهترین است. بهترین عملکرد پیش‌بینی کلی 1HD1W است. عملکرد پیش بینی 2H1D1W نیز خوب است، گاهی اوقات حتی بهتر از 1H1D1W. با این حال، در کل، RMSE 2H1D1W نسبتاً بالا است. از نظر 3H1D1W، RMSE پایدارترین تغییر را در چند مرحله زمانی دارد، که به این معنی است که ثبات پیش‌بینی خوب است. با این حال، RMSE 3H1D1W به طور کلی بالاتر از 1H1D1W و 2H1D1W است.

4.3. مدل های پایه

برای مقایسه، مدل پیشنهادی را با نه مدل پایه (شامل یک روش آماری، سه روش یادگیری ماشینی و هفت روش یادگیری عمیق) بر اساس همان ترکیب الگوهای ورودی مقایسه می‌کنیم. خطوط پایه به طور خلاصه به شرح زیر است:
  • رگرسیون خطی (LR) [ 56 ]: یک مدل آماری، که می تواند برای پیش بینی های آینده بر اساس رابطه خطی بین داده های ورودی و داده های هدف انجام دهد.
  • K-نزدیکترین همسایه (KNN) [ 19 ]: یک روش یادگیری ماشینی که در آن جریان مسافر گره هدف با توجه به میانگین جریان مسافر نزدیکترین همسایه آن محاسبه می شود.
  • رگرسیون برداری پشتیبانی با تابع پایه شعاعی (RSVR) [ 15 ]: یک روش یادگیری ماشین معمولی. تابع پایه شعاعی هسته SVR در یادگیری scikit است.
  • رگرسیون برداری پشتیبانی با تابع خطی (LSVR) [ 16 ]: یک روش یادگیری ماشین معمولی. تابع خطی هسته SVR در scikit-learn است.
  • حافظه کوتاه مدت دو جهته (Bi-LSTM) [ 42 ]: یک مدل یادگیری عمیق متشکل از دو لایه LSTM، که می تواند اطلاعات گذشته و آینده را ضبط کند.
  • ترانسفورماتور [ 53 ]: یک مدل یادگیری عمیق. این مبتنی بر مکانیزم توجه به خود است و می تواند وابستگی زمانی جهانی را مدل کند.
  • شبکه عصبی کانولوشنال (CNN) [ 38 ]: یک مدل یادگیری عمیق معمولی. در پیش‌بینی جریان ترافیک، داده‌ها در قالب تصویر دو بعدی به عنوان ورودی شبکه عصبی پردازش می‌شوند. علاوه بر این، محور عمودی نشان دهنده ایستگاه مترو و محور افقی نشان دهنده زمان است.
  • شبکه قراردادی نمودار مکانی-زمانی (STGCN) [ 44 ]: این مدل وابستگی‌های مکانی را با استفاده از GCN و ویژگی‌های زمانی را با استفاده از پیچیدگی 1 بعدی همراه با واحد خطی دروازه‌ای (GLU) ثبت می‌کند.
  • شبکه ترانسفورماتور مکانی-زمانی (STNN) [ 53 ]: مدل یک حالت ترانسفورماتور مکانی-زمانی ایجاد می کند که ویژگی های زمانی را توسط ترانسفورماتور زمانی ثبت می کند، و ویژگی های مکانی را با ترکیب ترانسفورماتور فضایی و GCN ثبت می کند.
  • GCTN_NoLSTM: ما مؤلفه LSTM را در بلوک مکانی-زمانی GCTN حذف کردیم.
  • GCTN_NoTransformer: ما مؤلفه Transformer را در بلوک مکانی-زمانی GCTN حذف کردیم.

4.4. نتایج و بحث

ما نتایج پیش‌بینی چند مرحله‌ای را با فواصل زمانی 10 دقیقه، 20 دقیقه و 30 دقیقه تجزیه و تحلیل و مورد بحث قرار دادیم. در عین حال، نتایج پیش‌بینی‌شده را با مقادیر واقعی در برخی از ایستگاه‌های خاص مقایسه کردیم. ما عملکرد پیش‌بینی را در دوره‌ای که جریان مسافران مترو به سرعت تغییر کرد، تحلیل کردیم. ما عملکرد پیش‌بینی مدل را در طول روز کاری نشان دادیم. ما تأثیر ترکیب الگوهای زمانی را بررسی کردیم. در نهایت، عملکرد اجزای بهبود یافته در GCTN مورد بحث قرار می‌گیرد.

4.4.1. مقایسه نتایج مدل های مختلف پیش بینی

ما از داده های مشابه و حالت پیش بینی چند مرحله ای در مدل های مختلف استفاده می کنیم. ویژگی های جریان مسافر توسط یک لایه کانولوشن 1 × 1 پخش می شود. علاوه بر این، نتایج پیش‌بینی مدل یادگیری عمیق در نهایت توسط دو لایه کانولوشنال 1 × 1 تجمیع می‌شوند. ارزیابی های پیش بینی برای مدل های مختلف در بازه های زمانی مختلف در جدول 3 و جدول 4 نشان داده شده است.
با تجزیه و تحلیل MAE و WMAPE، می‌توانیم دریافتیم که GCTN می‌تواند نتایج بهتری را در مجموعه داده‌های جریان مسافران مترو با فواصل زمانی مختلف به دست آورد. با این حال، MAE و WMAPE برای GCTN همیشه بهتر از مدل‌های دیگر نیستند. به عنوان مثال، در فاصله زمانی 10 دقیقه، MAE STGCN بهتر از GCTN است. علاوه بر این، ممکن است سطح متوسط ​​جریان مترو در بازه زمانی 10 دقیقه کم باشد که منجر به اختلاف کمی بین دبی کم و دبی زیاد می شود. علاوه بر این، در بازه های زمانی 20 دقیقه و 30 دقیقه، MAE GCTN به دلیل گسترش بیشتر تفاوت بین جریان زیاد و کم بهتر است.
با تجزیه و تحلیل RMSE می توان دریافت که نتایج در روش های یادگیری ماشینی به طور کلی بهتر از روش آماری در بازه زمانی 10 دقیقه است. با این حال، در بازه های زمانی 20 دقیقه و 30 دقیقه، نتایج در روش آماری LR بهتر از نتایج در RSVR است که یک روش یادگیری ماشینی است. دلیل ممکن است کاهش تعداد نمونه ها باشد. در مقایسه با روش های آماری و روش های یادگیری ماشینی، اکثر روش های یادگیری عمیق عملکرد پیش بینی بهتری دارند. اولاً، مدل‌های LSTM و ترانسفورماتور با در نظر گرفتن ویژگی‌های زمانی بهتر از روش آماری و روش‌های یادگیری ماشین عمل می‌کنند. علاوه بر این، عملکرد پیش‌بینی Bi-LSTM که ویژگی‌های زمانی محلی را می‌گیرد بهتر از ترانسفورماتور است که ویژگی‌های زمانی جهانی را می‌گیرد. ممکن است ویژگی‌های زمانی محلی آسان‌تر از ویژگی‌های زمانی جهانی در جریان مسافران مترو باشد. ثانیا، STGCN و STTN می توانند ویژگی های مکانی-زمانی را ثبت کنند. STGCN ویژگی های مکانی-زمانی را به ترتیب از طریق شبکه های کانولوشن گراف ضبط می کند. در مقایسه با STGCN، STTN می تواند ویژگی های فضایی ثابت و پویا را با GCN و ترانسفورماتور ثبت کند. علاوه بر این، ویژگی های زمانی جهانی را بیشتر ادغام می کند. بنابراین STGCN و STTN عملکرد بهتری نسبت به Bi-LSTM و Transformer دارند. به همین ترتیب، عملکرد پیش‌بینی STTN بهتر از STGCN است. در نهایت، GCTN ویژگی‌های زمانی محلی و جهانی را ادغام می‌کند و تأثیر ایستگاه‌های جهانی را در GCN بهبود می‌بخشد، که نتایج پیش‌بینی بهتری نسبت به STTN و STGCN دارد. برای مقایسه بیشتر عملکرد پیش‌بینی ادغام ویژگی‌های زمانی محلی و ویژگی‌های زمانی جهانی با مدل زمانی واحد، مدل کامل GCTN را با حذف برخی از مؤلفه‌ها در GCTN اصلاح کردیم. به این ترتیب ما دو مدل جدید GCTN_NoLSTM و GCTN_NoTransformer را دریافت می کنیم. در بازه‌های زمانی مختلف، متوجه می‌شویم که GCTN عملکرد پیش‌بینی بهتری نسبت به GCTN_NoLSTM و GCTN_NoTransformer دارد. نتایج نشان می‌دهد که عملکرد پیش‌بینی ویژگی‌های زمانی جامع بهتر از ویژگی‌های زمانی منفرد است. در بازه‌های زمانی مختلف، متوجه می‌شویم که GCTN عملکرد پیش‌بینی بهتری نسبت به GCTN_NoLSTM و GCTN_NoTransformer دارد. نتایج نشان می‌دهد که عملکرد پیش‌بینی ویژگی‌های زمانی جامع بهتر از ویژگی‌های زمانی منفرد است. در بازه‌های زمانی مختلف، متوجه می‌شویم که GCTN عملکرد پیش‌بینی بهتری نسبت به GCTN_NoLSTM و GCTN_NoTransformer دارد. نتایج نشان می‌دهد که عملکرد پیش‌بینی ویژگی‌های زمانی جامع بهتر از ویژگی‌های زمانی منفرد است.
با در نظر گرفتن فاصله زمانی 20 دقیقه به عنوان مثال، ارزیابی پیش بینی را با پیش بینی جریان مسافر در 20 دقیقه، 40 دقیقه و 60 دقیقه پس از مرحله زمانی فعلی محاسبه می کنیم. از نظر RMSE، در مقایسه با روش های آماری و روش های یادگیری ماشین، عملکرد پیش بینی GCTN به طور قابل توجهی بهبود یافته است. علاوه بر این، با افزایش دامنه مراحل زمانی افزایش می یابد. علاوه بر این، در پیش‌بینی چند مرحله‌ای، فواصل بهبود GCTN 15.60~38.17%/16.22~35.84%/12.57~42.33% است. در روش های یادگیری عمیق، در مقایسه با CNN، عملکرد بهبود GCTN 31.03٪ / 26.07٪ / 26.79٪ است. در مقایسه با Bi-LSTM و Transformer که وابستگی زمانی را مدل می‌کنند، عملکرد بهبود GCTN به ترتیب 8.11%/8.44%/11.15% و 13.03%/11.29%/13.24% است.
4.4.2. مطالعات فرسایشی
به منظور بررسی اثربخشی بهبودها در ماتریس و مدل مجاور، آزمایش‌های مقایسه‌ای زیر را انجام دادیم. نتایج خطا در جدول 5 نشان داده شده است.
  • GCTN_1: مدل GCTN با استفاده از ماتریس مجاور بهبود نیافته.
  • GCTN_2: مدل GCTN از ماتریس مجاور بهبود یافته استفاده می کند. ترانسفورماتور بهبود یافته استفاده می شود، اما تلاش برای محصول نقطه ای اپراتور Laplacian در GCN حذف شده است.
  • GCTN_3: مدل GCTN از ماتریس مجاور بهبود یافته استفاده می کند. بهبود در GCN استفاده می شود، اما لایه کانولوشن اضافه شده در یک ترانسفورماتور حذف می شود.
  • GCTN_4: یک مدل اصلی GCTN بدون بهبود وجود دارد. به عبارت دیگر، پیشرفت‌ها در ماتریس مجاور، GCN و ترانسفورماتور حذف می‌شوند.
در جدول 5 ، در مقایسه با GCTN_4، GCTN عملکرد پیش‌بینی بهتری دارد. این نشان می دهد که بهبود ما در ماتریس مجاور، ساختار ترانسفورماتور و GCN موثر و قابل توجه است.
GCTN_1 یک مدل مقایسه ای برای تأیید اثربخشی ماتریس مجاور بهبود یافته است. معماری اصلی آن مانند معماری GCTN است. نتایج نشان می دهد که ماتریس مجاور بهبود یافته در پیش بینی مفید است. MAE GCTN_1 در برخی مراحل زمانی کمتر از GCTN است. با این حال، RMSE و WMAPE در هر مرحله زمانی بالاتر از GCTN هستند. نتایج حاکی از آن است که برای شبکه مترو، تأثیر فضایی واردات و صادرات ایستگاه مترو وجود دارد و ارزش تحلیل دارد.
GCTN_2 بهبود GCN را حذف کرد. عملکرد پیش بینی آن فقط بهتر از GCTN_4 است. با این حال، MAE، RMSE، و WMAPE GCTN_2 به وضوح بالاتر از GCTN هستند. نتایج نشان می‌دهد که تأثیر فضایی برای پیش‌بینی جریان مسافران مترو بسیار مهم است و لازم است تأثیر ایستگاه‌های جهانی بر ایستگاه‌های خاص افزایش یابد.
GCTN_3 لایه CNN را در ساختار ترانسفورماتور بهبود یافته حذف کرد تا مراحل استخراج ویژگی‌های میانی کاهش یابد. عملکرد پیش‌بینی GCTN_3 نشان می‌دهد که لایه CNN برای استخراج ویژگی‌های میانی و جمع‌آوری ویژگی‌های زمانی جهانی، که توسط مکانیسم توجه به خود جذب می‌شوند، سودمند است.
4.4.3. نتایج پیش بینی ایستگاه های مترو خاص
با توجه به نتایج ارزیابی مدل‌های مختلف، ما برخی از مدل‌های یادگیری عمیق (CNN، Bi-LSTM، Transformer، STGCN، STTN، GCTN) را برای بحث بیشتر انتخاب می‌کنیم. شکل 10 و شکل 11 جریان واقعی مسافر و جریان پیش بینی شده مربوطه را در ایستگاه Xujiahui و ایستگاه میدان مردم، شامل نیم روز غیر کاری و چهار روز کاری نشان می دهد. در مطالعات قبلی [ 28 ]، دامنه نوسانات جریان مسافر در تعطیلات آخر هفته نسبتاً کوچک است، که منجر به تقاضای کمی برای برنامه ریزی مترو می شود. بنابراین، ما در چهار روز کاری روی گردش مسافر تمرکز می کنیم و سپس جزئیات را مورد بحث قرار می دهیم.
در شکل 10 و شکل 11، می توانیم ویژگی های جریان مسافر در مترو را یاد بگیریم. به عنوان مثال، مقادیر پیک ورودی و خروجی مسافر در روزهای کاری به ترتیب حدود ساعت 18 و 9 صبح است که مطابق با ساعات غیر وظیفه و حین انجام وظیفه است. در همین حال، می‌توانیم ببینیم که مدل GCTN نتایج پیش‌بینی نسبتاً خوبی برای مقدار پیک، به‌ویژه در پیش‌بینی جریان ورودی دارد. GCTN می تواند تقریباً در هر مقدار اوج به خوبی پیش بینی کند، که برای مرجع اعزام مترو مفیدتر است. در همین حال، پیش‌بینی‌های بلندمدت سه مدل (GCTN، STGCN، STTN) را نشان می‌دهیم که عملکرد پیش‌بینی بهتری دارند. ما نتایج پیش‌بینی چند مرحله‌ای را به همان مرحله زمانی ترسیم می‌کنیم و تفاوت عملکرد پیش‌بینی چند مرحله‌ای را در برازش پیک مشاهده می‌کنیم. نتایج در شکل 12 نشان داده شده است. ما می‌توانیم متوجه شویم که عملکرد پیش‌بینی هر مرحله زمانی برای برازش اوج نسبتاً خوب است و جریان پیش‌بینی‌شده اغلب بزرگ‌تر از جریان واقعی است. برای ارسال مترو مفید است.
همانطور که همه ما می دانیم، هنگامی که جریان مسافر به سرعت تغییر می کند، اعزام مترو ممکن است دشوار شود. بنابراین، ما باید معیارهای ارزیابی را در دوره ای که جریان مسافر به سرعت تغییر می کند، تجزیه و تحلیل کنیم. در یک روز، برای حجم ورودی، سه دوره وجود دارد که گردش مسافران به سرعت تغییر می کند، یعنی از ساعت 5:30 صبح تا 6:30 صبح، 17:30 بعد از ظهر تا 20:00 و 21:30 تا 11: 00 pm برای حجم خروجی، دوره هایی که جریان مسافر به سرعت تغییر می کند، 8:00 صبح تا 11:00 صبح و 6:00 بعد از ظهر تا 8:00 بعد از ظهر است، بنابراین، برای اثبات بیشتر عملی بودن مدل در پیش بینی جریان مسافران مترو. این مقاله سعی دارد دوره ای را که جریان مسافر به سرعت تغییر می کند تقسیم کند. نتایج در کادر مستطیلی شکل 13 و شکل 14 نشان داده شده است. علاوه بر این، ما RMSE سه مدل را در این دوره محاسبه می کنیم که در جدول 6 نشان داده شده است .
در شکل 13 و شکل 14 می بینیم که دوره گردش مسافران مترو به سرعت در دو ایستگاه یکسان است. این مقاله عملکرد پیش‌بینی بلندمدت GCTN، STTN و STGCN را در دوره‌ای که جریان مسافر به سرعت در کل ایستگاه تغییر می‌کند، مقایسه می‌کند. در جدول 6 ، GCTN عملکرد پیش‌بینی بلندمدت بهتری در دوره‌ای که جریان مسافر به سرعت تغییر می‌کند، دارد، که بهتر از STTN در ورودی، و بهتر از STGCN در خروجی است. به طور کلی، در دوره‌ای که جریان مسافر به سرعت تغییر می‌کند، عملکرد پیش‌بینی GCTN در جریان مسافران مترو بهتر از مدل‌های مربوطه فهرست‌شده در این مقاله است.
برای مطالعه بیشتر ثبات پیش‌بینی مدل و عملکرد پیش‌بینی دوره‌های مختلف در یک روز، یک روز کاری را به 17 ساعت تقسیم می‌کنیم. با در نظر گرفتن تمام روزهای کاری در مجموعه تست، خطای مربوط به این 17 ساعت را محاسبه می کنیم. به این ترتیب می‌توان عملکرد پیش‌بینی مدل‌ها را در دوره‌های مختلف به طور خاص‌تر بررسی کرد. به عنوان مبنای تحلیل، معیارهای ارزیابی (MAE، RMSE، WMAPE) هر ساعت محاسبه می‌شوند. نتایج در شکل 15 و شکل 16 نشان داده شده است.
در شکل 15 و شکل 16 ، می بینیم که عملکرد پیش بینی مدل پیشنهادی در طول زمان در روز کاری تغییر می کند. برای ورودی و خروجی مسافر، عملکرد پیش‌بینی مدل در پیچ و خم تغییر می‌کند. مطابق با دوره ای که جریان ها به سرعت در ایستگاه Xujiahui و ایستگاه میدان مردم در شکل 13 و شکل 14 تغییر می کنند، می توان مشاهده کرد که خطای پیش بینی به شدت افزایش می یابد. دلیل ممکن است این باشد که داده ها به شدت نوسان دارند و تصادفی قوی دارند. گرفتن ویژگی های مکانی و زمانی دشوار است. در نتیجه، عملکرد پیش‌بینی مدل‌ها باید در دوره‌هایی که جریان مسافر به سرعت تغییر می‌کند، بهبود یابد.
ما یک تحلیل برای عملکرد پیش‌بینی در یک روز کاری این مدل‌ها انجام می‌دهیم. در مقایسه با STGCN و STTN، معیارهای ارزیابی GCTN در روز کاری نسبتاً کمی تغییر می کند. ما می‌توانیم RMSE GCTN را در ورودی ایستگاه Xujiahui و خروجی ایستگاه میدان مردم بهتر ببینیم. با این حال، در همه ایستگاه‌ها، می‌توانیم متوجه شویم که RMSE GCTN در خروجی بهتر است و STTN در ورودی بهتر است. این نشان می‌دهد که GCTN عملکردهای متفاوتی در سایت‌های مختلف دارد و عملکرد پیش‌بینی کلی در خروجی مترو پایدارتر است.
4.4.4. تأثیر فضایی اطراف در مورد ایستگاه ها
برای مطالعه عوامل فضایی مؤثر بر پیش‌بینی جریان مسافران مترو، واردات و صادرات ایستگاه‌های مترو، نقطه مورد نظر (POI) در اطراف ایستگاه‌های مترو و RMSE پیش‌بینی جریان مسافران مترو را تحلیل کردیم. به طور خاص، این عناصر شامل مقدار واردات و صادرات در ایستگاه، تعداد و نوع POI در 200 متری ایستگاه و RMSE ایستگاه خاص است.
ما از خوشه بندی K-means برای طبقه بندی این عناصر به ترتیب در سه دسته استفاده کردیم. علاوه بر این، نقشه‌های حرارتی نتایج خوشه‌بندی برای مشاهده توزیع فضایی خطاهای پیش‌بینی جریان مسافر و تأثیر POI و واردات و صادرات بر پیش‌بینی جریان مسافر ترسیم می‌شوند. نتایج در شکل 17 نشان داده شده است.
ایستگاه های مترو با RMSE بالاتر متمرکز هستند و بیشتر آنها در مرکز شهر قرار دارند. علاوه بر این، ایستگاه های مترو با واردات و صادرات بیشتر یا POI بیشتر نیز در مرکز شهر متمرکز شده اند. بنابراین، ما معتقدیم که تعداد و نوع POI و مقدار واردات و صادرات بر دقت پیش‌بینی جریان در ایستگاه مترو تأثیر می‌گذارد. علاوه بر این، با RMSE همبستگی مثبت دارد. هر چه واردات و صادرات بیشتر باشد، RMSE پیش بینی جریان بالاتر است. هرچه تعداد و انواع POI در اطراف ایستگاه مترو کمتر باشد، RMSE پیش بینی جریان در ایستگاه مترو کمتر است. صحت وارد کردن واردات و صادرات به عوامل تأثیرگذار فضایی شبکه مترو را ثابت می کند.

5. نتیجه گیری ها

با هدف مشکل پیش‌بینی جریان مسافران مترو، ما استدلال می‌کنیم که آثار موجود تأثیر فضایی واردات و صادرات ایستگاه‌های مترو و تأثیر ایستگاه‌های جهانی بر ایستگاه‌های خاص را نادیده می‌گیرند. علاوه بر این، بسیاری از روش ها بر اساس یک مدل RNN یا تغییرات آن یا مدل ترانسفورماتور هستند که محدودیت هایی در گرفتن ویژگی های زمانی دارد. این مقاله یک شبکه عصبی ترکیبی، GCTN، برای حل این مشکلات پیشنهاد کرد.
ما از داده‌های جریان مسافران متروی شانگهای برای آزمایش استفاده می‌کنیم. نتایج نشان می دهد که MAE، RMSE و WMAPE عملکرد خوبی در پیش بینی چند مرحله ای به دست آورده اند. GCTN عملکرد پیش‌بینی بهتری در ثبت اوج و دوره‌ای که جریان مسافر به سرعت تغییر می‌کند، دارد که برای کاربرد عملی مدل مفیدتر است. ما اثرات حالت‌های ترکیب زمانی مختلف را مقایسه کردیم که نشان می‌دهد ترکیب الگوهای نزدیک، روزانه و هفتگی می‌تواند عملکرد پیش‌بینی را بهبود بخشد. در همین حال، ما بهبودهای پیشنهادی در GCTN را تأیید کردیم و فکر می‌کنیم ترکیب CNN و Transformer مفید است. ما دریافتیم که RMSE جریان پیش‌بینی‌شده ایستگاه با مقدار واردات و صادرات و مقدار POI همبستگی مثبت دارد.
با این حال، برخی از محدودیت ها هنوز وجود دارد. اولاً، دوره مجموعه داده های اعتبارسنجی برای مطالعه تأثیر عوامل طولانی مدت مانند فصل ها به اندازه کافی طولانی نیست. ثانیاً تأثیر عوامل خارجی مانند آب و هوا در نظر گرفته نمی شود. در نهایت، ما ویژگی‌های فضایی پویا را مطالعه نمی‌کنیم، که ممکن است وابستگی فضایی را بهبود بخشد. در آینده، تأثیر ویژگی های خارجی را بیشتر بررسی خواهیم کرد و کاربرد GCTN را در مجموعه داده های طولانی تر مطالعه خواهیم کرد. ما همچنین قصد داریم تأثیر ویژگی‌های مکانی-زمانی پویا را در مدل یادگیری عمیق و تفاوت‌های بین انواع مختلف مکانیسم‌های توجه در ویژگی‌های زمانی جهانی مطالعه کنیم.

منابع

  1. بانک جهانی. در دسترس آنلاین: https://www.worldbank.org/en/topic/urbandevelopment/overview#1 (در 20 ژانویه 2022 قابل دسترسی است).
  2. دینگیل، AE; روپی، اف. Esztergár-Kiss, D. بررسی یکپارچه عوامل اجتماعی و فنی مؤثر بر تصمیم گیری سفر و عملکرد حمل و نقل شهری. پایداری 2021 ، 13 ، 10158. [ Google Scholar ] [ CrossRef ]
  3. لیو، دی. وو، زی. Sun, S. مطالعه بر روی پیش بینی جریان مسافر در مترو بر اساس شبکه عصبی عود کننده عمیق. چندتایی. ابزارهای کاربردی 2020 ، 6 ، 335-343. [ Google Scholar ] [ CrossRef ]
  4. زو، ایکس. Guo, D. نقشه برداری داده های جریان فضایی بزرگ با خوشه بندی سلسله مراتبی. ترانس. GIS 2014 ، 18 ، 421-435. [ Google Scholar ] [ CrossRef ]
  5. موری، یو. مندیبورو، ا. آلوارز، م. Lozano, JA مروری بر تخمین و پیش‌بینی زمان سفر برای سیستم‌های اطلاعات پیشرفته مسافران. ترانسپ ترانسپ. علمی 2015 ، 11 ، 119-157. [ Google Scholar ] [ CrossRef ]
  6. ژائو، ال. آهنگ، ی. ژانگ، سی. لیو، ی. وانگ، پی. لین، تی. دنگ، م. Li، H. T-GCN: یک شبکه کانولوشنال نمودار زمانی برای پیش بینی ترافیک. IEEE Trans. هوشمند ترانسپ سیستم 2020 ، 21 ، 3848-3858. [ Google Scholar ] [ CrossRef ]
  7. لیو، سی. لیو، اس. تیان، ی. Sun، QL; Tang, YY تحقیق در مورد پیش بینی جریان ترافیک ریلی بر اساس مدل ARIMA. J. Phys. Conf. سر. 2021 ، 1792 ، 012065. [ Google Scholar ] [ CrossRef ]
  8. احمد، ام اس; کوک، تحلیل واقعیت افزوده داده‌های سری زمانی ترافیک آزادراه با استفاده از تکنیک‌های Box-Jenkins. ترانسپ Res. ضبط 1979 ، 722 ، 1-9. [ Google Scholar ]
  9. چنگ، تی. وانگ، جی. هاورث، جی. هایدکر، بی. چاو، الف. یک ماتریس وزن فضایی پویا و میانگین متحرک یکپارچه خودبازگشتی مکان-زمان محلی برای مدل‌سازی شبکه. Geogr. مقعدی 2014 ، 46 ، 75-97. [ Google Scholar ] [ CrossRef ]
  10. میلنکوویچ، م. شوادلنکا، ال. ملیچار، وی. بویوویچ، ن. رویکرد مدل‌سازی Avramović، Z. SARIMA برای پیش‌بینی جریان مسافر راه‌آهن. حمل و نقل 2018 ، 33 ، 1113-1120. [ Google Scholar ] [ CrossRef ]
  11. دینگ، سی. دوان، جی. ژانگ، ی. وو، ایکس. یو، جی. استفاده از رویکرد مدل‌سازی ARIMA-GARCH برای بهبود حسابداری پیش‌بینی کوتاه‌مدت سواری مترو برای نوسانات پویا. IEEE Trans. هوشمند ترانسپ سیستم 2018 ، 19 ، 1054-1064. [ Google Scholar ] [ CrossRef ]
  12. اوکوتانی، آی. استفاندس، YJ پیش‌بینی دینامیکی حجم ترافیک از طریق نظریه فیلتر کالمن. ترانسپ Res. قسمت B 1984 ، 18 ، 1-11. [ Google Scholar ] [ CrossRef ]
  13. پیش بینی جریان ترافیک کومار، SV با استفاده از تکنیک فیلتر کالمن. Procedia Eng. 2017 ، 187 ، 582-587. [ Google Scholar ] [ CrossRef ]
  14. ژو، تی. جیانگ، دی. لین، ز. آویزان شدن.؛ خو، X. مدل فیلتر کالمن دوگانه هیبریدی Qin، J. برای پیش‌بینی کوتاه‌مدت جریان ترافیک. IET Intel. ترانسپ سیستم 2019 ، 13 ، 1023-1032. [ Google Scholar ] [ CrossRef ]
  15. Suthaharan, S. (ویرایش) ماشین بردار پشتیبانی. در مدل‌ها و الگوریتم‌های یادگیری ماشین برای طبقه‌بندی کلان داده‌ها: تفکر با مثال‌هایی برای یادگیری مؤثر . Springer: Boston, MA, USA, 2016; ص 207-235. [ Google Scholar ] [ CrossRef ]
  16. وو، CH; هو، جی.ام. Lee, DT پیش‌بینی زمان سفر با رگرسیون بردار پشتیبان. IEEE Trans. هوشمند ترانسپ سیستم 2004 ، 5 ، 276-281. [ Google Scholar ] [ CrossRef ]
  17. سو، اچ. ژانگ، ال. Yu, S. پیش بینی کوتاه مدت جریان ترافیک بر اساس رگرسیون بردار پشتیبانی افزایشی. در مجموعه مقالات سومین کنفرانس بین المللی محاسبات طبیعی، ICNC 2007، هایکو، چین، 24-27 اوت 2007. صص 640-645. [ Google Scholar ] [ CrossRef ]
  18. آلتمن، NS مقدمه ای بر رگرسیون ناپارامتریک هسته و نزدیکترین همسایه. صبح. آمار 1992 ، 46 ، 175-185. [ Google Scholar ] [ CrossRef ]
  19. یو، بی. وو، SH; وانگ، MH; ژائو، ZH K-نزدیک‌ترین همسایه مدل پیش‌بینی کوتاه‌مدت جریان ترافیک. جیائوتونگ یونشو گونگ چنگ ژئوبائو/جی. Traffic Transp. مهندس 2012 ، 12 ، 105-111. [ Google Scholar ] [ CrossRef ]
  20. ژانگ، ال. لیو، کیو. یانگ، دبلیو. وی، ن. دونگ، دی. یک مدل K-نزدیک‌ترین همسایه بهبود یافته برای پیش‌بینی کوتاه‌مدت جریان ترافیک. Procedia-Soc. رفتار علمی 2013 ، 96 ، 653-662. [ Google Scholar ] [ CrossRef ]
  21. سان، اس. ژانگ، سی. یو، جی. رویکرد شبکه بیزی برای پیش‌بینی جریان ترافیک. IEEE Trans. هوشمند ترانسپ سیستم 2006 ، 7 ، 124-132. [ Google Scholar ] [ CrossRef ]
  22. احمد، شبکه های بیزی SE و نمودارهای تصمیم. Technometrics 2008 , 50 , 97. [ Google Scholar ] [ CrossRef ]
  23. کیو، جی. لیو، ایکس. Ruyue، L. پیش بینی وضعیت ترافیک کوتاه مدت بر اساس ماشین بردار پشتیبانی. در مجموعه مقالات کنوانسیون حمل و نقل جهانی 2019، پکن، چین، 13 ژوئن 2019؛ صص 720-727. [ Google Scholar ]
  24. لینگ، ایکس. فنگ، ایکس. چن، ز. خو، ی. Haifeng, Z. پیش‌بینی کوتاه‌مدت جریان ترافیک با ماشین بردار پشتیبانی چند هسته‌ای بهینه‌سازی شده. در مجموعه مقالات کنگره IEEE 2017 در محاسبات تکاملی، CEC، سن سباستین، اسپانیا، 5 تا 8 ژوئن 2017؛ صص 294-300. [ Google Scholar ] [ CrossRef ]
  25. لو، سی. هوانگ، سی. کائو، جی. لو، جی. هوانگ، دبلیو. گوا، جی. Wei, Y. پیش‌بینی جریان ترافیک کوتاه‌مدت بر اساس ماشین بردار پشتیبان حداقل مربع با الگوریتم بهینه‌سازی ترکیبی. فرآیند عصبی. Lett. 2019 ، 50 ، 2305-2322. [ Google Scholar ] [ CrossRef ]
  26. یین، اچ. وانگ، SC; خو، جی. Wong، CK پیش‌بینی جریان ترافیک شهری با استفاده از رویکرد عصبی فازی. ترانسپ Res. قسمت C Emerg. تکنولوژی 2002 ، 10 ، 85-98. [ Google Scholar ] [ CrossRef ]
  27. بهارتی، اس. Vinod، KK; Arvind، مدل منطق فازی KG برای پیش‌بینی حجم ترافیک در روزهای هفته. بین المللی جی. کامپیوتر. Appl. 2014 ، 107 ، 1-6. [ Google Scholar ] [ CrossRef ]
  28. هان، ی. پنگ، تی. وانگ، سی. ژانگ، ز. چن، جی. یک مدل GLM ترکیبی برای پیش‌بینی جریان مسافری مترو در سطح شهر. ISPRS Int. J. Geo-Inf. 2021 ، 10 ، 222. [ Google Scholar ] [ CrossRef ]
  29. بلهادی، ع. جنوری، ی. جنوری، د. لین، JC-W. یک شبکه عصبی تکراری برای پیش‌بینی جریان ترافیک شهری درازمدت Appl. هوشمند 2020 ، 50 ، 3252-3265. [ Google Scholar ] [ CrossRef ]
  30. لی، ز. لی، سی. کوی، ایکس. Zhang, Z. پیش‌بینی کوتاه‌مدت جریان ترافیک بر اساس شبکه عصبی مکرر. در مجموعه مقالات کنفرانس بین المللی 2021 در زمینه ارتباطات رایانه ای و هوش مصنوعی (CCAI)، گوانگژو، چین، 7 تا 9 مه 2021؛ صص 81-85. [ Google Scholar ] [ CrossRef ]
  31. فو، آر. ژانگ، ز. Li, L. استفاده از روش های شبکه عصبی LSTM و GRU برای پیش بینی جریان ترافیک. در مجموعه مقالات سی و یکمین کنفرانس سالانه آکادمیک جوانان انجمن اتوماسیون چین، YAC 2016، ووهان، چین، 11 تا 13 نوامبر 2016؛ صص 324-328. [ Google Scholar ] [ CrossRef ]
  32. ویبین، ز. یینگهائو، ی. یونگ، کیو. فنگ، اس. Yinhai، W. پیش‌بینی کوتاه‌مدت جریان ترافیک بر اساس تجزیه و تحلیل مکانی-زمانی و یادگیری عمیق CNN. ترانسپ ترانسپ. علمی 2019 ، 15 ، 1688-1711. [ Google Scholar ] [ CrossRef ]
  33. Agafonov، A. پیش‌بینی جریان ترافیک با استفاده از شبکه‌های عصبی پیچیدگی نمودار. در مجموعه مقالات دهمین کنفرانس بین المللی علوم و فناوری اطلاعات 2020 (ICIST)، لندن، انگلستان، 9 تا 15 سپتامبر 2020؛ ص 91-95. [ Google Scholar ] [ CrossRef ]
  34. یان، بی. وانگ، جی. یو، جی. جین، ایکس. Zhang، H. شبکه عصبی نمودار فضایی-زمانی چبیشف برای پیش‌بینی جریان ترافیک در ITS مبتنی بر اینترنت اشیا. IEEE Internet Things J. 2017 , 9 , 9266–9279. [ Google Scholar ] [ CrossRef ]
  35. ژائو، ز. چن، دبلیو. وو، ایکس. چن، PCY; شبکه لیو، جی. LSTM: یک رویکرد یادگیری عمیق برای پیش بینی ترافیک کوتاه مدت. IET Intel. ترانسپ سیستم 2017 ، 11 ، 68-75. [ Google Scholar ] [ CrossRef ]
  36. لی، جی اس. پنگ، ال. لی، ایکس. Wu, T. پیش‌بینی ترافیک کوتاه‌مدت ایستگاه‌های اتوبوس شهری بر اساس حافظه کوتاه‌مدت. جی. هایو. ترانسپ Res. توسعه دهنده (Engl. Ed.) 2019 ، 13 ، 65–72. [ Google Scholar ] [ CrossRef ]
  37. کیائو، ی. وانگ، ی. مک.؛ یانگ، جی. پیش‌بینی کوتاه‌مدت جریان ترافیک بر اساس ساختار شبکه عصبی 1DCNN-LSTM. مد. فیزیک Lett. B 2020 , 35 , 2150042. [ Google Scholar ] [ CrossRef ]
  38. ما، ایکس. دای، ز. او، ز. ما، جی. وانگ، ی. Wang, Y. ترافیک یادگیری به عنوان تصاویر: یک شبکه عصبی پیچیده عمیق برای پیش بینی سرعت شبکه حمل و نقل در مقیاس بزرگ. Sensors 2017 , 17 , 818. [ Google Scholar ] [ CrossRef ]
  39. لیو، ی. ژنگ، اچ. فنگ، ایکس. Chen, Z. پیش‌بینی کوتاه‌مدت جریان ترافیک با Conv-LSTM. در مجموعه مقالات نهمین کنفرانس بین المللی 2017 در زمینه ارتباطات بی سیم و پردازش سیگنال، WCSP، نانجینگ، چین، 11 تا 13 اکتبر 2017؛ صص 1-6. [ Google Scholar ] [ CrossRef ]
  40. یو، دبلیو. ژیفی، دبلیو. هونگیه، دبلیو. جونفنگ، ز. Ruilong، F. پیش بینی جریان مسافر بر اساس مدل ترکیبی CNN-LSTM. در مجموعه مقالات دوازدهمین سمپوزیوم بین المللی هوش محاسباتی و طراحی (ISCID) 2019، هانگژو، چین، 14 تا 15 دسامبر 2019؛ صص 132-135. [ Google Scholar ] [ CrossRef ]
  41. کانر، جی تی. مارتین، RD; اطلس، شبکه های عصبی بازگشتی LE و پیش بینی سری زمانی قوی. IEEE Trans. شبکه عصبی 1994 ، 5 ، 240-254. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  42. نواک، ج. تاسپینار، ا. Scherer، R. LSTM شبکه های عصبی بازگشتی برای طبقه بندی متن کوتاه و احساسات. در مجموعه مقالات کنفرانس بین المللی هوش مصنوعی و محاسبات نرم، زاکوپان، لهستان، 11 تا 15 ژوئن 2017؛ نکات سخنرانی در علوم کامپیوتر. Springer: Cham, Switzerland, 2017; جلد 10246، ص 553–562. [ Google Scholar ] [ CrossRef ]
  43. چو، ک. ون مرینبور، بی. بهداناو، د. Bengio، Y. در مورد خواص ترجمه ماشین عصبی: رویکردهای رمزگذار-رمزگشا. در مجموعه مقالات کارگاه آموزشی SSST 2014-2014 در مورد نحو، معناشناسی و ساختار در ترجمه آماری، دوحه، قطر، 25 اکتبر 2014. صص 103-111. [ Google Scholar ] [ CrossRef ]
  44. یو، بی. یین، اچ. Zhu, Z. شبکه‌های کانولوشنال نمودار فضایی-زمانی: یک چارچوب یادگیری عمیق برای پیش‌بینی ترافیک. arXiv 2017 , arXiv:1709.04875. [ Google Scholar ]
  45. لی، ز. شیونگ، جی. چن، ی. Lv، Y.; هو، بی. زو، اف. وانگ، F.-Y. یک رویکرد یادگیری عمیق ترکیبی با GCN و LSTM برای پیش‌بینی جریان ترافیک. در مجموعه مقالات کنفرانس سیستم های حمل و نقل هوشمند IEEE 2019، ITSC 2019، اوکلند، نیوزیلند، 27 تا 30 اکتبر 2019؛ صفحات 1929-1933. [ Google Scholar ] [ CrossRef ]
  46. Lv، M. هنگ، ز. چن، ال. چن، تی. زو، تی. جی، S. شبکه کانولوشن چند گرافی زمانی برای پیش‌بینی جریان ترافیک. IEEE Trans. هوشمند ترانسپ سیستم 2021 ، 22 ، 3337-3348. [ Google Scholar ] [ CrossRef ]
  47. برونا، جی. زارمبا، دبلیو. اسلم، آ. LeCun، Y. شبکه های طیفی و شبکه های عمیق محلی متصل بر روی نمودارها. arXiv 2014 ، arXiv:1312.6203. [ Google Scholar ]
  48. دیفرارد، ام. برسون، ایکس. Vandergheynst، P. شبکه‌های عصبی کانولوشنال روی نمودارها با فیلتر کردن طیفی سریع محلی. arXiv 2016 , arXiv:1606.09375. [ Google Scholar ] [ CrossRef ]
  49. بهداناو، د. چو، خ. Bengio، Y. ترجمه ماشینی عصبی با یادگیری مشترک تراز و ترجمه. arXiv 2014 ، arXiv:1409.0473. [ Google Scholar ]
  50. بای، جی. ژو، جی. آهنگ، ی. ژائو، ال. هو، ز. دو، آر. Li، H. A3T-GCN: توجه به شبکه کانولوشن نمودار زمانی برای پیش بینی ترافیک. ISPRS Int. J. Geo-Inf. 2021 ، 10 ، 485. [ Google Scholar ] [ CrossRef ]
  51. ژانگ، جی. چن، اف. کوی، ز. گوا، ی. Zhu, Y. معماری یادگیری عمیق برای پیش بینی جریان مسافر کوتاه مدت در حمل و نقل ریلی شهری. IEEE Trans. هوشمند ترانسپ سیستم 2021 ، 22 ، 7004–7014. [ Google Scholar ] [ CrossRef ]
  52. ژو، جی. وانگ، کیو. تائو، سی. دنگ، اچ. ژائو، ال. Li, H. AST-GCN: شبکه کانولوشنی نمودار فضایی-زمانی با ویژگی افزوده شده برای پیش بینی ترافیک. دسترسی IEEE 2021 ، 9 ، 35973–35983. [ Google Scholar ] [ CrossRef ]
  53. خو، ام. دای، دبلیو. لیو، سی. گائو، ایکس. لین، دبلیو. چی، جی. Xiong، H. شبکه های ترانسفورماتور مکانی-زمانی برای پیش بینی جریان ترافیک. arXiv 2020 ، arXiv:2001.02908. [ Google Scholar ]
  54. واسوانی، ع. Shazeer, N. پارمار، ن. Uszkoreit، J. جونز، ال. گومز، AN; قیصر، Ł. Polosukhin، I. توجه شما تمام چیزی است که نیاز دارید. در مجموعه مقالات سی و یکمین کنفرانس بین المللی سیستم های پردازش اطلاعات عصبی، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 4 دسامبر 2017; صفحات 6000–6010. [ Google Scholar ]
  55. دالدال، ن. سنگور، ا. پولات، ک. کومرت، Z. یک سیستم دمودولاسیون جدید برای سیگنال های مدولاسیون دیجیتال باند پایه بر اساس مدل حافظه کوتاه مدت عمیق عمیق. Appl. آکوست. 2020 , 166 , 107346. [ Google Scholar ] [ CrossRef ]
  56. Ober, PB مقدمه ای بر تحلیل رگرسیون خطی. JR Stat. Soc. 2010 ، 40 ، 2775-2776. [ Google Scholar ] [ CrossRef ]
شکل 1. نمودار شماتیک فرآیند پیش بینی.
شکل 2. معماری کلی مدل.
شکل 3. نمودار گرفتن ویژگی های گره از طریق GCN.
شکل 4. نمودار شماتیک Bi-LSTM.
شکل 5. واحد هسته Bi-LSTM.
شکل 6. نمودار ساختار Conv-Transformer.
شکل 7. منطقه مورد مطالعه و خطوط مترو مربوطه.
شکل 8. معیارهای ارزیابی برای TI 20 دقیقه که توسط GCTN با پیکربندی مدل های مختلف به دست آمده است. ( الف ) سرهای توجه؛ ( ب ) کانال های ویژه. ج ) چبیشف دستور می دهد.
شکل 9. نتایج پیش‌بینی GCTN در مجموعه داده‌های الگوهای زمانی مختلف – RMSE.
شکل 10. پیش بینی جریان مسافر در ایستگاه Xujiahui، ( الف ) حجم ورودی. ( ب ) حجم خروجی. فاصله زمانی 10 دقیقه و دوره آزمون شامل نیم روز غیر کاری و چهار روز کاری می باشد.
شکل 11. پیش بینی جریان مسافر در ایستگاه میدان مردم، ( الف ) حجم ورودی. ( ب ) حجم خروجی. فاصله زمانی 10 دقیقه و دوره آزمون شامل یک نیم روز غیر کاری و چهار روز کاری می باشد.
شکل 12. تجسم پیش بینی طولانی مدت با حجم ورودی و حجم خروجی در ایستگاه Xujiahui که فاصله زمانی آن 10 دقیقه است، ( الف ) حجم ورودی GCTN. ( ب ) حجم ورودی STTN; ( ج ) حجم ورودی STGCN. ( د ) حجم خروجی GCTN. ( ه ) حجم خروجی STTN. ( f ) حجم خروجی STGCN.
شکل 13. دوره زمانی که جریان مسافر به سرعت در ایستگاه Xujiahui تغییر می کند. ( الف ) حجم ورودی؛ ( ب ) حجم خروجی.
شکل 14. دوره زمانی که جریان مسافر به سرعت در ایستگاه میدان مردم تغییر می کند. ( الف ) حجم ورودی؛ ( ب ) حجم خروجی.
شکل 15. عملکرد پیش بینی جریان در زمان های مختلف در روز کاری، با هر بازه زمانی 60 دقیقه. ( الف ) ایستگاه Xujiahui؛ ( ب ) ایستگاه میدان مردم؛ ( ج ) همه ایستگاه ها.
شکل 16. عملکرد پیش بینی جریان خروجی زمان های مختلف در روز کاری، با هر فاصله زمانی 60 دقیقه. ( الف ) ایستگاه Xujiahui؛ ( ب ) ایستگاه میدان مردم؛ ( ج ) همه ایستگاه ها.
شکل 17. نقشه های حرارتی عوامل فضایی و RMSE. هر چه رنگ تیره تر باشد، مقدار آن بیشتر است. الف ) تعداد واردات و صادرات. ب ) تعداد و نوع POI. ( ج ) میانگین RMSE در ایستگاه ها.

بدون دیدگاه

دیدگاهتان را بنویسید