1. مقدمه
توسعه و استفاده از فضای زیرزمینی شهری (UUS) میتواند ساختار فضایی شهری را بهینه کند، زیرساختهای شهری را بهبود بخشد و به طور موثر تراکم ترافیک شهری و سایر مشکلات شهرنشینی را حل کند [ 1 ، 2 ، 3 ، 4 ، 5 ]. بنابراین، اخیراً، علاقه به استفاده از UUS، به دلیل سهم قابل توجه آن در توسعه پایدار شهری، رو به رشد بوده است [ 6 ، 7 ، 8 ، 9 ].
با شهرنشینی مداوم در چین، زیرساخت های زیرزمینی به دلیل منابع محدود زمین اهمیت زیادی در استفاده از فضای شهری پیدا کرده است [ 10 ، 11 ، 12 ، 13 ، 14 ]. سیستمهای متروی زیرزمینی جایگاه مهمی در زیرساختهای زیرزمینی شهری دارند و به تدریج به یک ابزار حملونقل عمومی غیرقابل جایگزین تبدیل شدهاند [ 15 ، 16 ، 17 ، 18 ].
طبق آمار منتشر شده توسط انجمن متروی شهری چین، تا ژوئن 2021، 40 شهر در چین خطوط مترو را افتتاح کرده اند که در مجموع 6641.73 کیلومتر خط در حال بهره برداری است. با این حال، به دلیل عواملی مانند زمان سفر مردم و موقعیت جغرافیایی مترو، اشباع بیش از حد جمعیت ایستگاهها اغلب رخ میدهد [ 19 ] که منجر به ازدحام و احتباس افراد در ایستگاهها میشود. در نتیجه، این باعث ناهماهنگی نسبت منابع و مشکلات ایمنی بالقوه بزرگ می شود [ 20 ، 21 ]. برای تخصیص معقول جابجایی وسایل نقلیه و تنظیم زمانبندی پرسنل، انجام تحقیقات برای پیشبینی جریان مسافر در ایستگاههای مترو مهم است [ 22 ، 23 ].
پیشبینی حمایت کوتاهمدت در ایستگاههای مترو، تخمین اولیه حمایت برای یک دوره آینده است [ 24 ]، و روشهای مختلفی برای رسیدگی به این مشکل استفاده شده است. که و همکاران یک مدل پیشبینی تقاضای مسافر کوتاهمدت بر اساس حافظه کوتاهمدت بلند مدت (LSTM) [ 25 ] ساخته شد.]. مدل پیشبینی پیشنهادی از سلولهای حافظه متعدد تشکیل شده است و نسبت به سایر انواع مدلهای پیشبینی اثر پیشبینی بهتری دارد. اگرچه عوامل متعددی به طور جامع برای مسافران در نظر گرفته شده است، اما عامل زمان مسافران هنوز به طور کامل مورد تجزیه و تحلیل و استفاده قرار نگرفته است. لی و همکاران مدل میانگین متحرک یکپارچه اتورگرسیو را بر اساس رگرسیون نمادین ترکیب کرد و به دقت پیشبینی کوتاهمدت بهتری نسبت به مدلهای سنتی در شرایط واقعی دست یافت [ 26 ]. چن و همکاران از ترکیبی از تجزیه روند فصلی بر اساس لس و LSTM برای کاهش تأثیر نوسانات داده استفاده کرد [ 27 ]. روشهای فوق شامل شبکههای عصبی، یادگیری ماشین و مدلهای ترکیبی است [ 28 ، 29] که هدف همه آنها توسعه سریع پیش بینی جریان مسافر است.
دادههای جریان مسافر ایستگاههای مترو دارای ویژگی زمانی هستند و با ویژگیهای زمانی خارجی، مانند روزهای کاری و تعطیلات آخر هفته، ارتباط نزدیکی دارند. با توجه به ویژگیهای دادههای جریان مسافران ایستگاه مترو، در این مطالعه، ما مکانیسم توجه حالت سری زمانی را بر اساس شبکه عصبی LSTM یکپارچه میکنیم که وابستگی بلندمدت دادهها را ضبط میکند و ویژگیهای سری زمانی کوتاهمدت را تحلیل میکند. مشارکت های این مطالعه را می توان به شرح زیر فهرست کرد:
-
مدل پیشبینی توجه الگوی زمانی (TPA)-LSTM، ترکیب مکانیسم توجه حالت سری زمانی و LSTM، برای پیشبینی جریان مسافر ایستگاههای مترو استفاده شد. از اشکال ناپدید شدن گرادیان LSTM اجتناب شد و دقت و ثبات پیشبینی بهتر بود.
-
در پیشبینی جریان مسافری کوتاهمدت TPA، به جای انتخاب مراحل مربوط به زمان جریان مسافر مانند مکانیسم توجه معمولی، مدل پیشبینی میآموزد که سریهای زمانی جریان مسافر مربوطه را انتخاب کند. با توجه به وابستگیهای زمانی بلندمدت و کوتاهمدت جریان مسافران مترو، وابستگی و همبستگی دادههای جریان مسافر را میتوان عمیقاً استخراج کرد و دقت پیشبینی را میتوان بیشتر بهبود بخشید.
-
با توجه به تجزیه و تحلیل روزهای هفته، تعطیلات آخر هفته و انواع مختلف جریان مسافر، کاربرد مدل در پیشبینی جریان مسافران ایستگاه مترو با در نظر گرفتن متروی هانگژو در چین به عنوان مثال تأیید شد.
بقیه این مقاله به شرح زیر سازماندهی شده است. بخش 2 روش ها و وضعیت تحقیق پیش بینی جریان مسافران ایستگاه مترو را به تفصیل معرفی می کند. بخش 3 مشکل پیشبینی جریان مسافر در ایستگاههای مترو را ارائه میکند. بخش 4 روش ها و فرآیند مدل پیش بینی جریان مسافر ایستگاه مترو را در این مطالعه معرفی می کند. بخش 5 تنظیم پارامتر مدل و شاخص های ارزیابی نتایج پیش بینی را ارائه می دهد. بخش 6 نتایج پیش بینی و تجزیه و تحلیل آنها را ارائه می کند. در نهایت، محتوای تحقیق و جهت بهبود در آینده در بخش 7 خلاصه شده است.
2. بررسی ادبیات
روشهای پیشبینی کوتاهمدت جریان مسافر شامل مدلهای آماری سنتی، یادگیری ماشینی، شبکه عصبی و سایر مدلهای پیشبینی است. مدلهای آماری سنتی شامل مدل سری زمانی [ 30 ] و مدل فیلتر کالمن [ 31 ] است. این مدل ها می توانند بر اساس داده های تاریخی جریان مسافر، تغییر تعداد مسافران در دوره بعدی را پیش بینی کنند. اگرچه مدلهای آماری سنتی میتوانند دادههای جریان مسافر را در دورههای مختلف پردازش کنند، اما از نظر نوع دادهها و سازگاری نیازهای بالایی دارند. علاوه بر این، دقت پیشبینیهای ایستا و کوتاهمدت به طور قابلتوجهی کمتر است. در گذشته، محققان از مدلهای یادگیری ماشین برای پیشبینی جریان مسافر استفاده میکردند. مدل های یادگیری ماشینی شامل مدل خاکستری (GM) [ 32] و مدل رگرسیون [ 33 ]. بنیتز و همکاران از GM برای ساخت یک مدل پیشبینی تقاضای مسافر برای صنعت حملونقل هوایی استفاده کردند [ 34 ] و جیانگ و همکاران. یک مدل پیشبینی کوتاهمدت برای جریان مسافر راهآهن پرسرعت با استفاده از یک ماشین بردار پشتیبان خاکستری [ 35 ] ساخته است. با توجه به افزایش حجم داده ها و بهبود قدرت محاسباتی، شبکه های عصبی به تدریج به روشی مهم برای پردازش داده های بزرگ تبدیل شده اند. در دهه گذشته، الگوریتم های مختلفی به طور مداوم توسعه یافته اند و بسیاری از پیش بینی های جریان مسافر با استفاده از شبکه های عصبی مورد مطالعه قرار گرفته اند [ 36 ]. محققان از روشهای یادگیری عمیق برای ساخت مدلهای پیشبینی جریان مسافران ایستگاه مترو، از جمله شبکههای انتشار برگشتی (BP) استفاده کردهاند.37 ]، شبکه های عصبی کانولوشن (CNN) [ 38 ] و شبکه های LSTM [ 39 ]. چن و همکاران از زمان سفر جریان مسافر به عنوان هدف تحقیق استفاده کرد و از یک شبکه عصبی BP برای پیشبینی زمان سفر مسافران استفاده کرد [ 40 ]. ژانگ و همکاران [ 41 ] از یک شبکه LSTM برای پیش بینی استفاده کرد و سپس از CNN برای ساخت یک مدل پیش بینی برای مترو استفاده کرد [ 42 ]. نتایج این مطالعات نشان می دهد که مدل های یادگیری عمیق به عملکرد خوبی در پیش بینی جریان مسافر دست می یابند.
با توجه به توانایی شبکههای عصبی بلندمدت و کوتاهمدت برای گرفتن وابستگی متقابل غیرخطی، تحقیقات مربوطه در سالهای اخیر به نتایج خوبی دست یافته است. شبکه عصبی کوتاه مدت توسط Hochreiter و همکاران پیشنهاد شده است. [ 43 ]؛ این یک نوع از یک شبکه عصبی بازگشتی (RNN) است و می تواند برای به خاطر سپردن الگوهای نسبتا طولانی مدت استفاده شود. با این حال، در کاربردهای عملی، LSTM ها نمی توانند وابستگی های متقابل را برای مدت طولانی به خاطر بی ثباتی آموزش و از بین رفتن مشکلات گرادیان حفظ کنند [ 44 ]. بر اساس LSTM، جینگ و همکاران. الگوریتم LightGBM و روش همجوشی بهینه محلی DRS را برای ساخت یک مدل LGB-LSTM-DRS ترکیب کرد [ 45]. در مقایسه با رگرسیون لجستیک، جنگل تصادفی، درخت تصمیم تقویت کننده گرادیان و سایر مدلهای پیشبینی، اثر پیشبینی بهتری دارد. یانگ و همکاران یک مدل بهبود یافته بر اساس یک LSTM (یعنی ویژگیهای بلندمدت بهبودیافته مبتنی بر مدل پیشبینی LSTM) ایجاد کرد، که بر محدودیت یادگیری ناکافی وابستگیهای بلندمدت به دلیل تأخیر زمانی غلبه میکند [ 46 ]. ژانگ و همکاران مدل پیشبینی ResLSTM را ساخت که یک مدل یادگیری عمیق است که یک شبکه باقیمانده، گراف CNN و LSTM را ترکیب میکند [ 47 ]. در مقایسه با سایر مدلهای پیشبینی پیشرفته، ResLSTM دارای دقت پیشبینی و استحکام بهتری است. چن و همکاران یک مدل پیشبینی Conv-LSTM ساخته است که میتواند ویژگیهای مکانی و زمانی شبکه را ضبط کند [ 48 ]]. پس از آن، آنها کارایی روش را با در نظر گرفتن حمل و نقل ریلی چونگ کینگ به عنوان مثال تأیید کردند. روشهای فوق میتوانند دقت پیشبینی جریان مسافران ایستگاه مترو را افزایش دهند که برای ساخت مدلهای پیشبینی دقیق مهم است. با این حال، این روشها نمیتوانند وابستگی بلندمدت و کوتاهمدت مشکل پیشبینی جریان مسافران ایستگاه مترو و رابطه بین همبستگی و دقت پیشبینی را عمیقاً بررسی کنند. اگر ویژگیهای زمانی عمیقاً بررسی شوند، دقت پیشبینی میتواند بیشتر بهبود یابد.
با توجه به تحلیل فوق، این مطالعه مدل پیشبینی TPA-LSTM را معرفی میکند که مکانیسم TPA را بر اساس LSTM ترکیب میکند. در مقایسه با مکانیسمهای توجه سنتی، TPA برای پردازش دادههای جریان مسافران ایستگاه مترو با ویژگیهای سری زمانی مساعدتر است [ 49 ]. در مقایسه با LSTM سنتی، TPA-LSTM دارای مزایای زیر است: (1) از مشکل یک گرادیان ناپدید شدن LSTM جلوگیری می کند و دقت و ثبات پیش بینی بهتری دارد. (2) با توجه به وابستگیهای زمانی بلندمدت و کوتاهمدت جریان مسافران ایستگاه مترو، میتواند وابستگی و همبستگی دادههای جریان مسافر را عمیقاً استخراج کند. (3) در مقایسه با LSTM، مدل بهبود یافته TPA-LSTM می تواند ویژگی های داده های تاریخی طولانی تری را بدون افزایش پیچیدگی زمانی بیاموزد.
3. بیان مشکل
پیشبینی جریان مسافر در مترو یک زمینه تحقیقاتی پیچیده و حیاتی است که نیازمند استفاده از روشهای پیشبینی دقیق و کارآمد بر اساس دادههای تاریخی جریان مسافر است. پیشبینی دقیق و کارآمد جریان مسافر ایستگاههای مترو برای سازماندهی جریان مسافران ایستگاه مترو مهم است، که به ترتیب منطقی شیفتهای عملیاتی، بهبود کارایی سفر مسافران و جلوگیری از ازدحام بیش از حد ایستگاهها، به ویژه برای سایتهای هاب در شبکه مترو، کمک میکند. شکل 1 .
تجزیه و تحلیل ویژگی های زمانی جریان مسافران ایستگاه مترو یک گام ضروری برای پیش بینی است. از منظر زمان، سفر مسافر تحت تأثیر تعطیلات آخر هفته و تعطیلات است. با در نظر گرفتن ایستگاه متروی جین جیانگ شهر هانگژو در چین به عنوان مثال، تعداد مسافران به طور قابل توجهی با تاریخ در نوسان است. جریان مسافر در روزهای هفته اوج قابل توجهی را در صبح و عصر نشان می دهد، در حالی که این اوج در تعطیلات آخر هفته کاهش می یابد که ارتباط نزدیکی با رفت و آمد افراد به محل کار دارد، همانطور که در شکل 2 نشان داده شده است.. روندهای مختلفی در تعداد مسافران در روزهای مختلف و در ایستگاه های مختلف وجود دارد. به عنوان مثال خط 1 مترو در شهر هانگژو چین را در نظر بگیرید. خط 1 بر روی رودخانه کیانتانگ و کانال شهر پکن-هانگژو قرار دارد. جریان مسافر به صورت افقی مقایسه شده است، همانطور که در شکل 3 نشان داده شده است. جريان مسافر در ايستگاه اول، آخرين ايستگاه و ايستگاه مياني (نه اول، آخر يا ايستگاه انتقال) كم است، در حالي كه جريان مسافر در ايستگاه انتقال به طور قابل توجهي بيشتر از ساير ايستگاه ها است. جریان مسافر به شدت به ویژگی های تغییر داده های تاریخی آن بستگی دارد.
این مطالعه از ویژگیهای زمانی منحصر به فرد دادههای تاریخی جریان مسافری ایستگاه مترو برای پیشبینی جریان مسافر استفاده میکند و مشکل تراکم جریان مسافر در ایستگاه مترو را کاهش میدهد. بر این اساس، ورودی مدل پیشبینی، مقدار مشاهده تاریخی موجود جریان مسافری هر سایت است و بیان ریاضی آن به صورت زیر تعریف میشود. {ایکسn| n = t − 1 , … , t − x + 1 , t − x }{ایکس�|�=تی-1،… ،تی-ایکس+1،تی-ایکس}(جایی که n�شماره گام زمانی است، تی�طول گام زمانی است و ایکس�تعداد مسافران اولین است n�مراحل زمانی). Yتی��مقدار خروجی مدل پیش بینی است و بیان ریاضی آن به صورت تعریف شده است {Yn| n = t ، … ، t + m }{��|�=�,… ,�+�}(جایی که متر�مرحله زمانی پیش بینی شده است و Y�نشان دهنده جریان پیش بینی شده مسافر است متر�مراحل).
4. روش شناسی
در یادگیری ماشینی، یادگیری عمیق برای یادگیری قوانین ذاتی داده های نمونه استفاده می شود. به طور گسترده ای در تشخیص کلمه، تشخیص تصویر و پردازش صدا استفاده می شود. یادگیری عمیق می تواند ابزار موثری برای تجزیه و تحلیل و پردازش کلان داده ها باشد. در این بخش، روشهای درگیر در مدل پیشبینی جریان مسافران مترو، از جمله LSTM، مکانیسم توجه حالت متوالی، و مدل پیشبینی TPA-LSTM را توضیح میدهیم.
4.1. LSTM
LSTM شکل بهبود یافته ای از RNN است که عملکرد حافظه کوتاه و بلند مدت را دارد که می تواند با مشکلات سری زمانی مقابله کند. RNN سنتی در ارتباط دادن نتایج پیشبینی با اطلاعات مرتبط فراتر از یک فاصله معین با چالشهایی مواجه است. RNN نمی تواند به طور موثر داده های بزرگ را با ماهیت سری زمانی پردازش کند، مانند داده های جریان مسافران مترو [ 50 ]. برای غلبه بر نقص RNN، Hochreiter و همکاران. یک شبکه عصبی LSTM را در سال 1997 پیشنهاد کرد که یک ماژول حافظه مبتنی بر RNN را اضافه کرد و RNN لایه پنهان را با یک واحد LSTM جایگزین کرد و توانایی حافظه طولانی مدت را ایجاد کرد [ 43 ]]. هنگامی که اطلاعات جدید وارد می شود، LSTM اطلاعات مهم را غربال می کند و آنها را در حافظه بلند مدت ذخیره می کند و بنابراین از مشکل ناپدید شدن گرادیان در فرآیند آموزش RNN جلوگیری می کند. بنابراین، LSTM برای مطالعه چنین مشکلاتی مناسب تر است.
LSTM یک ساختار شبکه دروازه ای را اتخاذ می کند و شامل دروازه فراموشی، ورودی و دروازه های خروجی است ( شکل 4 ). برای پردازش داده های جریان مسافر در ایستگاه مترو، مراحل کاری به شرح زیر است:
مرحله 1: هنگامی که واحد LSTM داده های جریان تاریخی جدید مسافر را دریافت می کند، دروازه فراموشی اطلاعات فراموش شده را در آخرین لحظه تعیین می کند و به صورت بیان می شود.
جایی که fتی��نشان دهنده مقدار وضعیت دروازه فراموشی در واحد LSTM است، σ�نشان دهنده تابع فعال سازی سیگموئید است، ایکستی��مقدار ورودی جریان مسافر در لحظه جاری است، ساعتt – 1ℎ�−1مقدار خروجی جریان مسافر در آخرین لحظه است، ωf��وزن ورودی است، αf��وزن چرخه ای دروازه فراموشی است و بf��تعصب دروازه فراموشی است.
مرحله 2: گیت ورودی تعیین می کند که آیا اطلاعات جریان مسافر جدید در حافظه ذخیره شود یا خیر. یعنی مقدار ورودی و حالت نورون مرحله زمانی قبلی به واحد عصبی مرحله زمانی بعدی به روز می شود یا خیر. بنابراین، از به خاطر سپردن اطلاعات بی اهمیت فعلی جلوگیری می کند. معادله به صورت زیر است:
جایی که منتی��ارزش دولتی است، αمن��وزن چرخه ای است و بتی�تیبایاس گیت ورودی است.
مرحله 3: تابع sigmoid برای محاسبه خروجی نهایی استفاده می شود و به صورت بیان می شود
جایی که oتی�تیارزش دولتی است، ωo��وزن ورودی است، αo��وزن چرخه ای است، بoب�تعصب است، ساعتتیساعتتیحالت لایه پنهان است و ∗∗عملیات محصول هادامارد است.
4.2. TPA
مکانیسم توجه ابتدا در پردازش تصویر و زبان طبیعی استفاده شد. عملکرد آن اطمینان از تمرکز مدل بر اطلاعات مهم در داده های تاریخی است. علاوه بر این، با بررسی اطلاعات هر مرحله زمانی قبل از مرحله زمانی فعلی و تمرکز بر اطلاعات مربوطه، به تولید خروجی کمک می کند. با این حال، مکانیسم توجه سنتی نمی تواند الگوی زمانی را در چندین مرحله زمانی ثبت کند. بنابراین، نمی تواند داده های دوره ای گردش مسافران مترو را به خوبی مدیریت کند. برای غلبه بر این نقص، Shih و همکاران. مدلی از مکانیسم توجه زمانی (یعنی مکانیسم توجه الگوی زمانی (TPA)) در سال 2019 [ 49 ] پیشنهاد کرد.]. این مدل می تواند داده ها را در چندین مرحله و الگوهای زمانی با توجه به تابع امتیاز برای تعیین ارزش الگوهای زمانی مختلف جمع آوری کند. مقدار خروجی با مقدار وزن تعیین می شود. ماژول مکانیسم توجه حالت متوالی در شکل 5 نشان داده شده است .
برای پردازش داده های جریان مسافران مترو، اصل کار TPA را می توان به سه مرحله زیر تقسیم کرد.
مرحله 1: تنظیم کنید h = {ساعتm , l − w + 1, … , ساعتm , t}ساعت={ساعتمتر،ل-�+1،… ،ساعتمتر،تی}به عنوان توالی داده جریان مسافر مترو ورودی TPA، که در آن w�طول دنباله است و مترمتربعد یک توالی داده واحد است. سی= {سی1،سی2, … , سیتی}سی={سی1،سی2،… ،سیتی}فیلتر CNN است، جایی که تیتیحداکثر طول مکانیسم توجه را نشان می دهد. تنظیم کردیم w = T�=تی: یعنی طول دنباله با حداکثر طول به دست آمده توسط مکانیسم توجه سازگار است. الگوهای زمان بندی متفاوتی را می توان با عملیات پیچیدگی به دست آورد ساعتساعتو سیسی، که می تواند به صورت بیان شود
مرحله 2: محاسبه وزن
وزن داده های هر مرحله زمانی را با تعریف یک تابع امتیاز محاسبه کنید که به صورت بیان می شود
جایی که اچسیمناچمنسینشان دهنده منمنبردار ردیف از اچسیاچسی، دبلیوآ∈آرk × mدبلیوآ∈آرک×متر. بنابراین، وزن توجه صفر است.
در معادله (7)، سیگموئید تابع فعال سازی است که برای نرمال سازی وزن استفاده می شود.
مرحله 3: خروجی TPA
بردار زمینه را همانطور که در رابطه زیر نشان داده شده است تعریف کنید:
وزن لایه پنهان در زمان t که از طریق مکانیسم توجه به دست می آید به شرح زیر است:
با توجه به معادله (9) دبلیوساعت∈آرمتر × متردبلیوساعت∈آرمتر×متر، دبلیوV∈آرm × kدبلیو�∈آرمتر×ک.
بنابراین خروجی TPA به صورت زیر است:
با توجه به معادله (10) دبلیوساعت“∈آرn × mدبلیوساعت”∈آر�×متر، و Yتی�تیمقدار خروجی در زمان است تیتی.
4.3. TPA-LSTM
LSTM به طور قابل توجهی تحت تأثیر قدرت محاسباتی و الگوریتم های بهینه سازی در طول عملیات قرار می گیرد. بنابراین، ما یک مدل پیشبینی TPA-LSTM را معرفی کردیم که مکانیسم توجه سریهای زمانی و شبکه LSTM را ترکیب میکند. بنابراین، از دام های LSTM اجتناب می شود.
مدل TPA-LSTM از مکانیزم TPA برای محاسبه مقدار خروجی مدل LSTM استفاده می کند. در مقایسه با مدل LSTM، این مدل می تواند به طور همزمان روی مقدار خروجی در مراحل زمانی مختلف در تاریخ و همچنین در زمان فعلی تمرکز کند [ 49 ]. علاوه بر این، مدل TPA-LSTM می تواند این مقادیر خروجی را ترکیب کند تا مقادیر خروجی دقیق تر شود. ساختار مدل TPA-LSTM در شکل 6 نشان داده شده است . ورودی مدل در شکل ابتدا داده های تاریخی جریان مسافر است ایکسایکسلحظات، و خروجی مقدار پیش بینی شده است.
5. مطالعه موردی
5.1. توضیحات مجموعه داده
در این مطالعه، دادههای کارت مسافری سیستم جمعآوری خودکار کرایه شهر هانگژو را به عنوان مجموعه داده اعتبارسنجی در نظر گرفتیم که شامل دادههای مربوط به کاربران است: نام، شماره کارت، اطلاعات کارت اعتباری، و زمان و مکان استفاده از کارت. طبق مقررات حفظ حریم خصوصی، اطلاعات خصوصی کاربران مخفی شده بود. در سال 2019، شهر هانگژو تنها سه خط مترو با مجموع 81 ایستگاه افتتاح کرد. اطلاعات اولیه به شرح زیر است: خط 1 مترو هانگژو دارای 34 ایستگاه است که ایستگاه های Xianghu و Xiashajiangbin به ترتیب اولین و آخرین ایستگاه ها هستند. خط 2 مترو هانگژو دارای 33 ایستگاه است که به ترتیب در ایستگاه لیانگژو و ایستگاه چائویانگ شروع و پایان می یابد. خط 4 مترو هانگژو 14 ایستگاه دارد که ایستگاه پویان و ایستگاه پنگبو به ترتیب اولین و آخرین ایستگاه هستند. در این مطالعه،
بر اساس فاصله داده های تاریخی 10 دقیقه، حجم مسافر در یک بازه زمانی معین با نشان داده می شود. {ایکسn| n = t − 1 , … , t − x + 1 , t − x }{ایکس�|�=تی-1،… ،تی-ایکس+1،تی-ایکس}، جایی که n�شماره گام زمانی را نشان می دهد، تیتیطول گام زمانی را نشان می دهد و ایکسایکسنشان دهنده جریان مسافر در اولین مرحله n زمانی است. مقدار جریان مسافر پیش بینی شده به صورت بیان می شود {Yn| n = t ، … ، t + m }{��|�=تی،… ،تی+متر}، جایی که مترمترمرحله زمانی پیش بینی شده است و Y�جریان مسافر پیش بینی شده است مترمترمراحل زمانی فرآیند پیش بینی در شکل 7 نشان داده شده است .
5.2. روش های مقایسه
آزمایشها عمدتاً بر روی یک پلتفرم GPU با کارت گرافیک NVIDIA GeForce MX150 اجرا شدند که اطلاعات دقیق آن در جدول 1 نشان داده شده است . کتابخانههای پایتون، از جمله TensorFlow، Numpy، Keras، Pandas و Numpy برای ساخت مدل ما استفاده شدند.
در مدل TPA-LSTM ایجاد شده در این مطالعه، LSTM به عنوان سه لایه تنظیم شد و هر لایه دارای 40 نورون LSTM بود. تابع فعال سازی تابع سیگموئید بود. ما میانگین مربعات خطا را به عنوان تابع از دست دادن مدل و نزول گرادیان تصادفی به عنوان الگوریتم بهینهسازی انتخاب کردیم. در فرآیند آموزش مدل، میزان یادگیری و تعداد تکرارها به ترتیب 001/0 و 20 بود. تنظیمات پارامتر مدل پیشبینی جریان مسافران مترو TPA-LSTM در جدول 2 نشان داده شده است.
در این مطالعه، مدل پیشبینی TPA-LSTM را با برخی از مدلهای پیشبینی سنتی مقایسه کردیم. سه مدل برای مقایسه CNN، LSTM و CNN-LSTM بودند و پارامترهای این مدل ها به شرح زیر بود:
CNN: اندازه هسته کانولوشن 3 × 3 اتخاذ شد، مرحله زمان پیچیدگی روی 5 تنظیم شد و حالت ادغام روی حداکثر ادغام تنظیم شد.
LSTM: 40 نورون LSTM با سه لایه تنظیم شد. در فرآیند آموزش مدل، نرخ یادگیری و زمان های تکرار با مدل TPA-LSTM مطابقت داشت.
CNN-LSTM: ما پارامترهایی را مطابق با پارامترهای مدل های CNN و LSTM تنظیم می کنیم.
5.3. ارزیابی نتایج پیش بینی
در این تحقیق از چهار شاخص ارزیابی زیر شامل میانگین خطای مطلق (MAE)، ریشه میانگین مربع خطا (RMSE)، میانگین درصد مطلق خطا (MAPE) و ضریب تعیین ( R2 ) برای تحلیل دقت استفاده شد. از مدل
اینجا، آتیآتیمقدار واقعی حجم مسافران مترو است، آt aآتیآمقدار متوسط حجم واقعی مسافر است، Yتی�تیمقدار پیش بینی شده حجم مسافر مترو است و n�تعداد نمونه حجم مسافران مترو است.
6. تجزیه و تحلیل نتایج
6.1. نتایج پیش بینی
با در نظر گرفتن ایستگاه Linping خط 1 مترو Hangzhou، نتایج پیشبینی 25 و 26 ژانویه را میتوان با در نظر گرفتن دادههای تاریخی جریان مسافر از 1 ژانویه تا 24 ژانویه به عنوان مقدار ورودی به دست آورد. برای آزمایش دقت پیشبینی هر مدل، به طور خاص نتایج پیشبینی را در 25 ژانویه، همانطور که در شکل 8 نشان داده شده است، تجزیه و تحلیل کردیم . شکل شامل نتایج پیشبینی چهار مدل پیشبینی است: CNN، LSTM، CNN-LSTM، و TPA-LSTM.
از شکل 8 قابل مشاهده استکه (1) همه مدلهای پیشبینی در پیشبینی جریان مسافری ایستگاه لینپینگ خط 1 مترو هانگژو، ضبط خوبی از اوج صبح و عصر را نشان میدهند. هر دو مدل CNN و LSTM میتوانند روند نوسانات جریان مسافر را پیشبینی کنند. در یک تحلیل دقیق، مدل پیشبینی TPA-LSTM کاربرد خوبی برای پیشبینی جریان مسافران مترو هانگژو دارد و میتواند اوج جریان مسافر را به دقت پیشبینی کند. بنابراین، مدل پیشبینی TPA-LSTM دارای دقت پیشبینی بالا و توانایی یادگیری قوی است. (2) اگرچه مدلهای CNN و LSTM در شکل میتوانند روند کلی تغییر جریان مسافران مترو شهر هانگژو را در 25 ژانویه در مقایسه با مدلهای پیشبینی CNN-LSTM و TPA-LSTM بهطور دقیق پیشبینی کنند، اما درجه تناسب آنها کمی بدتر است. این نتیجه همچنین محدودیت ساختار واحد دو مدل پیشبینی را تأیید میکند. در حالی که مدل پیشبینی ترکیبی دقت بالاتری برای پیشبینی جریان مسافران مترو دارد. (3) در بیشتر موارد، اثر پیشبینی CNN-LSTM نزدیک به مدل TPA-LSTM است. با این حال، TPA-LSTM به مقدار اندازه گیری شده در فازهای اوج و اوج نزدیک تر است. این به این دلیل است که مکانیسم TPA نقش مهمی در ثبت الگوهای زمانی در چندین مرحله زمانی ایفا می کند. علاوه بر این، وزن الگوهای زمانی مختلف را با توجه به تابع امتیازدهی برای تولید مقدار خروجی تعیین میکند و مدل TPA-LSTM را به مدل مناسبتری تبدیل میکند. این به این دلیل است که مکانیسم TPA نقش مهمی در ثبت الگوهای زمانی در چندین مرحله زمانی ایفا می کند. علاوه بر این، وزن الگوهای زمانی مختلف را با توجه به تابع امتیازدهی برای تولید مقدار خروجی تعیین میکند و مدل TPA-LSTM را به مدل مناسبتری تبدیل میکند. این به این دلیل است که مکانیسم TPA نقش مهمی در ثبت الگوهای زمانی در چندین مرحله زمانی ایفا می کند. علاوه بر این، وزن الگوهای زمانی مختلف را با توجه به تابع امتیازدهی برای تولید مقدار خروجی تعیین میکند و مدل TPA-LSTM را به مدل مناسبتری تبدیل میکند.
جدول 3 شامل شاخص های ارزیابی مختلف مدل پیش بینی است. شاخصهای مدل ترکیبی نسبت به مدل تک برتری دارند و مدل پیشبینی TPA-LSTM اتخاذ شده در این مطالعه نسبت به سایر مدلها برتری دارد. از نظر MAPE، ارزش TPA-LSTM 6.8090٪ بود. یعنی 1.1865% کمتر از CNN-LSTM. علاوه بر این، TPA-LSTM از سایر مدل ها در MAE، RMSE و R 2 عملکرد بهتری داشت . بنابراین، برتری مدل پیشبینی ایجاد شده در این مطالعه را در پیشبینی کوتاهمدت جریان مسافران مترو ثابت میکند.
6.2. عملکرد در روزهای کاری و آخر هفته
در بخش بیان مشکل، اشاره کردیم که در روزهای هفته و آخر هفته در تعداد مسافران تفاوت وجود دارد. بنابراین، این بخش جریان مسافر را در روزهای کاری و آخر هفته در ایستگاه Linping در خط 1 مترو Hangzhou در چین پیش بینی و تجزیه و تحلیل می کند. داده های تاریخی جریان مسافر از 1 ژانویه تا 24 ژانویه ورودی مدل بود. نتایج پیش بینی 25 و 26 ژانویه مورد تجزیه و تحلیل قرار گرفت که در آن 25 (جمعه) روز کاری و 26 (شنبه) روز استراحت است.
شکل 9نتایج پیش بینی هر مدل را نشان می دهد. چندین مسافر در روزهای اوج هفته با مترو سوار می شوند و تعداد مسافران در اوج صبح به طور قابل توجهی بیشتر از اوج عصر است. با این حال، این پدیده در تعطیلات آخر هفته آشکار نیست. هر مدل می تواند منعکس کننده روند تغییر تعداد مسافران در زمان های مختلف باشد، اما در دقت هر مدل تفاوت هایی وجود دارد. منحنی پیشبینی مدلهای CNN و LSTM برای ایستگاه Linping در 26 ژانویه (شنبه) نسبتاً صاف است. اگرچه LSTM می تواند روند تغییر جریان مسافر را پیش بینی کند، نمی تواند تصادفی بودن داده ها را ضبط کند. در نتیجه، منحنی پیشبینی جریان مسافران مترو در تعطیلات آخر هفته نسبتاً هموار است و نوسانات سریع در محدوده کوچک را نمیتوان بهطور دقیق پیشبینی کرد. در مقایسه با مدل پیشبینی LSTM، مدل پیشبینی TPA-LSTM ساختهشده در این مطالعه در پیشبینی نوسانهای کوچک جریان مسافر دقیقتر است و میتواند بهطور دقیق پیکهای جریان مسافر محلی متعدد را در آخر هفتهها پیشبینی کند. ساعات اوج مصرف در روزهای هفته و آخر هفته مشابه است. این به این دلیل است که برخی از مسافران باید در تعطیلات آخر هفته در ساعات اوج بار رفت و آمد کنند. با این حال، تعداد مسافران در ساعات اوج مصرف در تعطیلات آخر هفته بیشتر از روزهای هفته نخواهد بود.
بنابراین، ما معتقدیم که مدل پیشبینی ساختهشده در این مطالعه توانایی خوبی برای گرفتن مقادیر پیک محلی برای دادههای جریان مسافر در طول تعطیلات آخر هفته، که پراکنده هستند و دارای نوسانات تصادفی خاصی هستند، دارد.
جدول 4 شامل شاخص های ارزیابی نتایج پیش بینی است. نتایج مقایسه خطا نشان میدهد که مدل TPA-LSTM اتخاذ شده در این مقاله نسبت به مدلهای CNN، LSTM و CNN-LSTM برتری دارد. در مقایسه با مدلهای دیگر، میتواند ویژگیهای زمانی جریان مسافران مترو را بهتر ثبت کند و روند تغییر را بین ساعات اوج بار و غیر اوج بار پیشبینی کند. علاوه بر این، این نشان میدهد که مدلهای ترکیبی TPA-LSTM و CNN-LSTM برای حل مشکل پیشبینی جریان مسافر در حملونقل عمومی نسبت به مدلهای منفرد مانند CNN و LSTM مناسبتر هستند.
6.3. عملکرد در انواع مختلف ایستگاه
با توجه به تفاوت و توزیع گردش مسافر بین ایستگاه های مختلف، ایستگاه های اول و آخر و همچنین ایستگاه های میانی و انتقال برای پیش بینی جریان مسافر انتخاب شدند. برای تجزیه و تحلیل تفاوت گردش مسافر بین انواع سایت ها، این بخش جریان مسافر را بین انواع سایت ها در روزهای هفته و آخر هفته مقایسه و تجزیه و تحلیل می کند.
- (1)
-
پیش بینی جریان مسافر در ایستگاه اول و آخر
ایستگاه لینپینگ اولین و آخرین ایستگاه خط 1 می باشد. جریان مسافر در 25 ژانویه و 26 ژانویه در قسمت قبل پیش بینی شده است که در آن 25 روز هفته و 26 تعطیلات آخر هفته است. نتایج پیشبینی نشان میدهد که مقدار پیشبینیشده جریان مسافر معمولاً با مقدار اندازهگیری شده سازگار است. جریان مسافر در روزهای هفته اوج صبح و عصر قابل توجهی را نشان می دهد، در حالی که پیک های آخر هفته به طور قابل توجهی کمتر از روزهای هفته است. نوسان مقدار پیشبینیشده در دوره اوج ثابت آخر هفتهها به دلیل تصادفی بودن شدید تغییرات جریان مسافر در تعطیلات آخر هفته کمی بیشتر است و دامنه نوسان مقدار پیشبینیشده نیز افزایش مییابد.
در مقایسه با مدلهای دیگر، مدل TPA-LSTM دارای دقت پیشبینی بالاتر و کمترین خطا است و پیشبینی بهتری را نشان میدهد.
- (2)
-
پیش بینی جریان مسافر در یک ایستگاه میانی
این مطالعه جریان مسافری ایستگاه Xinfeng را در 25 (روز هفته) و 26 ژانویه (آخر هفته) پیشبینی میکند و شکل 10 نتایج پیشبینی را نشان میدهد. هر مدل به خوبی می تواند ویژگی های داده ایستگاه های میانی را در روزهای هفته و آخر هفته پیش بینی کند که معمولاً با مقادیر اندازه گیری شده مطابقت دارد. در مقایسه با جریان مسافر در روزهای هفته، دامنه نوسان مقدار پیشبینیشده به دلیل تصادفی بودن بیشتر تغییرات در جریان مسافر در آخر هفته افزایش مییابد. با این حال، مقدار اوج جریان مسافر در روزهای هفته کاهش می یابد.
جدول 5 نتایج مقایسه خطای هر مدل را نشان می دهد. هر دو مدل تک CNN و مدل هیبریدی TPA-LSTM می توانند ویژگی های اساسی جریان مسافر ایستگاه Xinfeng را در روزهای هفته و آخر هفته پیش بینی کنند. با این حال، فاصله زیادی در دقت بین مدل ها وجود دارد. نتایج مقایسه نشان می دهد که MAPE، MAE، RMSE و R 2 TPA-LSTM به ترتیب 20.6221، 9.6947، 13.1371 و 0.9539 هستند. در مقایسه با مدل های دیگر، مدل TPA-LSTM دارای دقت پیش بینی بالاتر و برازش بهتر است.
- (3)
-
پیش بینی جریان مسافر در یک ایستگاه میانی
در این مطالعه، از دادههای مسافران ایستگاه جینجیانگ برای پیشبینی ایستگاه انتقال استفاده کردیم. روزهای پیش بینی 25 و 26 ژانویه بود. در مقایسه با ایستگاه های Linping و Xinfeng، داده های ایستگاه Jinjiang بزرگتر و وضعیت پیچیده تر است. نتایج پیشبینی جریان مسافر از هر مدل در ایستگاه جین جیانگ در شکل 11 نشان داده شده است. هر مدل به خوبی می تواند ویژگی های جریان مسافر در ایستگاه جین جیانگ را پیش بینی کند که معمولاً با مقادیر اندازه گیری شده مطابقت دارد. برای آخر هفته ها، نتایج پیش بینی ایستگاه های Linping و Xinfeng دارای نوسانات قابل توجهی است.
جدول 6 تجزیه و تحلیل خطای نتایج پیش بینی مدل های مختلف ایستگاه جین جیانگ را نشان می دهد. MAE، RMSE و ضریب تعیین TPA-LSTM به ترتیب 34.3704، 48.4728 و 0.9636 است. در مقایسه با مدل های دیگر، مدل TPA-LSTM اثر پیش بینی بهتری دارد. با این حال، دقت پیشبینی مدل TPA-LSTM برای ایستگاههای انتقال به دلیل حجم بیشتر مسافران در ایستگاههای مبادله کاهش یافته و وضعیت را پیچیده میکند.
بر اساس تحلیل جامع، مدل TPA-LSTM اتخاذ شده در این مطالعه نیز برای پیشبینی جریان مسافر ایستگاههای انتقال مناسب است. در مقایسه با سایر مدلهای پیشبینی، دقت آموزشی بهتر و اثر پیشبینی بهتری دارد.
7. نتیجه گیری و کار آینده
در این مطالعه، روش TPA-LSTM که به عنوان ترکیبی از مکانیزم TPA و شبکه LSTM توسعه یافته است، برای پیشبینی کوتاهمدت جریان مسافر در ایستگاههای مترو استفاده شد. مکانیسم TPA میتواند الگوهای زمانی را در چندین مرحله زمانی ثبت کند که با مکانیسمهای توجه سنتی قابل دستیابی نیست. در مقایسه با مدل سنتی LSTM، این مدل میتواند به طور همزمان بر روی مقدار خروجی لایه پنهان مراحل مختلف زمانی در تاریخ و مقدار خروجی لایه پنهان زمان فعلی تمرکز کند. علاوه بر این، می تواند همبستگی بین این مقادیر خروجی را محاسبه کند و دقت پیش بینی را بیشتر بهبود بخشد. نتایج زیر حاصل شد:
-
بر اساس دادههای کشیدن کارت مسافران در مترو هانگژو، نتایج اعتبارسنجی نشان میدهد که TPA-LSTM کاربرد خوب و دقت بالایی برای پیشبینی جریان مسافران ایستگاه مترو دارد. این می تواند به ایستگاه های مترو در تدوین طرح های برنامه ریزی و بهره برداری شبکه مترو و در کاهش حوادث ترافیکی ناشی از تحرک، مانند ازدحام کمک کند.
-
در این مطالعه، مدل TPA-LSTM با سه مدل کلاسیک پیشبینی کوتاهمدت جریان مسافر در ایستگاههای مترو مقایسه شد: CNN، LSTM، و CNN-LSTM. نتایج پیشبینی کوتاهمدت جریان مسافر برای روزهای هفته، آخر هفته و سه نوع ایستگاه نشان میدهد که مدل TPA-LSTM بهترین دقت و پایداری را از نظر MAPE، MAE، RMSE و R2 در بین چهار مدل پیشبینی داشت. . در نتیجه، مکانیسم TPA میتواند بیشتر ویژگیهای زمانی دادههای تاریخی جریان مسافران ایستگاه مترو را استخراج کند.
برخی از جنبه های این مقاله را می توان بهبود بخشید. در این مطالعه، وابستگی زمانی و همبستگی دادههای جریان مسافران مترو مورد بررسی قرار گرفت. محدودیت ها و تحمل های این مطالعه عبارتند از: (1) تأثیر عوامل خارجی، مانند آب و هوا و تعطیلات، در نظر گرفته نشد. (2) بازه زمانی مجموعه داده ها تنها چند ماه بود، که ممکن است منجر به بررسی نشدن برخی عوامل خارجی زمانی مانند فصول شود. در مطالعات آینده، اثرات ویژگیهای خارجی، مانند آب و هوا و تعطیلات، بر پیشبینی کوتاهمدت جریان مسافران ایستگاههای مترو را میتوان برای بهبود ضد تداخل مدل پیشنهادی در نظر گرفت. ما کاربرد مدل TPA-LSTM را در مجموعه داده های طولانی تر مطالعه خواهیم کرد.
بدون دیدگاه