شبکه کانولوشن گراف فضایی-زمانی برای پیش بینی ترافیک

شبکه کانولوشن گراف فضایی-زمانی برای پیش بینی ترافیک چند مقیاسی

چکیده

با بهره مندی از توسعه سریع فناوری های مرتبط با داده های بزرگ جغرافیایی، سیستم های حمل و نقل هوشمند (ITS) به بخشی از زندگی روزمره مردم تبدیل شده اند. پیش بینی حجم ترافیک یکی از وظایف ضروری در ITS است. شبکه عصبی نمودار فضایی-زمانی به دلیل قابلیت قدرتمند ثبت الگوی مکانی-زمانی خود توجه حوزه‌های دانشگاهی و تجاری را به خود جلب کرده است. با این حال، کار موجود به جای گره های ترافیکی بر روی شبکه ترافیک کلی متمرکز شده است و دومی می تواند در یادگیری الگوهای مختلف در بین گره ها مفید باشد.

علاوه بر این، آثار کمی وجود دارد که استخراج ویژگی‌های فضایی-زمانی گره‌های ریز را در مقیاس‌های چندگانه به طور همزمان ثبت کرده باشد. برای باز کردن الگوی گره، یک پارامتر تعبیه گره برای یادگیری تطبیقی الگوهای گره ها در ماتریس مجاورت و لایه پیچش گراف طراحی شده است. برای رسیدگی به این مشکل چند مقیاسی، ما ایده Res2Net را پذیرفتیم و یک لایه توجه زمانی سلسله مراتبی و لایه پیچش گراف تطبیقی سلسله مراتبی طراحی کردیم. بر اساس روش‌های فوق، یک مدل جدید به نام شبکه کانولوشنال نمودار باقیمانده زمانی (Tres2GCN) پیشنهاد شد تا نه تنها ویژگی‌های فضایی-زمانی چند مقیاسی، بلکه همچنین ویژگی‌های ریز دانه را به تصویر بکشد. Tres2GCN با مقایسه آن با 10 روش پایه با استفاده از دو مجموعه داده حجم ترافیک عمومی تأیید شد. نتایج نشان می دهد که مدل ما دقت خوبی را انجام می دهد و تا 9.4٪ از روش های موجود بهتر عمل می کند. ما ایده Res2Net را پذیرفتیم و یک لایه توجه زمانی سلسله مراتبی و لایه پیچش گراف تطبیقی سلسله مراتبی طراحی کردیم. بر اساس روش‌های فوق، یک مدل جدید به نام شبکه کانولوشنال نمودار باقیمانده زمانی (Tres2GCN) پیشنهاد شد تا نه تنها ویژگی‌های فضایی-زمانی چند مقیاسی، بلکه همچنین ویژگی‌های ریز دانه را به تصویر بکشد. Tres2GCN با مقایسه آن با 10 روش پایه با استفاده از دو مجموعه داده حجم ترافیک عمومی تأیید شد. نتایج نشان می دهد که مدل ما دقت خوبی را انجام می دهد و تا 9.4٪ از روش های موجود بهتر عمل می کند. ما ایده Res2Net را پذیرفتیم و یک لایه توجه زمانی سلسله مراتبی و لایه پیچش گراف تطبیقی سلسله مراتبی طراحی کردیم. بر اساس روش‌های فوق، یک مدل جدید به نام شبکه کانولوشنال نمودار باقیمانده زمانی (Tres2GCN) پیشنهاد شد تا نه تنها ویژگی‌های فضایی-زمانی چند مقیاسی، بلکه همچنین ویژگی‌های ریز دانه را به تصویر بکشد. Tres2GCN با مقایسه آن با 10 روش پایه با استفاده از دو مجموعه داده حجم ترافیک عمومی تأیید شد. نتایج نشان می دهد که مدل ما دقت خوبی را انجام می دهد و تا 9.4٪ از روش های موجود بهتر عمل می کند. Tres2GCN با مقایسه آن با 10 روش پایه با استفاده از دو مجموعه داده حجم ترافیک عمومی تأیید شد. نتایج نشان می دهد که مدل ما دقت خوبی را انجام می دهد و تا 9.4٪ از روش های موجود بهتر عمل می کند. Tres2GCN با مقایسه آن با 10 روش پایه با استفاده از دو مجموعه داده حجم ترافیک عمومی تأیید شد. نتایج نشان می دهد که مدل ما دقت خوبی را انجام می دهد و تا 9.4٪ از روش های موجود بهتر عمل می کند.

کلید واژه ها:

پیش بینی حجم ترافیک ; ویژگی فضایی و زمانی ریزدانه ; ویژگی چند مقیاسی ؛ شبکه عصبی نمودار مکانی-زمانی

1. مقدمه

دستگاه های اینترنت اشیا (IoT) مبتنی بر اطلاعات جغرافیایی به زیرساخت سیستم حمل و نقل هوشمند تبدیل شده اند که توسعه سریع سیستم حمل و نقل هوشمند را پیش برده است. پیش‌بینی ترافیک کوتاه‌مدت با دقت بالا، به‌عنوان ماموریت کلیدی سیستم‌های حمل‌ونقل هوشمند (ITS)، می‌تواند به طور موثر به مدیریت راه، رفع ازدحام، برنامه‌ریزی سفر و بسیاری از کاربردهای دیگر کمک کند. با این حال، غیرخطی بودن و پیچیدگی جریان ترافیک، الگوهای مکانی و زمانی جریان ترافیک را پویا، متغیر و درک آن دشوار می کند. الگوی زمانی به الگوی ترافیکی در حال تغییر اشاره دارد که تناوب و گرایش را نشان می دهد. الگوی فضایی به تعامل بین گره ها در یک شبکه حمل و نقل اشاره دارد، که وضعیت ترافیک را در نقطه ای تحت تأثیر وضعیت ترافیک بالادست جاده متصل نشان می دهد. با توجه به ارزش عملی زیاد آن، مردم بر روی مدل‌های پیش‌بینی دقیق‌تر از منظر الگوهای مکانی-زمانی کار کرده‌اند.

مدل‌های پیش‌بینی ترافیک موجود را می‌توان به دو نوع تقسیم کرد: مدل‌های آماری و مدل‌های یادگیری ماشین. در تحقیقات اولیه پیش‌بینی ترافیک، مدل‌های سنتی پیش‌بینی ترافیک آماری بر الگوهای زمانی تمرکز می‌کنند. در میان آنها، مدل های معرف شامل میانگین متحرک یکپارچه خودکار رگرسیون (ARIMA) [ 1 ]، رگرسیون خودکار برداری (VAR) [ 2 ] و غیره است. این روش ها خطی بودن داده ها را بر اساس سری های زمانی فرض می کنند. با این حال، پیچیدگی و غیرخطی بودن جریان ترافیک قادر به برآورده کردن مفروضات ایده آل نبود. مدل‌های یادگیری ماشین، مانند رگرسیون بردار پشتیبانی (SVR) [ 3 ] و K-نزدیک‌ترین همسایه (KNN) [ 4 ]]، بر اساس داده های نمونه به خوبی آموزش دیده برای پیش بینی غیرخطی بودن جریان ترافیک است که به معنای حجم کار زیاد است. بسیاری از مدل های پیش بینی ترافیک بر اساس یادگیری عمیق توسعه یافته اند [ 5 ]. به عنوان مثال، شبکه های عصبی کانولوشن (CNN) [ 6 ]، شبکه های عصبی بازگشتی (RNN) [ 7 ] (به ویژه شبکه های حافظه کوتاه مدت بلند مدت (LSTM) [ 8 ] و شبکه های واحد بازگشتی دروازه ای (GRU) [ 9 ]) درگیر شدند. برای پیش بینی جریان یا سرعت ترافیک با این حال، استخراج ویژگی های زمانی به تنهایی کافی نیست زیرا وابستگی مکانی نیز در داده های ترافیک وجود دارد. در سال‌های اخیر، بسیاری از مطالعات شبکه‌های جاده‌ای را به عنوان ساختارهای نموداری و بر اساس شبکه‌های عصبی گراف (GNN) ساخته‌اند. 10 ]] برای استخراج ویژگی های فضایی. پس از آن، آنها رویکردهای CNN یا RNN را با آنها ترکیب می‌کنند تا مدلی بسازند، به عنوان مثال، شبکه‌های عصبی نمودار فضایی-زمانی (STGNN) [ 11 ، 12 ]، تا ویژگی‌های مکانی-زمانی را به تصویر بکشند. در میان آنها، مدل های مبتنی بر CNN [ 11 ، 12 ] توسط STGCN، MSTGCN، ASTGCN، Graph WaveNet، و غیره نشان داده می شوند، در حالی که مدل های مبتنی بر RNN [ 11 ، 12 ] توسط GCRNN، DCRNN، T-GCN، AGCRN، در مقایسه با روش‌های یادگیری عمیق سنتی، ویژگی‌های فضایی بیشتری را در نظر می‌گیرند که دقت پیش‌بینی را بهبود می‌بخشد و همچنین در حال حاضر به روش‌های اصلی برای پیش‌بینی ترافیک تبدیل می‌شود.

در سال های اخیر، STGNN های موجود به تدریج توسعه یافته اند، اما با این وجود، می توان آنها را دوباره از نظر استخراج ویژگی بهینه کرد. سؤالات خاص به شرح زیر است: (1) دانه ریز. با توجه به ساخت GNN، آن‌ها قصد دارند الگوهای مشترک گره‌ها را در توالی‌های ترافیکی به دست آورند و تفاوت‌های الگوی بین گره‌ها را نادیده بگیرند و در نتیجه نتوانند ویژگی‌های مکانی-زمانی ریز بین گره‌ها را به دست آورند. (2) چند مقیاسی. STGNN ها بیشتر برای استخراج ویژگی در یک مقیاس استفاده می شوند. با این حال، الگوهای مکانی-زمانی در یک مقیاس منفرد دارای محدودیت‌هایی هستند و میدان دریافتی را در محدوده مکانی ثابت می‌کنند. اطلاعات مکانی-زمانی استخراج شده در مقیاس های مکانی-زمانی مختلف متفاوت اما به هم پیوسته است که بر نتایج پیش بینی تأثیر می گذارد. (3) روش اتصال. نحوه اتصال ویژگی‌های مکانی-زمانی نیز بر انتقال اطلاعات تأثیر می‌گذارد که در نهایت بر نتایج تأثیر می‌گذارد. برای اینکه اجازه ندهیم اطلاعات در انتقال از بین برود، باید فرآیند انتقال ویژگی ها را تقویت کنیم و عرض ویژگی ها را تا حد امکان افزایش دهیم. در حال حاضر، به سختی روشی وجود دارد که تمام این مشکلات را در نظر بگیرد، که عملکرد مدل های آن را نیز محدود می کند.

برای رسیدگی به مشکلات فوق، ما یک چارچوب شبکه عصبی نمودار فضایی-زمانی جدید – شبکه کانولوشن گراف باقیمانده موقتی II (TRes2GCN) – برای بهینه‌سازی استخراج ویژگی‌های مکانی-زمانی، و در نهایت بهبود دقت پیش‌بینی پیشنهاد کردیم. مشارکت های TRes2GCN پیشنهادی به شرح زیر است:

برای بهینه‌سازی استخراج یک ویژگی، یک مدل شبکه عصبی نمودار فضایی-زمانی جدید پیشنهاد شد که به طور همزمان تناوب زمانی، ویژگی‌های چند مقیاسی مکانی-زمانی، روش اتصال و تعبیه الگوی گره را در نظر می‌گیرد.
بر اساس Res2Net، ما لایه‌های توجه زمانی سلسله مراتبی و پیچیدگی نمودار تطبیقی سلسله مراتبی را طراحی می‌کنیم تا ویژگی‌های فضایی-زمانی چند مقیاسی را بیاموزیم. با توجه به دانش ما، این مقاله اولین مطالعه ای است که ایده Res2Net را در زمینه شبکه های عصبی نمودار مکانی-زمانی برای پیش بینی ترافیک به کار می گیرد.
آزمایش‌های سیستماتیک برای مقایسه رویکرد ما با روش‌های پیشرفته موجود با استفاده از دو مجموعه داده حجم ترافیک در دنیای واقعی در دسترس عموم انجام شد. نتایج نشان می دهد که مدل ما دقت خوبی را انجام می دهد و تا 9.4٪ از روش های موجود بهتر عمل می کند.

بقیه این مقاله به صورت زیر سازماندهی شده است: بخش 2 ادبیات مربوط به پیش بینی جریان ترافیک را با استفاده از روش STGNN مرور می کند. در بخش 3 ، ابتدا دانش مرتبط مورد استفاده در بخش های بعدی را به عنوان مبنا ارائه می کنیم. سپس، طرح و جزئیات مدل پیشنهادی خود را ارائه می دهیم. بخش 4 آزمایش، مدل های پایه در این کار و نتایج را شرح می دهد. بخش 5 مدل و نتایج جدید را مورد بحث و تحلیل قرار می دهد. بخش 6 کار ما را خلاصه می کند.

2. کارهای مرتبط

2.1. مدل های کوتاه مدت پیش بینی حجم ترافیک

تحقیقات پیش‌بینی ترافیک کوتاه‌مدت روش‌های زیادی را تولید کرد و به طور کلی می‌توان آنها را به دو دسته روش‌های آماری و روش‌های یادگیری ماشینی تقسیم کرد. بسیاری از روش‌های آماری مدل‌های خطی هستند که بر تفسیرپذیری تمرکز دارند و به فرضیه محکم‌تری نیاز دارند. آثار معرف شامل HA [ 13 ]، ARIMA [ 1 ]، VAR [ 2 ]، حداقل مربعات جزئی (PLS) [ 14 ]] و غیره با این حال، این مدل‌ها در کاربردهای سناریویی عملی عملکرد خوبی ندارند، زیرا ویژگی‌های دینامیکی و غیرخطی داده‌های ترافیک را در نظر نمی‌گیرند و در برآوردن فرضیات خطی ثابت خود مشکل دارند. از سوی دیگر، یادگیری ماشینی می‌تواند همبستگی‌های مکانی-زمانی پیچیده‌تر و مؤثرتری را از خود داده‌ها بیاموزد، بنابراین نتایج پیش‌بینی بهتری ارائه می‌دهد. برخی از کارهای معرف SVR [ 3 ]، KNN [ 4 ] و شبکه های عصبی [ 15 ] هستند. اگرچه ویژگی‌هایی که استخراج می‌کنند حاوی اطلاعات غیرخطی هستند، اما زمان‌برتر و نامطمئن‌تر هستند، زیرا ویژگی‌های آن‌ها عمدتاً به صورت دستی توسط انسان استخراج می‌شوند.

با توسعه یادگیری عمیق، آنها قادر به مدل سازی خودکار وابستگی های پیچیده تر هستند، که توجه زیادی را به مدل سازی داده های مکانی-زمانی پیچیده جلب کرده است [ 5 ]. بسیاری از مدل‌های یادگیری عمیق کلاسیک به دلیل قابلیت‌های پردازش توالی طبیعی‌شان برای پیش‌بینی ترافیک استفاده شده‌اند، به عنوان مثال، RNN [ 7 ]، LSTM [ 8 ] و GRU [ 9 ]. متعاقباً، سایرین برای مدل‌سازی سری‌های زمانی ترافیک توسط CNN، یادگیری اطلاعات زمانی با هسته‌های کانولوشنال و تأیید برتری آنها نسبت به سایر شبکه‌های عصبی تکراری استفاده شده‌اند. 6 ].]. با این حال، این روش ها تمایل دارند فقط بر روی الگوهای زمانی داده های ترافیک تمرکز کنند و الگوهای مکانی را نادیده بگیرند. برای یادگیری کامل الگوهای فضایی، محققان صحنه های ترافیک را به صحنه های مدل تصویری برای یادگیری تقسیم می کنند. CLTFP [ 16 ] سعی می کند ویژگی های مکانی را با استفاده از CNN به تصویر بکشد و یک شبکه پیش بینی مکانی-زمانی با استفاده از LSTM برای حل مشکل پیش بینی زمانی کوتاه مدت بسازد. Convolutional LSTM (Conv-LSTM) [ 17 ] همچنین از شبکه های CNN و LSTM به ترتیب برای گرفتن ویژگی های مکانی و زمانی استفاده می کند. با این حال، تفاوت این است که شبکه Conv-LSTM به جای انباشته کردن یک شبکه CNN و یک شبکه LSTM، CNN را در دروازه شبکه LSTM قرار می دهد و آنها را بطور ذاتی ادغام می کند. ST-ResNet [ 18] از CNN باقیمانده عمیق برای مدیریت شدت در یک شبکه فضایی برای پیش‌بینی جریان‌های جمعیت در سطح شهر در بازه‌های زمانی مختلف استفاده می‌کند. آنها همچنین ویژگی های مکانی-زمانی را برای دوره های زمانی مختلف وارد می کنند و عوامل خارجی را برای بهبود دقت پیش بینی ها اضافه می کنند. همه روش های فوق برای داده های شبکه پردازش می شوند، در حالی که جریان ترافیک اساسا یک داده گرافیکی است. باید به قالبی تبدیل شود که به اندازه کافی راحت نباشد. علاوه بر این، آنها تنها بر روی اطلاعات همسایگی داده‌های شبکه تمرکز می‌کنند و اطلاعات توپولوژیکی خاصی را که توسط بخش‌های جاده‌ای به هم پیوسته ذکر شده است نادیده می‌گیرند.

2.2. شبکه عصبی نمودار فضایی و زمانی برای پیش بینی ترافیک

در مقایسه با شبکه‌های عصبی کانولوشن در فضای اقلیدسی، شبکه‌های عصبی گراف (GNN) می‌توانند در فضاهای نامنظم و نامنظم نمونه‌برداری و جمع شوند و برای پردازش داده‌های ساختار یافته گراف مناسب‌تر هستند. با افزایش محبوبیت GNN، چندین رویکرد برای GNN در سال های اخیر پدیدار شده است، مانند شبکه های کانولوشن گراف (GCN) [ 19 ]، شبکه های Chebyshev (ChebNet) [ 20 ]، شبکه های توجه گراف (GAT) [ 21 ]، کانولوشن انتشاری. شبکه های عصبی (DCNN) [ 22]، و غیره. به خصوص، GCN محبوبیت خاصی دارد. آنها به طور گسترده در طبقه بندی ساختار گراف، سیستم های توصیه و غیره استفاده می شوند. از آنجایی که ویژگی های مکانی داده های ترافیکی به خوبی با ساختار نمودار مطابقت دارد، آنها همچنین کلیدی برای به دست آوردن ویژگی های فضایی ذاتی داده ها شده اند. در سال های اخیر، توسعه مستمر آنها STGNN ها را به مدل اصلی در مدل های پیش بینی ترافیک تبدیل کرده است.

اگرچه انواع زیادی از STGNN وجود دارد، اما به طور کلی، آنها را می توان به دو نوع تقسیم کرد: یکی مدل مبتنی بر RNN و دیگری مدل مبتنی بر CNN.

یکی از مدل‌های STGNN مبتنی بر RNN برای گرفتن ویژگی‌های زمانی با یک شبکه عصبی مکرر و جایگزینی (یا اضافه کردن مستقیم) لایه خطی RNN با پیچیدگی نمودار برای گرفتن ویژگی‌های فضایی استفاده می‌شود. به عنوان مثال، در مورد معرف ترین T-GCN [ 23 ] یا GCRNN [ 24 ]، هر دوی آنها از GRU برای گرفتن ویژگی های زمانی و GCN برای گرفتن ویژگی های مکانی استفاده می کنند، بنابراین به آنها اجازه می دهد تا ویژگی های مکانی-زمانی کامل را ثبت کنند. با توجه به اشکال اشتراک هسته کانولوشن و به اشتراک گذاری GCN، GNN های دیگری برای یادگیری در نظر گرفته می شوند. لی مدل کلاسیک DCRNN را پیشنهاد کرد [ 24]، که ویژگی‌های فضایی را با سرگردانی تصادفی DCNN روی نمودار می‌گیرد و ویژگی‌های زمانی را با استفاده از Seq2Seq ثبت می‌کند و مدل را انعطاف‌پذیرتر و کارآمدتر می‌کند. با این حال، جریان ترافیک داده‌ای پویا و در حال تغییر است و باید در نظر گرفت که پیش‌بینی ممکن است در هر مرحله متفاوت باشد. بنابراین، Cui TGC-LSTM [ 25 ] را پیشنهاد کرد که GCN و LSTM را ادغام می‌کند و با افزودن یک ماتریس دسترس‌پذیری جریان آزاد، گردش کار پیچیدگی نمودار را بهینه می‌کند. Guo OGCRNN را توسعه داد [ 26]، که بر اساس GCRNN بهینه می شود. از تغییرات داده‌ها برای بهینه‌سازی ماتریس لاپلاس در طول پیچیدگی نمودار استفاده می‌کند، بنابراین مدل را قادر می‌سازد تا ویژگی‌های مکانی-زمانی پویا را به دست آورد. هر دوی این کارها همبستگی‌های مکانی-زمانی ثابت را بهبود می‌بخشند، بنابراین تغییرات دینامیکی در همبستگی‌های مکانی-زمانی را ممکن می‌سازند. بای A3T-GCN [ 27 ] را پیشنهاد کرد که توجه را به T-GCN می افزاید و تغییرات دینامیکی داده ها را در مرحله اکتساب ویژگی در نظر می گیرد. با این حال، RNN دارای محدودیت‌هایی است، زیرا پارامترهای یکسانی را در هر مرحله زمانی به اشتراک می‌گذارد، که نشان‌دهنده توانایی ضعیف برای توصیف پویایی پیچیده همبستگی‌های زمانی است.

بسیاری از مدل های STGNN مبتنی بر CNN توسعه یافتند. این روش‌ها اغلب ویژگی‌های زمانی را با CNN و ویژگی‌های مکانی را با GNN دریافت می‌کنند. نماینده ترین آنها STGCN [ 28 ] است که ویژگی های زمانی را با CNN با دروازه GLU و ویژگی های فضایی با GCN ثبت می کند. این همان T-GCN برای به دست آوردن ویژگی های فضایی و زمانی کامل است. با این حال، به دلیل محدوده بسیار کوچک هسته کانولوشن CNN، میدان ادراکی نسبتا کمی دارد که منجر به کاهش توانایی پیش‌بینی بلندمدت آن نیز می‌شود. برای حل این مشکل، Graph WaveNet [ 29]، پیشنهاد شده توسط وو، می خواهد دقت پیش بینی توالی طولانی را با استفاده از پیچش اتساع بهبود بخشد. همچنین یک ماتریس مجاورت یادگیری مستقل ایجاد می کند تا به یادگیری ماتریس مجاورت ناشناخته کمک کند، که بیشتر بر مبنای پویا سازگار است. این اولین مطالعه بر روی ماتریس مجاورت تطبیقی در زمینه پیش‌بینی ترافیک است. علاوه بر این، مدل های دیگری نیز وجود دارند که مکانیسم توجه را برای جبران مشکل یک میدان ادراکی کوچک در نظر می گیرند. Guo ASTGCN را پیشنهاد کرد [ 30] برای ادغام مکانیسم توجه و GCN برای ترسیم همبستگی فضایی و زمانی پویا. نه تنها میدان دریافت را از طریق توجه گسترش می‌دهد، بلکه هوشمندانه از مکانیسم‌های توجه زمانی و مکانی برای دستیابی به توانایی به دست آوردن اطلاعات مکانی-زمانی پویا به طور کامل از خود داده‌ها استفاده می‌کند. آنها همچنین MSTGCN [ 30 ] را بدون توجه دینامیکی برای مقایسه پیشنهاد می‌کنند و نشان می‌دهند که ASTGCN او می‌تواند ویژگی‌های مکانی-زمانی پویا را ثبت کند. ژنگ GMAN را پیشنهاد کرد [ 31]، که همچنین بر تغییرات پویا در فرآیند تمرکز دارد. در مقایسه با ASTGCN، GMAN به طور کامل جایگزین CNN و GCN با توجه می شود و بیشتر به تعامل بین اطلاعات زمانی و مکانی می پردازد. GMAN بر اساس ساختار رمزگذار خودکار و مکانیسم توجه برای محاسبه اثر عوامل مکانی و زمانی بر شرایط ترافیک طراحی شده است. بعدها، برخی از مدل‌های مبتنی بر ASTGCN و GMAN توسعه یافتند و با بهبودهایی مانند DGCN [ 32 ] و MASTGCN [ 33 ] عمل کردند. با توجه به عملکرد قدرتمندشان، چنین مدل هایی برای پیش بینی مسیر [ 11 ] و تعیین داده های ترافیکی [ 11 ، 12 ، 34 ] نیز استفاده می شوند.

همچنین مطالعاتی وجود دارد که می‌خواهند داده‌های دیگری (شرایط آب و هوا، نقاط مورد علاقه (POI) و غیره) را برای کمک به پیش‌بینی‌ها به مطالعات فوق اضافه کنند. Bai یک شبکه عصبی کانولوشنی بازگشتی [ 35 ] را برای مدل‌سازی و پیش‌بینی داده‌های تقاضای خودروی تاریخی در شهر پیشنهاد می‌کند. داده های هواشناسی و عناصر زمانی را به صورت رمزگذاری شده جاسازی می کند و آنها را با استفاده از رمزگذار خودکار مبتنی بر LSTM پیش بینی می کند. زو یک مدل پیش‌بینی به نام AST-GCN [ 36 ] پیشنهاد می‌کند]، که هم POI و هم اثرات آب و هوا را بر جریان ترافیک در نظر می گیرد. این سه نوع داده را ترکیب می کند و آنها را برای آموزش در T-GCN قرار می دهد که ساده و مؤثر است. اگرچه روش های فوق بسیار مؤثر هستند، اما به دلیل محرمانه بودن داده ها و مسائل مربوط به حریم خصوصی، که کار مدل های آنها را محدود می کند، همه داده ها به طور کامل در دسترس نیستند.

همه مدل های فوق اساساً استخراج ویژگی را در مقیاس مکانی-زمانی یکسان انجام می دهند. با این حال، تفاوت‌هایی در الگوهای مکانی-زمانی که به دلیل مقیاس‌های مکانی-زمانی متفاوت یاد می‌شوند، وجود دارد. بنابراین، برخی از محققین به بررسی ویژگی‌های مکانی-زمانی محلی یا ویژگی‌های چند مقیاسی پرداخته‌اند. یو ST-UNet [ 37 ] را پیشنهاد کرد که می تواند اطلاعات فضایی چند مقیاسی را به دست آورد. ST-UNet بر اساس چارچوب مدل ساختار U-Net است و به طور مشترک از ST-pooling و ST-unpooling برای انجام استخراج اطلاعات مکانی در مقیاس های مختلف استفاده می کند. علاوه بر این، از RNN توسعه یافته برای به دست آوردن ویژگی های زمانی طولانی تر استفاده می کند. آهنگ پیشنهادی STSGCN [ 38]، که استخراج ویژگی نمودارهای محلی را در نظر می گیرد و اهمیت ویژگی های نمودار محلی را اثبات می کند. بر اساس GCN، بلوک‌های مکانی-زمانی می‌سازد که می‌توانند هم استخراج اطلاعات زمانی و هم مکانی را انجام دهند، که ناهمگونی پیش‌بینی جریان ترافیک را نیز در نظر می‌گیرد. گوئو HGCN را پیشنهاد کرد [ 39]، که ساختار گراف را به صورت سلسله مراتبی بر اساس خوشه بندی طیفی پردازش می کند تا پیش بینی ترافیک را در ساختارهای گراف خرد و کلان انجام دهد. این برهم نهی از ویژگی های میکروسکوپی و ماکروسکوپی همچنین به ضبط ویژگی های فضایی-زمانی چند مقیاسی دست می یابد. با این حال، اندازه مقیاس مدل های چند مقیاسی پیشنهادی نیاز به تنظیم مصنوعی دارد. به دلیل خطای تنظیم دستی، از یک طرف توانایی بالقوه مدل را محدود می کند. از طرفی نیاز به عملیات دستی بیشتری دارد که بسیار پر زحمت و دردسر است.

با این حال، مطالعات فعلی، مشکلات ساختار گراف را در دانه‌بندی نمودارها یا نمودارهای محلی مورد مطالعه قرار داده‌اند، و فقدان مطالعات ریزدانه خاص گره وجود دارد. بای AGCRN را پیشنهاد کرد [ 40] برای مطالعه جزئیات پیش بینی با دانه بندی گره. از یک GCN با پارامترهای گره برای تولید ماتریس مجاورت تطبیقی استفاده می کند و پارامترها را با GRU جاسازی می کند تا الگوهای ترافیک را به صورت پویا یاد بگیرد. بخشی از مشکلات RNN با GCN را حل می کند و توانایی برخی از مدل ها را برای توصیف پویایی پیچیده همبستگی زمانی و مکانی ریز دانه بهبود می بخشد. با این حال، همچنان دارای کاستی هایی است، نادیده گرفته می شود که تفاوت هایی در الگوهای گره ها در مقیاس های مختلف وجود خواهد داشت. از سوی دیگر، حتی مشکل اشتراک پارامتر RNN با تعبیه گره کاهش می یابد. با این حال، آموزش خاصی متوقف می شود، اطلاعات جاسازی گره ثابت می شود و ویژگی های پارامتر RNN، اگرچه بسیار غنی تر از نسخه اصلی است، هنوز ثابت هستند.

3. روش شناسی

3.1. مقدماتی

بر اساس مفهوم ساخت گراف، شبکه ترافیک را می توان به صورت تعریف کرد

G (V, E, A)

، جایی که

V \in R^{N}

مجموعه ای از رئوس یا گره ها را نشان می دهد و

E \in R^{N \times N}

مجموعه ای از لبه ها را نشان می دهد. شبکه ترافیک G نشان دهنده رابطه بین رئوس در بعد فضایی است و در طول زمان ثابت می ماند. ماتریس مجاورت با نشان داده می شود

A \in R^{N \times N}

. ماتریس سیگنال گراف به صورت مشخص شده است

X_{t}^{G} \in R^{N \times F}

، که در آن F ویژگی های هر گره را در زمان مشخص می کند

t

. از نظر پیش بینی جریان ترافیک، هر بار

t

ماتریس ویژگی دارد

X_{t}

، داده های تاریخی

H

را می توان به عنوان نشان داد

X_{H} = \{X_{t - i + 1}, X_{t - i + 2}, \dots, X_{t}\}

و داده های پیش بینی شده

P

را می توان به عنوان نشان داد

X_{P} = \{X_{t + 1}, X_{t + 2}, \dots, X_{t + p}\}

3.2. طراحی TRes2GCN

در این بخش، شکل 1 a چارچوب پیشنهادی TRes2GCN را نشان می دهد. این مدل از سه جزء تشکیل شده است که هر یک شامل همان بخش زیرماژول کانولوشنال نمودار باقیمانده زمانی (TRes2GC-Submodule) است ( شکل 1 ب). سه زیر ماژول به ترتیب بر سه دوره زمانی مختلف تمرکز می کنند و ترکیب وزنی هر دوره زمانی توسط مجموعه ای از پارامترهای همجوشی انجام می شود. هر TRes2GC-Submodule شامل چهار بلوک فضایی-زمانی (ST Blocks) است که در اتصال متراکم [ 41 ] به هم متصل شده اند.

به طور خلاصه، مدل ما چندین مفهوم طراحی دارد، به شرح زیر:

از طریق یک رویکرد چند جزئی، مدل ما ویژگی‌های مکانی-زمانی دوره‌های زمانی مختلف را می‌آموزد و ترکیب می‌کند و الگوهای سفر وسایل نقلیه را بررسی می‌کند.
TRes2GC-Submodule بلوک‌های فضایی و زمانی را در مسیر DenseNet به هم متصل می‌کند، که عرض ویژگی‌ها را با ترکیب ویژگی‌های مکانی-زمانی سطوح مختلف افزایش می‌دهد و به طور موثر مشکل تخریب و هموارسازی بیش از حد شبکه را کاهش می‌دهد.

3.3. چند دوره زمانی

اگرچه داده های ترافیک با تغییرات دینامیکی بلادرنگ مشخص می شوند، مطالعات نشان داده اند که داده های ترافیک درجات مختلفی از الگوهای مشابه در مجاورت، دوره های روزانه و هفتگی دارند [ 17 ]. در نظر گرفتن این تغییر دوره ای جریان ترافیک می تواند به طور موثری دقت پیش بینی را بهبود بخشد. در این مطالعه، ما از ASTGCN [ 30 ] برای نمونه برداری از دوره زمانی استفاده کردیم.

فرض کنید زمان فعلی T ₀ است، اندازه پنجره پیش بینی T _p و تعداد نمونه ها در روز است.

q

. ما سه سری زمانی T h _، Td _و Tw _را به ترتیب در محور زمانی به عنوان ورودی‌های مؤلفه زمانی برای دوره‌های اخیر، دوره‌های روزانه و دوره‌های هفتگی قطع می‌کنیم، که _{در آن Th، Td و}_Tw به همان مقدار هستند. تی _پی . ما دوره های زمانی مختلف را برای ورودی نشان داده ایم. جزئیات این سه دوره به شرح زیر است:

(1): دوره اخیر: دوره اخیر به داده های تاریخی در نزدیکی مقدار پیش بینی اشاره دارد که به صورت نشان داده شده است. $X_{h} = (X_{T_{0} - T_{k} + 1}, X_{T_{0} - T_{k} + 2}, \dots, X_{T_{0}}) \in R^{N \times F \times T_{k}}$ از آنجایی که تغییرات ناگهانی در جریان ترافیک مقدماتی هستند، قطعه لحظه نزدیک به ویژه برای قطعه پیش‌بینی مهم است. برش خاص در شکل 1 الف نشان داده شده است و رنگ سبز نسبت به رنگ سیاه دوره اخیر آن است.
(2): دوره روزانه: یک دوره روزانه به داده های تاریخی یک روز قبل همزمان با بخش پیش بینی اشاره دارد که با نشان داده می شود. $X_{d} = (X_{T_{0} - q + 1}, X_{T_{0} - q + 2}, \dots, X_{T_{0} - q + T_{p}}) \in R^{N \times F \times T_{d}}$ قطعه ای از همان بازه زمانی دوره پیش بینی شده در روز گذشته است. داده‌های ترافیک احتمالاً بخشی از همان الگو را در مدتی نشان می‌دهند، به عنوان مثال، اوج صبح و اوج عصر برای هر روز از یک روز هفته وجود دارد. بنابراین، ما این بخش را به عنوان بخشی از پیش بینی مشترک انتخاب می کنیم، بنابراین ویژگی های مشابه دوره روزانه را به دست می آوریم. برش خاص در شکل 1 الف نشان داده شده است و رنگ نارنجی نسبت به رنگ سیاه دوره روزانه آن است.
(3): دوره هفتگی: دوره هفتگی به داده های تاریخی یک هفته قبل همزمان با بخش پیش بینی اشاره دارد که با نشان داده شده است. $X_{w} = (X_{T_{0} - 7 * q + 1}, X_{T_{0} - 7 * q + 2}, \dots, X_{T_{0} - 7 * q + T_{p}}) \in R^{N \times F \times T_{w}}$ قطعه ای از همان بازه زمانی دوره پیش بینی شده در هفته گذشته است. دلیل آن همان دوره روزانه است. به عنوان مثال، تغییر جریان این جمعه بسیار شبیه به جمعه آینده است، اما تفاوت هایی با تغییر جریان آخر هفته وجود دارد. بنابراین، ما از آن برای ثبت ویژگی های مشابه دوره هفتگی استفاده می کنیم. برش خاص در شکل 1 الف نشان داده شده است و رنگ آبی نسبت به رنگ سیاه دوره هفتگی آن است.

3.4. روش ضبط ویژگی فضایی و زمانی

هر بلوک مکانی-زمانی ( شکل 2 الف) شامل یک لایه توجه زمانی سلسله مراتبی ( شکل 2 ب) و یک لایه پیچش گراف تطبیقی سلسله مراتبی است ( شکل 2) است.ج). آنها در آرایش عمودی معمول نیستند، اما به صورت افقی مستقر می شوند. آنها تحت تأثیر دروازه ای با یکدیگر تعامل دارند تا ویژگی های مکانی-زمانی را بیشتر به هم مرتبط کنند. در مورد لایه توجه سلسله مراتبی و لایه پیچیدگی گراف تطبیقی سلسله مراتبی، آنها به ترتیب ثبت اطلاعات مکانی چند مقیاسی زمانی و چند مقیاسی را بر اساس لایه به لایه پیاده سازی می کنند. این با جمع‌آوری اطلاعات چند مقیاسی مبتنی بر بلوک که در بالا ذکر شد ترکیب می‌شود، بنابراین چارچوب ما را قادر می‌سازد تا اطلاعات مکانی-زمانی چند مقیاسی را با دانه‌بندی خوب انجام دهد. مشکل تک ویژگی مکانی-زمانی در مسئله پیش‌بینی داده‌های غیراقلیدسی اساساً حل شده است.

(1). لایه توجه زمانی سلسله مراتبی

لایه توجه زمانی (TAL). برای جریان ترافیک، در بعد زمانی پویا و مرتبط است و چنین ویژگی های پویایی را نمی توان توسط CNN یا RNN معمولی یاد گرفت. بنابراین، این مقاله از مکانیسم توجه در حوزه NLP [ 42 ] استفاده می کند، بنابراین بر اهمیت اطلاعات در گره های زمانی مختلف در یک دوره زمانی کامل تمرکز می کند و وزن های بیشتری را به نقاط زمانی معتبر اختصاص می دهد [ 30 ]. این نه تنها ارتباط زمانی پویا و تطبیقی را به مدل ما اضافه می‌کند، بلکه میدان احساس را برای حل مشکلات پیش‌بینی زمان طولانی‌تر گسترش می‌دهد. فرمول ریاضی آن به صورت زیر نشان داده شده است:

E = V ه \cdot σ ((_ایکس ساعت) تی U 1) U 2 (U 3 ایکس ساعت) + ب ه) ،

(1)

E ‘ من ، ج = S o f تی ام یک x (E من ، ج) = e x p ( E من ، ج ) \sum تی j = 1 e x p ( E من ، ج ) ،

(2)

تی A L (ایکس ساعت) = ایکس ساعت E “ = (ایکس 1 ، ایکس 2, \dots, ایکس تی) \cdot E ‘ ،

(3)

جایی که $V_{e}, b_{e} \in R^{T \times T}$ ، $U_{1} \in R^{N}$ ، $U_{2} \in R^{F \times N}$ ، و $U_{3} \in R^{F}$ پارامترهای قابل یادگیری هستند، $X_{h} = (X_{1}, X_{2}, \dots, X_{T}) \in R^{N \times F \times T}$ خروجی بلوک مکانی-زمانی قبلی را نشان می دهد، $E$ وزن توجه هر لحظه را نسبت به لحظه های دیگر نشان می دهد و بسته به داده های ورودی و مقدار آن متفاوت خواهد بود. $E_{i, j}$ نشان دهنده همبستگی بین زمان i و زمان j پس از عادی سازی (the $S o f t M a x$ تابع فعال سازی برای عادی سازی استفاده می شود).

لایه توجه زمانی سلسله مراتبی (Res2TAL). Res2Net [ 43 ] توانایی خود را در زمینه بینایی رایانه (پیچیدگی اقلیدسی) برای تقسیم یک پیچیدگی به چند کانولوشن که به هم مرتبط هستند، ثابت کرده است، و به ما امکان می دهد اطلاعات ویژگی های چند مقیاسی را از دیدگاهی دقیق استخراج کنیم. ما با استقرار بخش چارچوب Res2Net با حذف ساختار باقیمانده بر روی لایه توجه زمانی ایجاد کردیم، بنابراین یک لایه توجه زمانی سلسله مراتبی را پیشنهاد کردیم، همانطور که در شکل 2 نشان داده شده است.ب لایه توجه زمانی سلسله مراتبی نه تنها بر اهمیت هر لحظه تمرکز می کند، بلکه شباهت روندهای زمانی را نیز در یک دوره زمانی یاد می گیرد. این به ما امکان می دهد هم تغییرات وزن ارزش زمانی و هم تغییرات روند زمانی را در یک دوره زمانی یاد بگیریم، بنابراین ویژگی های زمانی را در یک چشم انداز دقیق تر یاد بگیریم. از طرف دیگر Res2Net را می توان بدون افزایش تعداد پارامترها با زمان آموزش بیشتر تحت تنظیمات خاص استفاده کرد. بنابراین، Res2TAL می تواند ما را قادر سازد تا اطلاعات ویژگی های زمانی را در مقیاس های مختلف بدون افزایش پارامترها استخراج کنیم. فرمول ریاضی آن به صورت زیر نشان داده شده است:

[ز ساعت 1 ، ز ساعت 2, \dots, ز ساعت س] = ز ساعت = سی h a n g e C o n v 1 (ایکس ساعت) ،

(4)

Y ساعت من = {ز ساعت, i = 1; تی آ L من (ز ساعت من + Y ساعت من - 1) ، 2 ≪ i ≪ s . ،

(5)

R e s 2 T A L (ایکس ساعت) = سی h a n g e C o n v 2 ([Y ساعت 1 ، Y ساعت 2, \dots, Y ساعت س]) ،

(6)

جایی که $s$ پارامتر مقیاس در Res2Net است و همچنین تعداد مقیاس های زمانی ما را نشان می دهد. هر دو $C h a n g e C o n v_{1}$ و $C h a n g e C o n v_{2}$ شبکه های عصبی کانولوشنی با هسته کانولوشنال 1 هستند که برای کاهش تعداد کانال های ویژگی ها استفاده می شوند.

شایان ذکر است که بلوک فشار و برانگیختگی آن (SE-Block) را که در ابتدا وجود داشت [ 44 ] برای جایگزینی ترکیب بین لایه‌های منفرد حذف کردیم و فضایی چند مقیاسی زمانی و چند مقیاسی را به شکل بلوک‌های فضایی-زمانی با هم ترکیب کردیم. . به جای استخراج ویژگی های مشترک، می خواهیم تفاوت بین مقیاس را حفظ کنیم. این امر تعامل بین اطلاعات چند مقیاسی را در دروازه‌بندی بلوک مکانی-زمانی تسهیل می‌کند، در حالی که بهبود جزئی عملکرد آن بعداً تأیید می‌شود.

(2). لایه کانولوشنال گراف تطبیقی سلسله مراتبی

تولید ماتریس مجاورت تطبیقی در بعد فضایی، در هر گره تفاوت هایی در الگوهای ترافیکی وجود دارد که می تواند تاثیر زیادی در پیش بینی ترافیک داشته باشد. روش کنونی ساخت گراف عمدتاً از ویژگی‌های فردی شروع می‌شود (به عنوان مثال، شبکه جاده، نقطه مورد علاقه (POI)، شباهت ترافیک، و غیره)، که بسیار قابل تفسیر هستند اما حاوی اطلاعات وابستگی مکانی کامل نیستند. علاوه بر این، بیشتر ساختارهای گراف به نمودارهای از پیش تعریف شده نیاز دارند و مدل‌های آن‌ها در صورت از دست دادن نمی‌توانند کار کنند. به منظور حل مشکلات ظاهر شده در بالا، ما یک رویکرد تعبیه گره را برای ساخت ماتریس مجاورت تطبیقی اعمال کردیم [ 29 ، 40 ]. فرمول به صورت زیر نشان داده شده است:

آ a d پ = S o f تی ام a x (R e L U (E \cdot E تی)) ،

(7)

جایی که $E \in R^{N \times D}$ پارامتر تعبیه گره را نشان می دهد $D$ بعد، که می تواند به صورت تطبیقی یاد شود و برای یادگیری تغییرپذیری در بین گره ها استفاده شود، $I_{N} \in R^{N \times N}$ نشان دهنده ماتریس واحد است $N$ ابعاد، که برای افزودن حلقه های خود به ساختار گراف استفاده می شود $R e L U$ تابع فعال سازی برای از بین بردن ارتباطات منفی بین گره ها و گره ها استفاده می شود $SoftMax$ تابع فعال سازی برای عادی سازی ماتریس مجاورت استفاده می شود.

لایه پیچیدگی نمودار تطبیقی (AGCN). از آنجایی که هسته کانولوشن GCN مشترک است، اگرچه می‌تواند مهم‌ترین الگوهای ترافیکی را در کل نمودار ترافیک به تصویر بکشد، در واقع یادگیری تغییرپذیری در بین گره‌ها و یادگیری الگوهای ترافیک گره‌های مختلف به روشی دقیق برای ما دشوار است. . AGCN [ 40] ما را قادر می سازد تا بدون نیاز به داده های مشخصه گره شناخته شده، ویژگی های ریز دانه گره ها را ضبط کنیم. یک پارامتر تعبیه گره دیگر در ماتریس مجاورت فوق به GCN اضافه می کند. این پارامتر می‌تواند به ما کمک کند ماتریس مجاورت تطبیقی را آموزش دهیم و در عین حال بر پارامترهای یادگیری در طول پیچیدگی نمودار تأثیر بگذارد و ویژگی‌های هر گره را کاهش دهد. بنابراین، به ما کمک می‌کند تا تفاوت‌های الگوی گره را در نظر بگیریم تا ویژگی‌های فضایی تطبیقی پویا را در دانه‌ریزی ریز به دست آوریم. معادله آن به صورت زیر نشان داده شده است:

A G C ن (X) = آ a d پ ایکس E دبلیو + E ب_

(8)

جایی که $W \in R^{D \times F \times F ’}$ و $b \in R^{D \times F ’}$ پارامترهای قابل یادگیری هستند متفاوت از GCN، از ایده تجزیه ماتریس برای حل بخشی از مشکلات overfitting و oversmoothing GCN استفاده می کند. با این حال، یک مشکل نیز دارد که دارای محدوده ثابتی از میدان های ادراکی است. این ویژگی‌های فضایی چند مقیاسی گرفته‌شده توسط مدل را محدود می‌کند.

لایه پیچیدگی گراف تطبیقی سلسله مراتبی (Res2GCN). Res2Net [ 43 ] تأیید شده است که توانایی بهتری در استخراج ویژگی ها در مقیاس های چندگانه در فضای اقلیدسی دارد. ما به این ایده اشاره می کنیم و ایده ساخت Res2Net را در AGCN به کار می بریم تا یک لایه پیچیدگی گراف تطبیقی سلسله مراتبی را پیشنهاد کنیم. به طور مشابه، می‌تواند ویژگی‌های فضایی چند مقیاسی را در جریان ترافیک (فضای غیر اقلیدسی) در سطح دانه‌بندی دقیق‌تر به تصویر بکشد، و عملکرد داخلی در شکل نشان داده شده است. شکل 2 نشان داده شده است.ج. ویژگی‌های چند مقیاسی Res2GCN نه تنها میدان ادراکی پیچیدگی را افزایش می‌دهد، بلکه محدودیت‌های عملکرد ناشی از تثبیت هسته GCN و همچنین مشکلات اشتراک‌گذاری را تا حدی کاهش می‌دهد، زیرا AGCN در هر مقیاس پارامترهای مشترکی ندارند. از سوی دیگر، از آنجایی که AGCN از همان بردار تعبیه شده در مقیاس‌های مختلف در فرآیند انتشار برگشت پارامتر استفاده می‌کند، این به ماتریس مجاورت ما اجازه می‌دهد تا برای یادگیری الگوهای گره در مقیاس‌های متعدد ترکیب شوند. در بخش بعدی، ما همچنین تأیید می‌کنیم که ماتریس‌های مجاورت مختلف با رویکردهای پارامتر تعبیه گره، اثرات متفاوتی بر Res2GCN دارند. معادله به شرح زیر است:

[ز 1 ، ز 2, \dots, ز س] = Z = سی h a n g e C o n v 1 (X) ،

(9)

Y من = {ز من, i = 1; A G C ن من (ز من + Y من - 1) ، 2 ≪ i ≪ s . ،

(10)

R e s 2 A G C ن (X) = سی h a n g e C o n v 2 ([Y 1 ، Y 2, \dots, Y س]) ،

(11)

R e s 2 A G C ن (ایکس ساعت) = [R e s 2 A G C ن (ایکس 1) ، R e s 2 A G C ن (ایکس 2), \dots, R e s 2 A G C ن (ایکس تی)],

(12)

جایی که $s$ پارامتر مقیاس در Res2Net است و همچنین تعداد مقیاس های فضایی ما را نشان می دهد و $C h a n g e C o n v_{1}$ و $C h a n g e C o n v_{2}$ یک شبکه عصبی کانولوشنال با هسته کانولوشنال 1 هستند که همان نقش را در Res2TAL ایفا می کنند.

(3). فیوژن دردار پویا

این بخش برای توضیح چگونگی ادغام ویژگی های زمانی و مکانی در بلوک ST استفاده می شود. پیش‌بینی جریان ترافیک هر بخش جاده باید بر جریان تاریخی آن بخش جاده و جریان تاریخی سایر بخش‌های جاده مرتبط در گذشته تمرکز کند. بنابراین، ما باید ویژگی های زمانی سلسله مراتبی استخراج شده را به صورت پویا با ویژگی های فضایی سلسله مراتبی در اینجا ترکیب کنیم. در مطالعات گذشته، اکثر مدل‌ها به‌طور متوالی در جهت طولی عمل می‌کنند، که باعث می‌شود همبستگی بین ویژگی‌های زمانی و مکانی به اندازه کافی قوی نباشد. بنابراین، ما از یک تکنیک دروازه‌ای برای ترکیب کردن ویژگی‌های زمانی و مکانی به صورت افقی و پویا استفاده می‌کنیم، بنابراین همبستگی بین ویژگی‌های زمانی و مکانی را افزایش می‌دهیم. فرآیند عملیات ذاتی در نشان داده شده استشکل 2 الف و همچنین معادله ریاضی نشان داده شده در زیر:

G a t e = σ (L i n e a r 1 (R e s 2 T A L (X)) + L i n e a r 2 (R e s 2 G C ن (X)))) ،

(13)

اس تی B l o c k (X) = G a t e ⊙ R e s 2 T A L (X) + (1 - G a t e) ⊙ R e s 2 G C ن (X) ،

(14)

جایی که $L i n e a r_{1}, L i n e a r_{2}$ لایه تبدیل خطی است که می تواند به صورت پویا و تطبیقی با خود داده تغییر کند و بر بزرگی عمل تأثیر بگذارد. $G a t e$ ، $⊙$ محصول هادامارد است و $σ$ هست $sigmoid$ تابع فعال سازی، که می تواند در عادی سازی مقادیر ویژگی ها و در نتیجه جلوگیری از انفجار گرادیان در طول فرآیند همجوشی استفاده شود.

3.5. اتصال متراکم

بسیاری از مطالعات گذشته، مانند STGCN [ 28 ]، ASTGCN [ 30 ] و غیره، از اتصالات باقیمانده برای یکپارچه‌سازی ویژگی استفاده کرده‌اند، و استفاده مداوم از همان تابع در اتصالات باقی‌مانده همچنان مانع انتقال ویژگی می‌شود. از آنجایی که TRes2GC-Submodule شامل چندین بلوک ST است، استفاده مداوم از ساختار ResNet [ 45 ] می تواند باعث مشکلاتی مانند ناپدید شدن گرادیان و تخریب شبکه شود. برای حل این مشکلات، از DenseNet [ 41 ] برای اتصال بلوک های ST خود استفاده می کنیم. انتشار ویژگی ها را افزایش می دهد، استفاده مجدد از ویژگی ها را تشویق می کند و تعداد پارامترها را کاهش می دهد. از سوی دیگر، DenseNet می تواند مشکل هموارسازی بیش از حد ناشی از استفاده های متعدد از GCN را کاهش دهد.

خوشبختانه، داده‌های جریان ترافیک به اندازه داده‌های تصویری پیچیده نیستند، که به تعداد زیادی لایه برای عمیق‌تر کردن یادگیری نیاز دارند. برای تکمیل یادگیری ویژگی ها به تعداد معقول و محدود بلوک نیاز دارد، اما نه تعداد بلاک های فوق العاده زیاد. بنابراین، شایان ذکر است که دلیل اصلی ما برای استفاده از DenseNet، گسترش تعداد کانال‌های ویژگی‌های مکانی و زمانی است و دلیل ثانویه، انجام عمق‌سازی شبکه است. در آزمایش‌های فرسایشی بعدی، ما همچنین تفاوت‌های حاصل از روش‌های اتصال مختلف (و تفاوت‌های بین ResNet و DenseNet) و تأثیرات ناشی از گسترش و تعمیق مدل را در پیش‌بینی تأیید می‌کنیم. عملیات ذاتی در شکل 1 ب و همچنین معادله زیر نشان داده شده است:

Y ˜ اس تو ب = S تی B l o c ک ل ([ایکس 1 ، ایکس 2, \dots, ایکس l - 1]) ،

(15)

جایی که $S T B l o c k_{l}$ نشان دهنده بلوک ST از بلوک پشته و $[X^{1}, X^{2}, \dots, X^{l - 1}]$ اشاره به اتصال نگاشت ویژگی ایجاد شده پس از عبور از ( $0, \dots, l - 1$ ) بلوک ها

3.6. فیوژن چند جزئی

این بخش نحوه ادغام چندین زیرماژول TRes2GC را شرح می دهد. از آنجایی که یک قالب چند جزئی برای مدل ما در دوره‌های زمانی مختلف و مکان‌های مختلف استفاده می‌شد، ما به راهی برای ترکیب ویژگی‌ها در اجزای مختلف نیاز داشتیم. به عنوان مثال، مدل یکشنبه تأثیر کمی بر پیش بینی جریان مدل دوشنبه دارد، اما مدل دوشنبه تأثیر زیادی بر مدل سه شنبه دارد. بنابراین، ما سه پارامتر وزن را برای کاهش اهمیت هر جزء تعریف کردیم و آنها را جمع‌بندی کردیم. فرمول آنها در زیر نشان داده شده است:

Y ˜ = دبلیو ساعت ⊙ Y ˜ ساعت + دبلیو د ⊙ Y ˜ د + دبلیو w ⊙ Y ˜ w ،

(16)

جایی که $⊙$ محصول هادامارد است و $W_{h}$ ، $W_{d}$ ، و $W_{w} \in R^{N \times T}$ به ترتیب پارامترهایی هستند که باید یاد بگیرند و همچنین پارامترهای وزنی برای چرخه های مختلف.

4. آزمایش و نتیجه

4.1. مجموعه داده ها

دو مجموعه داده حجم ترافیک دنیای واقعی عمومی انتخاب شدند: PeMS04 و PeMS08، که توسط سیستم اندازه‌گیری عملکرد Caltrans در مناطق اصلی شهری کالیفرنیا [ 46 ] جمع‌آوری شدند. همه داده ها از بیش از 39000 حسگر مستقر در آزادراه های کالیفرنیا در فواصل 30 ثانیه جمع آوری می شوند.

داده های خام قبل از اینکه بتوان آنها را برای آموزش در مدل قرار داد باید از قبل پردازش شوند. ما از همان رویکرد پیش پردازشی مانند STSGCN [ 38 ] و AGCRN [ 40 ] برای برخی از مقادیر گمشده در مجموعه داده استفاده می‌کنیم، این مقادیر گمشده را با درون یابی خطی پر می‌کنیم. علاوه بر این، ما مجموعه داده را با تمام مقادیر داده‌ها بین [0,1] نرمال کردیم و میانگین مقدار مجموعه داده 0 است. مجموعه داده را به صورت زمانی تقسیم کردیم و آن را به مجموعه‌های آموزشی، اعتبارسنجی و آزمایشی به نسبت 6:2 تقسیم کردیم. :2. داده‌ها در نهایت در فواصل 5 دقیقه‌ای تجمیع شدند و در مجموع 288 نقطه داده در روز به دست آمد. اطلاعات فراداده در جدول 1 نشان داده شده است. جایی که میانگین داده ها میانگین هر پنج دقیقه (در هر دوره زمانی) داده را نشان می دهد، و محدوده داده نشان دهنده حدود بالا و پایین تغییرات داده ها در هر پنج دقیقه است.

4.2. روش های پایه

ما 10 روش پیش‌بینی جریان ترافیک زیر را به عنوان مدل‌های پایه برای مقایسه با مدل خود انتخاب می‌کنیم. علاوه بر این، برای نشان دادن تازگی و اعتبار مدل ما، هفت مورد از خطوط پایه، روش‌های پیش‌بینی جریان ترافیک هستند. جزئیات به شرح زیر است:

VAR : رگرسیون خودکار برداری یک مدل پیش‌بینی است که ویژگی مکانی-زمانی بین داده‌های ترافیک را ثبت می‌کند.
SVR : رگرسیون بردار پشتیبان از یک ماشین بردار پشتیبان برای انجام رگرسیون خطی استفاده می کند.
LSTM : شبکه حافظه کوتاه مدت بلندمدت مدلی از RNN است که می تواند وظایف سری زمانی را بهتر انجام دهد.
DCRNN : شبکه عصبی بازگشتی پیچیدگی انتشار یک چارچوب رمزگذار خودکار است. از پیچیدگی نقشه انتشار برای به دست آوردن ویژگی های فضایی و Seq2Seq برای رمزگذاری اطلاعات زمانی استفاده می کند.
STGCN : شبکه کانولوشن گراف فضایی-زمانی از ChebNet برای به دست آوردن همبستگی مکانی و CNN با مکانیزم دروازه برای به دست آوردن همبستگی زمانی استفاده می کند.
MSTGCN : شبکه پیچیدگی نمودار فضایی-زمانی چند جزئی، اطلاعات مکانی-زمانی را در دوره های زمانی مختلف با مدل سازی الگوهای زمانی مختلف استخراج و ترکیب می کند. ویژگی های زمانی را توسط CNN و ویژگی های مکانی را توسط ChebNet به دست می آورد.
ASTGCN : شبکه کانولوشن گراف فضایی-زمانی مبتنی بر توجه توجه زمانی و توجه مکانی را به MSTGCN برای استخراج اطلاعات مکانی-زمانی پویا اضافه می کند.
Graph WaveNet : Graph WaveNet GCN و شبکه کانولوشن گشاد شده را برای به دست آوردن همبستگی مکانی و همبستگی زمانی به طور جداگانه ترکیب می کند. همچنین از تعبیه گره برای یادگیری تطبیقی ماتریس مجاورت از داده ها استفاده می کند.
STSGCN : شبکه‌های کانولوشن گراف همزمان مکانی-زمانی از GCN برای ساخت بلوک‌های کانولوشن سنکرون مکانی-زمانی استفاده می‌کنند تا به طور همزمان همبستگی‌های زمانی و مکانی را با چیدن ماژول‌های کانولوشن سنکرون مکانی-زمانی به دست آورند.
AGCRN : شبکه کانولوشن برگشتی گراف تطبیقی یک شبکه کانولوشن گراف تطبیقی جدید پیشنهاد کرد تا ویژگی فضایی ریز دانه را به تصویر بکشد. علاوه بر این، از GRU تقویت شده برای گرفتن ویژگی زمانی استفاده می کند.

4.3. تنظیمات آزمایش

TRes2GCN بر اساس چارچوب PyTorch پیاده سازی شده و آموزش آن بر روی کارت گرافیک NVIDIA RTX 2080TI انجام می شود. در مدل ما، 4 مقیاس عرض 26 برای استقرار Res2GCN و 3 مقیاس 26 عرض برای Res2TAL گرفته شده است. علاوه بر این، هر یک از لایه های دیگر دارای 64 ویژگی است. سایز دسته ای این مدل 32 است و بهینه ساز Adam برای 40 دوره آموزش مدل با نرخ یادگیری 0.001 استفاده می شود. در فرآیند آموزش، نرخ یادگیری را با بازپخت کسینوس کاهش می‌دهیم و پایین‌ترین نقطه کاهش نرخ یادگیری را 0.0001 قرار می‌دهیم که ما را برای گرفتن نتایج آموزشی بهتر تسهیل می‌کند. در انتخاب تابع از دست دادن، از SmoothL1Loss استفاده می کنیم (یعنی HuberLoss [ 47]) به جای L2Loss، تا ضد اغتشاش مدل افزایش یابد و خطای ناشی از نویز کاهش یابد. فرمول ریاضی به صورت زیر است:

اس m o o t ساعت L 1 (Y ، Y ˜) = ⎧⎩⎨⎪⎪ 0.5 (Y - Y ˜) ² ، ∣∣ Y - Y ˜ ∣∣ \leq σ; σ ∣∣ Y - Y ˜ ∣∣ - 0.5 σ ², o t h e r w i s e . ،

(17)

جایی که $Y$ مقدار واقعی جریان ترافیک را نشان می دهد، $\tilde{Y}$ مقدار جریان ترافیک پیش بینی شده توسط مدل را نشان می دهد و $σ$ یک پارامتر آستانه است که محدوده تلفات مربع خطا را کنترل می کند.

این آزمایش همچنین از سه معیار ارزیابی پرکاربرد برای اندازه‌گیری عملکرد مدل استفاده می‌کند، یعنی میانگین خطای مطلق (MAE)، ریشه میانگین مربع خطا (RMSE) و میانگین درصد مطلق خطا (MAPE)، مانند AGCRN [ 40 ]. ما از این سه معیار برای اندازه گیری اثربخشی پیش بینی مدل خود در مقایسه با مدل پایه استفاده می کنیم.

4.4. مقایسه نتایج

جدول 2 مقایسه ای از میانگین عملکرد چارچوب های مختلف در تمام افق های زمانی را نشان می دهد. به طور کلی، در هر دو مجموعه داده، مدل ما از ده روش پایه دیگر در هر سه معیار عملکرد بهتری دارد. برای توصیف واضح قدرت پیش‌بینی مدل پیشنهادی، آن را از دو جنبه به تفصیل تجزیه و تحلیل می‌کنیم.

(1) توانایی پیش بینی کلی

در جدول 2 می بینیم که روش های SVR و LSTM در مقایسه با سایر شبکه ها دقت کمتری دارند زیرا همبستگی مکانی را در داده های ترافیک در نظر نمی گیرند. VAR در مقایسه با SVR عملکرد بهتری دارد زیرا برخی از اطلاعات مکانی در نظر گرفته شده است. با این حال، این روش‌ها در مقایسه با روش‌های شبکه‌های عصبی نمودار مکانی-زمانی، فضایی برای بهبود در مدیریت اطلاعات مکانی دارند، به همین دلیل است که VAR بیشتر از آنها عملکرد پایین‌تری دارد.

STGCN، DCRNN، MSTGCN، ASTGCN، Graph WaveNet، STSGCN و AGCRN همگی همبستگی فضایی کامل جهانی را در نظر می گیرند و نسبت به مدل های فوق عملکرد بهتری دارند. با این حال، به دلیل طراحی و ساخت متفاوت هر مدل، این مدل‌ها همچنان در نتایج تفاوتی نشان می‌دهند. STGCN، DCRNN و Graph WaveNet همگی ضبط ویژگی های تک دوره ای را از منظر طراحی هدف قرار می دهند، و اهمیت چرخه های زمانی را نادیده می گیرند، و بنابراین، عملکرد کمی پایین تر خواهند داشت. برای MSTGCN و ASTGCN، دوره‌های زمانی متفاوتی را در نظر می‌گیرند و از اطلاعات دوره زمانی بیشتری نسبت به STGCN و DCRNN استفاده می‌کنند. با این حال، مدل های فوق فاقد اطلاعات زمانی چند مقیاسی در مقایسه با TRes2GCN پیشنهادی هستند، بنابراین عملکرد آنها را محدود می کند. برای STSGCN، ویژگی های نمودار محلی نیز در نظر گرفته می شود. بنابراین بهبود جزئی دیگری را در مقایسه با STGCN، DCRNN یا Graph WaveNet ارائه می دهد. با این حال، یک روش استخراج واحد دارد، بنابراین ویژگی‌های مکانی-زمانی استخراج‌شده به اندازه کافی غنی نیستند. در مقابل، مدل ما ویژگی‌های فضایی-زمانی سطوح و مقیاس‌های مختلف را از طریق ساختارهای DenseNet و Res2Net، که از نظر ویژگی‌های مکانی-زمانی غنی‌تر هستند و نتایج پیش‌بینی بهتری دارند، ترکیب می‌کند. برای AGCRN، پارامترهای یادگیری در GCN را به دو پارامتر کوچک برای یادگیری تقسیم می‌کند که از منظری دقیق بهبود می‌یابد. با این حال، تنها ویژگی‌های مکانی و زمانی ریزدانه را در یک مقیاس واحد در نظر می‌گیرد و قادر به در نظر گرفتن الگوهای سفر در دوره‌های زمانی مختلف نیست. مدل پیشنهادی ما، از سوی دیگر، AGCN و TAL را از طریق ایده Res2Net بر اساس برش GCN به کار می‌گیرد. و جمع آوری اطلاعات مکانی-زمانی چند مقیاسی با دانه بندی ریزتر را تکمیل می کند. علاوه بر این، ما همچنین از طریق یک مدل چند جزئی به ضبط ویژگی در دوره‌های زمانی مختلف دست می‌یابیم تا پیش‌بینی با دقت بالاتری را انجام دهیم.

(2) قابلیت پیش بینی چند مرحله ای

برای بررسی عملکرد مدل خود در مقابل مدل پایه در بازه های زمانی مختلف، ما نتایج معیارها را در مراحل زمانی مختلف تجسم می کنیم ( شکل 3). واضح است که برای همه مدل‌ها، با افزایش زمان پیش‌بینی، خطاهای پیش‌بینی روند افزایشی نشان می‌دهند. در این میان، SVR با LSTM پیش‌بینی کوتاه‌مدت بسیار خوبی دارد، اما خطای آن سریع‌ترین روند صعودی را در بین همه مدل‌ها دارد، زیرا تغییر ویژگی‌های فضایی را در نظر نمی‌گیرد. در مقایسه با VAR، توانایی پیش بینی کوتاه مدت آن خیلی خوب نیست. با این حال، به دلیل در نظر گرفتن برخی ویژگی های فضایی، روند صعودی خطای آن با گذشت زمان بیشتر کاهش یافته است. این همچنین ثابت می کند که در نظر گرفتن ویژگی های فضایی می تواند به طور موثری توانایی پیش بینی مدل را در میان مدت و بلند مدت بهبود بخشد. در مورد شبکه‌های عصبی نمودار مکانی-زمانی، در بیشتر موارد، پیش‌بینی‌های میان‌مدت و بلندمدت آنها بهتر از VAR، SVR و LSTM است. این همچنین اثربخشی GCN را در گرفتن ویژگی‌های فضایی در پیش‌بینی ترافیک نشان می‌دهد. شایان ذکر است که AGCRN و TRes2GCN ما، که ویژگی‌های فضایی ریزدانه را در نظر می‌گیرند، به طور قابل توجهی به دلیل سایر مدل‌های پایه در کار پیش‌بینی میان‌مدت و بلندمدت هستند. این همچنین اثربخشی AGCN را در مقایسه با GCN معمولی برجسته می کند. TRes2GCN نسبت به AGCRN پیشرفت زیادی دارد، به ویژه برای پیش بینی کوتاه مدت و میان مدت. این به دلیل مزیت در نظر گرفتن دوره‌های زمانی مختلف است که به مدل ما اجازه می‌دهد تا مشخص شود که ویژگی‌های بیشتری از تغییرات در این دوره زمانی دارد، بنابراین نتایج پیش‌بینی ما را با دقت بیشتری منطبق می‌کند. به طور قابل توجهی به دلیل دیگر مدل های پایه در کار پیش بینی میان مدت و بلند مدت هستند. این همچنین اثربخشی AGCN را در مقایسه با GCN معمولی برجسته می کند. TRes2GCN نسبت به AGCRN پیشرفت زیادی دارد، به ویژه برای پیش بینی کوتاه مدت و میان مدت. این به دلیل مزیت در نظر گرفتن دوره‌های زمانی مختلف است که به مدل ما اجازه می‌دهد تا مشخص شود که ویژگی‌های بیشتری از تغییرات در این دوره زمانی دارد، بنابراین نتایج پیش‌بینی ما را با دقت بیشتری منطبق می‌کند. به طور قابل توجهی به دلیل دیگر مدل های پایه در کار پیش بینی میان مدت و بلند مدت هستند. این همچنین اثربخشی AGCN را در مقایسه با GCN معمولی برجسته می کند. TRes2GCN نسبت به AGCRN پیشرفت زیادی دارد، به ویژه برای پیش بینی کوتاه مدت و میان مدت. این به دلیل مزیت در نظر گرفتن دوره‌های زمانی مختلف است که به مدل ما اجازه می‌دهد تا مشخص شود که ویژگی‌های بیشتری از تغییرات در این دوره زمانی دارد، بنابراین نتایج پیش‌بینی ما را با دقت بیشتری منطبق می‌کند.

5. بحث

5.1. تأثیر روش اتصال و ویژگی چند مقیاسی

در این بخش، برای بررسی بیشتر تأثیر روش اتصال و تغییر چند مقیاسی مدل خود، هفت نوع TRes2GCN را طراحی کردیم و آزمایش‌های فرسایشی را انجام دادیم.

این ها بر اساس تعداد بلوک های مکانی-زمانی روی هم چیده شده، نحوه چیدمان آنها و تأثیر ساختار سلسله مراتبی (ساختار Res2Net) طراحی شده اند. سپس این هفت نوع را با TRes2GCN در مجموعه داده PeMS08 مقایسه کردیم. در طول مقایسه، همه مدل‌های متغیر با فراپارامترهای یکسان آموزش و آزمایش شدند، بنابراین از انصاف و اعتبار علمی اطمینان حاصل شد. تفاوت بین مدل های مختلف در هشت نکته خلاصه شده و در زیر توضیح داده شده است:

(1): Two Blocks-ResNet: این مدل اساس مطالعه ما است. این شامل دو بلوک فضایی-زمانی است و در ساختار ResNet که در حال حاضر رایج ترین استفاده می شود، انباشته شده است. هر بلوک فضایی-زمانی دارای ساختار سلسله مراتبی نیست، یعنی فقط شامل یک لایه TAL و یک لایه AGCN است.
(2): Two Blocks-DenseNet: این مدل بر اساس اولین نوع است که ساختار ResNet با ساختار DenseNet جایگزین شده است.
(3): Three Blocks-ResNet: این مدل بر اساس نوع اول با یک بلوک فضایی-زمانی دیگر روی هم چیده شده و بقیه بدون تغییر است.
(4): Three Blocks-DenseNet: این مدل بر اساس نوع سوم با جایگزینی ساختار ResNet با ساختار DenseNet است.
(5): Four Blocks-ResNet: این مدل بر اساس نوع سوم با یک بلوک فضایی-زمانی دیگر انباشته و بقیه بدون تغییر است.
(6): Four Blocks-DenseNet: این مدل بر اساس نوع پنجم با جایگزینی ساختار ResNet با ساختار DenseNet ساخته شده است.
(7): Four Blocks-DenseNet + Res2GCN: این مدل بر اساس نوع ششم با افزودن پیچیدگی گراف تطبیقی سلسله مراتبی (Res2GCN) است.
(8): TRes2GCN: این نسخه کامل TRes2GCN است. این لایه توجه زمانی سلسله مراتبی را در بالای نوع هفتم اضافه می کند.

در مقایسه شش نوع اول، بهبود مدل از طریق راه و تعداد بلوک‌های مکانی-زمانی به تفصیل بررسی شده است. همانطور که در شکل 4 نشان داده شده است ، ما انواع 1، 3 و 5 را با هم مقایسه می کنیم و به وضوح می بینیم که اثر نحوه اتصال ResNet رضایت بخش نیست. وقتی پشته سه بلوک باشد، اثر کمی بهتر از دو بلوک خواهد بود. با این حال، هنگامی که تعداد پشته ها بلوک چهارم باشد، یک بازگشت قابل توجه در معیارهای ارزیابی شده توسط مدل وجود دارد، به خصوص بازگشت MAPE بزرگترین است. بنابراین، تعداد موثر بلوک های انباشته شده برای ResNet 3 است و در بلوک چهارم، مدل یک پدیده بسیار جدی تخریب شبکه را نشان می دهد. وقوع این پدیده به احتمال زیاد مربوط به هموار شدن بیش از حد GCN است [ 48]. تأیید شده است که GCN با پشته‌ای از سه یا چهار لایه به دلیل پدیده هموارسازی بیش از حد منجر به روند همگن ویژگی‌ها می‌شود و در نتیجه باعث شکست مدل می‌شود. این نتیجه گیری بسیار شبیه به نتایج تجربی ما است. با مقایسه مدل های 2، 4 و 6 متوجه شدیم که DenseNet از نظر اتصال نتایج بهتری نسبت به ResNet دارد. معیارهای مدل با بزرگتر شدن تعداد بلوک‌های مکانی-زمانی بهبود می‌یابند و هیچ تخریب شبکه وجود ندارد. این به درجه بالای استفاده از ویژگی نسبت داده می شود، که ویژگی ها را غنی می کند و در عین حال مشکل هموارسازی بیش از حد را تا حدی تعدیل می کند. همچنین بسیار موثر است، زیرا حافظه و تعداد پارامترهای فرآیند آموزش را افزایش نمی دهد. با این حال، ما آن را در طول تغییر نوارهای خطا به طور قابل توجهی کوتاهتر نمی یابیم.

شایان ذکر است که ResNet در حال حاضر در اکثر شبکه های عصبی نمودار فضایی-زمانی استفاده می شود. به خصوص نوع 1 (با تعداد انباشته 2) بسیار شبیه به شبکه های فعلی مبتنی بر CNN (STGCN، MSTGCN، ASTGCN، و غیره) است. این همچنین ثابت می‌کند که اکثر مدل‌ها با نادیده گرفتن تأثیر روش‌های تعمیق شبکه و اتصال بر روی مدل‌ها ساخته شده‌اند و جا برای بهبود بیشتر وجود دارد.

از سوی دیگر، میزان بهبود سلسله مراتب خود را بر روی مدل در انواع 6، 7 و 8 بررسی کردیم. پس از اضافه کردن Res2GCN و Res2TAL، به ترتیب، متوجه می‌شویم که مقادیر میانگین هر سه معیار به تدریج بهبود می‌یابند، و به ویژه Res2GCN. بهبود می بخشد. این ثابت می‌کند که گرفتن اطلاعات مکانی-زمانی چند مقیاسی، در واقع می‌تواند مزایای مثبتی برای مدل به همراه داشته باشد. مقیاس‌های فضایی چند مقیاسی، به‌ویژه، در پیش‌بینی ترافیک اهمیت بیشتری دارند. علاوه بر این، ما همچنین دریافتیم که نوارهای خطای انواع 7 و 8 در مقایسه با نوع 6 به طور قابل توجهی باریک تر است. این نشان می دهد که اگر می خواهیم میان مدت و بلندمدت دقیق تری داشته باشیم، باید اطلاعات مکانی و زمانی بیشتری را در مقیاس های مختلف در نظر بگیریم. نتایج پیش بینی

سپس، همانطور که در جدول 3 نشان داده شده است، تأثیر تغییر ساختار Res2Net بر دقت را بیشتر بررسی کردیم.. در همان ابتدا، ما فقط Res2Net بهینه را در ساختار مدل خود اعمال کردیم، یعنی ویژگی های 26 مقیاس 4. با این حال، با مقایسه نتایج بدون استقرار Res2Net، اثر بهبود یافت، اما فقط MAPE بیشتر بهبود یافت. پس از آن، حدس زدیم که آیا مقیاس های زیادی برای TAL وجود دارد یا خیر. بنابراین، ما سعی کردیم تعداد مقیاس‌های Res2TAL را کاهش دهیم و تأثیر آن در واقع بهبود یافت. این به این دلیل است که TAL خود اهمیت هر لحظه را به دست می آورد و میدان ادراکی خود بزرگ است. TAL دوم (یعنی مقیاس برابر با 3) برای یادگیری ارتباط لحظه به لحظه بین سطوح اهمیت انجام شد. از سوی دیگر، انجام TAL بیشتر (یعنی مقیاس برابر با 4)، هیچ معنای عملی ندارد و نتایج در واقع از حالتی که مقیاس 3 است پایین‌تر است. از سوی دیگر، ما همچنین سعی کردیم تعداد مقیاس های Res2GCN را کاهش دهیم و متوجه شدیم که نتایج بهبود نیافته است، بلکه دارای اراده ضعیفی است. بنابراین، ما در نهایت مقیاس 4 را برای Res2GCN و مقیاس 3 را برای Res2TAL، هر دو با عرض 26 انتخاب کردیم. این همچنین نشان می‌دهد که ساختار Res2Net می‌تواند به طور موثر نه تنها در پیچیدگی اقلیدسی، بلکه در مکانیسم توجه و غیر قابل استفاده باشد. -پیچیدگی اقلیدسی که بار دیگر اثربخشی و عمومیت چارچوب آن را ثابت می کند.

علاوه بر این، ما نیز مفید بودن SE-Block را تأیید می کنیم و متوجه می شویم که SE-Block تأثیر بیشتری بر مدل ایجاد می کند. دلیل اصلی این است که SE-Block الگوهای مشترک بین مقیاس ها را استخراج می کند و تفاوت بین مقیاس ها را محو می کند. با مقایسه ردیف دوم با ردیف چهارم، نتایج نشان می‌دهد که Res2Net بدون SE-Block برای پیش‌بینی شبکه‌های عصبی نمودار مکانی-زمانی مناسب‌تر است.

شایان ذکر است که از آنجایی که باید نتایج سه مؤلفه را به صورت تجمعی محاسبه کنیم (در مجموع 12 بلوک مکانی-زمانی)، و افزایش پارامترها در هر لایه باعث افزایش ناگهانی طول و حافظه برای آموزش مدل می شود. بنابراین، در اینجا، ما فقط مورد Res2Net (4 مقیاس 26 عرض) را بدون افزایش در پارامترهای محاسباتی بررسی می کنیم. تنظیمات دیگر، اگرچه نتایج را بهتر می کنند، اما باعث کاهش شدید حافظه آموزشی و زمان تمرین مدل ما می شوند، بنابراین آنها را در نظر نمی گیریم.

5.2. تأثیر بردار جاسازی گره و ماتریس مجاورت تطبیقی

بردار تعبیه گره و ماتریس مجاورت تطبیقی مستقیماً بر استخراج ویژگی مکانی-زمانی ریز دانه تأثیر می‌گذارند، بنابراین تأثیر تغییرات بردار تعبیه گره و ماتریس مجاورت تطبیقی را در این بخش بررسی می‌کنیم.

همانطور که ماتریس مجاورت تطبیقی مورد توجه قرار گرفته است، روش های آنها تکثیر شده است [ 29 ، 40 ، 49 ]. با الهام از اینها، ما تأثیر ساختارهای ماتریس مجاورت مختلف با بردارهای جاسازی پیچیدگی نمودارهای مختلف را بر پیش‌بینی بررسی می‌کنیم. با این حال، Graph WaveNet [ 29 ] و MTGNN [ 49 ] تنها ماتریس مجاورت تطبیقی را بدون بردار تعبیه گره در نظر گرفتند. بنابراین، ما بردارهای ترکیب آن دسته از ماتریس‌های مجاورت تطبیقی را که به عنوان بردارهای جاسازی گره در نظر گرفته نشده‌اند، تطبیق می‌دهیم و مناسب بودن آنها را تأیید می‌کنیم، همانطور که در جدول 4 نشان داده شده است.

شایان ذکر است که تمامی این روش‌ها برای شبیه‌سازی بهتر ماتریس مجاورت تایید شده‌اند، اما هیچ تاییدی در مورد مناسب بودن بردار تعبیه وجود ندارد. بنابراین، خوب بودن نتایج این آزمایش تنها می‌تواند نشان‌دهنده مناسب بودن بردارهای آنها برای ساخت ماتریس‌های مجاورت به عنوان بردارهای تعبیه‌کننده برای پیچیدگی نمودار باشد.

با مقایسه دو ردیف اول با سطرهای دیگر، ماتریس مجاورت تطبیقی بدون افزودن جاسازی گره، نتایج مشابهی با ماتریس مجاورت اصلی خواهد داشت، اما باز هم، هیچ کدام نمی توانند تنوع الگوی گره ریز دانه را بدست آورند. علاوه بر این، مهم نیست که از چه روش جاسازی استفاده می شود، عملکرد بهتری نسبت به پیچیدگی نمودار بدون جاسازی خواهد داشت. این همچنین تأیید می کند که ویژگی های فضایی-زمانی ریز دانه با الگوهای گره، در واقع، بهتر از ویژگی های مکانی-زمانی معمولی هستند.

با کمال تعجب، متوجه شدیم که رویکرد تعبیه گره AGCRN (ردیف سوم) ساده تر است، اما نتایج بهتری نسبت به روش های دیگر دارد. در مقابل، دو روش ساخت ماتریس مجاورت تطبیقی ذکر شده در MTGNN پیچیده‌تر هستند (ردیف‌های پنجم و ششم)، اگرچه در مقاله اصلی تأیید شد که نتایج بهتری نسبت به Graph WaveNet (ردیف چهارم بدون جاسازی گراف) بدون افزودن جاسازی گره وجود دارد. . با این حال، هنگامی که تعبیه گره اضافه می شود، نتایج کمتر رضایت بخش هستند. این به احتمال زیاد به دلیل استفاده بیش از حد از لایه‌های کاملاً متصل در بلوک‌های ساختمانی است که منجر به برازش بیش از حد بردارهای پیچیدگی نمودار آموخته شده می‌شود. از سوی دیگر، مقایسه ردیف های سوم و پنجم (گراف های بدون جهت) با ردیف های چهارم و ششم (گراف های جهت دار) نشان می دهد که ماتریس مجاورتی که با استفاده از دو بردار آموخته شده است به طور کلی به خوبی ماتریس مجاورتی که با استفاده از یک بردار یاد می شود نیست. این همچنین ثابت می کند که گراف تطبیقی بدون جهت برای پیش بینی بهتر از گراف جهت دار تطبیقی هنگام در نظر گرفتن تعبیه گره است.

5.3. قابلیت پیش بینی در بازه های مختلف

برای تجسم تفاوت‌های پیش‌بینی بین مدل خود و مدل پایه، به طور تصادفی یک حسگر را در مجموعه داده PeMS08 انتخاب کردیم تا تناسب پیش‌بینی و خطای پیش‌بینی را مقایسه کنیم، همانطور که در شکل 5 نشان داده شده است.

برای اینکه مقایسه دقیق‌تر و واضح‌تر باشد، نتایج پیش‌بینی را در بازه‌های زمانی مختلف در یک روز تجسم کردیم. در این حالت تست در چهار نقطه زمانی یعنی ۱۵ دقیقه، ۳۰ دقیقه، ۴۵ دقیقه و ۶۰ دقیقه انجام می‌شود. در هر طرح فرعی، نمودار بالایی حجم پیش‌بینی و حقیقت پایه مدل ما را با برخی از مدل‌های پایه نشان می‌دهد، در حالی که نمودار پایین نشان‌دهنده خطای پیش‌بینی بین مدل‌ها در فاصله‌ای از حقیقت زمین است.

نتایج نشان می‌دهد که منحنی‌های برازش شده هر سه مدل پایه برای یک بازه پیش‌بینی 15 دقیقه بسیار نزدیک هستند. و با افزایش بازه زمانی پیش بینی، خطای STGCN به طور قابل توجهی افزایش می یابد. در مقابل، MSTGCN و ASTGCN به طور قابل توجهی به مقادیر واقعی نزدیکتر از STGCN تحت بازه پیش بینی 45 و 60 دقیقه هستند. این افزایش موثر پیش بینی بلند مدت آنها به دلیل در نظر گرفتن دوره های زمانی متعدد است.

در بین همه مدل‌ها، TRes2GCN در پیش‌بینی تغییرات ترافیک آینده بهتر است و مقادیر پیش‌بینی‌شده آن به Ground Truth نزدیک‌تر است، به خصوص در قسمت اوج، جایی که مزیت مدل ما برجسته‌تر است. ما به وضوح می‌توانیم ببینیم که مدل ما نتایج بهتری برای قسمت در جعبه نارنجی (یعنی قله‌ها برای تمام بازه‌های زمانی) به دست می‌آورد. این به این دلیل است که ساختارهای Res2Net و DenseNet در مدل ما غنی از ویژگی‌های مکانی-زمانی هستند که برخی از مشکلات هموارسازی بیش از حد موجود در GCN را کاهش می‌دهد. بنابراین، در مقایسه با مدل‌های دیگر، مدل ما نه تنها می‌تواند روند آینده ترافیک را پیش‌بینی کند، بلکه اندازه پیک ترافیک را نیز با دقت بیشتری پیش‌بینی می‌کند.

5.4. تحلیل دوره ای زمانی

به منظور ارزیابی اثربخشی ترکیب چندین ویژگی ترافیک دوره‌ای، ما تأثیر دوره‌های زمانی مختلف بر پیش‌بینی ترافیک را بررسی کردیم.

با مقایسه ردیف‌های 1، 2 و 3 در جدول 5 ، می‌بینیم که دو مدلی که به ترتیب دوره‌های روزانه و هفتگی را در نظر می‌گیرند، در مقایسه با مدلی که فقط دوره‌های اخیر را در نظر می‌گیرد، افزایش متفاوتی دریافت می‌کنند. این به این دلیل است که رفت و آمد معمولا یک هفته طول می کشد. برای مثال الگوی دوشنبه هفته قبل به الگوی دوشنبه هفته بعد بسیار نزدیک خواهد بود. بنابراین، دوره هفتگی کمی بالاتر خواهد بود.

از سوی دیگر، با مقایسه ردیف سوم با ردیف چهارم در جدول 5 ، متوجه می‌شویم که اگرچه بهبود دوره روز کم است، اما اگر بخواهیم دقت پیش‌بینی را بیشتر کنیم، باید تأثیر آن در نظر گرفته شود. این به این دلیل است که دوره روزانه می تواند تا حدی برای یادگیری الگوی بین روزهای هفته (یا تعطیلات قانونی) در همان هفته مفید باشد. به عنوان مثال، الگوهای ترافیک برای دوشنبه (شنبه) می تواند سهمی در پیش بینی روز سه شنبه (یکشنبه) داشته باشد.

علاوه بر این، ما همچنین تأثیر ساختار Res2Net را بر تناوب بررسی کردیم. تحت شرایط مشابه، متوجه می‌شویم که Res2Net برای مدل‌هایی که فقط مؤلفه‌های اخیر را در نظر می‌گیرند، بهبود بیشتری می‌یابد. در مقابل، افزایش برای تمام دوره های در نظر گرفته شده در مقایسه با آن کمتر است. این به احتمال زیاد به دلیل الگوهای مختلف اشتراک گذاری دوره های مختلف است که باعث تقویت و همچنین تضعیف ویژگی دوره اخیر می شود.

5.5. تحلیل همبستگی فضایی

برای نشان دادن اثر عملی ماتریس مجاورت خود تطبیقی چند مقیاسی، ما 15 حسگر از مجموعه داده PeMS08 را برای تجزیه و تحلیل انتخاب کردیم. همانطور که در شکل 6 نشان داده شده است، ماتریس مجاورت از پیش تعریف شده آنها، ماتریس مجاورت خود تطبیقی در یک مقیاس واحد و ماتریس مجاورت خود تطبیقی را در قالب نقشه های حرارتی تجسم کردیم . علاوه بر این، هر ردیف نشان دهنده درجه ارتباط بین سنسورها است، جایی که گره های همبستگی بیشتر، رنگ تیره تر است. مقایسه شکل 6 الف با شکل 6 ب، شکل 6ج، می بینیم که نمودار از پیش تعریف شده بسیار ساده تر از دو نمودار تطبیقی دیگر است. این به این دلیل است که نمودار از پیش تعریف شده فقط بر نحوه اتصال شبکه جاده تمرکز می کند و تغییرات در الگوهای گره را نادیده می گیرد. برای اعتبار بخشیدن به ایده خود، تغییرات ترافیکی این 15 گره را در هر روز مشخص کردیم و آن را به عنوان میانگین ترافیک در ساعت نشان دادیم ( شکل 6 d-f). به عنوان مثال، می بینیم که دو نقطه ای که در نمودار از پیش تعریف شده مرتبط نیستند، اما در الگوی ترافیک (حجم جریان یا روند تغییرات) از کادر آبی و کادر سبز به شدت مرتبط هستند ( شکل 6)e,f). در ماتریس مجاورت تطبیقی تک مقیاسی، به طور جزئی، اما ناقص آموخته می شود. در مقابل، در ماتریس مجاورت تطبیقی چند مقیاسی، رابطه آنها به طور کامل آموخته می شود. این همچنین نیاز به چند مقیاس را در زمینه پیش‌بینی ترافیک، به ویژه یادگیری ماتریس مجاورت تطبیقی نشان می‌دهد.

6. نتیجه گیری

در این مطالعه، ما یک مدل STGNN جدید پیشنهاد می‌کنیم که نه تنها اطلاعات فضایی-زمانی چند مقیاسی را در نظر می‌گیرد، بلکه یادگیری تطبیقی را از منظری دقیق انجام می‌دهد. مدل ما اولین مدلی است که از ایده Res2Net برای پیش‌بینی شبکه عصبی نمودار فضایی-زمانی استفاده می‌کند و کاربرد آن را برای توجه و پیچیدگی نمودار تأیید می‌کند. ما این مدل را بر روی دو مجموعه داده‌های دنیای واقعی در دسترس عموم تأیید می‌کنیم و نتایج نشان می‌دهد که مدل ما از مدل‌های پیشرفته موجود بهتر عمل می‌کند. علاوه بر این، ما نتایج پیش‌بینی را برای مناطق ترافیکی مختلف تجسم کردیم و آنها را با مدل پایه مقایسه کردیم، که به وضوح اثربخشی TRes2GCN پیشنهادی ما را نشان داد. متأسفانه، اگرچه مدل ما بسیاری از ویژگی های داده های مکانی-زمانی را در نظر می گیرد، ما تأثیر توزیع داده های زمانی را در نظر نمی گیریم. در آینده، در حالی که روش خود را برای کارهای پیش بینی واقعی تر به کار می بریم، مسائل فوق را در نظر می گیریم.

منابع

احمد، ام اس; کوک، تحلیل واقعیت افزوده داده‌های سری زمانی ترافیک آزادراه با استفاده از تکنیک‌های Box-Jenkins. ترانسپ Res. ضبط 1979 ، 722 ، 1-9. [ Google Scholar ]
چن، پی. دینگ، سی. لو، جی. وانگ، ی. پیش‌بینی وضعیت ترافیک کوتاه‌مدت با در نظر گرفتن تأثیر مکانی – زمانی بر بزرگراه شهری. ترانسپ Res. ضبط 2016 ، 2594 ، 61-72. [ Google Scholar ] [ CrossRef ]
اسمولا، ای جی; Schölkopf, B. A Tutorial on Support Vector Regression. آمار محاسبه کنید. 2004 ، 14 ، 199-222. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
لی، اچ. لیو، جی. لیو، RW; شیونگ، ن. وو، ک. کیم، تی.-اچ. یک روش خوشه‌بندی چند مرحله‌ای مبتنی بر کاهش ابعاد برای تحلیل مسیر کشتی قوی. Sensors 2017 ، 17 ، 1792. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
عقیب، م. محمود، ر. الزهرانی، ع. کاتب، ط. البشری، ع. Altowaijri، SM پیش بینی ترافیک هوشمندتر با استفاده از داده های بزرگ، محاسبات درون حافظه، یادگیری عمیق و پردازنده های گرافیکی. Sensors 2019 , 19 , 2206. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
بای، اس. Kolter، JZ; کلتون، وی. ارزیابی تجربی شبکه‌های کانولوشنال و تکراری عمومی برای مدل‌سازی توالی. arXiv , 2018; arXiv:1803.01271. [ Google Scholar ]
ون لینت، جی. هوگندورن، اس. Van Zuylen، HJ Freeway پیش‌بینی زمان سفر با شبکه‌های عصبی فضای حالت: مدل‌سازی پویایی فضای حالت با شبکه‌های عصبی مکرر ترانسپ Res. ضبط 2002 ، 1811 ، 30-39. [ Google Scholar ] [ CrossRef ]
تیان، ی. Pan, L. پیش بینی جریان ترافیک کوتاه مدت توسط شبکه عصبی بازگشتی حافظه کوتاه مدت. در مجموعه مقالات کنفرانس بین المللی IEEE 2015 در شهر هوشمند/SocialCom/SustainCom (SmartCity)، چنگدو، چین، 21 دسامبر 2015؛ صص 153-158. [ Google Scholar ]
چانگ، جی. گلچهره، سی. چو، ک. Bengio، Y. ارزیابی تجربی شبکه‌های عصبی بازگشتی دروازه‌ای در مدل‌سازی توالی. در مجموعه مقالات کارگاه آموزشی NIPS 2014 در مورد یادگیری عمیق، مونترال، QC، کانادا، 13 دسامبر 2014. [ Google Scholar ]
Sato, R. بررسی قدرت بیانی شبکه های عصبی گراف. arXiv ، 2020; arXiv:2003.04078. [ Google Scholar ]
بله، جی. ژائو، جی. بله، ک. Xu, C. چگونه یک معماری یادگیری عمیق مبتنی بر نمودار در حوزه ترافیک بسازیم: یک نظرسنجی. IEEE Trans. هوشمند ترانسپ سیستم 2020 ، 1–21. [ Google Scholar ] [ CrossRef ]
جیانگ، دبلیو. شبکه عصبی لو، جی. گراف برای پیش بینی ترافیک: یک نظرسنجی. arXiv , 2021; arXiv:2101.11174. [ Google Scholar ]
لیو، جی. Guan, W. خلاصه ای از روش های پیش بینی جریان ترافیک. جی. هایو. ترانسپ Res. توسعه دهنده 2004 ، 3 ، 82-85. [ Google Scholar ]
لی، دبلیو. وانگ، جی. فن، آر. ژانگ، ی. گوا، کیو. صدیق، سی. Ban، XJ پیش‌بینی وضعیت ترافیک کوتاه‌مدت از ساختارهای پنهان: دقت در مقابل کارایی. ترانسپ Res. قسمت C Emerg. تکنولوژی 2020 ، 111 ، 72-90. [ Google Scholar ] [ CrossRef ]
کومار، ک. پریدا، م. کاتیار، وی. پیش‌بینی کوتاه مدت جریان ترافیک برای یک بزرگراه غیر شهری با استفاده از شبکه عصبی مصنوعی. Procedia-Soc. رفتار علمی 2013 ، 104 ، 755-764. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
وو، ی. Tan، H. پیش‌بینی کوتاه‌مدت جریان ترافیک با همبستگی مکانی-زمانی در یک چارچوب یادگیری عمیق ترکیبی. arXiv , 2016; arXiv:1612.01022. [ Google Scholar ]
لیو، ی. ژنگ، اچ. فنگ، ایکس. Chen, Z. پیش‌بینی کوتاه‌مدت جریان ترافیک با Conv-LSTM. در مجموعه مقالات نهمین کنفرانس بین المللی 2017 در زمینه ارتباطات بی سیم و پردازش سیگنال (WCSP)، نانجینگ، چین، 11 تا 13 اکتبر 2017؛ صص 1-6. [ Google Scholar ]
ژانگ، جی. ژنگ، ی. چی، دی. لی، آر. یی، ایکس. لی، تی. پیش‌بینی جریان‌های جمعیتی در سطح شهر با استفاده از شبکه‌های باقیمانده عمیق مکانی-زمانی. آرتیف. هوشمند 2018 ، 259 ، 147-166. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
Kipf، TN; Welling, M. طبقه بندی نیمه نظارت شده با شبکه های کانولوشن گراف. arXiv , 2016; arXiv:1609.02907. [ Google Scholar ]
دیفرارد، ام. برسون، ایکس. Vandergheynst، P. شبکه‌های عصبی کانولوشنال روی نمودارها با فیلتر کردن طیفی سریع محلی. Adv. عصبی Inf. سیستم پردازش 2016 ، 29 ، 3844-3852. [ Google Scholar ]
ولیچکوویچ، پ. کوکورول، جی. کازانووا، آ. رومرو، آ. لیو، پی. Bengio، Y. گراف شبکه های توجه. arXiv , 2017; arXiv:1710.10903. [ Google Scholar ]
اتوود، جی. تاوسلی، دی. شبکه های عصبی کانولوشنال انتشار. در مجموعه مقالات پیشرفت‌ها در سیستم‌های پردازش اطلاعات عصبی، بارسلون، اسپانیا، 4 تا 9 دسامبر 2016. صفحات 1993-2001. [ Google Scholar ]
ژائو، ال. آهنگ، ی. ژانگ، سی. لیو، ی. وانگ، پی. لین، تی. دنگ، م. Li، H. T-gcn: یک شبکه کانولوشن گراف زمانی برای پیش‌بینی ترافیک. IEEE Trans. هوشمند ترانسپ سیستم 2019 ، 21 ، 3848–3858. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
لی، ی. یو، آر. شهابی، ج. Liu, Y. Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting. در مجموعه مقالات کنفرانس بین المللی در مورد بازنمایی های یادگیری، ونکوور، بریتیش کلمبیا، کانادا، 1 تا 3 مه 2018. [ Google Scholar ]
کوی، ز. هنریکسون، ک. که، ر. وانگ، ی. شبکه عصبی کانولوشنال بازگشتی نمودار ترافیک: یک چارچوب یادگیری عمیق برای یادگیری و پیش‌بینی ترافیک در مقیاس شبکه. IEEE Trans. هوشمند ترانسپ سیستم 2019 ، 21 ، 4883-4894. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
گوو، ک. هو، ی. کیان، ز. لیو، اچ. ژانگ، ک. سان، ی. گائو، جی. یین، ب. شبکه عصبی تکراری پیچیدگی نمودار بهینه شده برای پیش بینی ترافیک. IEEE Trans. هوشمند ترانسپ سیستم 2020 ، 22 ، 1138-1149. [ Google Scholar ] [ CrossRef ]
بای، جی. ژو، جی. آهنگ، ی. ژائو، ال. هو، ز. دو، آر. Li، H. A3T-GCN: توجه به شبکه کانولوشن نمودار زمانی برای پیش بینی ترافیک. ISPRS Int. J. Geo-Inf. 2021 ، 10 ، 485. [ Google Scholar ] [ CrossRef ]
یو، بی. یین، اچ. Zhu, Z. شبکه‌های کانولوشنال نمودار فضایی-زمانی: یک چارچوب یادگیری عمیق برای پیش‌بینی ترافیک. در مجموعه مقالات بیست و هفتمین کنفرانس بین المللی مشترک هوش مصنوعی، استکهلم، سوئد، 13 تا 19 ژوئیه 2018؛ صص 3634–3640. [ Google Scholar ]
وو، زی. پان، اس. لانگ، جی. جیانگ، جی. Zhang, C. Graph WaveNet برای مدل‌سازی نمودار عمیق فضایی-زمانی. در مجموعه مقالات بیست و هشتمین کنفرانس بین المللی مشترک هوش مصنوعی (IJCAI)، ماکائو، چین، 10 تا 16 اوت 2019. [ Google Scholar ]
گوا، اس. لین، ی. فنگ، ن. آهنگ، سی. وان، اچ. شبکه‌های کانولوشنال نمودار مکانی-زمانی مبتنی بر توجه برای پیش‌بینی جریان ترافیک. در مجموعه مقالات کنفرانس AAAI در مورد هوش مصنوعی، هونولولو، HI، ایالات متحده آمریکا، 27 ژانویه 2019؛ ص 922-929. [ Google Scholar ]
ژنگ، سی. فن، X. وانگ، سی. Qi، J. Gman: یک گراف شبکه چندتوجهی برای پیش‌بینی ترافیک. در مجموعه مقالات کنفرانس AAAI در مورد هوش مصنوعی، نیویورک، نیویورک، ایالات متحده آمریکا، 7 تا 12 فوریه 2020؛ ص 1234-1241. [ Google Scholar ]
گوو، ک. هو، ی. کیان، ز. سان، ی. گائو، جی. یین، ب. شبکه پیچیدگی نمودار پویا برای پیش بینی ترافیک بر اساس شبکه نهفته تخمین ماتریس لاپلاس. IEEE Trans. هوشمند ترانسپ سیستم 2020 ، 1-10. [ Google Scholar ] [ CrossRef ]
هو، جی. Chen, L. شبکه‌های پیچیدگی نمودار مکانی-زمانی مبتنی بر توجه چندگانه برای پیش‌بینی جریان ترافیک. در مجموعه مقالات کنفرانس مشترک بین المللی 2021 در مورد شبکه های عصبی (IJCNN)، آنلاین، 18 تا 22 ژوئیه 2021؛ صص 1-7. [ Google Scholar ]
لیانگ، ی. ژائو، ز. Sun، L. شبکه‌های عصبی کانولوشنال نمودار فضایی-زمانی پویا برای برانگیختن داده‌های ترافیکی با الگوهای گمشده پیچیده. arXiv , 2021; arXiv:2109.08357. [ Google Scholar ]
بای، ال. یائو، ال. وانگ، ایکس. لی، سی. Zhang، X. مدل‌سازی توالی مکانی-زمانی عمیق برای پیش‌بینی تقاضای مسافر در چند مرحله. ژنرال آینده. محاسبه کنید. سیستم 2021 ، 121 ، 25-34. [ Google Scholar ] [ CrossRef ]
ژو، جی. وانگ، کیو. تائو، سی. دنگ، اچ. ژائو، ال. Li, H. AST-GCN: شبکه کانولوشنال نمودار فضایی-زمانی افزوده شده ویژگی برای پیش بینی ترافیک. دسترسی IEEE 2021 ، 9 ، 35973–35983. [ Google Scholar ] [ CrossRef ]
یو، بی. یین، اچ. Zhu, Z. St-unet: یک شبکه u مکانی-زمانی برای مدل‌سازی سری‌های زمانی با ساختار نمودار. arXiv , 2019; arXiv:1903.05631. [ Google Scholar ]
آهنگ، سی. لین، ی. گوا، اس. وان، اچ. شبکه های کانولوشن گراف همزمان مکانی-زمانی: چارچوبی جدید برای پیش بینی داده های شبکه مکانی-زمانی. در مجموعه مقالات کنفرانس AAAI در مورد هوش مصنوعی، نیویورک، نیویورک، ایالات متحده آمریکا، 7 تا 12 فوریه 2020؛ ص 914-921. [ Google Scholar ]
گوو، ک. هو، ی. سان، ی. کیان، س. گائو، جی. یین، ب. شبکه های پیچیدگی نمودار سلسله مراتبی برای پیش بینی ترافیک. در مجموعه مقالات کنفرانس AAAI در مورد هوش مصنوعی، ونکوور، QC، کانادا، 2 تا 9 فوریه 2021؛ صص 151-159. [ Google Scholar ]
بای، ال. یائو، ال. لی، سی. وانگ، ایکس. وانگ، سی. گراف تطبیقی شبکه تکراری پیوسته برای پیش بینی ترافیک. arXiv ، 2020; arXiv:2007.02842. [ Google Scholar ]
هوانگ، جی. لیو، ز. ون در ماتن، ال. Weinberger، KQ شبکه های کانولوشنال به هم پیوسته متراکم. در مجموعه مقالات کنفرانس IEEE در مورد دید رایانه و تشخیص الگو، هونولولو، HI، ایالات متحده آمریکا، 21 تا 26 ژوئیه 2017؛ صفحات 4700–4708. [ Google Scholar ]
فنگ، ایکس. گوا، جی. کین، بی. لیو، تی. لیو، ی. شبکه های حافظه عمیق موثر برای استخراج رابطه تحت نظارت از راه دور. در مجموعه مقالات بیست و ششمین کنفرانس مشترک بین المللی هوش مصنوعی، ملبورن، استرالیا، 19 تا 25 اوت 2017؛ صفحات 4002-4008. [ Google Scholar ]
گائو، اس. چنگ، م.-م. ژائو، ک. ژانگ، X.-Y.; یانگ، M.-H. Torr، PH Res2net: معماری ستون فقرات چند مقیاسی جدید. IEEE Trans. الگوی مقعدی ماخ هوشمند 2021 ، 43 ، 652-662. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
هو، جی. شن، ال. Sun, G. شبکه های فشار و تحریک. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 23 ژوئن 2018؛ صص 7132–7141. [ Google Scholar ]
او، ک. ژانگ، ایکس. رن، اس. Sun, J. یادگیری باقیمانده عمیق برای تشخیص تصویر. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو، لاس وگاس، NV، ایالات متحده، 27-30 ژوئن 2016. صص 770-778. [ Google Scholar ]
چن، سی. پتی، ک. اسکاباردونیس، ا. ورایا، پ. جیا، Z. سیستم اندازه گیری عملکرد آزادراه: داده های آشکارساز حلقه معدن. ترانسپ Res. ضبط 2001 ، 1748 ، 96-102. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
Huber، PJ برآورد قوی یک پارامتر مکان. در پیشرفت در آمار ; Springer: برلین/هایدلبرگ، آلمان، 1992; صص 492-518. [ Google Scholar ]
لی، کیو. هان، ز. وو، X.-M. بینش عمیق تر در مورد شبکه های کانولوشن گراف برای یادگیری نیمه نظارتی. در مجموعه مقالات سی و دومین کنفرانس AAAI در مورد هوش مصنوعی، نیواورلئان، لس آنجلس، ایالات متحده آمریکا، 2 تا 7 فوریه 2018. [ Google Scholar ]
وو، زی. پان، اس. لانگ، جی. جیانگ، جی. چانگ، ایکس. ژانگ، سی. اتصال نقاط: پیش‌بینی سری‌های زمانی چند متغیره با شبکه‌های عصبی گراف. در مجموعه مقالات بیست و ششمین کنفرانس بین المللی ACM SIGKDD در زمینه کشف دانش و داده کاوی، رویداد مجازی، CA، ایالات متحده آمریکا، 6 تا 10 ژوئیه 2020؛ صص 753-763. [ Google Scholar ]

شکل 1. چارچوب ( الف ) TRes2GCN و ( ب ) TRes2GC-Submodule.

شکل 2. ( a ) بلوک ST TRes2GCN. چارچوب ( ب ) لایه توجه زمانی سلسله مراتبی و ( ج ) لایه پیچش گراف تطبیقی سلسله مراتبی.

شکل 3. مقایسه مدل در بازه های زمانی مختلف: ( الف ) PeMS04-RMSE، ( ب ) PeMS04-MAE، ( ج ) PeMS08-MAPE، ( د ) PeMS08-RMSE، ( e ) PeMS04-MAE و ( f ) PeMS08- MAPE.

شکل 4. تجسم تأثیر اجزا بر روی خطای پیش‌بینی (به عنوان مثال PeMS08)، ( الف ) RMSE، ( ب ) MAE و ( ج ) MAPE. نوارهای خطا نشان دهنده تغییرات شناور معیارهای پیش بینی شده در 60 دقیقه است. خط قرمز نشان دهنده معیارهای نتیجه پیش بینی شده در 5 دقیقه است. خط آبی نشان دهنده معیارهای نتیجه پیش بینی شده در 30 دقیقه است. خط بنفش نشان دهنده معیارهای نتیجه پیش بینی شده در 60 دقیقه است.

شکل 5. تجسم نتایج و خطاهای پیش‌بینی در بازه 0-60 دقیقه حسگر #149.

شکل 6. بخشی از ماتریس مجاورت در مقیاس های مختلف و تغییرات میانگین ساعتی جریان ترافیک (به عنوان مثال PeMS08). ( الف ) ماتریس مجاورت از پیش تعریف شده. ( ب ) ماتریس مجاورت خودسازگار در یک مقیاس. ( ج ) ماتریس مجاورت خودسازگار در مقیاس های چندگانه. ( د ) تغییرات جریان ساعتی برای پانزده گره اول. ( ه ) تغییرات ترافیک ساعتی گره 3 و گره 4. ( f ) تغییرات ترافیک ساعتی گره 10 و گره 11.

مقالات داخلی و بین المللی

بدون دیدگاه

دیدگاهتان را بنویسید لغو پاسخ

برای نوشتن دیدگاه باید وارد بشوید.

مشاورین هوش پیروزی

شبکه کانولوشن گراف فضایی-زمانی برای پیش بینی ترافیک چند مقیاسی

شبکه کانولوشن گراف فضایی-زمانی برای پیش بینی ترافیک چند مقیاسی

چکیده

کلید واژه ها:

1. مقدمه

2. کارهای مرتبط

2.1. مدل های کوتاه مدت پیش بینی حجم ترافیک

2.2. شبکه عصبی نمودار فضایی و زمانی برای پیش بینی ترافیک

3. روش شناسی

3.1. مقدماتی

3.2. طراحی TRes2GCN

3.3. چند دوره زمانی

3.4. روش ضبط ویژگی فضایی و زمانی

3.5. اتصال متراکم

3.6. فیوژن چند جزئی

4. آزمایش و نتیجه

4.1. مجموعه داده ها

4.2. روش های پایه

4.3. تنظیمات آزمایش

4.4. مقایسه نتایج

5. بحث

5.1. تأثیر روش اتصال و ویژگی چند مقیاسی

5.2. تأثیر بردار جاسازی گره و ماتریس مجاورت تطبیقی

5.3. قابلیت پیش بینی در بازه های مختلف

5.4. تحلیل دوره ای زمانی

5.5. تحلیل همبستگی فضایی

6. نتیجه گیری

منابع

قبلیاستخراج اطلاعات مکانی – زمانی اشیاء بر اساس ویدئوهای نظارتی و مدل سطح دیجیتال

بعدیکاهش مقیاس رطوبت خاک AMSR-E در شمال چین با استفاده از رگرسیون جنگل تصادفی

مطالب مرتبط ...

آموزش مقاله نویسی در رشته ادبیات فارسی

تأثیر همسایگی درونیابی DEM بر عوامل زمین

رگرسیون وزنی جغرافیایی تطبیقی ​​غیر منفی برای تخمین تراکم جمعیت بر اساس نور شب

بدون دیدگاه

دیدگاهتان را بنویسید لغو پاسخ

درباره سرزمین فناوری مکانی GISLAND

دسترسی سریع

اطلاعات

خبرنامه

خبرنامه

درباره سرزمین فناوری مکانی GISLAND

دسترسی سریع

اطلاعات

دسترسی سریع

رگرسیون وزنی جغرافیایی تطبیقی غیر منفی برای تخمین تراکم جمعیت بر اساس نور شب