1. مقدمه
حمل و نقل عمومی به عنوان حلقه اتصال فضاهای شهری، نقش مهمی در توسعه شهرها دارد. این نه تنها حالت های سفر مردم را غنی می کند، بلکه توسعه شهری را ارتقا می دهد و الگوی شهرها را تغییر می دهد. به عنوان بخشی از سیستم حمل و نقل عمومی، تاکسی و مترو دو حالت مهم در مناطق شهری هستند. تعامل آنها عملکرد ترافیک شهری را بهبود می بخشد. لی و همکاران [ 1 ] این دیدگاه را تأیید کرد و اشاره کرد که یک ایستگاه متروی تازه ساخته شده رابطه تعاملی با توزیع فضایی جریان مسافر تاکسی در اطراف آن دارد.
علاوه بر این، توزیع مکانی-زمانی خدمات تاکسی اغلب نقش مرجع مهمی در مطالعه توسعه شهری ایفا می کند [ 2 ]. در رانندگی روزانه تاکسی ها، سیستم موقعیت یاب جهانی (GPS) بارگذاری شده بر روی آن، حجم زیادی از داده های مسیر را ثبت می کند و به دلیل کامل بودن، به موقع بودن و دقت بالا، معمولاً در داده کاوی، محاسبات شهری، هوشمند کاربرد فراوانی دارد. سیستم ترافیک، برنامه ریزی شهری هوشمند و غیره [ 3 ].
حمل و نقل مترو به عنوان یکی از روشهای اصلی حملونقل عمومی شهری، ایستگاههای آن خدماتی مانند جابجایی، پارکینگ، توزیع و راهنمایی را ارائه میکنند که ارتباط تنگاتنگی با اقتصاد، سیاست، فرهنگ و جامعه دارد.
از آنجایی که انتخاب مکان ایستگاه مترو بخش مهمی از فرآیند ساخت مترو است، حتی نقش مهمی در برنامه ریزی شهری و توسعه آینده شهر ایفا می کند. عناصر اصلی که بر برنامه ریزی ایستگاهی خط ترانزیت ریلی شهری تأثیر می گذارد را می توان به دو نکته خلاصه کرد: (1) وضعیت فعلی و تقاضای ترافیک آینده. (2) ویژگی کاربری زمین در اطراف ایستگاه های حمل و نقل ریلی شهری [ 4]. علاوه بر این، ساخت مترو دارای ویژگی های هزینه ساخت بالا، مدت زمان طولانی ساخت و ساز، ریسک بالا است و بازسازی یا جابجایی آن پس از اتمام آسان نیست، بنابراین انتخاب زود هنگام ایستگاه مترو بسیار مهم است. علاوه بر این، مکان فعلی عمدتاً بر اساس تراکم جمعیت، ویژگیهای کاربری منطقهای و شرایط ترافیکی است، کمتر با توجه به ویژگیهای سفر ساکنان شهری، که منجر به ناهماهنگی بین مکان و نیازهای واقعی مردم میشود. به همین دلیل برای رفع مشکلات فوق یک سایت انتخاب علمی و منطقی را پیشنهاد می کنیم.
بر اساس دادههای مسیر GPS تاکسیها در پکن و دادههای ایستگاههای مترو موجود، این مقاله موقعیت ایستگاههای مترو جدید را پیشبینی میکند تا به برنامهریزی انتخاب مکان ایستگاههای آینده کمک کند. برای مسیر رانندگی هر تاکسی، ابتدا هر مبدا مسافر (O) و مقصد (D) را در ساعات کاری مترو محاسبه میکنیم تا وضعیت فعلی و تقاضای ترافیک آینده را بررسی کنیم. علاوه بر این، با توجه به پوشش ایستگاههای مترو، دادههای OD را طبقهبندی میکنیم و الگوریتم خوشهبندی مدل مخلوط گاوسی (GMM) را برای خوشهبندی انتخاب میکنیم تا محدوده منطقهای و برنامهریزی مسیر ایستگاههای آینده را پیشبینی کنیم. پس از آن، ما یک تجزیه و تحلیل آماری از ویژگی های کاربری زمین در برخی از مناطق پیش بینی شده انجام می دهیم.
در این مقاله، مشارکت های اصلی ما به شرح زیر است:
-
ما از LeaderRank وزندار برای رتبهبندی ایستگاههای مترو استفاده کردیم، آن جهت سفر مسافران و تأثیر رابطه پیوند شبکه پویا و پیچیدهای که توسط سفر مسافر در سایت شکل میگیرد را در نظر میگیرد.
-
ما از یک روش خوشهبندی بر اساس مسیر تاکسی برای پیشبینی موقعیت ایستگاههای مترو استفاده کردیم. نتایج تجربی نشان میدهد که روش ما برای تعیین موقعیت ایستگاههای مترو مفید است.
-
ما روشی را برای انتخاب بهترین پارامترهای خوشهبندی برای پیشبینی بهتر مکان ایستگاهها پیشنهاد کردیم. علاوه بر این، استفاده از زمین در اطراف سایتهای پیشبینیشده را برای یافتن قانون استفاده از زمین برای ایستگاههای بالقوه مترو مشخص کردیم.
بقیه این مقاله به شرح زیر سازماندهی شده است. بخش 2 کار مرتبط را مرور می کند. بخش 3 تعاریف اصلی مقاله را ارائه می دهد. بخش 4 مدلی از پیش بینی ایستگاه مترو را ارائه می دهد. بخش 5 داده کاوی را بر روی داده های مسیر تاکسی ها، تجزیه و تحلیل و پیش بینی موقعیت ایستگاه های متروی پکن انجام می دهد. در نهایت، بخش 6 مقاله را به پایان می رساند و کارهای آینده را ارائه می دهد.
2. کارهای مرتبط
داده کاوی ترافیک یک موضوع تحقیقاتی مهم در سال های اخیر است. در حال حاضر، انتخاب مکان ایستگاه های ترافیکی در شبکه حمل و نقل عمدتاً بر سه جنبه زیر متمرکز است: بررسی داده های ترافیکی، شناسایی ایستگاه های مهم در شبکه حمل و نقل، مطالعه برنامه ریزی و مدل سازی سیستم حمل و نقل. آثار مربوط به سه بعد فوق در زیر بخشهای بعدی بررسی خواهد شد.
2.1. مطالعه بر روی داده های ترافیک
در حال حاضر دادههای ترافیکی دارای ارزش تحقیقاتی زیادی هستند که میتواند شرایط فعلی ترافیک شهری را منعکس کند و میتواند برای برنامهریزی شهری و بهبود سیستم ترافیکی شهر مورد استفاده قرار گیرد. به عنوان مثال، لیو و همکاران. [ 5 ] ضریب تراکم را به عنوان معیاری برای انعکاس وضعیت تراکم ترافیک با استفاده از مسیرهای GPS تاکسی به منظور بهبود مدیریت ترافیک شهری تعریف کرد. کروچه و همکاران [ 6 ] تلاش کرد تا داده ها را از مدل ها، نظرسنجی های سنتی و کلان داده ها یکپارچه کند. آنها چارچوبی را برای تخمین تقاضای سفر پیشنهاد کردند که امکان تعامل و هم افزایی بین دادههای حاصل از نظرسنجیهای سنتی، دادههای شناور خودروهای حاصل از GPS و روشهای سنتی را فراهم میکند. زو و همکاران [ 7] یک تاکسی OD و مجموعه داده های خیابانی را در پکن معرفی کرد تا الگوهای پویای مکانی-زمانی تحرک شهری در خیابان های شهری پکن را بررسی کند. در [ 8 ]، نویسندگان از یک الگوریتم DBSCAN بهبود یافته برای گروه بندی نقاط مشابه در هر بازه زمانی در طول سفر تاکسی استفاده کردند. آنها رویکردی را برای کشف الگوهای حرکتی و رفتار افراد پیشنهاد کردند. آنتونیو کومی و همکاران [ 9 ] سفرها و متعاقباً برای تخمین OD را از طریق نمونه گیری و آمار شناسایی کرد. اگرچه مطالعات زیادی بر روی شیوه خاصی از حمل و نقل عمومی متمرکز شده است، اما مطالعات کمی در مورد رابطه بین وجهی و تأثیر متقابل بین چندین روش حمل و نقل وجود دارد.
برخی از مطالعات مانند جیانگ و همکاران. [ 10 ] از مدلهای رگرسیون دوجملهای منفی برای بررسی رابطه بین سفرهای تاکسی و سواری در مترو استفاده کرد. در [ 11 ]، نویسندگان یک سیستم پیشنهادی طرح انتقال اتوبوس-مترو را طراحی کردند. این سیستم با استفاده از دادههای GPS اتوبوس تاریخی و لحظهای و دادههای ایستگاه ورود مترو، مسیرهای متفاوتی را به مسافر و زمان تخمینی سفر برای هر مسیر میدهد.
اگرچه تحقیقات فوق تأثیر شیوه های حمل و نقل موجود را مورد توجه قرار می دهد، اما مطالعات کمی در مورد توسعه و برنامه ریزی یک حالت ترافیکی خاص در آینده وجود دارد. به منظور پر کردن این شکاف، هدف این مقاله بررسی رابطه بین تاکسی و مترو است. ما خطوط مترو و مکان ایستگاه های آینده را از طریق داده کاوی در مسیرهای تاکسی پیش بینی می کنیم.
2.2. رتبه بندی گره ها در شبکه های پیچیده
برای تحقیق بر روی گرههای رتبهبندی در شبکههای پیچیده، محققان الگوریتمهای مرتبسازی بسیاری را با توجه به مسائل مختلف عملی طراحی کردهاند [ 12 ] که عمدتاً بر اساس چهار مسئله است. اول تعداد همسایگان گره است، مانند روش تجزیه k-shell [ 13]، دوم در نظر گرفتن مسیر بین گره ها است. سوم بر اساس بردارهای ویژگی است که نه تنها تعداد گره های همسایه را در نظر می گیرد، بلکه ویژگی های هر گره را نیز در نظر می گیرد. چهارم، بر اساس شبکه پویا که تأثیر تغییرات گره های شبکه بر روی شبکه را در نظر می گیرد. در میان روش های رتبه بندی گره ها بر اساس بردارهای ویژگی، الگوریتم PageRank و الگوریتم بهبود یافته آن LeaderRank به عنوان یک الگوریتم رتبه بندی اهمیت گره شبکه هدایت شده، به طور گسترده در زمینه های مختلف تحقیقاتی مانند رتبه بندی اهمیت صفحات وب استفاده می شود [ 14 ]. ، رتبه بندی گره های شبکه برق [ 15 ]، رتبه بندی شبکه سهام [ 16 ]، به دنبال پخش کننده های تأثیرگذار در شبکه های اجتماعی پیچیده [ 17 ]]. علاوه بر این، الگوریتم LeaderRank گره های پس زمینه را بر اساس PageRank اضافه می کند. از نظر سرعت همگرایی و شناسایی گره های مهم شبکه، بهتر از PageRank عمل می کند [ 18 ]. از این رو سعی می کنیم این الگوریتم را در تحقیقات شبکه حمل و نقل اعمال کنیم.
2.3. برنامه ریزی و مدل سازی سیستم حمل و نقل
انتخاب مکان همواره مورد توجه محققان بوده است. روش های سنتی مکان یابی به نیروی انسانی و هزینه های زمانی زیادی نیاز دارند. بسیاری از محققان [ 19 ، 20 ، 21 ، 22 ] از روش های مدل سازی ریاضی برای مطالعه مسئله مکان یابی در این مرحله استفاده می کنند. این روش نه تنها باعث صرفه جویی در زمان و هزینه های نیروی انسانی می شود، بلکه دقت نتایج را نیز تا حدودی بهبود می بخشد.
توسعه یک پروژه سیستم حمل و نقل ممکن است شامل طراحی عملکردی تأسیسات زیرساختی جدید مانند جاده ها، راه آهن، فرودگاه ها باشد. ارزیابی برنامه های سرمایه گذاری بلند مدت؛ تعریف طرح های گردش و تنظیم برای شبکه های جاده ای شهری. و طراحی استراتژی ها برای کنترل ترافیک و سیستم های اطلاعاتی پیشرفته جدید و غیره [ 23 ]. به طور سنتی، برنامه ریزی و طراحی سیستم های حمل و نقل اغلب از طریق مدل های ریاضی انجام می شود. G. Birgillito و همکاران. [ 24] یک سیستم حمل و نقل را در یک فضای ناپیوسته تجزیه و تحلیل کردند – آنها متغیرهایی را بررسی کردند که بر انتخاب سفر مسافران و وزن نسبی آنها در مدل فضای ناپیوسته تأثیر می گذارد تا به منظور برنامه ریزی و طراحی رویه هایی برای بهبود کیفیت تحرک.
مکان ایستگاه مترو بخش مهمی از حمل و نقل عمومی شهری است که به طور مستقیم بر توسعه ترافیک شهری و کارایی سفر ساکنان شهری تأثیر می گذارد. در تحقیقات موجود در مورد مکان های ایستگاه مترو، چرچ و کلیفورد [ 19 ] روش مکان ترانزیت ریلی را مورد مطالعه قرار دادند. آنها شبکه ها را در محدوده خط ترانزیت ریلی پیشنهادی تقسیم کردند و مجموعه ای از روش های ارزیابی را برای امتیاز دهی به هر شبکه توسعه دادند. در نهایت از الگوریتم Dijkstra برای انتخاب مسیر با حداقل وزن به عنوان مسیر بهینه استفاده کردند. یانگ و همکاران [ 25] با بررسی قیمت قطعات زمین معامله شده در رابطه با فاصله آنها تا نزدیکترین ایستگاه های مترو از طریق مدل های رگرسیون با استفاده از یک رویکرد لذت جو، دریافت که هم ترازی مترو و استقرار ایستگاه هسته جوامع مستقر را دور زده است. ژانگ و همکاران [ 26 ] از مدل پنهان مارکوف و الگوریتم بهینه ساز تعادل (EO) برای بهبود شبکه حمل و نقل عمومی استفاده کرد. این مدل با استفاده از داده های ساعت شلوغی عصر بارگذاری شده است و هدف آن کاهش هزینه (زمان جابجایی کل) و افزایش سفرهای امکان پذیر در شبکه های حمل و نقل عمومی است.
محققین پیگیری تعداد جمعیت، کاربری اراضی اطراف و سایر عوامل را در ساخت مدل در نظر می گیرند و از تئوری تحقیقات عملیاتی برای بهینه سازی تابع هدف مدل برای یافتن بهترین ایستگاه حمل و نقل ریلی استفاده می کنند. به عنوان مثال، Gendreau و Laporte [ 20 ] از روش Tabu Research استفاده می کنند که خطوط راه آهن ساخته شده را به شبکه تقسیم می کند. آنها تأثیر طرح مکان یابی ایستگاه ترانزیتی ریلی شهری را بر جذب جریان مسافر خط، تعداد و مکان ایستگاه با هدف به حداکثر رساندن کل جمعیت تحت پوشش ایستگاه بهینه سازی کردند. چین و استیون [ 21] یک مدل بهینه سازی فاصله بین ایستگاه های حمل و نقل را بر اساس حداقل هزینه کل با در نظر گرفتن توزیع تراکم سفر مسافر، سرعت سفر و هزینه زمان ایجاد کرد. استیون و همکاران [ 22 ] شعاع پوشش ایستگاه حمل و نقل ریلی و وضعیت توسعه و بهره برداری از زمین در طول خط را مطالعه کرده اند. آنها با تجزیه و تحلیل رابطه بین آنها، یک مدل تحلیل رگرسیون خطی بر اساس این دو عامل ایجاد کردند تا ناحیه تأثیرگذار خط ترانزیت ریلی را بدست آورند. الکساندر کرول و همکاران [ 27] کاربرد یک الگوریتم ژنتیک را برای دو مرحله از طراحی سیستم مترو ارائه کرد. مرحله اول چیدمان ایستگاههای مترو را از طریق دادههای تراکم جمعیت شهری تعیین میکند که به طور بهینه نیازهای حمل و نقل ساکنان را برآورده میکند. مرحله دوم با در نظر گرفتن به حداقل رساندن هزینه های ساخت، توپولوژی بهینه خطوط اتصال ایستگاه ها را ایجاد می کند.
از طریق تحقیق در مورد انتخاب مکان ایستگاه های حمل و نقل ریلی، مشخص شد که انتخاب مکان فعلی عمدتاً بر اساس تراکم جمعیت [ 20 ، 27 ]، محیط منطقه ای [ 22 ] و شرایط ترافیکی [ 21 ] است، بدون در نظر گرفتن جامع عوامل مختلف. و کمتر در نظر گرفتن ویژگی های سفر ساکنان شهری که منجر به انحراف بین انتخاب مکان و نیازهای واقعی مردم می شود. بنابراین، انتظار می رود این مقاله به طور موثر داده های ترافیکی عظیم را تجزیه و تحلیل کند، ویژگی های سفر افراد را استخراج کند و از آنها به عنوان مبنایی برای مکان یابی ایستگاه مترو استفاده کند تا مشکل مکان ایستگاه مترو را از وضعیت واقعی حل کند.
3. تعاریف
در این بخش، تعاریف رویکرد ما به تفصیل معرفی و توضیح داده شده است.
تعریف 1
(مدل جریان) . اجازه دهید و مجموعه ای از جریان های OD تاکسی و جریان های مسافری مترو باشد. سپس ، نشان دهنده یک حرکت جریان جهت دار از ایستگاه مبدا است در زمان به ایستگاه مقصد در زمان ، جایی که ، ، و نام ایستگاه مترو هستند و به ترتیب مختصات مبدا و مقصد هستند.
تعریف 2
(شبکه مترو) . دو توصیف توپولوژیکی اصلی برای ساخت شبکه های حمل و نقل پیچیده وجود دارد: فضای L و فضای P [ 28 ]. روش L space ایستگاه های ترافیکی را به عنوان گره های نمودار در نظر می گیرد. اگر دو ایستگاه در مجاورت یک خط ترافیک مشخص باشند، لبه ای وجود دارد که دو گره را به هم متصل می کند. روش فضای P نیز یک ایستگاه حمل و نقل را به عنوان گره گراف در نظر می گیرد. اگر خطوط ترافیکی قابل دسترسی بین دو ایستگاه وجود داشته باشد، یک لبه وجود دارد که دو گره را به هم متصل می کند. شکل 1یک شبکه مترو ساده را نشان می دهد که با دو روش توصیفی مختلف نشان داده شده است. بدیهی است که شبکه ساخته شده به روش فضای L یک شبکه فرعی است که با روش فضای P ساخته شده است. Space L وضعیت واقعی شبکه ایستگاه مترو را منعکس می کند، فقط نشان می دهد که دو ایستگاه واقعاً در یک خط ترافیک مجاور هستند، در حالی که فضای P وضعیت اتصال ایستگاه های شبکه ترافیک را بهتر منعکس می کند. بنابراین، این مقاله از روش فضای P برای ساخت یک شبکه مترو وزن دار استفاده می کند.
یک شبکه مترو وزن دار شامل ایستگاه های مترو و لبه های وزن دار بین آنها است که به صورت بیان می شود ، مجموعه ای از ایستگاه ها است، مجموعه ای با لبه های جهت دار است، مجموعه ای از وزنه های لبه هدایت شده است، تعداد مسافرانی است که از ایستگاه i به ایستگاه j می روند.
تعریف 3.
اجازه دهید مجموعه ای از مناطق خوشه بندی باشد. سپس ، جایی که به معنای مجموعه مختصات رأس ناحیه مستطیلی است، به معنای وزن منطقه خوشه بندی k است. شکل 2 تعاریف را نشان می دهد با مثال های گرافیکی
4. روش شناسی
از آنجایی که داده های توزیع OD تاکسی ها عمدتاً تحت تأثیر تراکم شبکه جاده های شهری و تراکم POI شهری است، ما فرض می کنیم که داده های OD تاکسی در پکن به طور کلی توزیع گاوسی دو بعدی است، یعنی هر چه به شهر نزدیک تر باشد. همانطور که در شکل 3 نشان داده شده است، چگالی داده OD بالاتر است. این نشان می دهد که توزیع بارها و بارها در مناطقی فراتر از پوشش ایستگاه های مترو موجود است، هر چه رنگ قرمز عمیق تر باشد، تقاضای سفر در این منطقه بیشتر است. از سوی دیگر، فراتر از پوشش ایستگاه های مترو موجود، مکان هایی با تراکم تراکم نقاط تردد و تردد، تقاضای سفر بیشتری دارند، در همین حال، ترانزیت ریلی موجود آن را پوشش نمی دهد، بنابراین ممکن است به یک ترانزیت جدید تبدیل شود. ایستگاه. و هدف ما استخراج این مناطق با روش زیر است:
-
داده های OD تاکسی ها را با توجه به پوشش ایستگاه های مترو طبقه بندی کنید.
-
برای داده های OD که فراتر از پوشش هستند، خوشه بندی GMM را انجام دهید و تأثیر پارامترهای مختلف را بر نتایج پیش بینی مطالعه کنید.
-
از طریق الگوریتم رهبرانک، چند ایستگاه ویژه دریافت کنید و داده های O یا D موجود در پوشش این ایستگاه را برای آزمایش ها انتخاب کنید تا گسترش آینده ایستگاه را پیش بینی کنید.
علاوه بر این، برای بررسی تأثیر آزمایشی این روش، دادههای سایت مترو در سال 2013 و دادههای OD تاکسی را در همان دوره زمانی با دادههای آزمایشی انتخاب میکنیم و از این روش برای پیشبینی سایت جدید و سایت برنامهریزیشده استفاده میکنیم. بعد از 2013
4.1. مدل GMM
روش خوشه بندی GMM فرض می کند که توزیع احتمال مکانی نقاط داده OD تاکسی را می توان با توابع احتمال توزیع گاوسی متعدد تقریب زد. این یک مدل توزیع احتمال با فرم زیر است
کجا در معادله ( 1 ) ، ، چگالی توزیع گاوس است و به معنای k امین جزء در مدل ترکیبی است. برای هر مدل فرعی باید پارامتر را پیدا کنیم ، ، . یعنی انتظار، کوواریانس و وزن هر مدل فرعی در مدل ترکیبی. با این حال، این پارامترها را نمی توان به طور مستقیم با استخراج محاسبه کرد. بنابراین از الگوریتم انتظار-بیشینه سازی استفاده می کنیم که توسط Dempster و همکارانش خلاصه و پیشنهاد شده است. [ 29 ] تکرار کردن.
وقتی از روش خوشهبندی مخلوط گاوسی بر اساس کتابخانه اسکلرن پایتون استفاده میکنیم، باید پارامتر تعداد مؤلفهها را تعیین کنیم. در مدل GMM نحوه تعیین این پارامتر به تفصیل در بخش 5.5 مورد بحث قرار خواهد گرفت .
علاوه بر این، به منظور تجسم منطقه خوشهبندی همانطور که در شکل 4 نشان داده شده است ، مستطیل محدود شده منطقه خوشهبندی را به دست میآوریم تا از طریق الگوریتم زیر برای تحقیقات بعدی ما راحت باشد.
4.2. مدل جریان مسافر وزنی LeaderRank
برای ارزیابی اهمیت ایستگاهها از طریق دادههای سیستم Auto Fare Collection (AFC)، روش سنتی استفاده از روشهای آماری برای محاسبه تعداد افراد ورودی و خروجی به هر ایستگاه و رتبهبندی ایستگاهها بر اساس تعداد جریان مسافر است. این روش از عوامل نسبتاً ایستا به عنوان مبنای ارزیابی سایت استفاده می کند و جهت سفر مسافر و تأثیر رابطه پیوند شبکه پویا و پیچیده شکل گرفته از سفر مسافر را در سایت در نظر نمی گیرد. مزیت LeaderRank این است که تعداد مسافران در ایستگاه و همچنین جریان مسافران را در نظر می گیرد.
سیستم AFC اطلاعات ایستگاه خاموش و زمان مسافران را ثبت می کند و جریان مسافران بین هر ایستگاه و ایستگاه یک شبکه وزنی هدایت شده را تشکیل می دهد، هر ایستگاه می تواند به عنوان یک گره در شبکه دیده شود، در حالی که ایستگاه های ورودی و خروجی در داده های AFC می توانند به عنوان پیوندهایی به این گره ها دیده شود. بنابراین، ما از الگوریتم وزنی LeaderRank برای تعیین کمیت اهمیت هر ایستگاه مترو در کل شبکه مترو استفاده خواهیم کرد. برای ایستگاههایی با مقادیر بالاتر Weighted LeaderRank (WLR)، ایستگاه در سراسر شبکه مترو مشغول است.
در این مقاله، ما از متروی پکن به عنوان مورد آزمایشی استفاده می کنیم و معادله وزنی شاخص LeaderRank را برای ایستگاه i به صورت زیر تعریف می کنیم :
که در معادلات ( 3 ) و ( 4 )، کل جریان مسافر از ایستگاه j است. این معادله فرآیند تخصیص و کسب مقادیر را توصیف می کند. هنگامی که معادله ( 3 ) تکرار می شود بار و تمایل به همگرایی، معادله متوقف می شود.
5. تجزیه و تحلیل و استخراج مناطق ایستگاه آینده بر اساس تاکسی OD
در این بخش به تحلیل و استخراج مناطق ایستگاه های آینده بر اساس OD تاکسی می پردازیم. ابتدا تاکسی مسیر رانندگی تمیز می شود. سپس هر مبدا مسافر (O) و مقصد (D) را در ساعات کار مترو محاسبه می کنیم. علاوه بر این، با توجه به پوشش ایستگاههای مترو، دادههای OD را طبقهبندی کرده و از مدل مخلوط گاوسی برای پیشبینی محدوده منطقهای و برنامهریزی مسیر ایستگاههای آینده استفاده میکنیم. در نهایت، ما به تجزیه و تحلیل آماری ویژگیهای کاربری زمین در برخی از مناطق پیشبینیشده میپردازیم.
5.1. پاکسازی داده های مسیر
داده های مسیر تاکسی از سیستم موقعیت یابی ماهواره ای GPS در 21590 تاکسی یک شرکت تاکسیرانی در پکن بدست می آید. این داده ها شامل اطلاعات رانندگی هر وسیله نقلیه در ژوئن 2013 (شناسه پایانه، شماره پلاک، زمان تولید، طول و عرض جغرافیایی، سرعت، وضعیت وسیله نقلیه و غیره) است. جدول 1 ساختار این داده ها را نشان می دهد.
پیش پردازش داده های تاکسی به مراحل زیر تقسیم می شود:
-
از آنجایی که سیستم GPS دارای خطاهای خاصی است، لازم است اطلاعات خام GPS تاکسی را اصلاح کرد تا دقت موقعیت یابی GPS بهبود یابد. فاصله طول و عرض جغرافیایی به ترتیب 0.002-456 درجه و 0.002 241 درجه است.
-
ما دادههای GPS تاکسی را بر اساس پلاک مرتب کردیم و دادههای استثنایی شامل حذف ویژگیهای غیرمرتبط با مطالعه در این مقاله، دادههای استثنای وضعیت GPS، شناسه اشتباه پلاک و زمان ثبت اشتباه را حذف کردیم.
-
منطقه تقریبی پکن در 115.7 تا 117.4 درجه طول شرقی و 39.4 تا 41.6 درجه عرض شمالی واقع شده است. در این منطقه، دادههای جمعآوریشده از دادههای مسیر GPS را که فراتر از مرزهای طول و عرض جغرافیایی هستند، حذف کردیم تا افزونگی دادهها را کاهش دهیم.
-
ما دادههای OD سفر تاکسیها را بهدست آوردیم و دادههایی را که زمان سفر آنها خارج از زمان عملیات مترو (6:00 تا 22:00) است، حذف کردیم. هر ردیف از دادههای بهدستآمده در نهایت شامل شناسه وسیله نقلیه، زمان تحویل / تحویل و مکان است.
یک دوره خدمات کامل تاکسی از زمانی که مسافران سوار می شوند شروع می شود و در مقصد به پایان می رسد. در آزمایش ما، دادههای OD همچنین دارای ویژگیهای دیگری مانند ID، زمان شروع، مکان تحویل، زمان پایان، مکان تخلیه است.
5.2. ایستگاه متروی پکن
داده های ایستگاه مترو در پکن با گرفتن اطلاعات مربوط به نقشه گود به دست می آید. برای آزمایش ما، ایستگاه های متروی جدید ساخته شده از سال 2013 تا 2020 (96 ایستگاه) و ایستگاه های مترو برنامه ریزی (84 ایستگاه) همانطور که در شکل 5 نشان داده شده است.
با توجه به ایستگاههای مترو که در سال 2013 ساخته شدهاند، فرض میکنیم که محدوده تحت پوشش ایستگاه دایرهای به شعاع 1 کیلومتر است و دادهها را با توجه به اینکه آیا OD تاکسی در همه پوشش قرار دارد به چهار دسته تقسیم کردیم. مناطقی که در جدول 2 نشان داده شده است.
5.3. تجزیه و تحلیل ODs تاکسی
پس از پیش پردازش داده های مسیر 21590 تاکسی در پکن، بیش از 4 میلیون داده OD تاکسی را به دست آورده ایم. از جدول 2 ، می بینیم که حدود نیمی از داده ها برداشت یا حذف می شوند که خارج از پوشش ایستگاه های مترو است، بنابراین معتقدیم که ایستگاه های مترو موجود به طور کامل نیازهای سفر مردم را برآورده نمی کنند. علاوه بر این، 30 درصد از موقعیت های حمل و نقل تاکسی ها خارج از پوشش ایستگاه های مترو است. بنابراین، میتوان فرض کرد که برخی از مسافران استفاده از ایستگاه مترو را بهعنوان مقصد (یا نقطه عزیمت) خود انتخاب میکنند و به مناطقی میروند که تحت پوشش ایستگاههای مترو نیستند، در حالی که 16 درصد از نقاط شروع و پیادهروی تاکسیها را تشکیل میدهند. خارج از پوشش ایستگاه مترو
به طور کلی، سیستم متروی موجود به طور کامل نیاز سفر مردم را برآورده نمی کند و درصد زیادی از مردم در مناطق خارج از پوشش خطوط مترو تردد می کنند.
5.4. پیش بینی موقعیت ایستگاه های مترو
در این بخش، نحوه استفاده از مدل GMM برای انتخاب مناطق و مرتبسازی ایستگاههای مترو موجود با الگوریتم LeaderRank برای پیشبینی خطوط جدید مترو در آینده و توسعه آینده خطوط مترو بر اساس ایستگاههای مترو موجود بحث خواهیم کرد.
از شکل 3، می بینیم که تراکم نقاط مکان داده های تاکسی سواری از مرکز شهر به اطراف کاهش می یابد. از دیدگاه کل منطقه پکن، میتوان فرض کرد که دادهها یک توزیع حالت گاوسی دو بعدی را ارائه میدهند و برای یک منطقه کوچک، مانند ناحیه چائویانگ، ناحیه دونگچنگ، دادهها نیز یک توزیع گاوسی ارائه میدهند. بنابراین، این نوع داده با توزیع گاوسی مختلط مطابقت دارد. علاوه بر این، وضعیت دیگری را فرض میکنیم، زیرا برخی از دادههای OD تاکسی ما خارج از پوشش ایستگاههای مترو موجود است و نقاط پرتراکمتر OD اغلب امکان ساخت ایستگاههای جدید مترو را دارند، توزیع نقاط OD نیز نشان میدهد. توزیع گاوسی برای داده های توزیع شده در این فرم، از مدل مخلوط گاوسی برای خوشه بندی نقاط داده استفاده می کنیم.
اول از همه، از طریق معادلات وزنی LeaderRank ( 3 ) و ( 4 )، امتیاز LeaderRank هر ایستگاه را محاسبه می کنیم. شکل 6 مقادیر LeadeRank را برای ایستگاه های مترو که در سال 2013 ساخته شده اند نشان می دهد. 15 ایستگاه برتر به شرح زیر است.
از جدول 3 ، ایستگاهی با امتیاز LeaderRank بالاتر نشان دهنده شلوغی بالاتر آن در شبکه مترو است. مسافران بیشتر از این ایستگاه به مکان های دیگر می روند یا از مناطق خارج وارد این ایستگاه می شوند. بنابراین لازم است یک ایستگاه جدید در نزدیکی ایستگاه ایجاد شود تا تردد مسافران در آنجا تسهیل شود و از این طریق خط مترو گسترش یابد.
5.5. تعیین پارامترهای مدل GMM
معیار اطلاعات بیزی (BIC) و معیار اطلاعات Akaike (AIC) معمولاً برای انتخاب پارامترهای مدل استفاده می شود. AIC و BIC هر دو نوع کوواریانس و تعداد اجزای مدل را در نظر می گیرند. AIC یک مدل خوب را برای پیشبینی از منظر پیشبینی انتخاب میکند، در حالی که BIC بهترین مدل را برای برازش دادههای موجود از منظر برازش انتخاب میکند.
در عمل، BIC به طور گسترده ای استفاده می شود، در حالی که در این مطالعه ما قصد داریم 200 منطقه ایستگاه مترو را در آینده پیش بینی کنیم. ما مناطق خوشهبندی را از طریق مدل GMM و الگوریتم 1 به دست آوردیم، وزنهای آنها را در مدل ترکیبی مرتب کردیم و -200 منطقه در نظر گرفتن نحوه انتخاب پارامتر مناسب ، به طوری که تا آنجایی که ممکن است از این 200 منطقه، ایستگاه های مترو جدید را در آینده پوشش دهند، در حالی که اطمینان حاصل شود که کل پوشش پیش بینی شده تا حد امکان کوچک است. با این حال، معیار BIC این مشکل را به خوبی حل نمی کند. برای انجام این کار، تعریف متغیرها را پیشنهاد می کنیم به عنوان تعداد ایستگاههای متروی واقعی که پیشبینی میکنیم از سال 2013 تا 2020 ساخته شدهاند، S به عنوان منطقه تحت پوشش همه مناطق خوشهبندی شده، و مساحت اشغال شده توسط هر ایستگاه پیش بینی است. شکل 7 ، شکل 8 و شکل 9 به ترتیب منحنی های تغییر را نشان می دهند ، S ، و با ارزش هدف از تعریف این دو متغیر، یافتن پارامترهای مناسب است به طوری که تعداد ایستگاه های جدید پیش بینی شده توسط کل شهر بیشترین و مساحت کل منطقه پیش بینی شده کمترین باشد.
الگوریتم 1 GetCoords. |
 |
از شکل 7 و شکل 8 می بینیم که با افزایش مقدار ، دو منحنی به طور کلی روند نزولی و روند نزولی را نشان می دهند آشکارتر است. علاوه بر این، در شکل 9 دریافتیم که شاخص نتیجه خوشه ای از -200 کوچکترین زمانی است = 400، بنابراین پارامتر مدل خوشه ای را تعیین می کنیم = 400.
5.6. نتایج و مطالعه موردی
شکل 10 نتیجه خوشه بندی را که طبق روش این مقاله به دست آورده ایم نشان می دهد. ما 200 منطقه خوشهبندی را بر اساس وزنهای خوشهبندی آنها رتبهبندی میکنیم و حداقل مختصات راس مستطیل شکل محدود شده هر منطقه را بدست میآوریم. ما از این مستطیل ها در نتیجه پیش بینی مکان های آینده سایت استفاده می کنیم. دقت پیشبینی نتایج خوشهبندی برای ایستگاههای جدید مترو پس از سال 2013، 57.5 درصد است که این تعداد شامل 68 ایستگاه پس از سال 2013 ساخته شده و 47 ایستگاه در حال برنامهریزی است. شکل 11 مکان ایستگاه های ساخته شده پس از سال 2013 را نشان می دهد که توسط مدل پیش بینی شده است و مکان ایستگاه های ساخته شده پس از سال 2013 که مدل در پیش بینی آنها شکست خورده است. این نتیجه پیشبینی میتواند مرجعی برای تصمیمگیری سایت جدید برای انتخاب سایت در آینده باشد. علاوه بر این، می توان آن را به وضوح ازشکل 12 که توزیع خوشه بندی در برخی مناطق به خوبی با خطوط جدید مترو مطابقت دارد.
علاوه بر این، از الگوریتم Weighted LeadeRank برای بدست آوردن ایستگاه های مترو با اهمیت بالا استفاده می کنیم و برخی از ایستگاه های نماینده را به عنوان مبنایی برای پیش بینی منطقه مکان ایستگاه های جدید در آینده انتخاب می کنیم، همانطور که در شکل 13 نشان داده شده است ، جایی که 1 کیلومتر را انتخاب می کنیم. پوشش ایستگاه ساختهشده بهعنوان شی آزمایشی، و از طریق محاسبه مدل، منطقه مستطیلی خوشهبندی برخی از ایستگاههای مترو جدید ساختهشده پس از سال ۲۰۱۳ را پوشش میدهد.
ایستگاه Jinsong، Dongzhimen، Dawanglu، Sanyuanqiao و Chongwenmen را بهعنوان مناطق آزمایشی در یک کیلومتری انتخاب کردهایم (بزرگترین دایره در شکل 13 ) و مناطق خوشهای مستطیلی Top5 را از طریق مدل نشاندادهشده در شکل 13 a-e به دست آوردیم. تعداد سایت های جدید (کوچکترین دایره در شکل 13 ) که به درستی پوشش داده شده است 4، 4، 2، 5 است. (تعداد کوچکترین دایره هایی که روی مستطیل همپوشانی دارند).
ما آمار و تجزیه و تحلیل ویژگی های کاربری زمین را در مناطق مستطیلی خوشه ای انجام می دهیم که به هشت دسته تقسیم می شوند: منطقه مسکونی، آموزش و ورزش، مراکز حمل و نقل، مناطق دیدنی، فرهنگ، مراقبت های بهداشتی، مشاغل و ساختمان های اداری.
تجزیه و تحلیل آماری ویژگیهای اصلی کاربری زمین در هر منطقه خوشهای و پیشبینی صحیح ایستگاههای مترو در شکل 14 نشان داده شده است.
از توزیع ویژگیهای کاربری زمین در مناطق خوشهای در جدول بالا، کاربری زمین شامل آموزش و ورزش، مرکز حملونقل، مکانهای تجاری و سایر ویژگیها است که احتمالاً به ایستگاههای مترو جدید تبدیل میشوند، در حالی که بیشتر مناطق خوشهای دارای مسکونی هستند، اما دارای کمی است. تاثیر بر تبدیل شدن به یک ایستگاه جدید با توجه به قوانین فوق، میتوان دریافت که ویژگیهای کاربری اراضی منطقه جدید اغلب شامل ویژگیهای کاربری متعدد است و نه منطقه مسکونی به عنوان ویژگیهای اصلی. علاوه بر این، همپوشانی در مناطق پیش بینی وجود دارد که نشان می دهد تقاضای ترافیک بیشتری در این منطقه وجود دارد و از نتایج پیش بینی در مقایسه با ایستگاه های واقعی، ایستگاه های جدیدی در نزدیکی منطقه همپوشانی وجود دارد.
با این حال، ما یک استثنا را در شکل 13 Dawanglu در منطقه 4 (ناحیه مستطیلی سمت راست پایین) یافتیم. اگرچه این منطقه دارای مکان های تجاری و مناطق دیدنی است، اما ایستگاه مترو جدید را پوشش نمی دهد. با تجزیه و تحلیل بیشتر، متوجه شدیم که منطقه شامل خطوط حلقه شهری است که در شکل 13 f نشان داده شده است، بنابراین احتمالاً دلیلی برای منطقه ای است که نمی تواند ایستگاه جدید را پوشش دهد.
6. نتیجه گیری و کار بیشتر
در این مقاله، ما روشی را برای یافتن مناطق بالقوه برای خطوط جدید مترو و گسترش ایستگاههای مترو موجود، بهمنظور بهبود سیستم حملونقل عمومی شهری و ارتقای توسعه سریع کلی منطقه، پیشنهاد میکنیم. ما از الگوریتم رهبری وزنی و مدل مخلوط گاوسی برای استخراج و توصیه منطقه حمل و نقل ریلی جدید از تاکسی OD کلی و محلی استفاده می کنیم. به منظور بررسی اثربخشی روش پیشنهادی، این مقاله ایستگاههای مترو را در پکن پس از سال 2013 انتخاب کرده و ایستگاههای حمل و نقل ریلی جدید پیشبینیشده در این مقاله را با ایستگاههای واقعی تازهساختی که پس از سال 2013 ساخته شدهاند مقایسه میکند. از 200 منطقه ایستگاهی پیش بینی شده ما، 115 منطقه دارای ایستگاه های مترو جدید هستند. علاوه بر این، ایستگاههای مترو شلوغتر را انتخاب کردیم (Jinsong، Dongzhimen، ایستگاه Dawanglu، Sanyuanqiao و Chongwenmen) از طریق الگوریتم LeaderRank و پنج منطقه مجاور آینده خود را از طریق مدل پیش بینی کردند، تعداد سایت های جدید به درستی پوشش داده شده 4، 4، 2، 5 است. نتایج نشان می دهد که روش ما تأثیر خاصی دارد. می تواند اطلاعات مفیدی را برای تصمیم گیرندگان در برنامه ریزی ساخت زیرساخت مترو فراهم کند. از آنجایی که مترو یک ابزار حمل و نقل با کربن بسیار کم، صرفه جویی در انرژی و حجم زیاد در حمل و نقل عمومی است، اینکه چگونه ایستگاه های جدید آن در آینده می توانند نیازهای مسافرتی مردم را بهتر برآورده کنند، قابل مطالعه بیشتر است. از یک طرف، لازم است ارتباط بین سایر حالت های سفر (اتوبوس، اشتراک گذاری داده های مسیر دوچرخه و غیره) و ایستگاه های مترو در نظر گرفته شود. علاوه بر این، ویژگی های کاربری اراضی منطقه پیش بینی شده نیز شایسته مطالعه بیشتر است. ایستگاه Sanyuanqiao و Chongwenmen) از طریق الگوریتم LeaderRank و پنج منطقه مجاور آینده خود را از طریق مدل پیشبینی کردند، تعداد سایتهای جدید به درستی تحت پوشش قرار گرفتهاند 4، 4، 2، 5. نتایج نشان میدهد که روش ما تأثیر مشخصی دارد. می تواند اطلاعات مفیدی را برای تصمیم گیرندگان در برنامه ریزی ساخت زیرساخت مترو فراهم کند. از آنجایی که مترو یک ابزار حمل و نقل با کربن بسیار کم، صرفه جویی در انرژی و حجم زیاد در حمل و نقل عمومی است، اینکه چگونه ایستگاه های جدید آن در آینده می توانند نیازهای مسافرتی مردم را بهتر برآورده کنند، قابل مطالعه بیشتر است. از یک طرف، لازم است ارتباط بین سایر حالت های سفر (اتوبوس، اشتراک گذاری داده های مسیر دوچرخه و غیره) و ایستگاه های مترو در نظر گرفته شود. علاوه بر این، ویژگی های کاربری اراضی منطقه پیش بینی شده نیز شایسته مطالعه بیشتر است. ایستگاه Sanyuanqiao و Chongwenmen) از طریق الگوریتم LeaderRank و پنج منطقه مجاور آینده خود را از طریق مدل پیشبینی کردند، تعداد سایتهای جدید به درستی تحت پوشش قرار گرفتهاند 4، 4، 2، 5. نتایج نشان میدهد که روش ما تأثیر مشخصی دارد. می تواند اطلاعات مفیدی را برای تصمیم گیرندگان در برنامه ریزی ساخت زیرساخت مترو فراهم کند. از آنجایی که مترو یک ابزار حمل و نقل با کربن بسیار کم، صرفه جویی در انرژی و حجم زیاد در حمل و نقل عمومی است، اینکه چگونه ایستگاه های جدید آن در آینده می توانند نیازهای مسافرتی مردم را بهتر برآورده کنند، قابل مطالعه بیشتر است. از یک طرف، لازم است ارتباط بین سایر حالت های سفر (اتوبوس، اشتراک گذاری داده های مسیر دوچرخه و غیره) و ایستگاه های مترو در نظر گرفته شود. علاوه بر این، ویژگی های کاربری اراضی منطقه پیش بینی شده نیز شایسته مطالعه بیشتر است. تعداد سایت های جدید به درستی پوشش داده شده 4، 4، 2، 5 است. نتایج نشان می دهد که روش ما تأثیر خاصی دارد. می تواند اطلاعات مفیدی را برای تصمیم گیرندگان در برنامه ریزی ساخت زیرساخت مترو فراهم کند. از آنجایی که مترو یک ابزار حمل و نقل با کربن بسیار کم، صرفه جویی در انرژی و حجم زیاد در حمل و نقل عمومی است، اینکه چگونه ایستگاه های جدید آن در آینده می توانند نیازهای مسافرتی مردم را بهتر برآورده کنند، شایسته مطالعه بیشتر است. از یک طرف، لازم است ارتباط بین سایر حالت های سفر (اتوبوس، اشتراک گذاری داده های مسیر دوچرخه و غیره) و ایستگاه های مترو در نظر گرفته شود. علاوه بر این، ویژگی های کاربری اراضی منطقه پیش بینی شده نیز شایسته مطالعه بیشتر است. تعداد سایت های جدید به درستی پوشش داده شده 4، 4، 2، 5 است. نتایج نشان می دهد که روش ما تأثیر خاصی دارد. می تواند اطلاعات مفیدی را برای تصمیم گیرندگان در برنامه ریزی ساخت زیرساخت مترو فراهم کند. از آنجایی که مترو یک ابزار حمل و نقل با کربن بسیار کم، صرفه جویی در انرژی و حجم زیاد در حمل و نقل عمومی است، اینکه چگونه ایستگاه های جدید آن در آینده می توانند نیازهای مسافرتی مردم را بهتر برآورده کنند، شایسته مطالعه بیشتر است. از یک طرف، لازم است ارتباط بین سایر حالت های سفر (اتوبوس، اشتراک گذاری داده های مسیر دوچرخه و غیره) و ایستگاه های مترو در نظر گرفته شود. علاوه بر این، ویژگی های کاربری اراضی منطقه پیش بینی شده نیز شایسته مطالعه بیشتر است. می تواند اطلاعات مفیدی را برای تصمیم گیرندگان در برنامه ریزی ساخت زیرساخت مترو فراهم کند. از آنجایی که مترو یک ابزار حمل و نقل با کربن بسیار کم، صرفه جویی در انرژی و حجم زیاد در حمل و نقل عمومی است، اینکه چگونه ایستگاه های جدید آن در آینده می توانند نیازهای مسافرتی مردم را بهتر برآورده کنند، قابل مطالعه بیشتر است. از یک طرف، لازم است ارتباط بین سایر حالت های سفر (اتوبوس، اشتراک گذاری داده های مسیر دوچرخه و غیره) و ایستگاه های مترو در نظر گرفته شود. علاوه بر این، ویژگی های کاربری اراضی منطقه پیش بینی شده نیز شایسته مطالعه بیشتر است. می تواند اطلاعات مفیدی را برای تصمیم گیرندگان در برنامه ریزی ساخت زیرساخت مترو فراهم کند. از آنجایی که مترو یک ابزار حمل و نقل با کربن بسیار کم، صرفه جویی در انرژی و حجم زیاد در حمل و نقل عمومی است، اینکه چگونه ایستگاه های جدید آن در آینده می توانند نیازهای مسافرتی مردم را بهتر برآورده کنند، شایسته مطالعه بیشتر است. از یک طرف، لازم است ارتباط بین سایر حالت های سفر (اتوبوس، اشتراک گذاری داده های مسیر دوچرخه و غیره) و ایستگاه های مترو در نظر گرفته شود. علاوه بر این، ویژگی های کاربری اراضی منطقه پیش بینی شده نیز شایسته مطالعه بیشتر است. لازم است ارتباط بین سایر حالت های سفر (اتوبوس، اشتراک گذاری داده های مسیر دوچرخه و غیره) و ایستگاه های مترو در نظر گرفته شود. علاوه بر این، ویژگی های کاربری اراضی منطقه پیش بینی شده نیز شایسته مطالعه بیشتر است. لازم است ارتباط بین سایر حالت های سفر (اتوبوس، اشتراک گذاری داده های مسیر دوچرخه و غیره) و ایستگاه های مترو در نظر گرفته شود. علاوه بر این، ویژگی های کاربری اراضی منطقه پیش بینی شده نیز شایسته مطالعه بیشتر است.
این مقاله روشی را بر اساس رویکرد داده محور پیشنهاد می کند. در سالهای اخیر، حملونقل، فناوریهای اطلاعات و ارتباطات (ICT) و انرژی ستونهای شهر هوشمند را تشکیل میدهند. در حال حاضر، روش پیشنهادی بر فرضیه رفتاری کاربر در مورد انتخاب های سفر تمرکز نمی کند. در مطالعه بیشتر، ما تقاضای سفر را با استفاده از مدلهای سیستم حمل و نقل (TSM) برآورد میکنیم تا کاربران بالقوهای را که میتوانند انتخابهای سفر خود را تغییر دهند، شناسایی کنیم. پیشرفتهای بیشتر تحقیقات ما میتواند شامل ادغام بین دادهها و TSM باشد.
بدون دیدگاه