چکیده

اشتراک دوچرخه عمومی دوستدار محیط زیست است، به خوبی با سایر روش های حمل و نقل ارتباط برقرار می کند و وسیله ای برای حرکت فراهم می کند که در عصر کنونی تغییرات آب و هوایی بسیار مناسب است. این مطالعه روشی را برای استنباط هدف سفر با دوچرخه بر اساس داده‌های اشتراک دوچرخه و نقطه علاقه (POI) پیشنهاد می‌کند. از آنجایی که هدف سفر مستلزم تصمیم گیری است، استنتاج آن مستلزم درک پیچیدگی مکانی و زمانی فعالیت های انسانی است. بنابراین، ویژگی‌های مکانی-زمانی مؤثر بر سفرهای دوچرخه‌سواری از داده‌های اشتراک دوچرخه انتخاب شدند و کاربری‌های زمین در مبدا و مقصد سفرها از داده‌های POI استخراج شدند. در طول جاسازی نوع POI، داده‌ها با توجه به فاصله جغرافیایی بین POI و تعداد دوچرخه‌های اجاره‌ای در هر ایستگاه دوچرخه افزوده شدند. ما بیشتر یک روش ساخت داده های حقیقت زمین را توسعه دادیم که از داده های تلفن همراه و POI زمانی استفاده می کند. مدل استنتاج با استفاده از یادگیری ماشین ساخته شد و در آزمایش‌های مربوط به ایستگاه‌های دوچرخه در Seocho-gu، سئول، کره اعمال شد. نتایج تجربی نشان داد که عملکرد بهینه با استفاده از الگوریتم‌های درخت تصمیم به دست آمد، همانطور که با دقت کلی 78.95٪ و امتیاز F1 66.43٪ نشان داده شد. روش پیشنهادی به درک بهتر علل حرکت در داخل شهرها کمک می کند. همانطور که با 78.95٪ دقت کلی و 66.43٪ امتیاز F1 نشان داده شده است. روش پیشنهادی به درک بهتر علل حرکت در داخل شهرها کمک می کند. همانطور که با 78.95٪ دقت کلی و 66.43٪ امتیاز F1 نشان داده شده است. روش پیشنهادی به درک بهتر علل حرکت در داخل شهرها کمک می کند.

کلید واژه ها: 

هدف سفر با دوچرخه ; جاسازی نقطه مورد علاقه ; استخراج کاربری زمین ; داده های تلفن همراه موقت ؛ فراگیری ماشین

1. مقدمه

اگرچه اقتصاد اشتراک گذاری در سرتاسر جهان در حال افزایش است، اما محدودیتی برای گسترش اشتراک گذاری وسایل نقلیه به دلیل مسائل حمل و نقل و محیط زیست در شهرهای شلوغ وجود دارد. بر این اساس، اشتراک دوچرخه، که باعث کاهش انتشار وسایل نقلیه و بهبود تحرک شهری می شود، یک جایگزین جذاب است [ 1 ]. در حال حاضر، بیش از 2000 شهر، سیستم‌های اشتراک دوچرخه را اجرا می‌کنند که ابزاری انعطاف‌پذیر برای انجام سفرهای کوتاه مدت و تبادل بین روش‌های مختلف حمل‌ونقل در اختیار کاربران قرار می‌دهد [ 2 ]. اشتراک دوچرخه یک حالت حمل و نقل قابل توجه است زیرا اغلب در مراحل شروع و پایان زنجیره های سفر قرار دارد [ 3 ، 4 ، 5 ]]. اشتراک‌گذاری شناور رایگان، که رشد قابل‌توجهی را در بازارهای شهری اروپا و آمریکا تجربه کرده است، سیستمی است که به کاربران اجازه می‌دهد آزادانه وسایل نقلیه مشترک را از طریق تلفن‌های هوشمند در پارکینگ‌های عمومی شرکت‌کننده اجاره کنند [ 6 ، 7 ]]. در این زمینه، اشتراک دوچرخه کاربران را قادر می سازد تا بین نقاط عزیمت خود و پارکینگ های ابتدایی و بین پارکینگ های انتهایی و مقصد خود ارتباط برقرار کنند. این خدمات به اشتراک گذاری وسیله نقلیه را گسترش می دهد، با افزایش اشتراک دوچرخه منجر به افزایش استفاده از وسایل نقلیه مشترک و همچنین سایر حالت های حمل و نقل عمومی می شود. این سناریو یک اقدام متقابل موثر در برابر تراکم ترافیک شهری ارائه می دهد. سفرهای غیرموتوری (پیاده‌روی و دوچرخه‌سواری) جریان «مویرگی» در مقیاس‌های ظریف‌تر را در شهرها به حساب می‌آورند که ماهیت کامل جریان‌های حمل‌ونقل شهری را آشکار می‌کند [ 3 ، 8 ]. بسیاری از مطالعات الگوهای حرکت مشترک دوچرخه را برای درک بهتر پویایی شهری تجزیه و تحلیل کرده اند [ 1 ، 3 ، 9 ]]، در حالی که دیگران بر بررسی تغییرپذیری کاربری زمین تمرکز کرده اند [ 10 ، 11 ]. ژائو و همکاران [ 10 ] از داده های اشتراک دوچرخه به عنوان مبنای اصلی برای شناسایی ویژگی های کاربری زمین استفاده کرد.
مطالعه حاضر به جای تجزیه و تحلیل ساده الگوهای حرکت دوچرخه-اشتراک، که بیشتر مربوط به «مکان» ترافیک است، بر «چرا» ترافیک متمرکز شد. مورد دوم فقط به تحرک شهری می پردازد، در حالی که اولی امکان استنباط در مورد اهداف سفرها و تعیین علل حرکت شهری را فراهم می کند. 12 ].]. با این وجود، دلیل یک پدیده و نتیجه آن بیشتر برای تصمیم گیری معنادار است تا مشاهده صرف آن پدیده. به عنوان مثال، به جای مشاهده صرفاً بسیاری از اتومبیل ها در یک منطقه خاص بعد از ساعت 6 بعد از ظهر (تحلیل الگوی حرکت)، درک علت مشاهده، یعنی حرکت ساعات شلوغی افراد از محل کار خود به محل سکونت، مهم تر است. استنتاج هدف سفر). این امر رانندگان را قادر می سازد تا در آن زمان از جاده های منتهی به مناطق مسکونی اجتناب کنند.
استنتاج هدف ترافیک برای درک رفتار ترافیک برای برنامه ریزی ترافیک، تصمیم گیری سرمایه گذاری و برآورد تقاضای ترافیک ضروری است [ 13 ]. با این حال، در میان مطالعات مربوط به ویژگی های ترافیک، پیش بینی هدف سفر به طور قابل توجهی کمتر مورد توجه قرار گرفته است [ 14 ، 15 ، 16 ]. داده های تاریخچه ترافیک برای پیش بینی هدف سفر مورد نیاز است. با این حال، تنها چند داده دقیق حاوی اطلاعات در مورد تصمیم گیری انسانی وجود دارد. بنابراین، تحلیل‌های استنتاج هدف سفر سنتی بر نظرسنجی‌های مستقیم کاربران تکیه می‌کنند [ 1]. نظرسنجی های مستقیم کاربر برای اهداف ترافیک حاوی داده های درستی زمینی هستند و بنابراین مجموعه داده های مناسبی برای به کارگیری الگوریتم های استنتاج هستند. با این حال، اهداف محدود و محدودیت های مربوط به هزینه وجود دارد.
نگوین و همکاران [ 17 ] 25 مطالعه را از نظر تعیین هدف سفر بررسی کرد و آنها را در دو زمینه گسترده، یعنی علوم حمل و نقل (TS) و جغرافیای انسانی (HG) طبقه بندی کرد. آنها نشان دادند که محققان همیشه خود را در این دو موقعیت در دنیای واقعی خواهند یافت. به عبارت دیگر، محققان یک مجموعه داده پس از جمع آوری را تجزیه و تحلیل می کنند یا یک نظرسنجی برای ایجاد یک مدل استنتاج پیشرفته طراحی می کنند. بنابراین تاکید می‌شود که هدف‌گذاری دقیق حوزه‌های پژوهشی بسیار مهم است. مطالعات مربوط به TS بر روش‌های استخراج اشیا از داده‌های GPS تمرکز دارند، در حالی که مطالعات مرتبط با HG بر غنی‌سازی معنایی مسیرهای GPS متمرکز هستند. مورد دوم به جای روش شناسی دقیق، بر کسب دانش عمومی در مورد تحرک و مکان فعالیت ها تمرکز دارد [ 17 ]].
برای اطلاعات GPS جمع‌آوری‌شده از طریق دستگاه‌های داخلی که حاوی داده‌های حقیقت زمینی نیستند، مطالعات مختلف از تلفیقی از داده‌های نظرسنجی (مانند داده‌های بررسی سفرهای خانگی)، داده‌های نقطه‌نظر (POI) و داده‌های رسانه‌های اجتماعی برای اهداف سفر استفاده کرده‌اند. استنباط [ 13 ، 14 ، 18 ]. با این حال، این موارد تنها درصد کمی از کارهای مرتبط را تشکیل می‌دهند و تحقیقات در مورد پیش‌بینی هدف سفرهای مرتبط با دوچرخه کافی نیست [ 2 ]. بائو و همکاران [ 1 ] و زینگ و همکاران. [ 2 ] هدف سفر با دوچرخه را با استفاده از داده های POI استنباط کرد، با توجه به اینکه هدف سفر با استفاده از زمین در مقصد مرتبط است [ 18 ، 19 ، 20 ]]. با این حال، این مطالعات تأثیر کاربری مختلط زمین در مناطق شهری را در نظر نگرفت. بائو و همکاران [ 1 ] اهداف سفر را با خوشه بندی تنها بر اساس تعداد فرکانس ساده از نوع POI در نزدیکی ایستگاه های دوچرخه طبقه بندی کرد. زینگ و همکاران [ 2 ] زمینه مبدأ و مقصد استفاده از دوچرخه را از طریق داده های POI افزایش داد، اما هدف سفر خاص را برای یک مکان یکپارچه مانند یک مرکز خرید در نظر نگرفت. با این حال، وقوع فزاینده استفاده از زمین مخلوط در مناطق شهری و POI یکپارچه مانند ساختمان ها باید در نظر گرفته شود [ 21 ، 22 ].
بنابراین، مطالعه حاضر با استفاده از فناوری تعبیه POI، با هدف حل مشکل کاربری ترکیبی زمین در زمینه مبدا-مقصد، که کلید استنتاج هدف سفر است، انجام می‌شود. POI ابزار مفیدی برای تعریف معنای مکان است. با این حال، به دلیل سلسله مراتب انواع POI، بسیاری از عوامل نادیده گرفته می شوند که منجر به از دست رفتن اطلاعات می شود [ 23 ]. به عنوان مثال، آپارتمان‌ها و پارک‌ها به دلیل دسته‌بندی‌های متفاوتشان به‌عنوان POI کاملاً نامرتبط در نظر گرفته می‌شوند، اما مناطق مسکونی و پارک‌های شهری عموماً بسیار نزدیک به یکدیگر قرار دارند. اخیراً تحقیقاتی در مورد معنای POI با توجه به همبستگی های فضایی آن انجام شده است [ 23 ، 24 ، 25]. این ممکن است شامل کاربرد فناوری جاسازی کلمه در حوزه پردازش زبان طبیعی [ 26 ] باشد، همانطور که برای طبقه بندی مناطق عملکردی شهری [ 25 ، 27 ] استفاده شده است. از آنجایی که نواحی عملکردی شهری به شدت با فعالیت‌های اجتماعی-اقتصادی داخلی در فضاها مرتبط هستند، شناسایی آنها از روی تصاویر سنجش از دور خالص آسان نیست [ 21 ].]. بنابراین، داده های POI به عنوان یک اندازه گیری تکمیلی استفاده می شوند، اما محدودیت سلسله مراتب انواع POI مستلزم استفاده از فناوری جاسازی برای تعریف نوع POI است. در نتیجه، در مطالعه حاضر، انواع POI سفارشی شده برای سفرهای دوچرخه، با تعبیه نوع POI بر اساس هدف سفر با دوچرخه استفاده شد. این یک راه حل برای مشکل کاربری اراضی مختلط شهری است.
این کار با مطالعات استنتاج هدف سفر موجود مرتبط با TS با تمرکز بر دقت روش متفاوت است. از این جهت متفاوت است که بر کسب دانش عمومی در مورد تحرک دوچرخه و محل فعالیت‌ها با استفاده از فرآیندهای تقویت‌کننده معنا که منعکس‌کننده دنیای واقعی هستند، تمرکز دارد. برای ارزیابی روش پیشنهادی، ما همچنین با استفاده از داده‌های تلفن همراه و داده‌های POI، داده‌های حقیقت زمینی را ایجاد می‌کنیم. کمک های این کار به حوزه و جامعه به شرح زیر است. ابتدا، این کار روشی را برای اعمال تکنیک‌های جاسازی POI برای استنتاج هدف سفر با دوچرخه پیشنهاد می‌کند. فناوری جاسازی POI یک کاربرد فناوری در زمینه پردازش زبان طبیعی (NLP) است. در زمینه تحلیل فضایی، تنها برای طبقه بندی مناطق عملکردی شهری استفاده شده است [ 25 ,27 ] و توصیه POI [ 26]. با بهترین دانش ما، این مطالعه اولین مطالعه‌ای است که تکنیک‌های جاسازی POI را برای استنتاج هدف سفر به کار می‌گیرد. دوم، تحرک شخصی، و همچنین شیوه های حمل و نقل موجود مانند اتوبوس و تاکسی، اخیراً در سراسر جهان به سرعت در حال افزایش است. با توجه به این سناریو، روش پیشنهادی را می توان با توجه به حالت مربوطه هنگام استنباط هدف سفر برای تحرک شخصی سفارشی کرد. سوم، داده‌های سفر مربوط به تحرک شخصی، از جمله دوچرخه‌های مشترک، به ما امکان می‌دهد تا جریان ظریف حرکت شخصی در شهرها را که نمی‌توان از الگوهای حرکت اتوبوس‌ها یا مترو مشاهده کرد، بدانیم. بنابراین، استفاده از روش استنتاج پیشنهادی برای داده‌های دنیای واقعی برای تجزیه و تحلیل هدف سفر، منجر به درک بهتر علل حرکت شخصی در شهرها می‌شود.
ادامه این مقاله به شرح زیر سازماندهی شده است. بخش 2 مطالعات قبلی مربوط به استنتاج هدف سفر و جاسازی POI را مرور می کند. بخش 3 روش پیشنهادی را برای استنباط هدف سفر با دوچرخه ارائه می کند. در بخش 4 ، ما یک آزمایش استنتاج هدف سفر با دوچرخه را که با استفاده از 87 ایستگاه دوچرخه در Seocho-gu، سئول انجام شد، توصیف می‌کنیم. در نهایت، بخش 5 نتیجه گیری و محدودیت های مطالعه و جهت گیری های تحقیقات آینده را ارائه می دهد.

2. آثار مرتبط

2.1. مطالعات در مورد استنتاج هدف سفر

در میان مطالعات مرتبط با ترافیک، هدف سفر نسبتاً کمتر مورد توجه قرار گرفته است [ 14 ، 15 ، 16 ]. این به دلیل پیچیدگی مکانی-زمانی فعالیت‌های انسانی مورد نیاز برای پیش‌بینی هدف سفر است [ 13 ، 28 ]. مطالعات در مورد استنباط هدف سفر را می توان بر اساس شیوه های اصلی سفر طبقه بندی کرد. بیشترین جنبه مورد مطالعه بر سفرهای انسان بدون مشخص کردن نحوه حمل و نقل متمرکز است. در این مورد، هدف سفر بیشتر بر اساس نظرسنجی‌ها پیش‌بینی می‌شود، با توسعه فناوری‌های مرتبط که امکان تحقیقات گسترده را فراهم می‌کند، از جمله افزودن داده‌های GPS که مسیرهای سفر را فراهم می‌کند [ 15 ، 29 ]]. علاوه بر این، تجزیه و تحلیل داده‌های پیچیده مکان و زمان از طریق ادغام داده‌های ناهمگن مانند داده‌های رسانه‌های اجتماعی (به عنوان مثال، توییت‌ها) و داده‌های POI (مانند Google API) پیچیده‌تر شده است [ 14 ، 29 ، 30 ]. با این حال، پیش‌بینی هدف سفر تنها از طریق نظرسنجی مستقیم مسافران، تحقیقات موجود را به شدت محدود کرده است.
همچنین مطالعاتی در مورد استنباط هدف سفر با توجه به نحوه حمل و نقل انجام شده است. بیشترین جنبه مورد مطالعه در این مورد، حالت حمل و نقل عمومی مانند مترو است که با توسعه کارت های هوشمند، تنوع حاصل شده است. با این حال، تنها تعداد کمی از این مطالعات بر پیش‌بینی هدف سفر متمرکز شده‌اند، زیرا کارت هوشمند شامل «هدف سفر» نیست، که نیاز به تصمیم‌گیری توسط مسافر دارد. السگر و همکاران [ 18 ] این موضوع را با استنباط هدف سفر از طریق جمع آوری داده های بررسی سفر خانواده (HTS) مورد بررسی قرار داد. مدل‌سازی مبتنی بر قانون برای داده‌های HTS، که از طریق نظرسنجی‌های مسافران به‌دست آمد، اعمال شد و هدف سفر بر اساس ویژگی‌های مکانی، زمانی و فرکانس استنباط شد.
در مطالعات مرتبط با دوچرخه، تجزیه و تحلیل الگوهای اشتراک گذاری سنتی یا اهداف سفر اغلب بر اساس نظرسنجی های رضایت مسافران است [ 13 ، 14 ، 29 ، 31 ، 32 ، 33 ]. اخیراً، فراوانی فزاینده داده های اشتراک دوچرخه برای استنباط هدف سفر مورد استفاده قرار گرفته است. به طور خاص، هدف سفر بسیار با کاربری زمین در مقصد مرتبط است. بنابراین، با افزایش پیچیدگی داده‌های POI، بسیاری از محققان تلاش کرده‌اند تا یک تحلیل مکانی-زمانی از ادغام داده‌های اشتراک دوچرخه و داده‌های POI انجام دهند. بائو و همکاران [ 1] الگوهای سفر با دوچرخه و هدف سفر را با استفاده از داده های Citi Bike در نیویورک، ایالات متحده تجزیه و تحلیل کرد. از طریق خوشه بندی k-means، آنها ایستگاه های دوچرخه را بر اساس داده های POI اطراف طبقه بندی کردند و یک مدل الگوی سفر دوچرخه را با استفاده از روش تخصیص نهفته دیریکله (LDA) توسعه دادند. با این حال، این مطالعه دارای محدودیت‌هایی بود، مانند خوشه‌بندی اهداف سفر با دوچرخه فقط با استفاده از فرکانس‌های ساده انواع POI در اطراف مقصد. زینگ و همکاران [ 2 ] از داده‌های Mobike و داده‌های اشتراک دوچرخه بدون اسکله برای شانگهای، چین و مشابه بائو و همکاران استفاده کرد. [ 1]، آنها داده های اشتراک دوچرخه و داده های POI را برای تجزیه و تحلیل الگوها و اهداف سفر کاربر ترکیب کردند. به‌ویژه، آن‌ها زمینه‌های مبدا و مقصد سفر را با استخراج اطلاعات در مورد پیکربندی‌های POI نزدیک، غنی‌تر کردند. این با رویکرد بائو و همکاران متفاوت است. [ 1 ]، که فقط فرکانس های انواع POI را در نظر گرفت. با این حال، فقط نوع POI و نقطه دوچرخه برای ساختن زمینه استفاده شد و داده‌هایی که در طول زمان تغییر می‌کردند حذف شدند. علاوه بر این، این روش به دلیل ناتوانی در در نظر گرفتن POI یکپارچه مانند مراکز خرید محدود شده است.
چن و همکاران [ 34 ] هدف سفر را برای کاربران تاکسی پیش بینی کرد. این مطالعه قابل توجه بود زیرا مقدار زیادی از داده های شخصیت سفر در یک مقدار برداری ادغام شد و از جاسازی برای استنتاج هدف سفر استفاده شد. داده‌های مسیر تاکسی مورد استفاده و داده‌های POI در شهر نیویورک، ایالات متحده آمریکا تولید شدند. برای توضیح بیشتر در زمینه مبدا و مقصد تاکسی، محبوبیت، منحصربه‌فرد بودن، و فاصله تا POI از طریق اطلاعات زمانی و داده‌های چک در چهار ضلعی در نظر گرفته شد. سه زمینه (زمان، مبدا و مقصد) سفر تاکسی از طریق رمزگذار خودکار ساخته و عمیقاً تعبیه شد. در نهایت، هدف سفر تاکسی با خوشه بندی مقادیر تعبیه شده استخراج شد.
بررسی فوق نشان می‌دهد که مطالعات سنتی مربوط به استنتاج هدف سفر عمدتاً از نظرسنجی‌های مبتنی بر GPS از سفرهای انسانی استفاده کرده‌اند. با این حال، برخی از کارهای استنتاج هدف سفر اخیر از داده های بزرگ به دست آمده توسط کارت های هوشمند یا خدمات اشتراک دوچرخه عمومی استفاده کرده اند. با این وجود، اگر مجموعه داده بر اساس نظرسنجی مسافرتی نباشد، اندازه گیری دقت مدل استنتاج دشوار است. بسیاری از این مطالعات قبلی تلاش کردند تا هدف سفر را از داده‌های تاریخچه سفر و داده‌های POI استنتاج کنند، اما تولید داده‌های حقیقت زمینی آسان نبود. بنابراین، هنگامی که داده های بزرگ استفاده می شود، آنها با داده های نظرسنجی ترکیب می شوند یا نتایج به دست آمده توسط مدل های استنتاج برای اهداف ترافیکی مناسب خوشه بندی و برچسب گذاری می شوند.
جدول 1 مطالعات مختلف مربوط به استنباط هدف سفر انجام شده در سه سال گذشته را با هم مقایسه می کند که از آنها می توان روندهای اخیر را مشاهده کرد. برخلاف مطالعات موجود، این مطالعه روشی را برای استنباط اهداف سفر با دوچرخه با هدف کسب دانش عمومی در مورد مکان‌های تحرک و فعالیت دوچرخه پیشنهاد می‌کند. علاوه بر این، این مطالعه روش پیشنهادی را با تولید داده های حقیقت زمینی با استفاده از داده های تلفن همراه و داده های POI ارزیابی می کند.

2.2. مطالعات مربوط به جاسازی POI

با توسعه فناوری هایی مانند Word2vec برای بردار سازی اطلاعاتی که تعیین کمیت آن در زبان های طبیعی دشوار است، مطالعاتی به طور فعال برای کمی سازی اطلاعات در زمینه های مختلف انجام می شود [ 26 ، 35 ، 36 ، 37 ]. یان و همکاران [ 24 ] مدل Place2vec را توسعه داد که برای جاسازی نوع POI استفاده می‌شود و فاصله جغرافیایی و محبوبیت POI را برای کمی کردن اطلاعات POI توزیع شده در یک فضای جغرافیایی در نظر می‌گیرد. Place2vec با روش های قبلی متفاوت است، که همبستگی های فضایی داخلی را در نظر نمی گیرند و فقط از فرکانس POI برای تعیین نوع عملکردی منطقه مورد نظر استفاده می کنند [ 25 ].
یائو و همکاران [ 27 ] و ژای و همکاران. [ 25 ] به اندازه‌گیری شباهت و ارتباط انواع مکان‌ها ادامه داد. این مطالعات تلاش کردند تا کاربری زمین را از نتایج تعبیه POI استخراج کنند. ژای و همکاران [ 25 ] نتایج به دست آمده توسط یان و همکاران را ساده کرد. [ 24 ] و از آنها برای تقویت داده ها فقط بر اساس فاصله بین POI استفاده کرد. نوع عملکردی منطقه شهری از نتایج تعبیه استخراج شد. علاوه بر این، برای شناسایی دقیق نتایج استخراج، حاشیه نویسی هر منطقه توسط داده های تلفن همراه و داده های مبدا-مقصد کامیون (OD) پشتیبانی می شود.
لیو و همکاران [ 38 ] و لیو و همکاران. [ 23 ] انواع POI را برای جلوگیری از از دست رفتن اطلاعات به دلیل سلسله مراتب تقسیم بندی کرد. به عنوان مثال، لیو و همکاران. [ 23 ] 488 نوع POI را مشخص کرد و یک ارتباط بین داروخانه ها، فروشگاه های رفاه و آرایشگاه ها مشاهده کرد. این انواع POI معمولاً نزدیک به یکدیگر قرار دارند، اما سلسله مراتب این انواع POI ممکن است همبستگی آنها را مبهم کند. علاوه بر تقسیم‌بندی نوع POI، همبستگی‌های مختلف ممکن است هنگام ساختن تاپل‌ها جفت شوند. برای مثال، جین و همکاران. [ 39 ] انواع فروشگاه را به جای انواع POI جاسازی کرد و با ساخت جفت هایی از نوع فروشگاه و اقلام فروخته شده توسط فروشگاه، داده ها را افزایش داد.
جدول 2مطالعات مختلف در مورد جاسازی POI را مقایسه می کند. در اکثر مطالعات، نوع POI از طریق افزایش داده ها بر اساس فاصله POI در فضای جغرافیایی تعریف می شد. نزدیکترین k یا یک بافر برای تولید چند تایی بین POIها و Word2vec skip-gram عمدتاً برای جاسازی استفاده شد. مطالعه حاضر جریان این مطالعات قبلی را با توجه به ترکیب چند تایی و استفاده از Word2vec دنبال کرد، اما یک روش جاسازی POI جدید برای استخراج کاربری زمین مخصوص یک سفر با دوچرخه استفاده شد. انواع POI بر اساس هدف سفر با دوچرخه با مراجعه به مطالعات مرتبط طبقه بندی شدند. به طور خاص، انواع POI مربوط به اوقات فراغت دوچرخه برای جلوگیری از از دست دادن اطلاعات به دلیل سلسله مراتب انواع POI به طور جداگانه طبقه بندی شدند.

3. روش ها

ما روشی را برای استنباط هدف سفرهای عمومی دوچرخه بر اساس داده های اشتراک دوچرخه و داده های POI ایجاد کردیم. این روش شامل استخراج ویژگی هایی است که بر هدف سفر تأثیر می گذارد از داده ها و استفاده از آنها برای یادگیری ماشینی برای استنباط هدف سفر نهایی. هنگام انتخاب ویژگی‌های مورد استفاده، اطلاعات کاربری زمین در نقاط شروع و پایان سفر با دوچرخه با جاسازی و خوشه‌بندی داده‌های POI برای منطقه اطراف ایستگاه دوچرخه تعیین شد. علاوه بر این، برای ایجاد داده های حقیقت زمینی برای تعیین هدف سفر، داده های تحرک را برای هر دوره زمانی در یک فرم مش استاندارد کردیم و آن را همراه با داده های POI استخراج کردیم. روش کلی در شکل 1 نشان داده شده است .

3.1. استخراج ویژگی برای استنتاج هدف سفر

برخلاف پیش‌بینی تقاضای سفر که تحت تأثیر عوامل مختلفی مانند آب و هوا و جمعیت شناور است، هدف سفر را می‌توان به طور کلی به اطلاعات زمانی و مکانی تقسیم کرد. زمان دوچرخه سواری و کاربری های زمین در نقطه عزیمت و مقصد به طور قابل توجهی نشان دهنده هدف سفر است. چن و همکاران [ 34 ] سه زمینه برای زمان، مبدا و مقصد ایجاد کرد و از جاسازی برای استنباط هدف سفر تاکسی استفاده کرد. السگر و همکاران [ 18 ] هدف سفر را با کمک کارت هوشمند، با استفاده از کاربری زمین مقصد، زمان شروع و مدت فعالیت به عنوان ویژگی‌های مهم استنباط کرد.
در مطالعه حاضر، ویژگی‌هایی که بر اهداف سفر عمومی دوچرخه تأثیر می‌گذارند عبارتند از: روز سواری، زمان حرکت، کاربری زمین نقطه عزیمت، زمان رسیدن، کاربری زمین مقصد، زمان سفر، مسافت سفر و فاصله بین ایستگاه‌های دوچرخه. با توجه به عدم احتمال استفاده از دوچرخه عمومی اجاره ای برای بیش از 24 ساعت، روز سواری به عنوان تاریخ اجاره در نظر گرفته شد. روز سواری با 1 برای یک روز کاری و 0 برای یک روز غیر کاری نشان داده می شد. زمان حرکت و رسیدن بین 0 تا 23 بود که فقط از اطلاعات منطقه زمانی استفاده شد و جزئیات دقیقه و ثانیه نادیده گرفته شد. برای در نظر گرفتن عوامل زمانی و مکانی کل سفر، زمان سفر و مسافت سفر به طور جداگانه وارد شد. فاصله بین ایستگاه های خروج و رسیدن به دلیل ویژگی های دوچرخه های مورد استفاده برای مقاصد تفریحی مانند پارک سواری، یک ویژگی مهم در نظر گرفته شد. به عنوان مثال، در مورد یک سفر تفریحی، حتی اگر کل زمان یا مسافت سفر طولانی باشد، ممکن است ایستگاه های عزیمت و مقصد یکسان باشند.
هنگامی که ویژگی های فوق با استفاده از داده های اشتراک دوچرخه ساخته می شوند، داده های POI برای مناطق اطراف ایستگاه ها باید برای استخراج کاربری زمین در نقطه عزیمت و مقصد استفاده شوند. با توجه به فاصله بین ایستگاه های دوچرخه عمومی و تراکم جمعیت شهر سئول، شعاع جستجو برای هر ایستگاه مانند مطالعات قبلی 250 متر تعیین شد [ 1 ، 40 ]. برای استنتاج دقیق، POI ها با دسته بندی بر اساس اهداف سفرهای دوچرخه به انواع سفارشی طبقه بندی شدند. طبقه بندی هدف سفرهای مورد استفاده در مطالعات قبلی در جدول 3 ارائه شده است .
در این مطالعه، هشت مقوله هدف سفر با دوچرخه، یعنی خانه، محل کار، تحصیل، حمل و نقل، ناهار خوری، خرید و خدمات، اوقات فراغت و اوقات فراغت دوچرخه در نظر گرفته شد. طبقه بندی با مراجعه به Bao و همکاران انجام شد. [ 1 ] که از دوچرخه به عنوان شیء اصلی استفاده می کرد و “کار” اضافه شد. علاوه بر این، POI در پارک‌ها و پارک‌های تفریحی مخصوص ترافیک دوچرخه به‌عنوان «تفریح ​​دوچرخه» شناسایی شدند. بعلاوه، POIهای مربوط به “فرغت دوچرخه” در شعاع جستجو با هر چیزی در 1000 متری ایستگاه دوچرخه به جای 250 متر استاندارد مقایسه شد. شناسایی کاربری زمین با استفاده از داده های POI برای مناطق اطراف ایستگاه های دوچرخه در زیربخش بعدی مورد بحث قرار می گیرد.

3.2. شناسایی کاربری زمین در سفرهای دوچرخه سواری

3.2.1. تعبیه نوع POI مربوط به هدف سفر با دوچرخه

مطالعات بر روی جاسازی انواع POI در سه سال گذشته در زمینه های مختلف انجام شده است که با کار یان و همکاران آغاز شده است. [ 23 ، 24 ، 25 ، 38 ]. در مطالعه حاضر، ما یک روش جاسازی POI را به طور خاص برای سفرهای دوچرخه ایجاد کردیم. نوع POI با در نظر گرفتن هدف سفر با دوچرخه طبقه‌بندی شد، در حالی که فاصله جغرافیایی بین POI و تعداد دوچرخه‌های اجاره‌ای در هر ایستگاه برای افزایش تاپل‌های POI برای جاسازی استفاده شد.
تعبیه نوع POI برای استنباط هدف سفر با دوچرخه اساساً جاسازی کلمه بود که با در نظر گرفتن مکان کلمه مرکزی و کلمات متن برای معنی دادن به یک کلمه استفاده می شود. این روش مفهوم جاسازی کلمه را در یک POI یا مکان اعمال می کند. شکل 2 Word2vec مبتنی بر اندازه پنجره و مفهوم تعبیه نوع POI را مقایسه می کند. از آنجا که جاسازی کلمه (skip-gram) بر اساس اندازه پنجره است، اگر اندازه پنجره 1 باشد، همانطور که در شکل 2 نشان داده شده است.آموزش با انتخاب “سریع” و “برای” به عنوان کلمات متنی کلمه مرکزی “قهوه ای” انجام می شود. این روش برای پیش بینی کلمات متنی بر اساس یک کلمه مرکزی استفاده می شود. برعکس، تعبیه نوع POI از مکان POI استفاده می کند. اگر POI در 100 متری POI مرکزی، “آپارتمان” واقع شده باشد، به عنوان POI زمینه (به عنوان مثال، سوپرمارکت، داروخانه یا پارک) شناخته می شود و یک تاپل تولید می شود.
ما یک روش جاسازی نوع POI به طور خاص برای سفرهای دوچرخه سواری بر اساس Yan et al. [ 24 ]. یک مدل پرش گرم برای پیش‌بینی کلمات زمینه از کلمه مرکزی که توسط مدل‌های Word2vec به دست آمده است، استفاده شد و تفاوت بین احتمال آموزش‌دیده شده و احتمال واقعی با آنتروپی متقاطع اندازه‌گیری شد. مدل به صورت زیر بیان می شود.

D(y^، y)=yجورود به سیستم(y^ج)

جایی که y^توزیع احتمال آموخته شده، y توزیع احتمال واقعی، c شاخص نوع، و y^ج احتمال وقوع m POI است ( تی1، تی2، تی3، تیمتربا معادله (2) به دست می آید.

y^ج=پ(تی1، تی2، تی3، تیمتر|تیج)

جایی که تیجمرکز POI است. هنگامی که فرض ساده بیز در محاسبه احتمال اعمال می شود، yج همیشه 1 است.

در نهایت با تبدیل امتیاز به احتمال با استفاده از تابع softmax می توان نوع POI را به صورت برداری بیان کرد. تابع هدف توسط،

مترمنnمنمترمنzه جی=لogتی=1مترانقضا(توتیتیvج) ک=1|تی|انقضا(توکتیvج)

جایی که توتیبردارهای نوع مکان را نشان می دهد، vجنشان دهنده بردارهای نوع مرکز مکان و |تی|اصلی بودن نوع POI است.

Yan et al. [ 24 ] پیشنهاد افزایش تعداد حضور تاپل های آموزشی ( تیجهnتیهr، تیجonتیهایکستی) توسط یک عامل β . آنها سه مفهوم را ارائه کردند: (1) بافت فضایی ساده، (2) بافت فضایی ساده افزوده شده که ایده محبوبیت و فاصله تا یک مکان را در خود جای داده است، و (3) زمینه فضایی که با تئوری اطلاعات، با تاخیر فاصله (ITDL) تقویت شده است.
روش ساده بافت فضایی تقویت شده برای مطابقت با هدف تحقیق اصلاح شد. این به طور خاص برای افزایش محبوبیت POI های فردی با بررسی داده های Yelp استفاده شد. این به این دلیل بود که تعداد بررسی‌ها نشان‌دهنده محبوبیت یا تسلط نسبی POI است. بنابراین، عامل β را می توان در رابطه (4) زیر تعریف کرد، جایی که پلjتعداد کل ورود به POI است لj. در این مطالعه، به جای داده های بررسی Yelp توسط یان و همکاران. [ 24 ]، ما تاپل های POI را با تخصیص تعداد اجاره ها در هر ایستگاه دوچرخه در میان POI ها در شعاع تعیین شده ایستگاه با توجه به فواصل مربوطه آنها افزایش دادیم. به عنوان مثال، اگر 100 داده ورود دوچرخه در ایستگاه A وجود داشته باشد، آنها به طور مساوی بین تمام POI های مجاور توزیع می شوند. با این حال، سهمیه آنها متناسب با فاصله آنها از ایستگاه خواهد بود.

βجساعتهجکمنnلj= [1+لn(1+پلj)]
این امر با افزایش بر اساس فاصله POI دنبال شد. اصل اساسی تعبیه نوع POI اعمال شد، به عنوان مثال، هر چه فاصله کوتاه تر باشد، رابطه بین POI عمیق تر می شود. فاکتور β مربوط به فاصله به صورت زیر تعریف می شود.

βدمنستیآnجهلj=[1+ک=1|L|پلک|L|1+دα(لمن، لj) ]

کجا | L | تعداد کل POI است، د(لمن، لj)فاصله بین POI است لمنو POI لjو α ضریب فاصله معکوس است که در این مطالعه 1 تنظیم شد. ما فاکتور افزایش فاصله مورد استفاده توسط Yan et al را اعمال کردیم. [ 24 ]. فاکتور β ، که به طور جامع نشان دهنده محبوبیت یک POI بر اساس مفهوم فاصله است، به صورت زیر تعریف شد.

βجoمتربمنnهدلj=[1+لوگاریتم(1+پلj)1+دα(لمن، لj) ]
بر اساس روش پیشنهادی یان و همکاران. [ 24 ]، روش پیشنهادی تعبیه نوع POI برای استنتاج هدف سفر با دوچرخه به شرح زیر است. ابتدا، یک تاپل برای POIهایی که در شعاع 250 متری ایستگاه دوچرخه قرار دارند (1000 متر در مورد POI های مربوط به اوقات فراغت دوچرخه) تشکیل می شود. تاپل ایجاد شده با استفاده از یک عامل تقویت کننده β که محبوبیت و فاصله بین POI ها را در نظر می گیرد، تقویت می شود. شکل 3 پیکربندی تمام تاپل های اطراف ایستگاه های دوچرخه و تقویت آنها را نشان می دهد. همانطور که در جدول سمت راست شکل 3 نشان داده شده است، اگر kدر طول پیکربندی K-نزدیکترین تابع 3 است، تاپل ها با گروه بندی مجموعه ای از سه POI نزدیک به هر POI تشکیل می شوند و همه POI در ایستگاه دوچرخه گنجانده می شوند. در این مورد، به دلیل اینکه فاصله بین تاپل ها کوتاهتر است و تعداد اجاره ها افزایش می یابد ، همانطور که توسط Yan و همکاران پیشنهاد شده است، می توان با استفاده از فاکتور β ، افزایش را انجام داد. 24 ]. اعداد داخل پرانتز زیر POI در شکل 3مقادیری هستند که با توزیع تعداد کل دوچرخه های کرایه شده (در اینجا 1000 برابر فرض می شود) بین POI متناسب با فاصله آنها از ایستگاه به دست می آید. این نشان می دهد که POI های نزدیک تر به ایستگاه های دوچرخه محبوبیت بیشتری دارند. علاوه بر این، از آنجایی که تعداد دوچرخه‌های کرایه‌ای بین ایستگاه‌های دوچرخه متفاوت است (برای مثال، تعداد دوچرخه‌های کرایه‌ای در ایستگاه A ممکن است 1000 باشد، در حالی که در ایستگاه B ممکن است 50 باشد)، این روش می‌تواند به‌طور متفاوتی در بین ایستگاه‌ها اعمال شود. تاپل های ایجاد شده در این روش با استفاده از TensorFlow آموزش داده شدند و تعداد ابعاد تعبیه شده روی 70 تنظیم شد و مانند مطالعات قبلی اعمال شد.
3.2.2. استخراج کاربری زمین در هر ایستگاه
روش استخراج کاربری زمین در هر ایستگاه دوچرخه بر اساس مقدار به دست آمده با تعبیه نوع POI بر اساس روش های ارائه شده توسط Zhai و همکاران است. [ 25 ] و یائو و همکاران. [ 27 ]. ابتدا، مقادیر جاسازی نوع POI هر ایستگاه با استفاده از معادله (7)، در یکی ترکیب می‌شوند. پOمنتیyپه(vمن، ک)مقدار برداری k امین نوع POI در ایستگاه دوچرخه است و N تعداد کل POI در تمام ایستگاه های دوچرخه است.

دوچرخه ایستگاه بردار=ک=1نپOمنتیyپه(vمن، ک)ن
بر اساس مقادیر استخراج‌شده، خوشه‌بندی برای ایستگاه‌های دوچرخه، با الگوریتم k-means برای استخراج کاربری زمین در ایستگاه‌ها انجام می‌شود. مقادیر جاسازی ایستگاه‌های دوچرخه فردی متشکل از بردارهای با ابعاد بالا برای انواع کاربری مشابه با تجزیه و تحلیل خوشه‌بندی گروه‌بندی می‌شوند. k _مقدار، که تعداد خوشه‌ها در الگوریتم k-means است، باید از قبل به‌عنوان مقدار زانو یا شبح تعیین شود. فرآیند با معادله (8) بیان می شود. در این تحقیق به دلیل اینکه خروجی نهایی یک ارزش کاربری دقیق زمین نیست، ارزش کاربری زمین مانند مطالعات قبلی با استفاده از شاخص های اضافی مشخص نشده است. در عوض، نتایج خوشه‌بندی به‌عنوان متغیرهایی از ویژگی‌های کاربری زمین در مبدا و مقصد برای استنباط هدف سفر با دوچرخه استفاده شد.

ایکس=سی1سی2   سیک،  سیمنسیj=آrgمترمنnج من=1کایکسjسیمنایکسjجمن2

3.3. ایجاد داده های حقیقت زمینی مرتبط با هدف سفر

3.3.1. استانداردسازی داده های مش

از آنجایی که داده های حقیقت زمینی برای هدف سفر منعکس کننده تصمیم گیری مسافران است، به دست آوردن آنها آسان نیست. در برخی از مطالعات قبلی، داده ها توسط یک نظرسنجی مسافر جمع آوری شد [ 13 ، 14 ، 29 ]. با این وجود، با ظهور انواع مختلف داده‌های مرتبط با ترافیک مبتنی بر GPS، داده‌های بزرگی که داده‌های واقعی را منعکس نمی‌کنند، پدیدار شدند. نگوین و همکاران [ 17 ] مطالعاتی را طبقه بندی کرد که هدف سفر را با استفاده از این نوع داده ها استنباط می کند، مانند مطالعات مربوط به HG. در مطالعات استنتاج با هدف ترافیک مرتبط با HG، داده های حقیقت زمینی اختیاری هستند زیرا عقل سلیم یا الگوهای سفر از نظرسنجی های قبلی برای اعتبارسنجی کافی هستند [ 17 ]]. علاوه بر این، به جای تمرکز بر دقت در سطوح فردی، هدف آنها غنی سازی معنایی مسیر و کشف الگوهای کلی فعالیت است. از آنجا که فعالیت های حاشیه نویسی با تقریب مجاز است، اکثر مطالعات مرتبط با HG نتایج هدف سفر را با یادگیری بدون نظارت، مانند خوشه بندی نتایج بدون داده های درستی زمینی دقیق، استنباط می کنند [ 1 ، 2 ، 34 ].
با این حال، این مطالعه تکنیکی را برای تولید داده‌های حقیقت زمینی برای ارزیابی دقت روش‌شناسی ما به شیوه‌ای واقع‌بینانه پیشنهاد می‌کند – این تکنیک شامل کمی کردن هدف سفر با دوچرخه در سطح عقل سلیم است، زمانی که کاربر دوچرخه در یک زمان خاص پیاده می‌شود و محل. این معنی دار است زیرا تحقیقات مرتبط با HG با هدف به دست آوردن دانش عمومی در مورد تحرک و محل فعالیت ها انجام می شود. نرخ مالکیت گوشی هوشمند در کره جنوبی 95 درصد است [ 41]؛ بنابراین، ما از داده های انباشته سیار از دیدگاه جمعیت خدمات یا جمعیت زنده استفاده می کنیم که با جمعیت ساکن متفاوت است. بنابراین، داده‌های حقیقت زمینی هدف سفر برای اشتراک‌گذاری ناشناس دوچرخه بر اساس این فرض ایجاد می‌شود که اکثر مردم وقتی در مکان و زمان خاصی بودند، انتخاب‌های خاصی انجام می‌دادند. بنابراین، جهان واقعی را منعکس می‌کند، البته نه داده‌های کامل حقیقت زمین.
از این منظر، این مطالعه از داده های تلفن همراه و داده های POI برای تولید داده های حقیقت زمینی برای اهداف سفر با دوچرخه استفاده می کند. این امر مستلزم استانداردسازی اطلاعات مکانی موجود بود. داده های تلفن همراه بلادرنگ مورد استفاده شامل داده های جمعیت ارائه شده توسط شهر سئول بود. واحد اطلاعات مکانی منطقه خروجی بود که حداقل منطقه شمارش آماری ساخته شده برای در نظر گرفتن اندازه جمعیت (بهینه 500 نفر)، همگنی اجتماعی-اقتصادی (نوع مسکن، قیمت زمین) و شکل زمین بر اساس یک منطقه آماری پایه است. [ 42 ]. بر این اساس، اداره ملی آمار در کره داده‌های سرشماری را در واحدهای کوچک منطقه (مساحت خروجی) که کوچک‌تر از واحدهای اداری هستند، جمع‌آوری و ارائه می‌کند. همانطور که در شکل 4 نشان داده شده استواحد استاندارد شده به عنوان داده مش (50 × 50 متر) برای مطابقت با واحد فضایی داده های تلفن همراه که می تواند برای تعیین جمعیت شناور با توجه به زمان استفاده شود، متحد شد. داده ها در یک منطقه بافر که شامل POI در 250 متر از هر ایستگاه دوچرخه است، اعمال شد.
برای استاندارد کردن واحد سطح خروجی به داده‌های مش، وزن مش با استفاده از داده‌های مساحت کف ساختمان تعیین شد. این داده ها برای در نظر گرفتن منطقه ای که جمعیت واقعی در فضای جغرافیایی در آن زندگی می کنند استفاده شد. در شکل 5 ، داده های مش (واحد استاندارد)، داده های مساحت طبقه ساختمان و داده های سطح خروجی در همان فضا ارائه شده است. ابتدا نقاط در فواصل 5 متری در چند ضلعی ساختمان چیده شدند و سپس مساحت طبقه ساختمان در هر نقطه به طور مساوی تقسیم شد تا مقادیر ویژگی آنها به دست آید. به عنوان مثال ساختمان A که در شکل 5 نشان داده شده است، دارای زیربنای ساختمان 1000; اگر تعداد نقاط 100 باشد، وزن هر نقطه 10 خواهد بود. اگر این مقدار در یک شبکه توزیع شود، هر شبکه اطراف ساختمان A (که با خطوط چین قرمز مشخص شده است) وزن متفاوتی خواهد داشت. مرحله بعدی تعیین نواحی خروجی است که نقاط مش شماره گذاری شده به آن تعلق دارند. این مرحله برای تطبیق یک ناحیه مش و یک ناحیه خروجی بر اساس نقاط استفاده می شود.
در بیشتر موارد، محدوده ناحیه خروجی وسیع تر از مش است. بنابراین، اولی را می توان با تقسیم مناطق خروجی به مش محاسبه کرد. با این حال، مشابه آنچه در مرکز شکل 5 وجود دارد (که با رنگ زرد مشخص شده است)، یک مش ممکن است دارای چندین ناحیه خروجی باشد و بنابراین، واحد باید بر اساس مقدار نقطه استاندارد شود. به این ترتیب، داده های تلفن همراه برای هر دوره زمانی ساخته شده در واحدهای ناحیه خروجی را می توان در واحدهای مش استاندارد کرد.
3.3.2. استخراج هدف سفر با دوچرخه
روش برای استنباط هدف سفر با دوچرخه با استفاده از داده های تلفن همراه استاندارد شده در واحدهای مش و داده های POI در اطراف ایستگاه های دوچرخه به شرح زیر است. ابتدا، منطقه حائل با شعاع 250 متری ایستگاه دوچرخه در واحدهای مش استاندارد شده است. همانطور که در شکل 6 نشان داده شده است ، جمعیت شناور استنباط شده از داده های تلفن همراه به هر مش اختصاص داده شده است. هرچه مش تیره تر باشد، جمعیت شناور اختصاص داده شده بالاتر است. محاسبه با تقسیم جمعیت شناور بین داده های POI هر مش انجام می شود. به عنوان مثال، ناحیه مش در شکل 6مشخص شده با خطوط چین قرمز دارای دو POI مربوط به خرید و خدمات و حمل و نقل است و جمعیت شناور در این شبکه به هر یک از این انواع POI اختصاص داده می شود. به عبارت دیگر، POI ها دارای مقادیری هستند که از جمعیت شناور تخصیص داده شده اند، و زمانی که این ها برای هر ایستگاه دوچرخه ترکیب شوند، می توان نوع با بیشترین مقدار را به عنوان هدف سفر دوچرخه برای آن ایستگاه استنتاج کرد. بر این اساس، می توان استنباط کرد که هدف سفر با دوچرخه برای ایستگاه در شکل 6 ، خرید و خدمات است. از آنجایی که داده های تلفن همراه در یک منطقه زمانی ساخته شده اند، این روش ساخت مقدار زیادی از داده های واقعی زمینی را امکان پذیر می کند.

3.4. آموزش برای یادگیری ماشین

هنگامی که داده های ترافیک ایجاد می شوند، سه نوع روش برای استفاده از داده ها برای استنتاج هدف سفر وجود دارد، یعنی روش های مبتنی بر قانون، آماری و یادگیری ماشین و شبکه های عصبی [ 14 ، 15 ].]. روش‌های مبتنی بر قانون به‌طور سنتی به کار گرفته می‌شوند، با قوانین مورد استفاده نماینده، جداول تطبیق کاربری و هدف، و نزدیک‌ترین تطابق با POI. روش های آماری برای محاسبه احتمال هر هدف سفر با ادغام اطلاعات شخصی یا اطلاعات مکان پاسخ دهنده با استفاده از یک مدل لاجیت چند جمله ای یا محاسبه احتمال مبتنی بر فاصله استفاده می شود. روش‌های یادگیری ماشین و شبکه عصبی برای مقادیر بیشتر داده مناسب‌تر هستند و برای ساخت مدل‌های طبقه‌بندی و تشخیص الگوی پیچیده و محاسباتی استفاده می‌شوند. مطالعات اخیر تمایل به استفاده از روش های آماری یا یادگیری ماشینی (و شبکه عصبی) دارند [ 14 ].
استنتاج هدف سفر در این مطالعه از یک مدل یادگیری ماشینی استفاده کرد که ساخت یک مدل پیچیده‌تر را در مقایسه با استفاده از روش‌های مبتنی بر قانون یا آماری امکان‌پذیر کرد. این به این دلیل است که امکان یادگیری نظارت شده از طریق ساخت داده های حقیقت زمینی از داده های فراوان تری نسبت به بررسی های سفر استفاده می کند. با توجه به نیاز به یک مدل طبقه‌بندی برای کلاس‌های چندگانه با هدف سفرهای عمومی دوچرخه‌سواری، ما یادگیری را با استفاده از مدل‌های درخت تصمیم و جنگل تصادفی پیاده‌سازی کردیم، که نشان داده شده است عملکرد نسبتاً خوبی دارند [ 14 ، 16 ، 20 ، 43 ، 44 , 45 , 46 ].
الگوریتم‌های درخت تصمیم برای یادگیری نظارت شده به عنوان ابزار تحلیلی برای طبقه‌بندی داده‌ها در گروه‌های مختلف و پیش‌بینی از طریق قوانین تصمیم‌گیری که در یک ساختار درختی نمایش داده می‌شوند، مفید هستند. کلید آموزش درختان تصمیم گیری یادگیری به روشی است که ناخالصی طبقه بندی را به حداقل برساند که با استفاده از شاخص هایی مانند شاخص جینی و آنتروپی اندازه گیری می شود. مزیت الگوریتم های درخت تصمیم توانایی آنها در تفسیر نتایج آنهاست. معیارهای تقسیم بندی درخت تصمیم تولید شده نشان می دهد که کدام ویژگی ها به عنوان معیارهای طبقه بندی استفاده می شوند و مقادیر معیار چه هستند.
جنگل تصادفی یک روش مجموعه ای است که پیش بینی ها را با استفاده از مدل های درخت تصمیم چندگانه جمع می کند. داده‌های آموزشی متعددی برای ساخت درخت‌های تصمیم فردی برای هر مجموعه داده و انتخاب تصادفی متغیرها برای ساخت یک مدل درخت تصمیم تولید می‌شوند. جنگل تصادفی این مزیت را دارد که ساخت سریع یک مدل را امکان‌پذیر می‌کند، و حتی زمانی که اندازه داده‌های مدل پایه بزرگ است، می‌توان یک مدل درخت تصمیم گسترده بدون نیاز به توزیع داده ساخت. بر این اساس، جنگل تصادفی اطلاعاتی در مورد اهمیت متغیرهای فردی ارائه نمی دهد، مانند مدل های رگرسیون خطی یا لجستیک، اما به طور غیرمستقیم اهمیت متغیرها را تعیین می کند، به عنوان مثال، از طریق تخمین های خارج از کیسه [ 47 ].
نتایج آموزش توسط یادگیری ماشین با استفاده از ماتریس سردرگمی در جدول 4 ارزیابی شده است. برای ارزیابی عملکرد مدل از دو معیار ارزیابی، یعنی دقت و امتیاز 1 بر اساس معادلات (9) و (10) استفاده شد. دقت می تواند به طور مستقیم عملکرد مدل را نشان دهد، در حالی که امتیاز 1 یک معیار عملکرد مفید است زمانی که طبقه بندی داده ها نامتعادل است.

دقت=تین+تیپ تین+افن+افپ+تیپ
اف1 نمره=2×پrهجمنسon×rهجآللپrهجمنسمنon+rهجآللجایی که پrهجمنسمنon=تیپتیپ+افپ و rهجآلل=تیپتیپ+افن

4. آزمایش ها و نتایج

4.1. داده ها

منطقه آزمایشی در Seocho-gu واقع در سمت جنوبی رودخانه هان که از مرکز سئول، جمهوری کره می گذرد، قرار دارد. Seocho-gu دارای یک سیستم حمل و نقل مناسب است و یک منطقه تجاری نماینده در سئول، همراه با Gangnam-gu است. منطقه آزمایشی خاص، یک منطقه مسکونی به خوبی توسعه یافته است که در مجاورت محیط های طبیعی، مانند رودخانه هان و جنگل شهروند یانگجائه، در مقایسه با سایر مناطق دولتی محلی در سئول، میزان استفاده بالایی از دوچرخه های عمومی را به همراه دارد. دوره آزمایش 1 تا 30 ژوئن 2019 بود. تعداد کل ایستگاه های دوچرخه در Seocho-gu 87 بود.
داده‌های اشتراک دوچرخه مورد استفاده شامل داده‌های عمومی در دسترس از پلازای باز داده‌های سئول ( https://data.seoul.go.kr ، در 4 مارس 2021) بود. داده ها شامل تعداد دوچرخه، تاریخ و زمان اجاره، شماره محل اجاره، نام مکان اجاره، تعداد اسکله های اجاره، تاریخ و زمان بازگشت، شماره محل بازگشت، نام مکان بازگشت، تعداد اسکله های بازگشت، زمان استفاده و مسافت طی شده بود. . به طور کلی، 132788 واحد مبنا وجود داشت.
داده‌های POI مورد استفاده از نقشه‌های تجاری که در حال حاضر در بازار کره برای CNS استفاده می‌شوند، به‌دست آمدند. داده ها برای بررسی کاربری زمین در اطراف ایستگاه های دوچرخه استفاده شد. در مجموع، 19358 واحد داده POI برای Seocho-gu استفاده شد. انواع POI اصلی در داده‌ها برای تناسب با هدف این مطالعه، یعنی استنتاج هدف سفر با دوچرخه، اصلاح شدند. انواع POI اصلاح شده در جدول 5 ارائه شده است. POI در 250 متری ایستگاه دوچرخه برای تعیین کاربری زمین انتخاب شدند، به استثنای موارد اوقات فراغت دوچرخه، که شعاع 1000 متر برای آن استفاده شد.
داده‌های تلفن همراه مورد استفاده برای تولید داده‌های حقیقت پایه نیز داده‌های عمومی به‌دست‌آمده از سئول Open Data Plaza ( https://data.seoul.go.kr ، در 4 مارس 2021) بود. برای این منظور، تعداد افراد در یک واحد فضایی خاص در یک زمان خاص در یک روز مشخص بر اساس سیگنال‌های تلفن همراه KT که از 6000 ایستگاه پایه در سراسر سئول گرفته شده بود، برآورد شد. این روش برای شناسایی جمعیت شناور مفید است، نه جمعیت مسکونی، زیرا جمعیت منطقه خروجی که کوچکترین واحد آماری است، با منطقه زمانی مطابقت دارد.

4.2. استفاده از زمین در ایستگاه های دوچرخه توسط جاسازی نوع POI

انواع POI مرتبط با هشت هدف سفر با دوچرخه بر اساس کار یان و همکاران تعبیه شده است. [ 24 ] از طریق کاربرد مفاهیم محبوبیت و فاصله. در پیکربندی تاپل‌های POI، مقدار k نزدیک‌ترین تابع k روی 10 تنظیم شد، که منجر به ایجاد گروه‌هایی از 10 نزدیک‌ترین نقطه نقطه به ازای هر POI شد. تاپل ها با استفاده از پارامتر افزوده شدند βجoمتربمنnهدلjارائه شده توسط یان و همکاران. [ 24 ]، و محبوبیت یک POI بر اساس تعداد دوچرخه های اجاره ای در ایستگاهی که POI به آن تعلق دارد محاسبه شد. تعداد نهایی تاپل های POI به دست آمده با افزایش داده ها 323184 بود. آزمایش‌های جاسازی نوع POI در پایتون 3.7.7 و TensorFlow 2.0.0 انجام شد. تعداد ابعاد تعبیه شده روی 70 و تعداد تکرارها 20000 تنظیم شد. مقادیر جاسازی بر اساس نوع POI محاسبه شده از طریق آموزش در جدول 6 ارائه شده است.
مقادیر تعبیه‌شده نوع POI محاسبه‌شده برای هر ایستگاه دوچرخه جمع‌آوری شد و تجزیه و تحلیل خوشه‌بندی k-means سپس انجام شد. از آنجایی که از خوشه بندی k-means برای تعیین مرکز خوشه برای به حداقل رساندن مجموع مربعات خطا (SSE) استفاده می شود، مقدار بهینه Cluster k با استفاده از تکنیک elbow با بررسی SSE تعیین می شود. در آزمایش های حاضر، SSE در حداقل مقدار برای k = 4 بود، همانطور که در شکل 7 نشان داده شده است.
نتایج نهایی خوشه بندی در شکل 8 نشان داده شده است. برای تجسم عناصر جغرافیایی منطقه آزمایشی، یک لایه ارائه شده توسط OpenStreetMap ( https://www.openstreetmap.org ، دسترسی به 4 مارس 2021) به عنوان نقشه پس زمینه استفاده شد. یک تجزیه و تحلیل نوع POI ساده از نتایج خوشه‌ای انجام شد. مشخص شد که خوشه 1 مرکز کار، حمل و نقل و خرید است، در حالی که خوشه 2 منطقه ای با مقدار نسبتاً بالایی از امکانات تفریحی مرتبط با دوچرخه مانند جنگل های مجاور، زمین های بازی و پارک ها بود. مشاهده شد که خوشه 3 یک منطقه مسکونی است که در آن مدارس و آکادمی ها غالب بودند، و خوشه 4 منطقه ای با POI های کم و نسبتاً ناچیز مشاهده شد.
برای تأیید توزیع POI در خوشه های مهم، مناطق A و B در شکل 8 بزرگنمایی شده و در شکل 9 نشان داده شده است.. از آنجا که منطقه A با خوشه های 1، 2 و 3 متراکم است، ویژگی ها را می توان برای هر خوشه مقایسه کرد. خوشه 1 (که با رنگ قرمز مشخص شده است) مرکز کار، حمل و نقل و خرید است، با POI های مختلف در امتداد جاده متمرکز شده است. خوشه 2 (که با رنگ نارنجی مشخص شده است) دارای POIهای نسبتاً کمتری است اما بسیار تحت تأثیر POIهای مربوط به اوقات فراغت دوچرخه مانند پارک ها و زمین های بازی است. POI های اوقات فراغت دوچرخه به گونه ای طراحی شده اند که بردی معادل 1000 متر از مرکز یک ایستگاه دوچرخه داشته باشند. بنابراین، POIهای خارج از محدوده بافر نیز در محدوده این خوشه قرار دارند. در نتیجه، نه تنها مجموعه ورزشی Banpo در خوشه 2، بلکه پارک Puleun و پارک کودکان Seorae نیز در محدوده کلاستر 2 قرار دارند. خوشه 3 (که با رنگ زرد مشخص شده است) یک منطقه مسکونی است که در آن POI های مسکونی در پایین شکل مشخص شده اند. منطقه B در دامنه یک کوه قرار دارد و بنابراین دارای POI های نسبتاً کمتری است. خوشه 4 (با رنگ سبز مشخص شده است) ویژگی های سبزه را منعکس می کند و خوشه 2 تحت تأثیر پارک کودکان Wissaem در خارج از محدوده بافر، مشابه منطقه A است. این تأیید می کند که طراحی تعبیه شده از نوع POI ما به خوبی برای سفرهای دوچرخه در هنگام پیکربندی خوشه ها سفارشی شده است.
اگر این روش بر روی نتایج کارهای موجود اعمال شود، نتایج مطالعه را بهبود می بخشد. در این مطالعه فقط اطلاعات نوع در جاسازی POI استفاده می شود. با این حال، اطلاعات مربوط به اندازه یا زمان باز بودن POI نیز می تواند مورد استفاده قرار گیرد [ 48 ]. تأثیر یک POI تفریحی دوچرخه، مانند پارکی که بر ترافیک دوچرخه تأثیر می گذارد، ممکن است بسته به اندازه آن متفاوت باشد. ما از یک بافر 250 متری برای طراحی محدوده‌ای استفاده کردیم که در حال حاضر بر ایستگاه‌های دوچرخه تأثیر می‌گذارد – اگر از فاصله شبکه استفاده شود یا یک منطقه خدماتی اعمال شود، این نتایج واقعی‌تر تعبیه‌سازی را ارائه می‌دهد [ 24 ]. اگر از داده‌های اضافی برای اعتبارسنجی نتایج خوشه‌بندی فعلی استفاده شود، می‌توان نتایج را آسان‌تر تفسیر کرد. ژای و همکاران [ 25] مناطق عملکردی شهری را با استفاده از جاسازی POI استخراج کرد و نتایج استخراج را با استفاده از داده‌های OD کامیون برای تفسیر نتایج خوشه‌بندی شده تأیید کرد.

4.3. نتایج استنتاج هدف سفر با دوچرخه عمومی

مجموعه داده نهایی شامل ویژگی های مربوط به هدف سفر با دوچرخه است که از داده های اشتراک دوچرخه و ویژگی های کاربری زمین محاسبه شده با تعبیه نوع POI به دست آمده است. همانطور که در جدول 7 نشان داده شده است، در مجموع هشت ویژگی وجود دارد. داده های حقیقت زمینی با استفاده از مقادیر هدف سفر محاسبه شده از داده های تلفن همراه و داده های POI به دست آمد. در میان ویژگی‌ها، مقادیر کاربری زمین مبدا و مقصد سفر که با تعبیه نوع POI محاسبه می‌شود، همانطور که در بخش قبل مورد بحث قرار گرفت، برای مقادیر خوشه‌بندی به‌دست‌آمده اعمال شد. پس از آن، به دلیل ماهیت طبقه‌بندی داده‌ها، رمزگذاری تک داغ انجام شد. از 132788 واحد داده اشتراک دوچرخه استفاده شده برای Seocho-gu، سئول، برای ماه ژوئن 2019، واحدهای مربوط به 1 تا 20 ژوئن به عنوان داده های آموزشی طبقه بندی شدند، و واحدهای مربوط به 21-30 ژوئن به عنوان داده های آزمایشی برای آزمایش طبقه بندی شدند.
الگوریتم درخت تصمیم و جنگل تصادفی برای استنتاج سفر با دوچرخه استفاده شد. ما اعتبارسنجی متقابل k-fold را انجام دادیم، که در آن داده‌ها به طور مکرر برای آموزش مدل‌های متعدد و اندازه‌گیری عملکرد تعمیم تقسیم شدند. درخت تصمیم و جنگل تصادفی نیاز به تنظیم فراپارامتر برای متغیرهای بحرانی دارند و برای انتخاب فراپارامترهای بهینه با عملکرد پیش‌بینی بالا با استفاده از ماژول GridSearchCV Python از Scikit-learn استفاده شدند.
نتایج تجربی نشان داد که عملکرد بهینه (معیار دقت) اندازه‌گیری شده توسط یادگیری ماشین 78.95 درصد برای درخت تصمیم و 74.08 درصد برای جنگل تصادفی بود. مدل درخت تصمیم نیز عملکرد بهتری از نظر امتیاز F1 نشان داد، یعنی 66.43٪ همانطور که توسط ماتریس سردرگمی تعیین می شود. نتایج تجربی برای سفرهای مختلف با دوچرخه در جدول 8 ارائه شده است، که از آن می توان پیش بینی دقیقی به خصوص برای خرید و خدمات، کار و ترانزیت مشاهده کرد. هدف آموزشی برای یک سفر با دوچرخه نسبتا کمتر قابل پیش بینی است، که به تعداد نسبتاً زیادی از POIهای خرید و خدمات در Seocho-gu نسبت داده می شود. علاوه بر این، ویژگی‌های POI برای خرید و خدمات با ویژگی‌های انواع مختلف POI دیگر ترکیب می‌شوند، زیرا POIهای خرید و خدمات به تنهایی قرار ندارند و به طور مشابه بر سایر اهداف سفر تأثیر می‌گذارند. این مشکل را می توان با تفکیک طبقه بندی انواع POI حل کرد.
علاوه بر این، برای بهبود دقت کلی، استفاده از الگوریتم های یادگیری عمیق ممکن است یک جایگزین باشد، که در آن ویژگی های کاربر دوچرخه (به عنوان مثال، جنسیت، سن) می تواند به عنوان ویژگی اضافه شود. در میان مطالعات مربوط به استنتاج هدف سفر، مطالعات با استفاده از یادگیری عمیق دقت بالاتری را نشان داده‌اند [ 13 ، 29 ]. از آنجایی که یادگیری عمیق برای داده های بزرگ به خوبی کار می کند، لازم است با افزایش دامنه مکانی و زمانی مطالعه، و همچنین ویژگی هایی که بر هدف سفر تأثیر می گذارد، داده ها ساخته شوند. علاوه بر این، کل مجموعه داده‌ها باید با ترکیب داده‌های مختلف تولید شده توسط کاربر، مانند داده‌های بررسی که توسط کاربران واقعی دوچرخه ساخته شده‌اند، ساخته شوند.

5. بحث و نتیجه گیری

این مقاله روشی را برای استنباط هدف سفرهای دوچرخه از داده‌های تاریخی دوچرخه‌های مشترک پیشنهاد می‌کند. بررسی‌های اشتراک دوچرخه، نگاه دقیق‌تری به تحرک شهری، به‌ویژه اولین و آخرین مایل حمل‌ونقل عمومی را تسهیل می‌کند. بنابراین، تصمیم گیری در مورد مسائل مختلف شهری را می توان با استنباط هدف از سفرهای با دوچرخه پشتیبانی کرد. یک عامل اساسی در استنتاج هدف سفر، استفاده از زمین مقاصد است [ 18 ، 19 ، 20 ]]. بر اساس این واقعیت، این مطالعه مشکل کاربری ترکیبی شهری را با استفاده از فناوری تعبیه POI حل کرد. تاریخ سفر با دوچرخه، زمان حرکت، زمان رسیدن، زمان کل، مسافت کل سفر و فاصله بین ایستگاه‌ها به عنوان ویژگی‌های مرتبط از داده‌های اشتراک دوچرخه استفاده شد. از داده‌های POI برای استخراج کاربری‌های زمین در مبدا و مقصد استفاده شد که به طور قابل‌توجهی هدف سفر را منعکس می‌کند. POI در شعاع 250 متری از ایستگاه های دوچرخه (1000 متر برای POI های مربوط به اوقات فراغت دوچرخه) برای استخراج کاربری زمین از طریق تعبیه نوع POI، روشی که توسط Yan et al. [ 24]، با انواع POI که برای علاقه فعلی به سفرهای دوچرخه‌سواری دوباره تعریف شده‌اند. فاصله جغرافیایی POI و تعداد دوچرخه‌های اجاره‌ای در هر ایستگاه به‌عنوان فاکتورهای افزایش چندگانه برای تعبیه نوع POI در نظر گرفته شد. با این حال، اگر صدها POI برای هر ایستگاه دوچرخه وجود داشته باشد، اطلاعات نوع POI به تنهایی نمی‌تواند اولویت‌های دوچرخه‌سوار را برای بازدید از منطقه نشان دهد. بنابراین، تعداد دوچرخه های اجاره ای در هر ایستگاه برای به دست آوردن اطلاعات محبوبیت برای هر POI توزیع شد. ما همچنین روشی را برای استفاده از داده‌های تلفن همراه موقت و داده‌های POI برای استخراج داده‌های حقیقت زمین برای اهداف سفر با دوچرخه ایجاد کردیم.
آزمایشات این مطالعه 87 ایستگاه دوچرخه را در Seocho-gu، سئول در نظر گرفت. دوره مطالعه 1 تا 31 ژوئن 2019 بود، و در مجموع، 132788 واحد داده عمومی اشتراک دوچرخه مورد استفاده قرار گرفت. درخت تصمیم و جنگل تصادفی برای یادگیری ماشین برای استنتاج هدف سفر با دوچرخه، با پارامترهای فراپارامتر برای عملکرد بهینه تنظیم شدند. کاربری های زمین در ایستگاه های دوچرخه استنباط شده توسط تعبیه نوع POI به چهار خوشه تقسیم شدند که درخت تصمیم عملکرد بهتری داشت و دقت 78.95٪ و امتیاز F1 66.43٪ داشت.
نتایج حاصل از تعبیه نوع POI نسبتاً به خوبی استفاده از زمین مبدا و مقصد را برای سفرهای دوچرخه‌سواری پیشنهاد شده در این مطالعه نشان داد. یک ایستگاه دوچرخه به طور متوسط ​​شامل 70 تا 100 POI در یک منطقه حائل 250 متری است. با این حال، خوشه های مربوط به این کاربری های مخلوط به خوبی در این مطالعه طبقه بندی شدند. به طور خاص، در مورد POI اوقات فراغت دوچرخه، که بر سفرهای دوچرخه‌سواری تأثیر می‌گذارد، محدوده تأثیر از مرکز ایستگاه دوچرخه تا 1000 متر تنظیم شد و نتایج خوشه‌ای ( شکل 9 ) نشان داد که جزئیات به خوبی منعکس شده‌اند. علاوه بر این، نتایج استنتاج هدف سفر به‌دست‌آمده از طریق یادگیری ماشین نشان داد که پیش‌بینی‌های نسبتاً دقیقی برای هر هشت هدف ترافیکی انجام می‌شود. جدول 8). در مطالعات قبلی مربوط به استنتاج هدف سفر، دقت 60 تا 90 درصد تنها از طریق استفاده از داده‌های نظرسنجی به دست آمد. این مطالعه به عنوان اولین گام به سمت استفاده از یادگیری ماشین بر روی داده‌های مکانی – نه داده‌های نظرسنجی – برای استنتاج هدف سفر اهمیت دارد.
نتایج این مطالعه نه تنها برای دوچرخه‌ها بلکه برای افزایش اخیر در استنباط هدف سفرهای حرکتی شخصی نیز می‌تواند مفید باشد. تکنیک جاسازی POI ویژه دوچرخه پیشنهاد شده در این مطالعه را می توان با توجه به تحرک مربوطه سفارشی کرد و برای استنتاج هدف سفر آن استفاده کرد. این مطالعه منبع خوبی برای تصمیم‌گیری در مورد مسائل شهری برای سیاست‌گذاران ارائه می‌دهد، و ابزاری را برای استنتاج هدف سفر با دوچرخه با استفاده از داده‌های اشتراک دوچرخه و داده‌های POI در دسترس عموم ارائه می‌دهد. استنباط اهداف سفر با استفاده از روش شناسی پیشنهادی در این مطالعه و تحلیل الگوهای آن به درک بهتر علل حرکت شخصی در داخل شهرها منجر می شود.
این مطالعه با کارهای مربوط به استنباط هدف سفر با استفاده از داده‌های نظرسنجی متفاوت است، زیرا بر کسب دانش عمومی در مورد تحرک دوچرخه و مکان فعالیت‌ها با استفاده از فرآیندهای تقویت‌کننده معنا که منعکس‌کننده دنیای واقعی هستند به جای بهبود دقت استنتاج از یک ترافیک تمرکز می‌کند. -دیدگاه مهندسی برای افزایش معنایی داده‌های اشتراک‌گذاری دوچرخه، استفاده از زمین در مبدا و مقصد با استفاده از فناوری جاسازی POI استخراج شد. علاوه بر این، این مطالعه روش پیشنهادی را با تولید داده‌های حقیقت زمینی با استفاده از داده‌های تلفن همراه و داده‌های POI برای استنباط هدف سفر با دوچرخه در سطح عقل سلیم ارزیابی کرد.
با این حال، این مطالعه دارای محدودیت است که روش پیشنهادی برای تولید داده های حقیقت زمینی از داده های انباشته استفاده می کند و نه داده ها در سطح تفکیک شده. با این وجود، این نشان دهنده دشواری بررسی سفر از افراد از دیدگاه واقع بینانه است. ما معتقدیم که نتایج این مطالعه از نظر جغرافیای انسانی معنادار است، که هدف آن غنی سازی معنایی و کشف الگوهای عمومی تحرک به جای تمرکز بر دقت در سطوح فردی است. علاوه بر این، یک مشکل وجود دارد که ویژگی‌های فردی کاربران دوچرخه را نمی‌توان در هنگام انتخاب ویژگی‌ها برای استنتاج هدف سفر در نظر گرفت. زیرا سطح داده‌های ارائه‌شده فقط اطلاعات مربوط به مبدا و نه کل داده‌های OD را برای محافظت از حریم خصوصی کاربران ارائه می‌کند.
از منظر روش شناختی، ما نوع POI را به هشت در طول جاسازی POI محدود کردیم و فقط از اطلاعات نوع برای تقویت داده ها استفاده کردیم. این محدودیت را می توان با تقسیم بندی نوع POI و طراحی مجدد الگوریتم برای افزایش داده ها با استفاده از اطلاعات مختلف مانند اندازه یا زمان باز بودن POI در طول جاسازی POI برطرف کرد. علاوه بر این، نتایج را می توان با همگرایی داده های مختلف مانند رسانه های اجتماعی و داده های تلفن همراه برای تقویت معنای خوشه استخراج شده تأیید کرد. الگوریتم های یادگیری عمیق که ثابت شده است نتایج استنتاج نسبتا خوبی را ارائه می دهند می توانند برای بهبود دقت استنتاج هدف سفر مورد استفاده قرار گیرند. از آنجایی که یادگیری عمیق تنها برای مجموعه داده های بزرگ نتایج خوبی به همراه دارد، محدوده مکانی و زمانی سایت های آزمایشی باید بهبود یابد. 

منابع

  1. بائو، جی. خو، سی. لیو، پی. وانگ، دبلیو. کاوش الگوهای سفر و اهداف سفر اشتراک‌گذاری دوچرخه با استفاده از داده‌های کارت هوشمند و نقاط مورد علاقه آنلاین. شبکه تف کردن اقتصاد 2017 ، 17 ، 1231-1253. [ Google Scholar ] [ CrossRef ]
  2. زینگ، ی. وانگ، ک. لو، جی جی در حال بررسی الگوهای سفر و اهداف سفر اشتراک‌گذاری دوچرخه بدون اسکله با تجزیه و تحلیل داده‌های عظیم اشتراک‌گذاری دوچرخه در شانگهای، چین. J. Transp. Geogr. 2020 , 87 , 102787. [ Google Scholar ] [ CrossRef ]
  3. یانگ، ی. هپنستال، ا. ترنر، آ. Comber، A. تجزیه و تحلیل فضایی-زمانی و نموداری از الگوهای اشتراک دوچرخه بدون اسکله برای درک جریان های شهری در طول آخرین مایل. محاسبه کنید. محیط زیست شهری. سیستم 2019 ، 77 ، 101361. [ Google Scholar ] [ CrossRef ]
  4. فیشمن، ای. Bikeshare: مروری بر ادبیات اخیر. ترانسپ Rev. 2016 , 36 , 92-113. [ Google Scholar ] [ CrossRef ]
  5. صابری، م. غمامی، م. گو، ی. شجاعی، محمدحسن; فیشمن، ای. درک تأثیرات یک اختلال حمل و نقل عمومی بر الگوهای تحرک اشتراکی دوچرخه: موردی از اعتصاب مترو در لندن. J. Transp. Geogr. 2018 ، 66 ، 154-166. [ Google Scholar ] [ CrossRef ]
  6. گیرائو، بی. آمپودیا، م. مولینا، ر. García-Valdecasas, J. رفتار دانش‌آموز نسبت به اشتراک خودروی شناور آزاد: اولین شواهد از تجربه در مادرید. ترانسپ Res. Procedia 2018 ، 33 ، 243-250. [ Google Scholar ] [ CrossRef ]
  7. لو واین، اس. پولاک، جی. تأثیر اشتراک‌گذاری خودروی شناور بر مالکیت خودرو: یافته‌های مرحله اولیه از لندن. ترانسپ سیاست 2019 ، 75 ، 119-127. [ Google Scholar ] [ CrossRef ]
  8. خو، ی. چن، دی. ژانگ، ایکس. تو، دبلیو. چن، ی. شن، ی. راتی، سی. مناظر و نبض های فعالیت های دوچرخه سواری را از یک سیستم اشتراک دوچرخه بدون اسکله باز کنید. محاسبه کنید. محیط زیست شهری. سیستم 2019 ، 75 ، 184-203. [ Google Scholar ] [ CrossRef ]
  9. Ai، Y. لی، ز. گان، م. ژانگ، ی. یو، دی. چن، دبلیو. Ju، Y. یک رویکرد یادگیری عمیق در پیش‌بینی توزیع مکانی-زمانی کوتاه‌مدت سیستم اشتراک دوچرخه بدون اسکله. محاسبات عصبی Appl. 2018 ، 31 ، 1665-1677. [ Google Scholar ] [ CrossRef ]
  10. ژائو، جی. فن، دبلیو. Zhai، X. شناسایی ویژگی های کاربری زمین با استفاده از داده های به اشتراک گذاری دوچرخه: یک رویکرد یادگیری عمیق. J. Transp. Geogr. 2020 , 82 , 102562. [ Google Scholar ] [ CrossRef ]
  11. اسامه، ا. سید، ت. مدل‌های Bigazzi، AY برای تخمین کیلومترهای دوچرخه‌سواری در سطح منطقه با استفاده از متغیرهای شبکه دوچرخه، کاربری زمین و تسهیلات جاده‌ای. ترانسپ Res. بخش A خط مشی Pr. 2017 ، 96 ، 14-28. [ Google Scholar ] [ CrossRef ]
  12. یانگ، ی. هپنستال، ا. ترنر، آ. Comber، A. چه کسی، کجا، چرا و چه زمانی؟ استفاده از کارت هوشمند و داده های رسانه های اجتماعی برای درک تحرک شهری. ISPRS Int. J. Geo-Inform. 2019 ، 8 ، 271. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  13. کوی، ی. منگ، سی. او، س. گائو، جی. پیش‌بینی هدف سفر فعلی و بعدی با داده‌های رسانه‌های اجتماعی و Google Places. ترانسپ Res. قسمت C Emerg. تکنولوژی 2018 ، 97 ، 159-174. [ Google Scholar ] [ CrossRef ]
  14. ارماگون، ا. فن، ی. ولفسون، جی. آدوماویسیوس، جی. Das, K. پیش‌بینی هدف سفر در زمان واقعی با استفاده از خدمات جستجو و اکتشاف مبتنی بر مکان آنلاین. ترانسپ Res. قسمت C Emerg. تکنولوژی 2017 ، 77 ، 96-112. [ Google Scholar ] [ CrossRef ]
  15. گونگ، ال. موریکاوا، تی. یاماموتو، تی. ساتو، اچ. استخراج داده های سفر شخصی از داده های GPS: مروری بر ادبیات روش های موجود. Procedia Soc. رفتار علمی 2014 ، 138 ، 557-565. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  16. مونتینی، ال. ریزر-شوسلر، ن. هورنی، ع. Axhausen، KW شناسایی هدف سفر از مسیرهای GPS. ترانسپ Res. ضبط J. Transp. Res. هیئت 2014 ، 2405 ، 16-23. [ Google Scholar ] [ CrossRef ]
  17. نگوین، MH; آرموگم، ج. مادر، ج.-ال. گارسیا، سی. بررسی انتساب هدف سفر در نظرسنجی های سفر مبتنی بر GPS. J. Traffic Transp. مهندس 2020 ، 7 ، 395-412. [ Google Scholar ] [ CrossRef ]
  18. السگر، ا. توسلی، ع. مصباح، م. فریرا، ال. هیکمن، ام. استنتاج هدف سفر حمل و نقل عمومی با استفاده از داده های کرایه کارت هوشمند. ترانسپ Res. قسمت C Emerg. تکنولوژی 2018 ، 87 ، 123-137. [ Google Scholar ] [ CrossRef ]
  19. بوته، دبلیو. Maat، K. استخراج و اعتبارسنجی اهداف سفر و حالت‌های سفر برای بررسی‌های سفر چند روزه مبتنی بر GPS: یک برنامه کاربردی در مقیاس بزرگ در هلند. ترانسپ Res. قسمت C Emerg. تکنولوژی 2009 ، 17 ، 285-297. [ Google Scholar ] [ CrossRef ]
  20. دنگ، ز. Ji, M. استخراج قوانین برای شناسایی هدف سفر از داده های بررسی سفر GPS و داده های استفاده از زمین: رویکرد یادگیری ماشینی. در مجموعه مقالات هفتمین کنفرانس بین المللی مطالعات ترافیک و حمل و نقل (ICTTS) 2010، کونمینگ، چین، 3 تا 5 اوت 2010. [ Google Scholar ]
  21. ژانگ، ایکس. سان، ی. ژنگ، ا. وانگ، ی. رویکردی جدید برای پالایش انواع کاربری زمین: پیش‌بینی دسته‌های نقطه‌نظر با استفاده از داده‌های ورود به Weibo. ISPRS Int. J. Geo-Inform. 2020 ، 9 ، 124. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  22. لانگ، ی. لیو، X. گرافیک ویژه. پکن، چین چقدر مختلط است؟ کاوش بصری کاربری مختلط زمین. محیط زیست طرح. یک اقتصاد. فضا 2013 ، 45 ، 2797-2798. [ Google Scholar ] [ CrossRef ]
  23. لیو، ک. یین، ال. لو، اف. Mou، N. تجسم و کاوش تنظیمات POI مناطق شهری در فضای معنایی نوع POI. Cities 2020 , 99 , 102610. [ Google Scholar ] [ CrossRef ]
  24. یان، بی. یانوویچ، ک. مای، جی. Gao, S. From itdl to place2vec: استدلال در مورد شباهت و ارتباط نوع مکان با یادگیری تعبیه‌ها از زمینه‌های فضایی تقویت‌شده. در مجموعه مقالات بیست و پنجمین کنفرانس بین المللی ACM SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی، ردوندو بیچ، کالیفرنیا، ایالات متحده آمریکا، 7 تا 10 نوامبر 2017. [ Google Scholar ]
  25. ژای، دبلیو. بای، ایکس. شی، ی. هان، ی. پنگ، Z.-R. Gu, C. Beyond Word2vec: رویکردی برای استخراج و شناسایی منطقه عملکردی شهری با ترکیب Place2vec و POI. محاسبه کنید. محیط زیست شهری. سیستم 2019 ، 74 ، 1-12. [ Google Scholar ] [ CrossRef ]
  26. فنگ، اس. کنگ، جی. آن، ب. Chee, YM Poi2vec: نمایش نهفته جغرافیایی برای پیش‌بینی بازدیدکنندگان آینده. در مجموعه مقالات سی و یکمین کنفرانس AAAI در مورد هوش مصنوعی، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، 4 تا 9 فوریه 2017. [ Google Scholar ]
  27. یائو، ی. لی، ایکس. لیو، ایکس. لیو، پی. لیانگ، ز. ژانگ، جی. Mai، K. سنجش توزیع فضایی کاربری زمین شهری با ادغام نقاط مورد علاقه و مدل Google Word2Vec. بین المللی جی. جئوگر. Inf. علمی 2017 ، 31 ، 825-848. [ Google Scholar ] [ CrossRef ]
  28. چن، سی. جیائو، اس. ژانگ، اس. لیو، دبلیو. فنگ، ال. Wang, Y. TripImputor: زمان واقعی ورود تاکسی هدف سفر با استفاده از داده های شهری چند منبعی. IEEE Trans. هوشمند ترانسپ سیستم 2018 ، 19 ، 3292-3304. [ Google Scholar ] [ CrossRef ]
  29. منگ، سی. کوی، ی. او، س. سو، ال. Gao, J. استنتاج هدف سفر با مسیرهای GPS، POI و داده های رسانه های اجتماعی با برچسب جغرافیایی. در مجموعه مقالات کنفرانس بین‌المللی IEEE 2017 درباره داده‌های بزرگ، بوستون، MA، ایالات متحده آمریکا، 11 تا 14 دسامبر 2017. [ Google Scholar ]
  30. ژانگ، ز. او، س. زو، اس. پتانسیل های استفاده از رسانه های اجتماعی برای استنتاج رفتار سفر طولی: یک روش خوشه بندی مبتنی بر مدل متوالی. ترانسپ Res. قسمت C Emerg. تکنولوژی 2017 ، 85 ، 396-414. [ Google Scholar ] [ CrossRef ]
  31. باک، دی. بوهلر، آر. هاپ، پی. رالز، بی. چانگ، پی. Borecki، N. آیا کاربران اشتراک دوچرخه با دوچرخه سواران عادی متفاوت هستند؟ اولین نگاهی به کاربران کوتاه مدت، اعضای سالانه و دوچرخه سواران منطقه در منطقه واشنگتن دی سی. ترانسپ Res. رکورد 2013 ، 2387 ، 112-119. [ Google Scholar ] [ CrossRef ]
  32. فیشمن، ای. واشنگتن، اس. هاورث، ن. واتسون، A. عوامل مؤثر بر عضویت اشتراک دوچرخه: تجزیه و تحلیل ملبورن و بریزبن. ترانسپ Res. بخش A سیاست سیاست. 2015 ، 71 ، 17-30. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  33. کمپبل، AA; گیلاس، CR; رایرسون، ام اس؛ یانگ، ایکس. عوامل مؤثر بر انتخاب دوچرخه های مشترک و دوچرخه های برقی مشترک در پکن. ترانسپ Res. قسمت C Emerg. تکنولوژی 2016 ، 67 ، 399-414. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  34. چن، سی. لیائو، سی. Xie، X. وانگ، ی. Zhao, J. Trip2Vec: یک رویکرد جاسازی عمیق برای خوشه بندی و پروفایل اهداف سفر تاکسی. پارس محاسبات همه جا حاضر. 2018 ، 23 ، 53-66. [ Google Scholar ] [ CrossRef ]
  35. گائو، اس. Yan, B. Place2Vec: تجسم و استدلال درباره شباهت و ارتباط نوع مکان با یادگیری تعبیه‌های زمینه. در مجموعه مجموعه مقالات تکمیلی چهاردهمین کنفرانس بین المللی خدمات مبتنی بر مکان، زوریخ، سوئیس، 15 تا 17 ژانویه 2018. [ Google Scholar ]
  36. لیو، ک. گائو، اس. کیو، پی. لیو، ایکس. یان، بی. Lu, F. Road2Vec: اندازه گیری تعاملات ترافیک در سیستم جاده های شهری از مسیرهای سفر عظیم. ISPRS Int. J. Geo-Inform. 2017 ، 6 ، 321. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  37. کریولاری، ا. Beinat, E. From Motion Activity to Geo-Embeddings: Generating and Exploring Vector Representations of Locations, Traces and Visitors from Large-Scale Mobility Data. ISPRS Int. J. Geo-Inform. 2019 ، 8 ، 134. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  38. لیو، ایکس. آندریس، سی. رحیمی، س. طاقچه مکان و تنوع منطقه ای آن: اندازه گیری الگوهای بافت فضایی برای نقاط مورد علاقه با یادگیری بازنمایی. محاسبه کنید. محیط زیست شهری. سیستم 2019 ، 75 ، 146-160. [ Google Scholar ] [ CrossRef ]
  39. جین، جی. شیائو، ز. کیو، کیو. Fang, J. مدل Place2vec مبتنی بر Geohash. در مجموعه مقالات IGARSS 2019-2019 IEEE بین المللی زمین شناسی و سمپوزیوم سنجش از دور، یوکوهاما، ژاپن، 28 ژوئیه تا 2 اوت 2019. [ Google Scholar ]
  40. فقیه ایمانی، ع. Eluru، N. ترکیب تاثیر تعاملات مکانی-زمانی بر تقاضای سیستم اشتراک دوچرخه: مطالعه موردی سیستم CitiBike نیویورک. J. Transp. Geogr. 2016 ، 54 ، 218-227. [ Google Scholar ] [ CrossRef ]
  41. Pewrearch. در دسترس آنلاین: https://www.pewresearch.org/global/2019/02/05/smartphone-ownership-is-growing-rapidly-around-the-world-but-not-always-equally (دسترسی در 15 آوریل 2021 ).
  42. KOSTAT. در دسترس آنلاین: https://sgis.kostat.go.kr (در 15 آوریل 2021 قابل دسترسی است).
  43. وو، جی. جیانگ، سی. هیوستون، دی. بیکر، دی. Delfino، R. طبقه بندی خودکار فعالیت زمانی بر اساس داده های ردیابی سیستم موقعیت یابی جهانی (GPS). محیط زیست Health 2011 , 10 , 101. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  44. لو، ی. لیو، ی. فناوری های فراگیر مکان یابی: فرصت ها و چالش ها برای مطالعات جغرافیایی. محاسبه کنید. محیط زیست شهری. سیستم 2012 ، 36 ، 105-108. [ Google Scholar ] [ CrossRef ]
  45. کیم، ی. پریرا، اف سی؛ ژائو، اف. قورپاد، ع. Zegras، PC; Ben-Akiva، M. شناسایی فعالیت برای یک بررسی سفر مبتنی بر وب و تلفن هوشمند. arXiv 2015 ، arXiv:1502.03634 2015. [ Google Scholar ]
  46. اولیویرا، ام جی اس؛ ووشا، پ. ولف، جی. میچل، ام. ارزیابی دو روش برای شناسایی هدف سفر در بررسی‌های سفر خانگی مبتنی بر GPS. ترانسپ Res. ضبط J. Transp. Res. هیئت 2014 ، 2405 ، 33-41. [ Google Scholar ] [ CrossRef ]
  47. دیاز-اوریارته، آر. De Andrés, SA انتخاب ژن و طبقه بندی داده های ریزآرایه با استفاده از جنگل تصادفی. BMC Bioinform. 2006 ، 7 ، 3. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  48. گونگ، ال. لیو، ایکس. وو، ال. لیو، ی. استنباط اهداف سفر و کشف الگوهای سفر از داده‌های مسیر تاکسی. کارتوگر. Geogr. Inf. علمی 2016 ، 43 ، 103-114. [ Google Scholar ] [ CrossRef ]
شکل 1. نمودار جریان روش استنتاج هدف سفر با دوچرخه پیشنهادی.
شکل 2. جاسازی کلمه در مقابل جاسازی نوع POI.
شکل 3. ترکیب یک جفت تاپل POI در یک ایستگاه دوچرخه.
شکل 4. استانداردسازی واحدهای فضایی مختلف به داده های مش.
شکل 5. روش استانداردسازی با استفاده از داده های مساحت طبقه ساختمان.
شکل 6. روش استخراج هدف سفر با دوچرخه با استفاده از داده های تلفن همراه و داده های POI.
شکل 7. نتایج تکنیک زانویی برای تعیین تعداد بهینه خوشه ها.
شکل 8. نتایج خوشه بندی نهایی.
شکل 9. تجسم توزیع POI در یک خوشه.

بدون دیدگاه

دیدگاهتان را بنویسید