1. معرفی
با توسعه ابزارهای مختلف موقعیتیابی، رفتار تحرکی افراد را میتوان به طور مداوم از تلفنهای همراه و وسایل GPS دریافت کرد [ 1 ، 2 ]. این دادههای تحرک بهعنوان پایهای مهم برای درک رفتار تحرکی افراد [ 3 ] عمل میکنند و به تدریج به دادههای اساسی برای تجزیه و تحلیل جمعیت، سفر، و ویژگیهای مکانی – زمانی شهروندان تبدیل شدهاند [ 4 ، 5 ]. آنها برای بررسی ساختارهای فضایی شهری و رفتار ساکنان از دیدگاه میکروسکوپی فردی بسیار مهم هستند [ 6 ، 7 ، 8 ].
در حال حاضر، بیشتر تحقیقات مبتنی بر دادههای GPS موبایل بر روی تجزیه و تحلیل ماکروسکوپی مانند شناسایی فضای کار و زندگی، تقسیم منطقه عملکردی و شناسایی نوع جمعیت متمرکز شدهاند [ 9 ، 10 ]. به عنوان مثال، بر اساس داده های GPS تلفن همراه در سراسر کره در طول یک هفته، لی و همکاران. (2018) فعالیتهای شهری و الگوهای تحرک را در 10 شهر تجزیه و تحلیل و مقایسه کرد و پراکندگی فضایی مناطق مسکونی را مورد بررسی قرار داد [ 11 ]. با تجزیه و تحلیل داده های GPS تلفن همراه در اسپانیا طی پنج هفته، Louail و همکاران. (2015) یک روش شناسایی ماتریس مبدا-مقصد (OD) را برای رفت و آمد ساکنان در شهرها پیشنهاد کرد و الگوهای توزیع فضایی فضاهای کار و زندگی در اسپانیا را روشن کرد [12 ]]. گائو و همکاران (2015) داده های تلفن همراه ناشناس را از شهری در چین طی یک هفته برای تجزیه و تحلیل الگوهای تحرک و پویایی شهری شهر اتخاذ کرد [ 13 ]. ژائو و همکاران (2019) شناسایی چند بعدی سفرهای کلان شهرها را بر اساس داده های تلفن همراه و کاربری زمین انجام داد و گزارش کرد که پوشش مناطق عملکردی مختلف در منطقه پکن-تیانجین-هبی به عنوان حلقه تأثیر کلان شهر > دایره زندگی کلان شهر > دایره سفر کلان شهرها رتبه بندی می شود. 14]. انتخاب منطقه مرکزی شهر در شانگهای به عنوان مثال، نیو و همکاران. (2015) روشی را برای بررسی ساختار فضایی شهری بر اساس داده های تلفن همراه پیشنهاد کرد. در این روش، تجزیه و تحلیل چگالی هسته دادههای تلفن همراه ابتدا انجام شد و سپس با دادههای ساعت پیک در صبح و عصر ترکیب شد تا مناطق عملکردی اصلی در منطقه مرکزی شهر شناسایی شوند [15 ] . علاوه بر این، مطالعاتی در مورد طبقه بندی اولیه نوع جمعیت بر اساس ویژگی های فعالیت های تحرک گروهی انجام شده است. به عنوان مثال، بر اساس داده های تلفن همراه 45 روز، دینگ و همکاران. (2019) تقریباً کاربران را بر اساس ویژگیهای فعالیت کاربران در مناطق مختلف به جمعیتهای دائمی و شناور طبقهبندی کرد [ 16]]. به طور مشابه، بر اساس داده های تلفن همراه در طول یک هفته، جیانگ و همکاران. (2012) با تجزیه و تحلیل فعالیت های شهروندان (ماندن در خانه، کار، رفتن به مدرسه و سایر فعالیت ها) شهروندان را به هفت نوع طبقه بندی کرد [ 17 ].
با این حال، تحقیقات موجود مبتنی بر دادههای تلفن همراه، عمدتاً از دادههای کوتاهمدت (اغلب چند روز را پوشش میدهد) در یک منطقه خاص برای انجام تحقیقات کلان بر روی شناسایی منطقه کانونی شهری یا تجزیه و تحلیل رفتار گروه انسانی استفاده میکند [18، 19 ، 20 ] ، مانند به عنوان شناسایی مناطق مسکونی گروهی و شناسایی جمعیت های شناور [ 21 و 22]. در حالی که مطالعات کمی در مورد تحقیقات پرتره (مانند شغل) کاربران فردی بر اساس داده های بلندمدت و عظیم GPS تلفن همراه وجود دارد، با افزایش تقاضا برای مدیریت شخصی هوشمند شهری و خدمات امنیتی سفارشی، شناسایی رفتار افراد از اهمیت ویژه ای برخوردار است. افراد و توصیف ویژگی های آنها بر اساس داده های بزرگ.
بنابراین، بر اساس دادههای GPS موبایل شرکتکنندگان داوطلب از پکن از سال 2007 تا 2012، این مقاله شناسایی تصویر پرتره را با تجزیه و تحلیل رفتار افراد در مقیاس زمانی طولانی انجام میدهد. با توجه به اینکه ردیابیهای تلفن دقت فضایی پایینی دارند و بهصورت پراکنده در زمان نمونهبرداری میشوند، چالش نیاز به مجموعهای دقیق از تکنیکها برای استخراج اطلاعات با ارزش پنهان موجود در آنها است. با استخراج مجموعه ای قوی از مهرهای زمانی موقعیت جغرافیایی که نشان دهنده زنجیره سفر هستند، اهداف این تحقیق (1) خوشه بندی فعالیت ها و طبقه بندی انواع مختلف الگوهای تحرک کاربر بر اساس داده های مسیر GPS است. (2) بر اساس انواع طبقه بندی شده، برای شناسایی ویژگی های افراد (شغل، سن، و سرگرمی ها) با بررسی الگوهای فعالیت تک تک کاربران با کمک GoogleMap. و (3) برای ارائه یک روش جدید برای تصویر پرتره فردی در مقیاس میکروسکوپی. این تحقیق میتواند به آشکار کردن سریع ویژگیهای افراد، پر کردن شکاف در تحقیقات شناسایی و پیشبینی پرتره فردی در عصر کلان داده، و ارائه راهنمایی برای خدمات هدف شهری و مدیریت تمام وقت فردی کمک کند. این مقاله تجزیه و تحلیل رفتار بلندمدت و تحقیقات پرتره افراد با تکیه بر داده های تلفن همراه را انجام می دهد تا پایه ای برای مدیریت شخصی شهرهای هوشمند فراهم کند. شکاف موجود در تحقیقات شناسایی و پیشبینی پرتره فردی در عصر کلان داده را پر کنید و برای خدمات هدف شهری و مدیریت فردی تمام وقت راهنمایی کنید. این مقاله تجزیه و تحلیل رفتار بلندمدت و تحقیقات پرتره افراد با تکیه بر داده های تلفن همراه را انجام می دهد تا پایه ای برای مدیریت شخصی شهرهای هوشمند فراهم کند. شکاف موجود در تحقیقات شناسایی و پیشبینی پرتره فردی در عصر کلان داده را پر کنید و برای خدمات هدف شهری و مدیریت فردی تمام وقت راهنمایی کنید. این مقاله تجزیه و تحلیل رفتار بلندمدت و تحقیقات پرتره افراد با تکیه بر داده های تلفن همراه را انجام می دهد تا پایه ای برای مدیریت شخصی شهرهای هوشمند فراهم کند.
این مقاله از پنج بخش تشکیل شده است. بخش 2 مطالعات مربوطه را در مورد داده های تلفن همراه معرفی می کند. بخش 3 منطقه مورد مطالعه، منابع داده ها و روش شناسی این تحقیق را تشریح می کند. نتایج طبقه بندی برای الگوهای مختلف سفر و نتایج پرتره معمولی در بخش 4 ارائه شده است . بحث و نتیجه گیری در بخش 5 آمده است .
2. منابع داده
این مقاله داده های مسیر GPS تلفن همراه 182 شرکت کننده داوطلب را از آوریل 2007 تا آگوست 2012، که از طریق پروژه Geolife انجام شده توسط Microsoft Research Asia [ 23 ] جمع آوری شده بود، اتخاذ می کند. دادههای Geolife عمدتاً مسیر حرکت بخشی از کارکنان مایکروسافت تحقیقات آسیا یا بستگان و دوستان آنها را ثبت میکنند. لازم به ذکر است که داده ها دوره های زمانی مختلفی را پوشش می دهند. به عنوان مثال، برخی از داده ها یک سال را پوشش می دهند، در حالی که سایر داده ها پنج سال را پوشش می دهند. مجموعه داده طیف گسترده ای از فعالیت های کاربران را در فضای باز ثبت می کند، از جمله عادات زندگی مانند رفتن به سر کار و بازگشت به خانه و همچنین سرگرمی و فعالیت های ورزشی مانند خرید، غذا خوردن در بیرون از خانه، و پیاده روی [24، 25 ] .]. شایان ذکر است که 90.56 درصد از مسیرهای کاربر در پکن قرار دارد و در سایر شهرها مسیرهای کمی وجود دارد. بنابراین، این مقاله عمدتاً بر پکن متمرکز است. ویژگی و توزیع داده های تلفن همراه مورد استفاده در جدول 1 و به ترتیب در شکل 1 نشان داده شده است .
پاکسازی داده ها باید قبل از تجزیه و تحلیل انجام شود. همانطور که توسط لی و همکاران گزارش شده است. [ 26 ]، پاکسازی داده ها شامل پردازش میدان های نامعتبر، حذف نقاط رانش GPS، و در نهایت استخراج جفت های OD (که اساس داده های مسیر را تشکیل می دهند) از نقاط GPS مرتب نشده برای تعیین مسیرهای سفر هر کاربر است. پاکسازی داده های این مطالعه به شرح زیر است.
(1) تقسیم بندی اولیه مسیر. با تجزیه و تحلیل فواصل زمانی اکتساب داده، دریافتیم که فرکانس اکتساب داده از 5 ثانیه تا 1 روز متغیر است. دادههای جمعآوریشده در بازههای زمانی 5 ثانیه، 1.02 درصد از کل دادهها را تشکیل میدهند، در حالی که تا 90.44 درصد از دادهها در 45 دقیقه جمعآوری میشوند. بنابراین، با در نظر گرفتن الگوریتم لی و همکاران. [ 26 ]، در این مقاله، نمونه شامل یک فاصله زمانی بیشتر از 45 دقیقه بین دو نقطه است که به عنوان ناهنجاری دستگاه یا داده های نامعتبر در نظر گرفته می شود. بنابراین این دو نقطه برای مستقل بودن از یکدیگر جدا می شوند.
(2) حذف نقاط بدون توقف و نازک شدن داده ها. بر اساس نتایج تقسیمبندی اولیه، نقاط عبوری با زمانهای ماندگاری کمتر از 10 دقیقه حذف میشوند. سپس نقاط OD و زمان سفر هر سفر برای یک کاربر به دست می آید. پس از پاکسازی داده ها، 17621 قطعه داده از جمله شناسه کاربر (UserID)، زمان جمع آوری داده ها (زمان) و مکان (طول و عرض جغرافیایی) باقی مانده است.
3. تعیین الگوی تحرک فردی و به تصویر کشیدن پرتره
این مقاله روشی را برای تعیین الگوی تحرک فردی و به تصویر کشیدن پرتره پیشنهاد میکند. این روش از طریق پنج مرحله اصلی ادامه می یابد: پاکسازی داده های GPS اصلی و نازک شدن داده ها، خوشه بندی فضایی نقاط GPS و تعیین خوشه های با چگالی بالا، اصلاح و تعمیم الگوهای تحرک، تجزیه و تحلیل اطلاعات بلند مدت فردی با ادغام با قانون. زندگی، و پیشبینی تصویر پرتره فردی. نمودار جریان روش پیشنهادی به صورت شکل 2 توضیح داده شده است .
3.1. پاکسازی و نازک شدن داده های GPS اصلی
برای داده های اصلی GPS تلفن همراه، به دلیل نقص دستگاه و داده های گم شده و غیرعادی، پاکسازی داده ها ضروری است. این عمدتاً شامل دو مرحله است – پاکسازی داده ها و نازک کردن داده ها – همانطور که در بخش 2 توضیح داده شده است . اشاره کرد که نازک شدن داده ها با هدف کاهش میزان محاسبات، اطمینان از نکات مهم و به حداکثر رساندن دقت خوشه بندی فضایی است.
3.2. خوشه بندی فضایی نقاط GPS
در این مقاله، از الگوریتم خوشهبندی فضایی مبتنی بر چگالی کاربرد با نویز (DBSCAN) برای تحلیل خوشهبندی استفاده شده است. این یک روش خوشه بندی چگالی معمولی است که یک خوشه را به عنوان بزرگترین مجموعه نقاط متصل به چگالی تعریف می کند [ 27 ]. DBSCAN می تواند نواحی با چگالی کافی را به خوشه ها تقسیم کند و خوشه هایی با شکل دلخواه را در مجموعه داده های فضایی پر سر و صدا تعیین کند. الگوریتم DBSCAN دارای ویژگی های پیشرفته ای است که هنگام تشخیص الگوهای با اشکال مختلف مفید است و همچنین انتخاب خوبی برای خوشه های “طبیعی” و آرایش آنها در فضای داده است [28 ] . با توجه به مزیت DBSCAN، الگوریتم پایه DBSCAN احتمالاً محبوب ترین روش برای خوشه بندی فضایی شد [ 29 ، 30]]. بنابراین برای روش خوشه بندی فضایی در این مقاله به دو دلیل از الگوریتم پایه DBSCAN استفاده شده است. یکی سادگی و پایایی این الگوریتم است و دیگری اینکه تحلیل خوشه بندی فضایی یک مرحله از روش پیشنهادی است. هدف اصلی تجزیه و تحلیل خوشهبندی در این مقاله تعیین ناحیه فعالیت اولیه فردی است نه یک ناحیه تابع دقیق با استفاده از الگوریتم پایه DBSCAN تا این نیاز را تا حدودی برآورده کند.
دو پارامتر مهم در الگوریتم DBSCAN وجود دارد که ϵ و MinPts هستند. ϵ نشاندهنده شعاع همسایگی خوشه، و MinPts نشاندهنده حداقل آستانه نقاط برای تعیین یک خوشه است [ 31 ، 32 ]. بر اساس تعداد نقاط یک محله، سه نوع نقطه داده را می توان تشخیص داد، یعنی شی هسته، شی مرزی و نقطه نویز. همانطور که در Lin et al. [ 32]، شی هسته نشان دهنده شی داده ای است که حاوی بیش از نقاط MinPts در ϵ-همسایه است، شی مرزی شی داده ای را نشان می دهد که حاوی کمتر از نقاط MinPts در ϵ-همسایه است، اما در ϵ-همسایه هسته قرار می گیرد. شیء، نقطه نویز به معنای شی داده ای است که به هیچ خوشه ای تعلق ندارد. به طور کلی، جسم هسته مربوط به نقطه در داخل منطقه متراکم، جسم مرزی مربوط به نقطه در لبه منطقه متراکم، و نقطه نویز مربوط به نقطه در ناحیه پراکنده است.
گردش کار اصلی الگوریتم DBSCAN به شرح زیر است. با شروع از یک نقطه P در مجموعه نقطه P، اگر همسایه ϵ نقطه P حاوی بیش از MinPts باشد، نشان می دهد که نقطه P شی هسته است. خوشه ای با P به عنوان هسته ایجاد می شود، و نقاطی در همسایه ϵ آن ایجاد می شود که از نظر چگالی قابل دسترسی هستند [ 32] به خوشه اضافه می شوند. نقاطی را که از نظر چگالی همه اشیای هسته قابل دسترسی هستند به خوشه اضافه کنید، و محاسبه تکراری تا زمانی انجام میشود که تمام نقاطی که با نقطه P متصل به چگالی هستند به خوشه اضافه شوند. سپس نقطه دیگری که به هیچ خوشه ای اضافه نشده است انتخاب می شود و روند فوق تکرار می شود تا جایی که نقطه جدیدی به هیچ خوشه ای اضافه نشود. نقاطی که به هیچ خوشه ای اضافه نمی شوند، نقاط نویز هستند. گردش کار دقیق الگوریتم DBSCAN را می توان از Ester و همکاران [ 27 ] و Lin و همکاران به دست آورد. [ 32 ].
بر اساس سوابق UserID، به دست آوردن نقاط GPS تلفن همراه هر کاربر ( T ij , i = 1, 2, …… n ؛ j = 1, 2, …… m ) m تعداد کاربران است، n تعداد کل نقاط پاکسازی GPS یک کاربر. سپس با تعریف مجموعه داده ورودی D = ( T 11 , T 12 ,…, T mn )، با استفاده از الگوریتم DBSCAN، خوشه های تک نقطه GPS C = { C 1 , C 2 ,…, C k} تعیین می شود. در این مقاله، بر اساس آزمایش های متعدد، آستانه بهینه MinPts و فاصله جستجو به ترتیب 50 متر و 500 متر تعیین شده است. پس از تعیین خوشه ها، خوشه با چگالی بالا شناسایی می شود. با توجه به نتایج خوشهبندی اولیه با الگوریتم DBSCAN، چگالی نقطه ( D i ) یک خوشه به صورت زیر محاسبه میشود:
که در آن D i چگالی نقطه یک خوشه (تعداد نقاط/km 2 )، C i تعداد نقاط در خوشه i و S i مساحتی است که از اتصال بیرونی ترین نقاط خوشه تشکیل می شود. سه متراکمترین خوشههای برتر شناسایی و انتخاب میشوند تا مناطقی با فرکانس بالای کاربران، زمانی که مجموعههای خوشهای بزرگتر از 3 هستند، به دست آید.
3.3. اصلاح و تعمیم الگوهای تحرک
بر اساس خوشه های فرکانس بالا، سه سناریو از الگوهای تحرک قابل تشخیص است. سناریو A: وجود سه خوشه فرکانس بالا. سناریوی B: وجود دو خوشه فرکانس بالا. سناریوی C: وجود یک خوشه فرکانس بالا.
با توجه به سه سناریو، سه نوع از ویژگی های تحرک تعمیم و نتیجه گیری می شود. برای سناریوی A با سه خوشه فرکانس بالا، الگوی تحرک به عنوان “الگوی دو هسته ای” در نظر گرفته می شود. برای سناریوی B با دو خوشه فرکانس بالا، الگوی تحرک به عنوان “الگوی دو نقطه یک خط” در این مقاله در نظر گرفته شده است. و به طور مشابه، برای سناریوی C با یک خوشه فرکانس بالا، الگوی تحرک به عنوان “الگوی پراکنده” در نظر گرفته می شود.
فرض کنید که هر فرد محل سکونت ثابتی دارد، سه سناریو الگوی تحرک را می توان به عنوان چهار مورد اصلاح کرد. برای «الگوی دو نقطهای یک خطی»، میتوان آن را به دو مورد اصلاح کرد که یک مکان مسکونی با یک «محل کار» است. برای “الگوی دو هسته ای” می توان آن را به دو مورد متمایز کرد که یک مکان مسکونی با دو “فضای کاری” و دو مکان مسکونی با یک “فضای کاری” است. برای «الگوی پراکنده»، یک مورد با یک منطقه مسکونی و بدون «محل کار» ثابت را نشان میدهد. لازم به ذکر است که فرض می کنیم در این مقاله هیچ موردی وجود ندارد که خوشه ها همه مکان های مسکونی یا محل کار را نشان دهند. دلیل آن این است که دلیل احتمالی این پدیده وجود موقعیت ذهنی انسان است.
3.4. تجزیه و تحلیل اطلاعات بلند مدت فردی با ادغام با قانون زندگی
با توجه به سه نوع تعمیم یافته از الگوهای تحرک، ویژگی فردی خاص با ادغام اطلاعات GPS هر کاربر قابل تجزیه و تحلیل است و می توان نوع الگوی تحرک فرد را مورد قضاوت قرار داد.
ابتدا تعیین “محل کار” و “محل سکونت” این کاربر. دوره های زمانی مختلف را تعریف کنید، از جمله (1) ساعات کاری در روزهای کاری (09:00 تا 18:00)، (2) ساعات غیر کاری در روزهای کاری (هر زمانی به جز از 09:00 تا 18:00 در روزهای هفته) و 3) روزها خاموش (آخر هفته و تعطیلات). استخراج زمان مکان GPS برای همه نقاط در خوشه های فرکانس بالا، تعیین خوشه ها در دوره های زمانی مختلف با استفاده از رابطه (2)
که در آن N wi تعداد نقاطی را نشان می دهد که زمان مکان GPS آنها در ساعات کاری برای i -امین خوشه فرکانس بالا است ، Nnoni تعداد نقاطی را نشان می دهد که زمان مکان GPS در ساعات غیر کاری برای i- امین خوشه فرکانس بالا است. و N i تعداد کل نقاط در خوشه i را نشان می دهد.
مطالعات اخیر [ 3 ، 33 ] گزارش کردند که علیرغم عدم تشابه در مناطق تحرک تحت پوشش افراد، نظم بالایی در رفتارهای حرکتی انسان وجود دارد، که نشان می دهد اکثر افراد از یک الگوی ساده و قابل تکرار پیروی می کنند. از نظر تئوری، منطقه ای که ساعات کاری بر آن غالب است معمولاً فضای کاری را نشان می دهد، به طور مشابه، منطقه ای در ساعات غیر کاری معمولاً نشان دهنده فضای مسکونی است. بنابراین با محاسبه و مقایسه مقادیر Rw و R non برای هر خوشه می توان ویژگی های فعالیت اولیه خوشه را استنباط کرد. به عنوان مثال، اگر Rw به مراتب بزرگتر از R non باشددر یک خوشه، به این معنی است که این خوشه بیشتر به عنوان یک فضای کاری است. در مقابل، عملکرد این خوشه بیشتر یک منطقه مسکونی است. این برای موردی مناسب تر است که داده های GPS موقعیت یابی متمرکز وجود نداشته باشد.
سپس بر اساس تعیین «محل کار» و «محل سکونت»، الگوی تحرک وی مورد قضاوت قرار می گیرد.
3.5. پیش بینی تصویر پرتره فردی
پس از تجزیه و تحلیل ویژگی فعالیت فرد و قضاوت در مورد الگوی تحرک او، می توان ویژگی های فردی را به طور مقدماتی پیش بینی کرد. به عنوان مثال، اگر الگوی تحرک فرد «الگوی دو نقطهای یک خطی» با یک «محل کار» ثابت و یک «محل مسکونی» ثابت باشد، میتوان ابتدا فرد را یک کارمند یا یقه سفید استنباط کرد. اگر الگوی تحرک فرد “الگوی دو هسته ای” باشد و دارای دو “محل کار” یا دو “محل مسکونی” ثابت باشد، می توان استنباط کرد که فرد دارای دو فضای کاری مانند معلمان کالج یا مدیران ارشد است. اگر الگوی تحرک فرد «الگوی پراکنده» باشد و یک «محل مسکونی» داشته باشد، که نشان میدهد «محل کار» ثابتی وجود ندارد، احتمالاً فرد فروشنده یا فریلنسر خانگی است. لازم به ذکر است که اگر مسیر دارای مجموعه خوشهای با چگالی بالا نباشد، نشان میدهد که این فرد ممکن است یک رهگذر باشد و این وضعیت باید به طور ویژه مورد تجزیه و تحلیل قرار گیرد. با این حال، برای گرفتن پرتره دقیق از یک فرد، تجزیه و تحلیل دقیق مانند سرگرمی و زمان رفت و آمد باید انجام شود.
ابتدا، برای هر نوع فعالیت، نتایج خوشهبندی را با دادههای کاربری زمین/دادههای POI ادغام کنید و انواع دقیق کاربری زمین محل زندگی و کار را تعیین کنید.
دوم، تفاوت زمان مکان GPS را برای هر خوشه در دوره های زمانی مختلف محاسبه کنید. برای «الگوی دو نقطهای یک خطی» و «الگوی دو هستهای» با مکانهای کاری ثابت، تفاوت بین حداقل زمان در «خوشه محل کار» و حداکثر زمان در «خوشه مسکونی» از ساعت 08:00 تا 10 :00 در یک روز شمارش می شود و سپس تفاوت روزانه میانگین می شود. این زمان تقریباً زمان رفت و آمد افراد است. برای نوع “الگوی پراکنده”، فراوانی مسیر در طول ساعات کاری ( Traj Working )، و فاصله اروپایی بین کار Trajامتیاز و “محل مسکونی” محاسبه می شود. اگر فرکانس و مسافت اروپایی هر دو زیاد باشد، احتمال بیشتری وجود دارد که فرد فروشنده باشد. اگر فرکانس کم و فاصله کم باشد، به احتمال زیاد فریلندر خانه یا دانش آموز مدرسه است.
علاوه بر این، با استفاده از روش پیشنهادی در این مقاله، ویژگی تحرک در روزهای تعطیل (آخر هفته و تعطیلات) را نیز می توان تجزیه و تحلیل کرد، که کمک می کند تا سرگرمی های فرد در طول تعطیلات را به تصویر بکشد، بنابراین سن و جنسیت را بهتر قضاوت می کند. برای مثال، زنان جوان بیشتر از مردان ترجیح می دهند در تعطیلات آخر هفته یا تعطیلات به مراکز تجاری بروند. از طریق تجزیه و تحلیل جامع، پرتره فردی را می توان عمیقاً به تصویر کشید. به عنوان مثال، فردی که الگوی تحرک او «الگوی دو نقطهای یک خطی» است، اگر «محل کار» او بیشتر در برخی از ساختمانهای تجاری واقع شده باشد. زمان رفت و آمد در پکن 45 دقیقه است، و منطقه با فرکانس بالا در روزهای تعطیل خانه و پارک است، بنابراین فرد به احتمال زیاد یک کارگر یقه سفید مرد است. در این صفحه،
4. تجزیه و تحلیل الگوی تحرک فردی و تصویر پرتره
بر اساس روش پیشنهادی، ابتدا الگوی تحرک فردی را با استفاده از دادههای مسیر GPS تلفن همراه جمعآوریشده از طریق پروژه Geolife تحلیل کردیم. پس از ارزیابی الگوهای تحرک، به منظور پرتره کردن ویژگی های فردی با جزئیات، GoogleMap با نتایج خوشه بندی یکپارچه شده است. لازم به ذکر است که پنج الگوی مختلف انتخاب شده و به تفصیل مورد تجزیه و تحلیل قرار گرفته است تا اطلاعات بیشتری برای به تصویر کشیدن پرتره ارائه شود.
4.1. تجزیه و تحلیل الگوهای مختلف
بر اساس نتایج خوشهبندی همه مسیرها، سه نوع خوشه با چگالی بالا به دست میآید: خوشههای تک، دوتایی و سهگانه با چگالی بالا. داوطلبانی که رفتارشان به یک الگوی دو نقطه یک خط پایبند است، 55.7٪ از داوطلبان را تشکیل می دهد، 13٪ از داوطلبان در امتداد مسیرهایی با هسته های دوگانه حرکت می کنند، و 30.8٪ از آنها یک مسیر پراکنده (شامل تنها یک مجموعه خوشه بندی) را نشان می دهند. . بدیهی است داوطلبانی که نوع سفرشان به مسیر ثابت دو نقطه-یک خط پایبند است، تعداد بیشتری دارند.
4.2. تصویر پرتره از افراد
با تجزیه و تحلیل دقیق ویژگی های رفتار آنها در روزهای هفته و روزهای تعطیل می توان به برخی ویژگی های دقیق تری از افراد استنباط کرد.
4.2.1. الگوی دو نقطه – یک خط
مورد 1: الگوی دو نقطه-یک خط ثابت
شکل 3 نتایج خوشه بندی را نشان می دهد که دارای دو مجموعه خوشه است. شکل 4a توزیع فعالیت یک فرد را در روزهای هفته از 2007 تا 2012 نشان می دهد. کشف شد که (1) از نظر توزیع فضایی که یک خوشه مکان مسکونی، جامعه Huilongguan، و منطقه خوشهبندی دیگر در اطراف آکادمی فناوری فضایی چین در Zhongguancun (محل کار) است. (2) با تجزیه و تحلیل فرکانس نقطه، فرد الگوهای منظم رفتن و ترک کار را نشان داد. معمولاً حدود ساعت 09:00 صبح محل سکونت خود را ترک می کردند و قبل از ساعت 09:30 به محل کار خود می رسیدند. زمان رفت و آمد تقریباً 25 دقیقه بود که نشان می دهد وسیله سفر ممکن است اتوبوس یا مترو باشد. با این حال، آنها کار را در زمان مشخصی ترک نکردند، اغلب اضافه کار می کردند و تقریباً ساعت 09:00 شب به محل اقامت خود می رسیدند.
شکل 4 ب توزیع فعالیت افراد را در روزهای تعطیل نشان می دهد. این افراد به غیر از محل سکونت و محل کار خود اغلب از مکان های دیگر نیز بازدید می کردند. با توجه به آمار رفتار مسافرتی افراد در روزهای تعطیل ( شکل 5 )، مشخص میشود که فرد معمولاً در روزهای تعطیل در خانه میماند (علاوه بر هر گردشگری انجام شده)، تعداد فعالیتهای صرف شده در محل کار تقریباً 40٪ است. فرکانس فعالیت رفتن به پارک تقریباً 30٪ و تعداد دفعات فعالیت رفتن به خرید تقریباً 20٪ است. این فرد معمولاً هر پنج هفته یک بار سفر می کرد.
از طریق تجزیه و تحلیل دقیق مسیرهای فعالیت فرد در روزهای هفته و روزهای تعطیل، نشان داده شد که فرد دارای شغل دائمی بوده و اغلب اضافه کار می کند. استنباط می شود که فرد ممکن است یک تکنسین یا محقق باشد. از نظر سرگرمی، آنها از خرید و بازدید از پارک ها یا جاذبه های گردشگری لذت می بردند، حتی گاهی اوقات با دوستان خود معاشرت می کردند. بنابراین، ابتدا استنباط می شود که این فرد احتمالاً یک فرد میانسال بوده است. از این رو، با توجه به تجزیه و تحلیل نوع شغل، سرگرمی ها و سن، این نتیجه حاصل می شود که فرد به احتمال زیاد یک کارگر یقه سفید با شغل ثابت بوده است.
مورد 2: الگوی دو نقطه-یک خط ثابت
شکل 6 نتایج خوشه بندی را نشان می دهد که دارای دو مجموعه خوشه است. شکل 7توزیع فعالیت یک فرد را در روزهای هفته نشان می دهد. خاطرنشان می شود که (1) برای توزیع فضایی، محل سکونت فرد در جامعه جاده تایپینگ و محل کار اصلی در نزدیکی جامعه هگوانگلی قرار داشت. سایر محل های کار در مکان های مختلف پکن رخ داده است. (2) برای ویژگی های زمانی، در روزهای هفته، فرد تقریباً در ساعت 06:30 صبح محل سکونت خود را ترک می کرد و تقریباً در ساعت 08:00 صبح به محل کار خود می رسید و زمان رفت و آمد تقریباً 1.5 ساعت بود. آنها معمولا در امتداد جاده Qingta West سفر می کردند. فراوانی وقوع فعالیت در محل سکونت و محل کار به ترتیب حدود 81.2% و 74.6% می باشد.
شکل 8 مسیر فعالیت افراد در روزهای تعطیل و آمار فراوانی را نشان می دهد. می توان دریافت که مسیرها عمدتاً در بین محل سکونت یا محل کار مختلف توزیع شده اند، در حالی که بقیه در جاذبه های توریستی (مانند Yuanmingyuan و Qianlingshan)، مراکز خرید و سایر مناطق مسکونی رخ داده اند. فرکانس فعالیتی که در پارک ها سپری می شود تقریباً 20٪ و دفعات فعالیتی که برای خرید انجام می شود تقریباً 15٪ است. و این فرد در طول دوره های تحصیلی مسافرت نکرده است.
از طریق تجزیه و تحلیل دقیق مسیرهای فعالیت فرد در روزهای هفته و روزهای تعطیل، نشان داده شد که فرد دارای شغل دائمی بوده است، اما در ساعات کاری، مسیرها پراکنده و به طور گسترده توزیع شده است، این استنباط می شود که فرد به احتمال زیاد فروشنده در روزهای تعطیل، فرد اغلب در خانه یا محل کار خود می ماند و گاهی از جاذبه های گردشگری، پارک ها، مراکز خرید و سایر مناطق مسکونی بازدید می کرد.
مورد 3: الگوی متنوع دو نقطه ای یک خطی
ویژگی های این نوع سفر شبیه به مسیر ثابت دو نقطه یک خط است. تفاوت این است که در طول دوره های زمانی مختلف، مکان مکانی خوشه ها تغییر کرده است.
شکل 9 توزیع فعالیت یک فرد را در روزهای هفته از 2007 تا 2009 نشان می دهد. مشاهده می شود که (1) از نظر توزیع فضایی، مناطق فعالیت اصلی فرد در روزهای هفته شامل آکادمی فناوری اطلاعات فضایی چین در ایستگاه مترو ژیچونلو (محل اقامت) و منطقه اطراف ایستگاه مترو داژونگسی (محل کار) می شود. . (2) از نظر ویژگی های زمانی، فرد الگوهای منظم رفتن و ترک کار را نشان می دهد. معمولاً حدود ساعت 08:00 صبح محل سکونت خود را ترک می کردند و تقریباً در ساعت 18:00 شب کار را به پایان می رساندند. (3) از سال 2007 تا 2009، این فرد در استان هنان و کره مشاهده شد و چنین استنباط کرد که آنها ممکن است برای تجارت سفر کنند.
شکل 10 توزیع فعالیت افراد را در روزهای هفته از سال 2010 تا 2012 نشان می دهد. کشف شده است که (1) از نظر توزیع فضایی، مناطق اصلی فعالیت فرد در نزدیکی خیابان سوژو (محل سکونت) و باغ جنوبی واقع شده است. پارک وانگه. (2) از نظر ویژگی های زمانی، فرد به الگوهای منظم متمایز رفتن و ترک کار پایبند بود. این فرد معمولاً در ساعت 09:00 صبح به سر کار می رفت و تقریباً در ساعت 17:00 بعد از ظهر کار را تمام می کرد. (3) شایان ذکر است که این فرد در مکانهای مختلف از جمله فوجیان، هنگ کنگ و تایوان در چین و شهرهای اروپا و آمریکای شمالی فعال باقی ماند. پیشنهاد می شود که فرد ممکن است برای کار به خارج از کشور سفر کند.
شکل 11 مسیر فعالیت افراد را در روزهای تعطیل نشان می دهد. تعداد مسیرها در نزدیکی محل کار آنها بیشترین است و پس از آن مسیرهای نزدیک محل سکونت آنها قرار دارد. علاوه بر این، فرد به مکان های دیگری مانند جاذبه های گردشگری سفر می کرد.
از طریق تجزیه و تحلیل دقیق مسیرهای فعالیت فرد در روزهای هفته و روزهای تعطیل، مسیر فعالیت طی شش سال تغییر کرد. جالب است که بدون در نظر گرفتن دوره زمانی، فرد اغلب برای مدت طولانی به سفرهای کاری می رفت و مدت اقامت از یک هفته تا 1.5 ماه متغیر بود. مقصد این سفرها شامل شهرهای چین و کشورهای خارجی بود. از این رو استنباط می شود که فرد مدیر یا تاجر است. در مورد سرگرمی ها، آنها از خرید لذت می بردند و اغلب از پارک ها یا جاذبه های گردشگری دیدن می کردند و گاهی اوقات با دوستان خود معاشرت می کردند. نتیجه گیری می شود که فرد به احتمال زیاد یک محقق یا مدیر یا یک فرد تجاری است که محل کارش اغلب تغییر می کند.
4.2.2. الگوی پراکنده (مسیر توزیع شده یکنواخت در مرکز یک نقطه)
شکل 12 نتایج خوشه بندی را نشان می دهد که فقط یک مجموعه خوشه دارد. ویژگی های این نوع سفر شامل یک منطقه فعالیت اصلی است، در حالی که سایر فعالیت ها به طور مساوی در اطراف منطقه اصلی توزیع می شوند. شکل 13توزیع دقیق فعالیت را در روزهای هفته و آخر هفته نشان می دهد. مشخص شد که (1) از نظر توزیع فضایی، منطقه خوشهبندی هسته فرد در اطراف دانشگاه پکن قرار داشت. (2) از نظر ویژگی های زمانی، فرد هیچ الگوی منظم کار یا اوقات فراغت نداشت. (3) در طول بازی های المپیاد XXIX، مسیر حرکت این فرد بیشتر در سبز المپیک قرار داشت. حدس زده می شد که او ممکن است در طول بازی های المپیک به عنوان یک داوطلب خدمت کرده باشد. فراوانی وقوع فعالیت در منطقه مسکونی (دانشگاه پکن) حدود 88.4٪ است.
فعالیت های این فرد تقریباً در مناطق مسکونی (دانشگاه پکن) و برخی از مسیرها در پارک المپیک واقع شده است. می توان نتیجه گرفت که فرد در دانشگاه پکن کار یا تحصیل کرده است. ابتدا مشخص شد که این فرد دانشجوی پسر است. قبل و بعد از بازی های المپیاد XXIX، آنها زمان زیادی را در المپیک سبز گذراندند. اعتقاد بر این است که آنها در طول بازی ها داوطلب بودند که نشان دهنده احتمال بیشتر یک فرد جوان است. نتیجه گیری می شود که این فرد به احتمال زیاد یک دانشجوی (مرد) در دانشگاه پکن است. شایان ذکر است که این وضعیت ممکن است برای افراد خوداشتغالی که در خانه کار می کنند نیز رخ دهد. با این حال، به دلیل برخی نقص ها در مجموعه داده های مورد استفاده در این مقاله، این وضعیت پوشش داده نمی شود.
4.2.3. مسیر با دو هسته
این نوع مسیر با سه حوزه فعالیت اصلی مشخص می شود، که یکی محل سکونت فرد است، در حالی که دو حوزه فعالیت دیگر شامل محل کار متفاوت فرد است. شکل 14 نتایج خوشه بندی را نشان می دهد که شامل سه مجموعه خوشه است.
شکل 15 a توزیع فعالیت یک فرد را در روزهای هفته از 2008 تا 2009 نشان می دهد. مشخص شد که (1) برای توزیع فضایی، محل سکونت فرد در نزدیکی آکادمی فناوری فضایی چین در ایستگاه مترو ژیچونلی قرار داشت و دو محل کار اصلی دانشگاه Tsinghua و دانشگاه فناوری شیمیایی پکن (BUCT) بودند. (2) برای ویژگی های زمانی، هیچ الگوی مشخصی برای رفتن و ترک کار وجود نداشت. این فرد اغلب بعد از ساعت 11:00 شب به محل اقامت خود می رسید و زمان رفت و آمد از دانشگاه فناوری شیمیایی پکن تقریبا 30 دقیقه بود. فراوانی وقوع فعالیت در محل مسکونی، محل کار A و B به ترتیب حدود 65.8٪، 52.7٪ و 38.9 است.
آمار فراوانی فعالیت ها در دانشگاه Tsinghua و دانشگاه فناوری شیمیایی پکن در شکل 16 نشان داده شده است . زمان صرف شده در دانشگاه Tsinghua (85٪) بیشتر از زمان صرف شده در BUCT (40٪) است، بنابراین می توان استنباط کرد که این فرد یک محقق در دانشگاه Tsinghua بود اما یک شغل نیمه وقت در BUCT داشت. با این حال، فرکانس کار در دانشگاه Tsinghua و دانشگاه فناوری شیمیایی پکن اساساً در روزهای تعطیل آنها یکسان بود.
بر اساس تجزیه و تحلیل دقیق مسیرهای فعالیت فرد در روزهای هفته و روزهای تعطیل، می توان نتیجه گرفت که این فرد محقق دانشگاه Tsinghua بود اما شغل پاره وقت در دانشگاه فناوری شیمیایی پکن داشت. این افراد معمولاً در روزهای تعطیل خود کار میکردند، گاهی اوقات از پارکها یا جاذبههای دیدنی بازدید میکردند، اما به ندرت به خرید میرفتند و این نشان میداد که احتمالاً یک مرد جوان هستند. در نهایت، با توجه به تجزیه و تحلیل نوع شغل، سرگرمی ها و سن، این نتیجه حاصل می شود که فرد به احتمال زیاد یک محقق با شغل پاره وقت است.
5. نتیجه گیری ها
با فرا رسیدن عصر کلان داده، داده های تلفن همراه به تدریج به داده های اساسی برای تجزیه و تحلیل جمعیت و ویژگی های مکانی و زمانی شهروندان تبدیل شده است. در حال حاضر، بر اساس داده های تلفن همراه، محققان مطالعات مختلفی را در زمینه تجزیه و تحلیل ماکروسکوپی انجام داده اند، مانند تشخیص نقاط داغ شهری و تجزیه و تحلیل رفتار جمعیت، اما تحقیقات میکروسکوپی بر روی پرتره افراد بر اساس داده های تلفن همراه طولانی مدت وجود ندارد. بنابراین، این مقاله ابتدا روشی را برای تعیین الگوهای مختلف تحرک فردی و سپس تجزیه و تحلیل دادههای بلند مدت تلفن همراه داوطلبان از پکن به عنوان بخشی از پروژه Geolife که توسط Microsoft Research Asia انجام شده است، پیشنهاد میکند. پرتره و رفتار دقیق تری از افراد، از جمله پنج نفر، تجزیه و تحلیل می شود. که می تواند نمونه هایی برای شخصیت شناسی افراد با الگوهای حرکتی متفاوت ارائه دهد. نتایج اصلی به شرح زیر است:
(1) این مقاله ابتدا روشی را برای تعیین الگوی تحرک فردی پیشنهاد کرد. و با استفاده از دادههای Geolife، سه نوع الگوی تحرک فردی بر اساس خوشهبندی مسیرها طبقهبندی میشوند. در میان این سه نوع، الگوی دو نقطه یک خط (55.7٪) و الگوی دو هسته ای (30.8٪) اکثر مسیرها در پکن را تشکیل می دهند.
(2) با ادغام با داده های GoogleMap، ویژگی های رفتاری دقیق تر افراد با انتخاب پنج داوطلب تجزیه و تحلیل شد. یک روش تصویربرداری پرتره از ویژگی های فردی که ویژگی های جامع افراد مانند شغل و سرگرمی ها را در نظر می گیرد، پیشنهاد شده است که ایده و نمونه های جدیدی را برای تصویر پرتره فرد در مقیاس میکروسکوپی ارائه می دهد.
(3) نتایج نشان داد که فردی با «الگوی دو نقطهای یک خط» عموماً کارگران یقه سفیدی هستند که در شرکتها یا مؤسسات کار میکنند، فرد با «الگوی پراکنده» عمدتاً در دانشجویان دانشگاه یا مشاغل آزاد خانگی وجود دارد، و افرادی که دارای “الگوی میخچه دوگانه” هستند، به احتمال زیاد کارگران پاره وقت با دو محل کار متفاوت هستند، مانند معلمان دانشگاه.
این مقاله با تجزیه و تحلیل ویژگیهای سفر و عادات روزانه افراد در یک دوره زمانی طولانی، یک روش تصویرسازی الگوی تحرک ویژگیهای فردی را پیشنهاد میکند که به طور جامع ویژگیهای افراد را در نظر میگیرد، که میتواند چشمانداز جدیدی در تحقیقات پرتره میکروسکوپی ارائه دهد. با این حال، هنوز محدودیت هایی برای این تحقیق وجود دارد. به عنوان مثال، به دلیل محدودیتهای حفظ حریم خصوصی و دادهها، از دادههای عمومی اما قدیمی برای انجام تجزیه و تحلیل دقیق استفاده شد، بنابراین نتایج فقط تا حدی با چند نمونه شناخته شده تأیید میشوند. علاوه بر این، با توجه به داده های محدود و فرکانس های مختلف اکتساب داده ها، دقت تعیین پرتره فردی محدود است. با توجه به به موقع بودن داده ها، داده های نقشه گوگل در سال 2015 برای تجزیه و تحلیل مشخصات دقیق افراد استفاده می شود. برای تجزیه و تحلیل خوشه بندی فضایی، در این مقاله از الگوریتم پایه DBSCAN استفاده شده است، اما دارای تعدادی کاستی است، از جمله اینکه اشیاء مرزی دو خوشه نسبتا نزدیک هستند و آستانه هایی برای پارامترها باید تنظیم شود، و سپس وجود دارد. چندین رویکرد برای بهبود الگوریتم پیشنهاد شده است، مانند الگوریتم خوشه بندی بدون پارامتر (DSets-DBSCAN) [34 ]، و یک الگوریتم بهبود یافته که اندازهگیری فاصله را هنگام جستجوی شی هسته کاهش میدهد [ 32 ]. علاوه بر این، الگوریتم پیشنهادی فرض میکند که موقعیتیابی ذهنی انسان (فقط موقعیتیابی در یک دوره معین) وجود ندارد. در کار آینده، الگوریتمهای DBSCAN بهبود یافته برای خوشهبندی نقطه و روشهای تعیین ویژگیهای تحرک بهبود یافته برای بهبود دقت تصویر پرتره یکپارچه خواهند شد. در نهایت، در آینده، دادههای جدید بیشتری برای اعتبارسنجی روش پیشنهادی و بهبود دقت تصویر پرتره استفاده خواهد شد، بنابراین پشتیبانی فنی و مراجع نمونه برای تحقیقات موضوعی و مدیریت شخصی شهرهای هوشمند فراهم میشود.
بدون دیدگاه