خلاصه

با ورود به عصر کلان داده، داده های تلفن همراه به دلیل اطلاعات غنی و نرخ نمونه برداری بالا توجه روزافزونی را به خود جلب کرده اند. در حال حاضر محققان مطالعات مختلفی را با استفاده از داده های تلفن همراه انجام داده اند. با این حال، اکثر مطالعات موجود بر روی تجزیه و تحلیل ماکروسکوپی، مانند تشخیص نقاط داغ شهری و تجزیه و تحلیل رفتار جمعیت در یک دوره کوتاه متمرکز شده‌اند. با توسعه شهر هوشمند، خدمات و مدیریت شخصی بسیار مهم شده است، بنابراین تحقیقات پرتره میکروسکوپی و الگوی حرکتی یک فرد بر اساس داده های بزرگ ضروری است. بنابراین، این مقاله ابتدا روشی را برای به تصویر کشیدن الگوی تحرک فردی، و بر اساس داده‌های بلندمدت تلفن همراه (از سال 2007 تا 2012) داوطلبان از پکن به عنوان بخشی از پروژه Geolife که توسط Microsoft Research Asia انجام شده است، پیشنهاد می‌کند. تجزیه و تحلیل تصویر پرتره فردی دقیق تر انجام می شود. نتیجه‌گیری به شرح زیر است: (1) بر اساس شناسایی خوشه‌ای با چگالی بالا، مسیرهای رفتاری داوطلبان به سه نوع تعمیم داده می‌شوند و از میان آنها، مسیر دو نقطه‌ای یک خطی و مسیر رفتاری توزیع شده به طور مساوی در پکن (2) با ادغام با داده های Google Maps، مسیرهای رفتاری پنج داوطلب و الگوهای فعالیت افراد به تفصیل تجزیه و تحلیل شد و یک روش تصویری پرتره برای ویژگی های فردی به طور جامع با در نظر گرفتن ویژگی های آنها، مانند شغل و سرگرمی ها، پیشنهاد شده است. (3) بر اساس تجزیه و تحلیل ویژگی های فردی برخی از داوطلبان، مشخص شد که افراد دو نقطه یک خط عموماً کارگران یقه سفید هستند که در شرکت ها یا مؤسسات کار می کنند. و وضعیت یک خوشه واحد عمدتاً در بین دانشجویان و فریلنسرهای خانگی وجود دارد. یافته‌های این مطالعه برای طبقه‌بندی و پیش‌بینی فردی در عصر کلان داده مهم است و همچنین می‌تواند راهنمایی مفیدی برای خدمات هدفمند و مدیریت فردی شهرهای هوشمند باشد.

کلید واژه ها:

داده های GPS تلفن همراه ; پرتره فردی ؛ الگوی تحرک ؛ پرتره ؛ ویژگی شغل

1. معرفی

با توسعه ابزارهای مختلف موقعیت‌یابی، رفتار تحرکی افراد را می‌توان به طور مداوم از تلفن‌های همراه و وسایل GPS دریافت کرد [ 1 ، 2 ]. این داده‌های تحرک به‌عنوان پایه‌ای مهم برای درک رفتار تحرکی افراد [ 3 ] عمل می‌کنند و به تدریج به داده‌های اساسی برای تجزیه و تحلیل جمعیت، سفر، و ویژگی‌های مکانی – زمانی شهروندان تبدیل شده‌اند [ 4 ، 5 ]. آنها برای بررسی ساختارهای فضایی شهری و رفتار ساکنان از دیدگاه میکروسکوپی فردی بسیار مهم هستند [ 6 ، 7 ، 8 ].
در حال حاضر، بیشتر تحقیقات مبتنی بر داده‌های GPS موبایل بر روی تجزیه و تحلیل ماکروسکوپی مانند شناسایی فضای کار و زندگی، تقسیم منطقه عملکردی و شناسایی نوع جمعیت متمرکز شده‌اند [ 9 ، 10 ]. به عنوان مثال، بر اساس داده های GPS تلفن همراه در سراسر کره در طول یک هفته، لی و همکاران. (2018) فعالیت‌های شهری و الگوهای تحرک را در 10 شهر تجزیه و تحلیل و مقایسه کرد و پراکندگی فضایی مناطق مسکونی را مورد بررسی قرار داد [ 11 ]. با تجزیه و تحلیل داده های GPS تلفن همراه در اسپانیا طی پنج هفته، Louail و همکاران. (2015) یک روش شناسایی ماتریس مبدا-مقصد (OD) را برای رفت و آمد ساکنان در شهرها پیشنهاد کرد و الگوهای توزیع فضایی فضاهای کار و زندگی در اسپانیا را روشن کرد [12 ]]. گائو و همکاران (2015) داده های تلفن همراه ناشناس را از شهری در چین طی یک هفته برای تجزیه و تحلیل الگوهای تحرک و پویایی شهری شهر اتخاذ کرد [ 13 ]. ژائو و همکاران (2019) شناسایی چند بعدی سفرهای کلان شهرها را بر اساس داده های تلفن همراه و کاربری زمین انجام داد و گزارش کرد که پوشش مناطق عملکردی مختلف در منطقه پکن-تیانجین-هبی به عنوان حلقه تأثیر کلان شهر > دایره زندگی کلان شهر > دایره سفر کلان شهرها رتبه بندی می شود. 14]. انتخاب منطقه مرکزی شهر در شانگهای به عنوان مثال، نیو و همکاران. (2015) روشی را برای بررسی ساختار فضایی شهری بر اساس داده های تلفن همراه پیشنهاد کرد. در این روش، تجزیه و تحلیل چگالی هسته داده‌های تلفن همراه ابتدا انجام شد و سپس با داده‌های ساعت پیک در صبح و عصر ترکیب شد تا مناطق عملکردی اصلی در منطقه مرکزی شهر شناسایی شوند [15 ] . علاوه بر این، مطالعاتی در مورد طبقه بندی اولیه نوع جمعیت بر اساس ویژگی های فعالیت های تحرک گروهی انجام شده است. به عنوان مثال، بر اساس داده های تلفن همراه 45 روز، دینگ و همکاران. (2019) تقریباً کاربران را بر اساس ویژگی‌های فعالیت کاربران در مناطق مختلف به جمعیت‌های دائمی و شناور طبقه‌بندی کرد [ 16]]. به طور مشابه، بر اساس داده های تلفن همراه در طول یک هفته، جیانگ و همکاران. (2012) با تجزیه و تحلیل فعالیت های شهروندان (ماندن در خانه، کار، رفتن به مدرسه و سایر فعالیت ها) شهروندان را به هفت نوع طبقه بندی کرد [ 17 ].
با این حال، تحقیقات موجود مبتنی بر داده‌های تلفن همراه، عمدتاً از داده‌های کوتاه‌مدت (اغلب چند روز را پوشش می‌دهد) در یک منطقه خاص برای انجام تحقیقات کلان بر روی شناسایی منطقه کانونی شهری یا تجزیه و تحلیل رفتار گروه انسانی استفاده می‌کند [18، 19 ، 20 ] ، مانند به عنوان شناسایی مناطق مسکونی گروهی و شناسایی جمعیت های شناور [ 21 و 22]. در حالی که مطالعات کمی در مورد تحقیقات پرتره (مانند شغل) کاربران فردی بر اساس داده های بلندمدت و عظیم GPS تلفن همراه وجود دارد، با افزایش تقاضا برای مدیریت شخصی هوشمند شهری و خدمات امنیتی سفارشی، شناسایی رفتار افراد از اهمیت ویژه ای برخوردار است. افراد و توصیف ویژگی های آنها بر اساس داده های بزرگ.
بنابراین، بر اساس داده‌های GPS موبایل شرکت‌کنندگان داوطلب از پکن از سال 2007 تا 2012، این مقاله شناسایی تصویر پرتره را با تجزیه و تحلیل رفتار افراد در مقیاس زمانی طولانی انجام می‌دهد. با توجه به اینکه ردیابی‌های تلفن دقت فضایی پایینی دارند و به‌صورت پراکنده در زمان نمونه‌برداری می‌شوند، چالش نیاز به مجموعه‌ای دقیق از تکنیک‌ها برای استخراج اطلاعات با ارزش پنهان موجود در آنها است. با استخراج مجموعه ای قوی از مهرهای زمانی موقعیت جغرافیایی که نشان دهنده زنجیره سفر هستند، اهداف این تحقیق (1) خوشه بندی فعالیت ها و طبقه بندی انواع مختلف الگوهای تحرک کاربر بر اساس داده های مسیر GPS است. (2) بر اساس انواع طبقه بندی شده، برای شناسایی ویژگی های افراد (شغل، سن، و سرگرمی ها) با بررسی الگوهای فعالیت تک تک کاربران با کمک GoogleMap. و (3) برای ارائه یک روش جدید برای تصویر پرتره فردی در مقیاس میکروسکوپی. این تحقیق می‌تواند به آشکار کردن سریع ویژگی‌های افراد، پر کردن شکاف در تحقیقات شناسایی و پیش‌بینی پرتره فردی در عصر کلان داده، و ارائه راهنمایی برای خدمات هدف شهری و مدیریت تمام وقت فردی کمک کند. این مقاله تجزیه و تحلیل رفتار بلندمدت و تحقیقات پرتره افراد با تکیه بر داده های تلفن همراه را انجام می دهد تا پایه ای برای مدیریت شخصی شهرهای هوشمند فراهم کند. شکاف موجود در تحقیقات شناسایی و پیش‌بینی پرتره فردی در عصر کلان داده را پر کنید و برای خدمات هدف شهری و مدیریت فردی تمام وقت راهنمایی کنید. این مقاله تجزیه و تحلیل رفتار بلندمدت و تحقیقات پرتره افراد با تکیه بر داده های تلفن همراه را انجام می دهد تا پایه ای برای مدیریت شخصی شهرهای هوشمند فراهم کند. شکاف موجود در تحقیقات شناسایی و پیش‌بینی پرتره فردی در عصر کلان داده را پر کنید و برای خدمات هدف شهری و مدیریت فردی تمام وقت راهنمایی کنید. این مقاله تجزیه و تحلیل رفتار بلندمدت و تحقیقات پرتره افراد با تکیه بر داده های تلفن همراه را انجام می دهد تا پایه ای برای مدیریت شخصی شهرهای هوشمند فراهم کند.
این مقاله از پنج بخش تشکیل شده است. بخش 2 مطالعات مربوطه را در مورد داده های تلفن همراه معرفی می کند. بخش 3 منطقه مورد مطالعه، منابع داده ها و روش شناسی این تحقیق را تشریح می کند. نتایج طبقه بندی برای الگوهای مختلف سفر و نتایج پرتره معمولی در بخش 4 ارائه شده است . بحث و نتیجه گیری در بخش 5 آمده است .

2. منابع داده

این مقاله داده های مسیر GPS تلفن همراه 182 شرکت کننده داوطلب را از آوریل 2007 تا آگوست 2012، که از طریق پروژه Geolife انجام شده توسط Microsoft Research Asia [ 23 ] جمع آوری شده بود، اتخاذ می کند. داده‌های Geolife عمدتاً مسیر حرکت بخشی از کارکنان مایکروسافت تحقیقات آسیا یا بستگان و دوستان آنها را ثبت می‌کنند. لازم به ذکر است که داده ها دوره های زمانی مختلفی را پوشش می دهند. به عنوان مثال، برخی از داده ها یک سال را پوشش می دهند، در حالی که سایر داده ها پنج سال را پوشش می دهند. مجموعه داده طیف گسترده ای از فعالیت های کاربران را در فضای باز ثبت می کند، از جمله عادات زندگی مانند رفتن به سر کار و بازگشت به خانه و همچنین سرگرمی و فعالیت های ورزشی مانند خرید، غذا خوردن در بیرون از خانه، و پیاده روی [24، 25 ] .]. شایان ذکر است که 90.56 درصد از مسیرهای کاربر در پکن قرار دارد و در سایر شهرها مسیرهای کمی وجود دارد. بنابراین، این مقاله عمدتاً بر پکن متمرکز است. ویژگی و توزیع داده های تلفن همراه مورد استفاده در جدول 1 و به ترتیب در شکل 1 نشان داده شده است .
پاکسازی داده ها باید قبل از تجزیه و تحلیل انجام شود. همانطور که توسط لی و همکاران گزارش شده است. [ 26 ]، پاکسازی داده ها شامل پردازش میدان های نامعتبر، حذف نقاط رانش GPS، و در نهایت استخراج جفت های OD (که اساس داده های مسیر را تشکیل می دهند) از نقاط GPS مرتب نشده برای تعیین مسیرهای سفر هر کاربر است. پاکسازی داده های این مطالعه به شرح زیر است.
(1) تقسیم بندی اولیه مسیر. با تجزیه و تحلیل فواصل زمانی اکتساب داده، دریافتیم که فرکانس اکتساب داده از 5 ثانیه تا 1 روز متغیر است. داده‌های جمع‌آوری‌شده در بازه‌های زمانی 5 ثانیه، 1.02 درصد از کل داده‌ها را تشکیل می‌دهند، در حالی که تا 90.44 درصد از داده‌ها در 45 دقیقه جمع‌آوری می‌شوند. بنابراین، با در نظر گرفتن الگوریتم لی و همکاران. [ 26 ]، در این مقاله، نمونه شامل یک فاصله زمانی بیشتر از 45 دقیقه بین دو نقطه است که به عنوان ناهنجاری دستگاه یا داده های نامعتبر در نظر گرفته می شود. بنابراین این دو نقطه برای مستقل بودن از یکدیگر جدا می شوند.
(2) حذف نقاط بدون توقف و نازک شدن داده ها. بر اساس نتایج تقسیم‌بندی اولیه، نقاط عبوری با زمان‌های ماندگاری کمتر از 10 دقیقه حذف می‌شوند. سپس نقاط OD و زمان سفر هر سفر برای یک کاربر به دست می آید. پس از پاکسازی داده ها، 17621 قطعه داده از جمله شناسه کاربر (UserID)، زمان جمع آوری داده ها (زمان) و مکان (طول و عرض جغرافیایی) باقی مانده است.

3. تعیین الگوی تحرک فردی و به تصویر کشیدن پرتره

این مقاله روشی را برای تعیین الگوی تحرک فردی و به تصویر کشیدن پرتره پیشنهاد می‌کند. این روش از طریق پنج مرحله اصلی ادامه می یابد: پاکسازی داده های GPS اصلی و نازک شدن داده ها، خوشه بندی فضایی نقاط GPS و تعیین خوشه های با چگالی بالا، اصلاح و تعمیم الگوهای تحرک، تجزیه و تحلیل اطلاعات بلند مدت فردی با ادغام با قانون. زندگی، و پیش‌بینی تصویر پرتره فردی. نمودار جریان روش پیشنهادی به صورت شکل 2 توضیح داده شده است .

3.1. پاکسازی و نازک شدن داده های GPS اصلی

برای داده های اصلی GPS تلفن همراه، به دلیل نقص دستگاه و داده های گم شده و غیرعادی، پاکسازی داده ها ضروری است. این عمدتاً شامل دو مرحله است – پاکسازی داده ها و نازک کردن داده ها – همانطور که در بخش 2 توضیح داده شده است . اشاره کرد که نازک شدن داده ها با هدف کاهش میزان محاسبات، اطمینان از نکات مهم و به حداکثر رساندن دقت خوشه بندی فضایی است.

3.2. خوشه بندی فضایی نقاط GPS

در این مقاله، از الگوریتم خوشه‌بندی فضایی مبتنی بر چگالی کاربرد با نویز (DBSCAN) برای تحلیل خوشه‌بندی استفاده شده است. این یک روش خوشه بندی چگالی معمولی است که یک خوشه را به عنوان بزرگترین مجموعه نقاط متصل به چگالی تعریف می کند [ 27 ]. DBSCAN می تواند نواحی با چگالی کافی را به خوشه ها تقسیم کند و خوشه هایی با شکل دلخواه را در مجموعه داده های فضایی پر سر و صدا تعیین کند. الگوریتم DBSCAN دارای ویژگی های پیشرفته ای است که هنگام تشخیص الگوهای با اشکال مختلف مفید است و همچنین انتخاب خوبی برای خوشه های “طبیعی” و آرایش آنها در فضای داده است [28 ] . با توجه به مزیت DBSCAN، الگوریتم پایه DBSCAN احتمالاً محبوب ترین روش برای خوشه بندی فضایی شد [ 29 ، 30]]. بنابراین برای روش خوشه بندی فضایی در این مقاله به دو دلیل از الگوریتم پایه DBSCAN استفاده شده است. یکی سادگی و پایایی این الگوریتم است و دیگری اینکه تحلیل خوشه بندی فضایی یک مرحله از روش پیشنهادی است. هدف اصلی تجزیه و تحلیل خوشه‌بندی در این مقاله تعیین ناحیه فعالیت اولیه فردی است نه یک ناحیه تابع دقیق با استفاده از الگوریتم پایه DBSCAN تا این نیاز را تا حدودی برآورده کند.
دو پارامتر مهم در الگوریتم DBSCAN وجود دارد که ϵ و MinPts هستند. ϵ نشان‌دهنده شعاع همسایگی خوشه، و MinPts نشان‌دهنده حداقل آستانه نقاط برای تعیین یک خوشه است [ 31 ، 32 ]. بر اساس تعداد نقاط یک محله، سه نوع نقطه داده را می توان تشخیص داد، یعنی شی هسته، شی مرزی و نقطه نویز. همانطور که در Lin et al. [ 32]، شی هسته نشان دهنده شی داده ای است که حاوی بیش از نقاط MinPts در ϵ-همسایه است، شی مرزی شی داده ای را نشان می دهد که حاوی کمتر از نقاط MinPts در ϵ-همسایه است، اما در ϵ-همسایه هسته قرار می گیرد. شیء، نقطه نویز به معنای شی داده ای است که به هیچ خوشه ای تعلق ندارد. به طور کلی، جسم هسته مربوط به نقطه در داخل منطقه متراکم، جسم مرزی مربوط به نقطه در لبه منطقه متراکم، و نقطه نویز مربوط به نقطه در ناحیه پراکنده است.
گردش کار اصلی الگوریتم DBSCAN به شرح زیر است. با شروع از یک نقطه P در مجموعه نقطه P، اگر همسایه ϵ نقطه P حاوی بیش از MinPts باشد، نشان می دهد که نقطه P شی هسته است. خوشه ای با P به عنوان هسته ایجاد می شود، و نقاطی در همسایه ϵ آن ایجاد می شود که از نظر چگالی قابل دسترسی هستند [ 32] به خوشه اضافه می شوند. نقاطی را که از نظر چگالی همه اشیای هسته قابل دسترسی هستند به خوشه اضافه کنید، و محاسبه تکراری تا زمانی انجام می‌شود که تمام نقاطی که با نقطه P متصل به چگالی هستند به خوشه اضافه شوند. سپس نقطه دیگری که به هیچ خوشه ای اضافه نشده است انتخاب می شود و روند فوق تکرار می شود تا جایی که نقطه جدیدی به هیچ خوشه ای اضافه نشود. نقاطی که به هیچ خوشه ای اضافه نمی شوند، نقاط نویز هستند. گردش کار دقیق الگوریتم DBSCAN را می توان از Ester و همکاران [ 27 ] و Lin و همکاران به دست آورد. [ 32 ].

بر اساس سوابق UserID، به دست آوردن نقاط GPS تلفن همراه هر کاربر ( ij , i = 1, 2, …… n ؛ j = 1, 2, …… m ) m تعداد کاربران است، n تعداد کل نقاط پاکسازی GPS یک کاربر. سپس با تعریف مجموعه داده ورودی D = ( 11 , 12 ,…, mn )، با استفاده از الگوریتم DBSCAN، خوشه های تک نقطه GPS C = { 1 , 2 ,…, k} تعیین می شود. در این مقاله، بر اساس آزمایش های متعدد، آستانه بهینه MinPts و فاصله جستجو به ترتیب 50 متر و 500 متر تعیین شده است. پس از تعیین خوشه ها، خوشه با چگالی بالا شناسایی می شود. با توجه به نتایج خوشه‌بندی اولیه با الگوریتم DBSCAN، چگالی نقطه ( i ) یک خوشه به صورت زیر محاسبه می‌شود:

Dمن=سیمن/اسمن،من∈(1،2،3…)

که در آن i چگالی نقطه یک خوشه (تعداد نقاط/km 2 )، i تعداد نقاط در خوشه i و i مساحتی است که از اتصال بیرونی ترین نقاط خوشه تشکیل می شود. سه متراکم‌ترین خوشه‌های برتر شناسایی و انتخاب می‌شوند تا مناطقی با فرکانس بالای کاربران، زمانی که مجموعه‌های خوشه‌ای بزرگ‌تر از 3 هستند، به دست آید.

3.3. اصلاح و تعمیم الگوهای تحرک

بر اساس خوشه های فرکانس بالا، سه سناریو از الگوهای تحرک قابل تشخیص است. سناریو A: وجود سه خوشه فرکانس بالا. سناریوی B: وجود دو خوشه فرکانس بالا. سناریوی C: وجود یک خوشه فرکانس بالا.
با توجه به سه سناریو، سه نوع از ویژگی های تحرک تعمیم و نتیجه گیری می شود. برای سناریوی A با سه خوشه فرکانس بالا، الگوی تحرک به عنوان “الگوی دو هسته ای” در نظر گرفته می شود. برای سناریوی B با دو خوشه فرکانس بالا، الگوی تحرک به عنوان “الگوی دو نقطه یک خط” در این مقاله در نظر گرفته شده است. و به طور مشابه، برای سناریوی C با یک خوشه فرکانس بالا، الگوی تحرک به عنوان “الگوی پراکنده” در نظر گرفته می شود.
فرض کنید که هر فرد محل سکونت ثابتی دارد، سه سناریو الگوی تحرک را می توان به عنوان چهار مورد اصلاح کرد. برای «الگوی دو نقطه‌ای یک خطی»، می‌توان آن را به دو مورد اصلاح کرد که یک مکان مسکونی با یک «محل کار» است. برای “الگوی دو هسته ای” می توان آن را به دو مورد متمایز کرد که یک مکان مسکونی با دو “فضای کاری” و دو مکان مسکونی با یک “فضای کاری” است. برای «الگوی پراکنده»، یک مورد با یک منطقه مسکونی و بدون «محل کار» ثابت را نشان می‌دهد. لازم به ذکر است که فرض می کنیم در این مقاله هیچ موردی وجود ندارد که خوشه ها همه مکان های مسکونی یا محل کار را نشان دهند. دلیل آن این است که دلیل احتمالی این پدیده وجود موقعیت ذهنی انسان است.

3.4. تجزیه و تحلیل اطلاعات بلند مدت فردی با ادغام با قانون زندگی

با توجه به سه نوع تعمیم یافته از الگوهای تحرک، ویژگی فردی خاص با ادغام اطلاعات GPS هر کاربر قابل تجزیه و تحلیل است و می توان نوع الگوی تحرک فرد را مورد قضاوت قرار داد.

ابتدا تعیین “محل کار” و “محل سکونت” این کاربر. دوره های زمانی مختلف را تعریف کنید، از جمله (1) ساعات کاری در روزهای کاری (09:00 تا 18:00)، (2) ساعات غیر کاری در روزهای کاری (هر زمانی به جز از 09:00 تا 18:00 در روزهای هفته) و 3) روزها خاموش (آخر هفته و تعطیلات). استخراج زمان مکان GPS برای همه نقاط در خوشه های فرکانس بالا، تعیین خوشه ها در دوره های زمانی مختلف با استفاده از رابطه (2)

آرwمن=نwمن/نمن،آرnonمن=نnonمن/نمن

که در آن wi تعداد نقاطی را نشان می دهد که زمان مکان GPS آنها در ساعات کاری برای i -امین خوشه فرکانس بالا است ، Nnoni تعداد نقاطی را نشان می دهد که زمان مکان GPS در ساعات غیر کاری برای i- امین خوشه فرکانس بالا است. و i تعداد کل نقاط در خوشه i را نشان می دهد.

مطالعات اخیر [ 3 ، 33 ] گزارش کردند که علیرغم عدم تشابه در مناطق تحرک تحت پوشش افراد، نظم بالایی در رفتارهای حرکتی انسان وجود دارد، که نشان می دهد اکثر افراد از یک الگوی ساده و قابل تکرار پیروی می کنند. از نظر تئوری، منطقه ای که ساعات کاری بر آن غالب است معمولاً فضای کاری را نشان می دهد، به طور مشابه، منطقه ای در ساعات غیر کاری معمولاً نشان دهنده فضای مسکونی است. بنابراین با محاسبه و مقایسه مقادیر Rw و non برای هر خوشه می توان ویژگی های فعالیت اولیه خوشه را استنباط کرد. به عنوان مثال، اگر Rw به مراتب بزرگتر از R non باشددر یک خوشه، به این معنی است که این خوشه بیشتر به عنوان یک فضای کاری است. در مقابل، عملکرد این خوشه بیشتر یک منطقه مسکونی است. این برای موردی مناسب تر است که داده های GPS موقعیت یابی متمرکز وجود نداشته باشد.
سپس بر اساس تعیین «محل کار» و «محل سکونت»، الگوی تحرک وی مورد قضاوت قرار می گیرد.

3.5. پیش بینی تصویر پرتره فردی

پس از تجزیه و تحلیل ویژگی فعالیت فرد و قضاوت در مورد الگوی تحرک او، می توان ویژگی های فردی را به طور مقدماتی پیش بینی کرد. به عنوان مثال، اگر الگوی تحرک فرد «الگوی دو نقطه‌ای یک خطی» با یک «محل کار» ثابت و یک «محل مسکونی» ثابت باشد، می‌توان ابتدا فرد را یک کارمند یا یقه سفید استنباط کرد. اگر الگوی تحرک فرد “الگوی دو هسته ای” باشد و دارای دو “محل کار” یا دو “محل مسکونی” ثابت باشد، می توان استنباط کرد که فرد دارای دو فضای کاری مانند معلمان کالج یا مدیران ارشد است. اگر الگوی تحرک فرد «الگوی پراکنده» باشد و یک «محل مسکونی» داشته باشد، که نشان می‌دهد «محل کار» ثابتی وجود ندارد، احتمالاً فرد فروشنده یا فریلنسر خانگی است. لازم به ذکر است که اگر مسیر دارای مجموعه خوشه‌ای با چگالی بالا نباشد، نشان می‌دهد که این فرد ممکن است یک رهگذر باشد و این وضعیت باید به طور ویژه مورد تجزیه و تحلیل قرار گیرد. با این حال، برای گرفتن پرتره دقیق از یک فرد، تجزیه و تحلیل دقیق مانند سرگرمی و زمان رفت و آمد باید انجام شود.
ابتدا، برای هر نوع فعالیت، نتایج خوشه‌بندی را با داده‌های کاربری زمین/داده‌های POI ادغام کنید و انواع دقیق کاربری زمین محل زندگی و کار را تعیین کنید.
دوم، تفاوت زمان مکان GPS را برای هر خوشه در دوره های زمانی مختلف محاسبه کنید. برای «الگوی دو نقطه‌ای یک خطی» و «الگوی دو هسته‌ای» با مکان‌های کاری ثابت، تفاوت بین حداقل زمان در «خوشه محل کار» و حداکثر زمان در «خوشه مسکونی» از ساعت 08:00 تا 10 :00 در یک روز شمارش می شود و سپس تفاوت روزانه میانگین می شود. این زمان تقریباً زمان رفت و آمد افراد است. برای نوع “الگوی پراکنده”، فراوانی مسیر در طول ساعات کاری ( Traj Working )، و فاصله اروپایی بین کار Trajامتیاز و “محل مسکونی” محاسبه می شود. اگر فرکانس و مسافت اروپایی هر دو زیاد باشد، احتمال بیشتری وجود دارد که فرد فروشنده باشد. اگر فرکانس کم و فاصله کم باشد، به احتمال زیاد فریلندر خانه یا دانش آموز مدرسه است.
علاوه بر این، با استفاده از روش پیشنهادی در این مقاله، ویژگی تحرک در روزهای تعطیل (آخر هفته و تعطیلات) را نیز می توان تجزیه و تحلیل کرد، که کمک می کند تا سرگرمی های فرد در طول تعطیلات را به تصویر بکشد، بنابراین سن و جنسیت را بهتر قضاوت می کند. برای مثال، زنان جوان بیشتر از مردان ترجیح می دهند در تعطیلات آخر هفته یا تعطیلات به مراکز تجاری بروند. از طریق تجزیه و تحلیل جامع، پرتره فردی را می توان عمیقاً به تصویر کشید. به عنوان مثال، فردی که الگوی تحرک او «الگوی دو نقطه‌ای یک خطی» است، اگر «محل کار» او بیشتر در برخی از ساختمان‌های تجاری واقع شده باشد. زمان رفت و آمد در پکن 45 دقیقه است، و منطقه با فرکانس بالا در روزهای تعطیل خانه و پارک است، بنابراین فرد به احتمال زیاد یک کارگر یقه سفید مرد است. در این صفحه،

4. تجزیه و تحلیل الگوی تحرک فردی و تصویر پرتره

بر اساس روش پیشنهادی، ابتدا الگوی تحرک فردی را با استفاده از داده‌های مسیر GPS تلفن همراه جمع‌آوری‌شده از طریق پروژه Geolife تحلیل کردیم. پس از ارزیابی الگوهای تحرک، به منظور پرتره کردن ویژگی های فردی با جزئیات، GoogleMap با نتایج خوشه بندی یکپارچه شده است. لازم به ذکر است که پنج الگوی مختلف انتخاب شده و به تفصیل مورد تجزیه و تحلیل قرار گرفته است تا اطلاعات بیشتری برای به تصویر کشیدن پرتره ارائه شود.

4.1. تجزیه و تحلیل الگوهای مختلف

بر اساس نتایج خوشه‌بندی همه مسیرها، سه نوع خوشه با چگالی بالا به دست می‌آید: خوشه‌های تک، دوتایی و سه‌گانه با چگالی بالا. داوطلبانی که رفتارشان به یک الگوی دو نقطه یک خط پایبند است، 55.7٪ از داوطلبان را تشکیل می دهد، 13٪ از داوطلبان در امتداد مسیرهایی با هسته های دوگانه حرکت می کنند، و 30.8٪ از آنها یک مسیر پراکنده (شامل تنها یک مجموعه خوشه بندی) را نشان می دهند. . بدیهی است داوطلبانی که نوع سفرشان به مسیر ثابت دو نقطه-یک خط پایبند است، تعداد بیشتری دارند.

4.2. تصویر پرتره از افراد

با تجزیه و تحلیل دقیق ویژگی های رفتار آنها در روزهای هفته و روزهای تعطیل می توان به برخی ویژگی های دقیق تری از افراد استنباط کرد.

4.2.1. الگوی دو نقطه – یک خط

مورد 1: الگوی دو نقطه-یک خط ثابت
شکل 3 نتایج خوشه بندی را نشان می دهد که دارای دو مجموعه خوشه است. شکل 4a توزیع فعالیت یک فرد را در روزهای هفته از 2007 تا 2012 نشان می دهد. کشف شد که (1) از نظر توزیع فضایی که یک خوشه مکان مسکونی، جامعه Huilongguan، و منطقه خوشه‌بندی دیگر در اطراف آکادمی فناوری فضایی چین در Zhongguancun (محل کار) است. (2) با تجزیه و تحلیل فرکانس نقطه، فرد الگوهای منظم رفتن و ترک کار را نشان داد. معمولاً حدود ساعت 09:00 صبح محل سکونت خود را ترک می کردند و قبل از ساعت 09:30 به محل کار خود می رسیدند. زمان رفت و آمد تقریباً 25 دقیقه بود که نشان می دهد وسیله سفر ممکن است اتوبوس یا مترو باشد. با این حال، آنها کار را در زمان مشخصی ترک نکردند، اغلب اضافه کار می کردند و تقریباً ساعت 09:00 شب به محل اقامت خود می رسیدند.
شکل 4 ب توزیع فعالیت افراد را در روزهای تعطیل نشان می دهد. این افراد به غیر از محل سکونت و محل کار خود اغلب از مکان های دیگر نیز بازدید می کردند. با توجه به آمار رفتار مسافرتی افراد در روزهای تعطیل ( شکل 5 )، مشخص می‌شود که فرد معمولاً در روزهای تعطیل در خانه می‌ماند (علاوه بر هر گردشگری انجام شده)، تعداد فعالیت‌های صرف شده در محل کار تقریباً 40٪ است. فرکانس فعالیت رفتن به پارک تقریباً 30٪ و تعداد دفعات فعالیت رفتن به خرید تقریباً 20٪ است. این فرد معمولاً هر پنج هفته یک بار سفر می کرد.
از طریق تجزیه و تحلیل دقیق مسیرهای فعالیت فرد در روزهای هفته و روزهای تعطیل، نشان داده شد که فرد دارای شغل دائمی بوده و اغلب اضافه کار می کند. استنباط می شود که فرد ممکن است یک تکنسین یا محقق باشد. از نظر سرگرمی، آنها از خرید و بازدید از پارک ها یا جاذبه های گردشگری لذت می بردند، حتی گاهی اوقات با دوستان خود معاشرت می کردند. بنابراین، ابتدا استنباط می شود که این فرد احتمالاً یک فرد میانسال بوده است. از این رو، با توجه به تجزیه و تحلیل نوع شغل، سرگرمی ها و سن، این نتیجه حاصل می شود که فرد به احتمال زیاد یک کارگر یقه سفید با شغل ثابت بوده است.
مورد 2: الگوی دو نقطه-یک خط ثابت
شکل 6 نتایج خوشه بندی را نشان می دهد که دارای دو مجموعه خوشه است. شکل 7توزیع فعالیت یک فرد را در روزهای هفته نشان می دهد. خاطرنشان می شود که (1) برای توزیع فضایی، محل سکونت فرد در جامعه جاده تایپینگ و محل کار اصلی در نزدیکی جامعه هگوانگلی قرار داشت. سایر محل های کار در مکان های مختلف پکن رخ داده است. (2) برای ویژگی های زمانی، در روزهای هفته، فرد تقریباً در ساعت 06:30 صبح محل سکونت خود را ترک می کرد و تقریباً در ساعت 08:00 صبح به محل کار خود می رسید و زمان رفت و آمد تقریباً 1.5 ساعت بود. آنها معمولا در امتداد جاده Qingta West سفر می کردند. فراوانی وقوع فعالیت در محل سکونت و محل کار به ترتیب حدود 81.2% و 74.6% می باشد.
شکل 8 مسیر فعالیت افراد در روزهای تعطیل و آمار فراوانی را نشان می دهد. می توان دریافت که مسیرها عمدتاً در بین محل سکونت یا محل کار مختلف توزیع شده اند، در حالی که بقیه در جاذبه های توریستی (مانند Yuanmingyuan و Qianlingshan)، مراکز خرید و سایر مناطق مسکونی رخ داده اند. فرکانس فعالیتی که در پارک ها سپری می شود تقریباً 20٪ و دفعات فعالیتی که برای خرید انجام می شود تقریباً 15٪ است. و این فرد در طول دوره های تحصیلی مسافرت نکرده است.
از طریق تجزیه و تحلیل دقیق مسیرهای فعالیت فرد در روزهای هفته و روزهای تعطیل، نشان داده شد که فرد دارای شغل دائمی بوده است، اما در ساعات کاری، مسیرها پراکنده و به طور گسترده توزیع شده است، این استنباط می شود که فرد به احتمال زیاد فروشنده در روزهای تعطیل، فرد اغلب در خانه یا محل کار خود می ماند و گاهی از جاذبه های گردشگری، پارک ها، مراکز خرید و سایر مناطق مسکونی بازدید می کرد.
مورد 3: الگوی متنوع دو نقطه ای یک خطی
ویژگی های این نوع سفر شبیه به مسیر ثابت دو نقطه یک خط است. تفاوت این است که در طول دوره های زمانی مختلف، مکان مکانی خوشه ها تغییر کرده است.
شکل 9 توزیع فعالیت یک فرد را در روزهای هفته از 2007 تا 2009 نشان می دهد. مشاهده می شود که (1) از نظر توزیع فضایی، مناطق فعالیت اصلی فرد در روزهای هفته شامل آکادمی فناوری اطلاعات فضایی چین در ایستگاه مترو ژیچونلو (محل اقامت) و منطقه اطراف ایستگاه مترو داژونگسی (محل کار) می شود. . (2) از نظر ویژگی های زمانی، فرد الگوهای منظم رفتن و ترک کار را نشان می دهد. معمولاً حدود ساعت 08:00 صبح محل سکونت خود را ترک می کردند و تقریباً در ساعت 18:00 شب کار را به پایان می رساندند. (3) از سال 2007 تا 2009، این فرد در استان هنان و کره مشاهده شد و چنین استنباط کرد که آنها ممکن است برای تجارت سفر کنند.
شکل 10 توزیع فعالیت افراد را در روزهای هفته از سال 2010 تا 2012 نشان می دهد. کشف شده است که (1) از نظر توزیع فضایی، مناطق اصلی فعالیت فرد در نزدیکی خیابان سوژو (محل سکونت) و باغ جنوبی واقع شده است. پارک وانگه. (2) از نظر ویژگی های زمانی، فرد به الگوهای منظم متمایز رفتن و ترک کار پایبند بود. این فرد معمولاً در ساعت 09:00 صبح به سر کار می رفت و تقریباً در ساعت 17:00 بعد از ظهر کار را تمام می کرد. (3) شایان ذکر است که این فرد در مکان‌های مختلف از جمله فوجیان، هنگ کنگ و تایوان در چین و شهرهای اروپا و آمریکای شمالی فعال باقی ماند. پیشنهاد می شود که فرد ممکن است برای کار به خارج از کشور سفر کند.
شکل 11 مسیر فعالیت افراد را در روزهای تعطیل نشان می دهد. تعداد مسیرها در نزدیکی محل کار آنها بیشترین است و پس از آن مسیرهای نزدیک محل سکونت آنها قرار دارد. علاوه بر این، فرد به مکان های دیگری مانند جاذبه های گردشگری سفر می کرد.
از طریق تجزیه و تحلیل دقیق مسیرهای فعالیت فرد در روزهای هفته و روزهای تعطیل، مسیر فعالیت طی شش سال تغییر کرد. جالب است که بدون در نظر گرفتن دوره زمانی، فرد اغلب برای مدت طولانی به سفرهای کاری می رفت و مدت اقامت از یک هفته تا 1.5 ماه متغیر بود. مقصد این سفرها شامل شهرهای چین و کشورهای خارجی بود. از این رو استنباط می شود که فرد مدیر یا تاجر است. در مورد سرگرمی ها، آنها از خرید لذت می بردند و اغلب از پارک ها یا جاذبه های گردشگری دیدن می کردند و گاهی اوقات با دوستان خود معاشرت می کردند. نتیجه گیری می شود که فرد به احتمال زیاد یک محقق یا مدیر یا یک فرد تجاری است که محل کارش اغلب تغییر می کند.
4.2.2. الگوی پراکنده (مسیر توزیع شده یکنواخت در مرکز یک نقطه)
شکل 12 نتایج خوشه بندی را نشان می دهد که فقط یک مجموعه خوشه دارد. ویژگی های این نوع سفر شامل یک منطقه فعالیت اصلی است، در حالی که سایر فعالیت ها به طور مساوی در اطراف منطقه اصلی توزیع می شوند. شکل 13توزیع دقیق فعالیت را در روزهای هفته و آخر هفته نشان می دهد. مشخص شد که (1) از نظر توزیع فضایی، منطقه خوشه‌بندی هسته فرد در اطراف دانشگاه پکن قرار داشت. (2) از نظر ویژگی های زمانی، فرد هیچ الگوی منظم کار یا اوقات فراغت نداشت. (3) در طول بازی های المپیاد XXIX، مسیر حرکت این فرد بیشتر در سبز المپیک قرار داشت. حدس زده می شد که او ممکن است در طول بازی های المپیک به عنوان یک داوطلب خدمت کرده باشد. فراوانی وقوع فعالیت در منطقه مسکونی (دانشگاه پکن) حدود 88.4٪ است.
فعالیت های این فرد تقریباً در مناطق مسکونی (دانشگاه پکن) و برخی از مسیرها در پارک المپیک واقع شده است. می توان نتیجه گرفت که فرد در دانشگاه پکن کار یا تحصیل کرده است. ابتدا مشخص شد که این فرد دانشجوی پسر است. قبل و بعد از بازی های المپیاد XXIX، آنها زمان زیادی را در المپیک سبز گذراندند. اعتقاد بر این است که آنها در طول بازی ها داوطلب بودند که نشان دهنده احتمال بیشتر یک فرد جوان است. نتیجه گیری می شود که این فرد به احتمال زیاد یک دانشجوی (مرد) در دانشگاه پکن است. شایان ذکر است که این وضعیت ممکن است برای افراد خوداشتغالی که در خانه کار می کنند نیز رخ دهد. با این حال، به دلیل برخی نقص ها در مجموعه داده های مورد استفاده در این مقاله، این وضعیت پوشش داده نمی شود.
4.2.3. مسیر با دو هسته
این نوع مسیر با سه حوزه فعالیت اصلی مشخص می شود، که یکی محل سکونت فرد است، در حالی که دو حوزه فعالیت دیگر شامل محل کار متفاوت فرد است. شکل 14 نتایج خوشه بندی را نشان می دهد که شامل سه مجموعه خوشه است.
شکل 15 a توزیع فعالیت یک فرد را در روزهای هفته از 2008 تا 2009 نشان می دهد. مشخص شد که (1) برای توزیع فضایی، محل سکونت فرد در نزدیکی آکادمی فناوری فضایی چین در ایستگاه مترو ژیچونلی قرار داشت و دو محل کار اصلی دانشگاه Tsinghua و دانشگاه فناوری شیمیایی پکن (BUCT) بودند. (2) برای ویژگی های زمانی، هیچ الگوی مشخصی برای رفتن و ترک کار وجود نداشت. این فرد اغلب بعد از ساعت 11:00 شب به محل اقامت خود می رسید و زمان رفت و آمد از دانشگاه فناوری شیمیایی پکن تقریبا 30 دقیقه بود. فراوانی وقوع فعالیت در محل مسکونی، محل کار A و B به ترتیب حدود 65.8٪، 52.7٪ و 38.9 است.
آمار فراوانی فعالیت ها در دانشگاه Tsinghua و دانشگاه فناوری شیمیایی پکن در شکل 16 نشان داده شده است . زمان صرف شده در دانشگاه Tsinghua (85٪) بیشتر از زمان صرف شده در BUCT (40٪) است، بنابراین می توان استنباط کرد که این فرد یک محقق در دانشگاه Tsinghua بود اما یک شغل نیمه وقت در BUCT داشت. با این حال، فرکانس کار در دانشگاه Tsinghua و دانشگاه فناوری شیمیایی پکن اساساً در روزهای تعطیل آنها یکسان بود.
بر اساس تجزیه و تحلیل دقیق مسیرهای فعالیت فرد در روزهای هفته و روزهای تعطیل، می توان نتیجه گرفت که این فرد محقق دانشگاه Tsinghua بود اما شغل پاره وقت در دانشگاه فناوری شیمیایی پکن داشت. این افراد معمولاً در روزهای تعطیل خود کار می‌کردند، گاهی اوقات از پارک‌ها یا جاذبه‌های دیدنی بازدید می‌کردند، اما به ندرت به خرید می‌رفتند و این نشان می‌داد که احتمالاً یک مرد جوان هستند. در نهایت، با توجه به تجزیه و تحلیل نوع شغل، سرگرمی ها و سن، این نتیجه حاصل می شود که فرد به احتمال زیاد یک محقق با شغل پاره وقت است.

5. نتیجه گیری ها

با فرا رسیدن عصر کلان داده، داده های تلفن همراه به تدریج به داده های اساسی برای تجزیه و تحلیل جمعیت و ویژگی های مکانی و زمانی شهروندان تبدیل شده است. در حال حاضر، بر اساس داده های تلفن همراه، محققان مطالعات مختلفی را در زمینه تجزیه و تحلیل ماکروسکوپی انجام داده اند، مانند تشخیص نقاط داغ شهری و تجزیه و تحلیل رفتار جمعیت، اما تحقیقات میکروسکوپی بر روی پرتره افراد بر اساس داده های تلفن همراه طولانی مدت وجود ندارد. بنابراین، این مقاله ابتدا روشی را برای تعیین الگوهای مختلف تحرک فردی و سپس تجزیه و تحلیل داده‌های بلند مدت تلفن همراه داوطلبان از پکن به عنوان بخشی از پروژه Geolife که توسط Microsoft Research Asia انجام شده است، پیشنهاد می‌کند. پرتره و رفتار دقیق تری از افراد، از جمله پنج نفر، تجزیه و تحلیل می شود. که می تواند نمونه هایی برای شخصیت شناسی افراد با الگوهای حرکتی متفاوت ارائه دهد. نتایج اصلی به شرح زیر است:
(1) این مقاله ابتدا روشی را برای تعیین الگوی تحرک فردی پیشنهاد کرد. و با استفاده از داده‌های Geolife، سه نوع الگوی تحرک فردی بر اساس خوشه‌بندی مسیرها طبقه‌بندی می‌شوند. در میان این سه نوع، الگوی دو نقطه یک خط (55.7٪) و الگوی دو هسته ای (30.8٪) اکثر مسیرها در پکن را تشکیل می دهند.
(2) با ادغام با داده های GoogleMap، ویژگی های رفتاری دقیق تر افراد با انتخاب پنج داوطلب تجزیه و تحلیل شد. یک روش تصویربرداری پرتره از ویژگی های فردی که ویژگی های جامع افراد مانند شغل و سرگرمی ها را در نظر می گیرد، پیشنهاد شده است که ایده و نمونه های جدیدی را برای تصویر پرتره فرد در مقیاس میکروسکوپی ارائه می دهد.
(3) نتایج نشان داد که فردی با «الگوی دو نقطه‌ای یک خط» عموماً کارگران یقه سفیدی هستند که در شرکت‌ها یا مؤسسات کار می‌کنند، فرد با «الگوی پراکنده» عمدتاً در دانشجویان دانشگاه یا مشاغل آزاد خانگی وجود دارد، و افرادی که دارای “الگوی میخچه دوگانه” هستند، به احتمال زیاد کارگران پاره وقت با دو محل کار متفاوت هستند، مانند معلمان دانشگاه.
این مقاله با تجزیه و تحلیل ویژگی‌های سفر و عادات روزانه افراد در یک دوره زمانی طولانی، یک روش تصویرسازی الگوی تحرک ویژگی‌های فردی را پیشنهاد می‌کند که به طور جامع ویژگی‌های افراد را در نظر می‌گیرد، که می‌تواند چشم‌انداز جدیدی در تحقیقات پرتره میکروسکوپی ارائه دهد. با این حال، هنوز محدودیت هایی برای این تحقیق وجود دارد. به عنوان مثال، به دلیل محدودیت‌های حفظ حریم خصوصی و داده‌ها، از داده‌های عمومی اما قدیمی برای انجام تجزیه و تحلیل دقیق استفاده شد، بنابراین نتایج فقط تا حدی با چند نمونه شناخته شده تأیید می‌شوند. علاوه بر این، با توجه به داده های محدود و فرکانس های مختلف اکتساب داده ها، دقت تعیین پرتره فردی محدود است. با توجه به به موقع بودن داده ها، داده های نقشه گوگل در سال 2015 برای تجزیه و تحلیل مشخصات دقیق افراد استفاده می شود. برای تجزیه و تحلیل خوشه بندی فضایی، در این مقاله از الگوریتم پایه DBSCAN استفاده شده است، اما دارای تعدادی کاستی است، از جمله اینکه اشیاء مرزی دو خوشه نسبتا نزدیک هستند و آستانه هایی برای پارامترها باید تنظیم شود، و سپس وجود دارد. چندین رویکرد برای بهبود الگوریتم پیشنهاد شده است، مانند الگوریتم خوشه بندی بدون پارامتر (DSets-DBSCAN) [34 ]، و یک الگوریتم بهبود یافته که اندازه‌گیری فاصله را هنگام جستجوی شی هسته کاهش می‌دهد [ 32 ]. علاوه بر این، الگوریتم پیشنهادی فرض می‌کند که موقعیت‌یابی ذهنی انسان (فقط موقعیت‌یابی در یک دوره معین) وجود ندارد. در کار آینده، الگوریتم‌های DBSCAN بهبود یافته برای خوشه‌بندی نقطه و روش‌های تعیین ویژگی‌های تحرک بهبود یافته برای بهبود دقت تصویر پرتره یکپارچه خواهند شد. در نهایت، در آینده، داده‌های جدید بیشتری برای اعتبارسنجی روش پیشنهادی و بهبود دقت تصویر پرتره استفاده خواهد شد، بنابراین پشتیبانی فنی و مراجع نمونه برای تحقیقات موضوعی و مدیریت شخصی شهرهای هوشمند فراهم می‌شود.

منابع

  1. چن، ی. شن، سی. تجزیه و تحلیل عملکرد رفتار حسگر گوشی هوشمند برای تشخیص فعالیت انسانی. IEEE Access 2017 ، 5 ، 3095–3110. [ Google Scholar ] [ CrossRef ]
  2. سناراتنه، اچ. مولر، ام. بهریش، م. لالان، اف. بوستوس-جیمنز، جی. اشنایدویند، جی. کیم، دی. Schreck، T. تحلیل تحرک شهری با داده های شبکه تلفن همراه: یک رویکرد تحلیل بصری. IEEE Trans. هوشمند ترانسپ سیستم 2017 ، 19 ، 1537-1546. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  3. لین، ام. Hsu، W. استخراج داده های GPS برای الگوهای تحرک: یک بررسی. اوباش فراگیر. محاسبه کنید. 2014 ، 12 ، 1-16. [ Google Scholar ] [ CrossRef ]
  4. دویل، جی. هوانگ، پی. فارل، آر. مک‌لون، اس. پویایی تحرک جمعیت برآورد شده از داده‌های تلفن همراه. J. فناوری شهری. 2014 ، 21 ، 109-132. [ Google Scholar ] [ CrossRef ]
  5. مانفردینی، ف. پوچی، پی. Tagliolato، P. به سمت استفاده سیستمی از داده های شبکه تلفن همراه چندگانه برای تحلیل و برنامه ریزی شهری. J. فناوری شهری. 2014 ، 21 ، 39-59. [ Google Scholar ] [ CrossRef ]
  6. چن، کیو. هو، ز. سو، اچ. تانگ، ایکس. یو، ک. درک الگوهای سفر گردشگران از داده های تلفن همراه: مطالعه موردی در هاینان. در مجموعه مقالات کنفرانس بین المللی IEEE 2018 در مورد داده های بزرگ و محاسبات هوشمند (BigComp)، شانگهای، چین، 15 تا 17 ژانویه 2018؛ جلد 1، ص 45-51. [ Google Scholar ]
  7. کوون، ی. کانگ، ک. Bae, C. یادگیری بدون نظارت برای تشخیص فعالیت های انسانی با استفاده از حسگرهای تلفن هوشمند. سیستم خبره Appl. 2014 ، 41 ، 6067-6074. [ Google Scholar ] [ CrossRef ]
  8. رونائو، کالیفرنیا؛ چو، اس.-بی. تشخیص فعالیت انسان با حسگرهای گوشی هوشمند با استفاده از شبکه های عصبی یادگیری عمیق سیستم خبره Appl. 2016 ، 59 ، 235-244. [ Google Scholar ] [ CrossRef ]
  9. جیانگ، اس. فریرا، جی. گونزالس، ام. الگوهای تحرک انسانی مبتنی بر فعالیت استنتاج شده از داده های تلفن همراه: مطالعه موردی سنگاپور. IEEE Trans. کلان داده 2017 ، 3 ، 208-219. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  10. ویدهام، پی. یانگ، ی. اولم، ام. آتاوال، اس. González، MC کشف الگوهای فعالیت شهری در داده های تلفن همراه. حمل و نقل 2015 ، 42 ، 597-623. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  11. تره فرنگی.؛ شما، SY; Eom، JK; آهنگ، جی. تجزیه و تحلیل فضایی-زمانی شهری Min، JH با استفاده از داده های تلفن همراه: مطالعه موردی شهرهای کره ای با اندازه متوسط ​​و بزرگ. Habitat Int. 2018 ، 73 ، 6-15. [ Google Scholar ] [ CrossRef ]
  12. لوائل، تی. لنورمند، م. پیکورنل، ام. Cantú، OG; هرانز، ر. فریاس مارتینز، ای. راماسکو، جی جی. بارتلمی، ام. کشف ساختار فضایی شبکه های تحرک. نات اشتراک. 2015 ، 6 ، 6007. [ Google Scholar ] [ CrossRef ] [ PubMed ] [ نسخه سبز ]
  13. گائو، S. تجزیه و تحلیل مکانی-زمانی برای کاوش الگوهای تحرک انسانی و پویایی شهری در عصر موبایل. تف کردن شناخت. محاسبه کنید. بین رشته ای. J. 2015 ، 15 ، 86-114. [ Google Scholar ] [ CrossRef ]
  14. ژائو، پی. متعجب.؛ های، ایکس. هوانگ، اس. لیو، دی. شناسایی لبه شهری در منطقه خوشه‌های شهر با استفاده از داده‌های تلفن همراه: مطالعه موردی جینگ-جین-جی. توسعه شهری گل میخ. 2019 ، 26 ، 69–79. [ Google Scholar ]
  15. نیو، ایکس. دینگ، ال. Song, X. درک ساختار فضایی شهری شهر مرکزی شانگهای بر اساس داده های تلفن همراه. طرح شهر چین Rev. 2015 , 24 , 15-23. [ Google Scholar ]
  16. دینگ، دی. مائو، اچ. Lu, Z. تحقیق در مورد تشخیص نوع جمعیت بر اساس داده های سیگنالینگ تلفن همراه. در مجموعه مقالات چهاردهمین کنفرانس حمل و نقل هوشمند چین، چینگدائو، چین، 31 اکتبر 2019؛ صص 417-428. [ Google Scholar ]
  17. جیانگ، اس. فریرا، جی. گونزالس، ام. خوشه بندی الگوهای روزانه فعالیت های انسانی در شهر. حداقل داده بدانید. کشف کنید. 2012 ، 25 ، 478-510. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  18. آحاس، ر. آسا، ا. یوان، ی. راوبال، م. اسموردا، ز. لیو، ی. زیملیکی، سی. تیرو، م. Zook، MA جغرافیای فضا-زمان روزمره: استفاده از داده های حسگر مبتنی بر تلفن همراه برای نظارت بر فعالیت شهری در هاربین، پاریس و تالین. بین المللی جی. جئوگر. Inf. علمی 2015 ، 29 . [ Google Scholar ] [ CrossRef ]
  19. کائو، جی. تو، دبلیو. لی، کیو. ژو، ام. کائو، آر. بررسی توزیع و پویایی مناطق عملکردی با استفاده از داده های تلفن همراه و داده های رسانه های اجتماعی. در مجموعه مقالات چهاردهمین کنفرانس بین المللی کامپیوتر در برنامه ریزی شهری و مدیریت شهری، بوستون، MA، ایالات متحده آمریکا، 10 ژوئیه 2015. [ Google Scholar ]
  20. یانگ، ایکس. نیش، ز. خو، ی. شاو، اس.-ال. ژائو، ز. یین، ال. ژانگ، تی. Lin, Y. درک الگوهای مکانی و زمانی همگرایی و واگرایی انسانی با استفاده از داده های مکان تلفن همراه. ISPRS Int. J. Geo-Inf. 2016 ، 5 ، 177. [ Google Scholar ] [ CrossRef ]
  21. وانگ، کیو. ژانگ، جی. یانگ، اف. دو، اس. Zhang، H. تجزیه و تحلیل ویژگی های سفر ساکنان شهری بر اساس داده های موقعیت یابی تلفن همراه در نانجینگ. در مجموعه مقالات هجدهمین کنفرانس بین المللی COTA متخصصان حمل و نقل، پکن، چین، 5 تا 8 ژوئیه 2018؛ صص 2274-2284. [ Google Scholar ]
  22. ژونگ، جی. وان، ایکس. ژانگ، جی. یین، تی. Ran, B. مشخص کردن جریان مسافر برای یک مرکز حمل و نقل بر اساس داده های تلفن همراه. IEEE Trans. هوشمند حمل و نقل. سیستم 2017 ، 18 ، 1507-1518. [ Google Scholar ] [ CrossRef ]
  23. در دسترس آنلاین: https://www.microsoft.com/en-us/download/details.aspx?id=52367 (در 9 اوت 2012 قابل دسترسی است).
  24. Xie, X. درک رفتار کاربر از نظر جغرافیایی. In Proceedings of the Contextual and Social Media Understanding and Usage، Wadern، آلمان، 15-20 ژوئن 2008. [ Google Scholar ]
  25. ژنگ، ی. ژانگ، ال. Xie، X. Ma، WY همبستگی معدن بین مکان‌ها با استفاده از تاریخچه مکان انسانی. در مجموعه مقالات هفدهمین کنفرانس بین المللی ACM SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی، سیاتل، WA، ایالات متحده آمریکا، 4-6 نوامبر 2009. ص 472-475. [ Google Scholar ]
  26. لی، سی. دای، ز. پنگ، دبلیو. Shen, J. Green Travel Mode: Trajectory Data Cleaning Method for Shared Electric Bicycles. پایداری 2019 ، 11 ، 1429. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  27. استر، ام. کریگل، اچ. ساندر، جی. Xu, X. یک الگوریتم مبتنی بر چگالی برای کشف خوشه ها در پایگاه داده های فضایی بزرگ با نویز. در مجموعه مقالات دومین کنفرانس بین المللی کشف دانش و داده کاوی، پورتلند، OR، ایالات متحده آمریکا، 2 تا 4 اوت 1996. صص 226-231. [ Google Scholar ]
  28. تران، تی. ورنس، آر. Buydens، L. خوشه‌بندی مبتنی بر چگالی هسته KNN برای داده‌های چند متغیره با ابعاد بالا. محاسبه کنید. آمار داده آنال. 2006 ، 51 ، 513-525. [ Google Scholar ] [ CrossRef ]
  29. تانگ، جی. لیو، اف. وانگ، ی. وانگ، اچ. کشف تحرک انسان شهری از داده های جی پی اس تاکسی در مقیاس بزرگ. فیزیک یک آمار مکانیک. Appl. 2015 ، 438 ، 140-153. [ Google Scholar ] [ CrossRef ]
  30. وو، دی. شی، ر. وانگ، جی. Wu, S. روش تجزیه و تحلیل ویژگی های توزیع جمعیت شهری بر اساس داده های تلفن همراه. در مجموعه مقالات پنجمین کنفرانس بین المللی 2016 در زمینه مواد پیشرفته و علوم کامپیوتر، چینگدائو، چین، 26 تا 27 مارس 2016. [ Google Scholar ]
  31. تران، تی. دراب، ک. Daszykowski، M. اصلاح الگوریتم DBSCAN برای خوشه بندی داده ها با خوشه های متراکم مجاور. شیمی. هوشمند آزمایشگاه. سیستم 2013 ، 120 ، 92-96. [ Google Scholar ] [ CrossRef ]
  32. لیو، پی. هنگ، ز. فنگ، دبلیو. لی، ی. Wu, L. طراحی و پیاده سازی یک الگوریتم DBSCAN بهبود یافته. در مجموعه مقالات سومین کنفرانس مدیریت اطلاعات پیشرفته، ارتباطات، کنترل الکترونیک و اتوماسیون IEEE 2019 (IMCEC 2019)، چونگ کینگ، چین، 11 تا 13 اکتبر 2019. [ Google Scholar ]
  33. ژائو، ک. تارکوما، اس. لیو، اس. Huy, V. داده کاوی تحرک انسانی شهری: یک مرور کلی. در مجموعه مقالات کنفرانس بین المللی IEEE در سال 2016 درباره داده های بزرگ (داده های بزرگ)، واشنگتن، دی سی، ایالات متحده آمریکا، 5 تا 8 دسامبر 2016؛ صفحات 1911-1920. [ Google Scholar ]
  34. هو، جی. گائو، اچ. Li, X. DSets-DBSCAN: الگوریتم خوشه بندی بدون پارامتر. IEEE Trans. فرآیند تصویر 2015 ، 25 ، 3182-3193. [ Google Scholar ] [ CrossRef ]
شکل 1. منطقه مطالعه و نقاط مسیر GPS.
شکل 2. نمودار جریان روش پیشنهادی.
شکل 3. دو خوشه با الگوی دو نقطه-یک خط.
شکل 4. فعالیت های مسافرتی فرد در روزهای هفته ( الف ) و روزهای تعطیل ( ب ).
شکل 5. آمار فراوانی فعالیت ها در روزهای تعطیل.
شکل 6. دو خوشه با الگوی دو نقطه-یک خط.
شکل 7. فعالیت های مسافرتی فرد در روزهای هفته.
شکل 8. آمار فراوانی فعالیت ها در روزهای تعطیل بیش از 10 هفته.
شکل 9. فعالیت های مسافرتی فرد در روزهای هفته ( الف ) و روزهای تعطیل ( ب ) از سال 2007 تا 2009.
شکل 10. فعالیت های مسافرتی فرد از سال 2010 تا 2012.
شکل 11. فعالیت های مسافرتی افراد در روزهای تعطیل از سال 2011 تا 2012.
شکل 12. یک خوشه با الگوی پراکنده.
شکل 13. فعالیت های مسافرتی فرد در روزهای هفته ( الف ) و روزهای تعطیل ( ب ).
شکل 14. سه خوشه با الگوی میخچه دوتایی.
شکل 15. الگوهای سفر افراد در روزهای هفته و روزهای تعطیل.
شکل 16. آمار فرکانس کار در دانشگاه Tsinghua و دانشگاه فناوری شیمیایی پکن.

بدون دیدگاه

دیدگاهتان را بنویسید