1. مقدمه
پیشبینی جرم به ادارات پلیس و مقامات دولتی برای تدوین استراتژیهای پیشگیری از جرم کمک میکند و تأثیر مهمی بر توسعه پایدار شهری و کیفیت زندگی شهروندان دارد [ 1 ]. بنابراین، محققان در صنعت و دانشگاه به طور فعال این مشکل را از دیدگاه های مختلف بررسی می کنند. در این مقاله هدف ما استنباط تراکم جرم هر واحد فضایی در بازه زمانی بعدی بر اساس سوابق جرم تاریخی است که می تواند راهنمایی هایی را در جهت بهینه سازی آرایش گشت های پلیس ارائه دهد. این موضوع همچنان به طور فزاینده ای توجه محققان را به خود جلب می کند.
با توجه به نظریه های جنایی کلاسیک مانند نظریه فعالیت های معمول [ 2 ]، نظریه تکرار نزدیک [ 3 ] و نظریه انتخاب عقلانی [ 4 ]، وقوع جرم ارتباط تنگاتنگی با زمان و مکان دارد. در مرحله اولیه، تکنیکهای پیشبینی جرم عمدتاً بر روی بعد زمانی جرم [ 5 ، 6 ، 7 ] یا بعد فضایی جرم [ 8 ، 9 ، 10 ] تمرکز داشتند. اگر هر دو همبستگی زمانی و مکانی در جرم به طور همزمان در نظر گرفته شوند، انتظار می رود که تحلیل جرم و تحقیقات پیش بینی به روش های معنادار پیشرفت کند [ 11 ].]. بنابراین، با توسعه فناوری تجزیه و تحلیل مکانی-زمانی، محققان به طور فعال در حال مطالعه پیشبینی جرم با استفاده از روشهای مکانی-زمانی در سالهای اخیر هستند [ 12 ]. با این حال، برخی از چالش ها فراوان است:
چالش 1 (مدل سازی همبستگی مکانی- زمانی در داده های جرم به اندازه کافی).
از یک سو، جنایت در یک منطقه تحت تأثیر جنایت تاریخی اخیر و دور خود و همچنین مناطق دور یا نزدیک آن است. به عبارت دیگر، همبستگی های مکانی-زمانی در داده های جرم نسبتاً پیچیده است و استخراج موثر آن دشوار است. از سوی دیگر، سهم همبستگی ها در داده های جرم از نظر زمانی و مکانی متفاوت است. از این رو، لازم است که ناهمگونی سهم همبستگی ها در مدل پیش بینی جرم مورد توجه قرار گیرد، که اغلب در اکثر مدل های پیش بینی جرم مکانی-زمانی موجود نادیده گرفته می شود.
چالش 2 (دستیابی به پیش بینی جرم در مقیاس های زمانی مکانی خوب).
در عمل، پیشبینی جرم در مقیاسهای زمانی مکانی ظریف نه تنها میتواند اطلاعات اولیه در زمان واقعی را برای گشت و تحقیق روزانه پلیس فراهم کند، بلکه زمینه کمی را برای تخصیص بهینه منابع پلیس شهری فراهم میکند و پشتیبانی قوی برای پیشگیری از خطرات و جرایم فراهم میکند. کنترل. از این رو، پیشبینی جرم در مقیاسهای زمانی مکانی ظریف، یک مسئله علمی و عملی مهم را نشان میدهد [ 13 ]. با این حال، دادههای جرم در مقیاسهای زمانی مکانی ظریف هم در زمان و هم در مکان پراکنده است، و پیشبینی جرم را به یک کار بسیار چالش برانگیز تبدیل میکند و تاکنون نتایج تحقیقات زیادی وجود ندارد.
برای پرداختن به چالشها، بر اساس شبکههای عصبی کانولوشن سه بعدی فضایی-زمانی (ST-3DNet) که در ابتدا در [ 14 ] برای پیشبینی دادههای شطرنجی ترافیک توسعه یافت، ما یک چارچوب ST-3DNet بهبود یافته برای پیشبینی جرم در مقیاسهای زمانی مکانی خوب پیشنهاد میکنیم. ST3DNetCrime). موارد زیر مشارکت های اصلی ما را خلاصه می کند.
-
تا جایی که می دانیم، ما اولین کسی هستیم که مدل ST-3DNet را معرفی و بهبود بخشیم تا آن را برای حوزه پیش بینی جرم مناسب کنیم.
-
نقشه برداری انتگرال دوره ای روزانه برای حل مشکل داده های جرم پراکنده و نامنظم در مقیاس های زمانی مکانی خوب استفاده می شود.
-
ما سه دسته از ویژگی های زمانی جرم یعنی نزدیکی، دوره و روند را در نظر می گیریم. علاوه بر این، ما ساختار ST-3DNet را اصلاح می کنیم تا به ترتیب، سه همبستگی مکانی-زمانی را استخراج کنیم و تفاوت بین مشارکت همبستگی ها در فضا را توصیف کنیم.
-
ما آزمایشهای جامعی را با استفاده از مجموعه دادههای دنیای واقعی جمعآوریشده از لس آنجلس برای ارزیابی عملکرد مدل ST3DNetCrime و بررسی نقش هر جزء در مدل ST3DNetCrime برای پیشبینی جرم انجام میدهیم.
ادامه این مقاله به شرح زیر سازماندهی شده است. کارهای مرتبط در بخش 2 خلاصه شده است. مقدمات، به عنوان مثال، تعاریف پیش بینی جرم و ساختار ST-3DNet، در بخش 3 توضیح داده شده است. مدل ST3DNetCrime پیشنهادی ما در بخش 4 توضیح داده شده است . بخش 5 نتایج تجربی را مورد بحث قرار می دهد. در نهایت، بخش 6 نتیجه گیری و پیشنهاداتی را برای کار آینده ارائه می دهد.
2. کارهای مرتبط
در این بخش، ما عمدتاً درباره کارهای مرتبط با پیشبینی جرم مکانی-زمانی بحث میکنیم.
مدلهای پیشبینی جرم مکانی-زمانی به طور همزمان همبستگیهای زمانی و مکانی را در جرم در نظر میگیرند و میتوانند پتانسیل زیادی برای مطالعه عمیق در مورد تجزیه و تحلیل جرم فراهم کنند. این موضوع در سال های اخیر توجه فزاینده ای را به خود جلب کرده است. به عنوان مثال، مطالعات اخیر [ 15 ، 16] یک مدل کوکریجینگ فضایی-زمانی را برای ادغام دادههای جرم تاریخی و متغیرهای محیطی مرتبط با الگوهای جنایی، مانند مناطق انتقالی شهری شناساییشده از تصاویر نور شب، و دادههای حرکتی مجرمان گذشته جمعآوریشده در عملیاتهای روتین توقف و پرسش پلیس ارائه کرد. پیش بینی دقیق جنایت ژائو و همکاران وجود همبستگی های زمانی-مکانی در جرم را تایید کرد و یک روش پیش بینی جرم به نام TCP را توسعه داد که این همبستگی ها را در یک چارچوب منسجم مدل می کند [ 17 ]. از آنجایی که بعد زمانی جرم در تخمین تراکم هسته محبوب (KDE) در نظر گرفته نمی شود، یک چارچوب تخمین تراکم هسته مکانی-زمانی (STKDE) برای نقشه برداری و ارزیابی نقاط کانونی جرم پیش بینی شده پیشنهاد شد [ 18 ].]. با توجه به اینکه رفتار مجرمانه شباهت هایی با زلزله دارد، به طوری که خطر زمین لرزه های بعدی یا پس لرزه ها در نزدیکی محل یک رویداد اولیه افزایش می یابد، مدل های فرآیند نقطه خود هیجان انگیز در زلزله شناسی برای مدل سازی جرم اقتباس شدند [ 19 ]. اخیراً فرجامی و عبدی یک سیستم مبتنی بر فازی ژنتیکی را توسعه دادند که ابزار مناسبی برای یافتن الگوهای جرم مکانی-زمانی و پیشبینی جرایم آینده برای محیطهایی با جرایم خوشهای در فضا و زمان است [ 20 ]. همچنین اخیراً یادگیری عمیق برای پیشبینی و مدلسازی جرم به کار گرفته شده است. در [ 21]، مشکل پیشبینی جرم به عنوان یک مسئله پیشبینی سری فضا-زمان بیان شد و یک شبکه عصبی عمیق عودکننده مناسب با تعبیه نفوذ فضایی برای پیشبینی فعالیت مجرمانه در آینده نزدیک اجرا شد. هوانگ و همکاران با جاسازی مشترک همه سیگنالهای مکانی، زمانی و طبقهای در بردارهای بازنمایی پنهان و ثبت دینامیک جرم از طریق یک شبکه تکرارشونده سلسله مراتبی دقت،. یک مدل پیشبینی جرم مبتنی بر معماری شبکه عصبی عمیق (DeepCrime) ایجاد کرد که میتواند وقوع جرایم مختلف را در هر منطقه از شهر پیشبینی کند [ 22 ]. یک چارچوب یادگیری مکانی-زمانی چند وجهی و چندوجهی (MiST) برای پیشبینی رویدادهای غیرعادی در شهر در [ 23 ] مطالعه شده است.]. MiST میتواند به صراحت الگوهای پویای رویدادهای غیرعادی در سطح شهر را از دیدگاههای مکانی-زمانی-مقولهای، با ادغام یک ماژول ترکیب الگوی چندوجهی و یک چارچوب سلسله مراتبی سلسله مراتبی مدلسازی کند. علاوه بر این، نویسندگان [ 24] یک مدل شبکه کانولوشن چند نموداری عمیق (DT-MGCN) برای پیشبینی جرم پیشنهاد کرد، که مؤلفه مکانی-زمانی و مؤلفه تولید نمودار را برای ثبت روابط بین جرم و بسیاری از عناصر خارجی ترکیب میکند. با این حال، همبستگی های پیچیده مکانی-زمانی در داده های جرم به اندازه کافی توصیف نشده است. به عنوان مثال، جرم نه تنها در فواصل زمانی مجاور همبستگی بالایی دارد، بلکه تحت تأثیر سایر ویژگیهای زمانی نیز قرار میگیرد، مانند الگوهای دوره و الگوهای روند که در اکثر مدلهای پیشبینی جرم فضایی-زمانی موجود بهطور مؤثری ثبت نشدهاند. علاوه بر این، اغلب نادیده گرفته میشود که همبستگیهای مکانی-زمانی در دادههای جرم از نظر زمان و مکان ناهمگن هستند. علاوه بر این، بیشتر این تکنیکها الگوهای مکانی-زمانی در مقیاس درشت را در دادههای جرم مدل میکنند.
خوشبختانه، پیشرفتهای جدید در تکنیکهای یادگیری عمیق، مدلسازی کارآمد همبستگیهای پیچیده در دادههای مکانی-زمانی را ممکن میسازد. علاوه بر این، نتایج تحقیقاتی در زمینه پیشبینی دادههای ترافیکی وجود دارد. برای مثال، ژانگ و همکاران. [ 25 و 26 ] یک شبکه باقیمانده مکانی-زمانی (ST-ResNet)، که مجموعه ای از شبکه های باقیمانده عمیق [ 27 ] و لایه های پیچشی را تشکیل می دهد، برای پیش بینی جمعی ورودی و خروجی ساعتی جمعیت در هر منطقه از یک شهر، پیشنهاد کرد. متعاقباً، مدل ST-ResNet برای پیشبینی جرم در مقیاسهای زمانی مکانی خوب اعمال میشود. وانگ و همکاران [ 13] ساختار ST-ResNet را برای پیشبینی توزیع جرم ساعتی لس آنجلس در بستههای همسایه تطبیق داد. علاوه بر این، یک روش تفکیک فضایی تطبیقی برای انتخاب بهترین وضوح فضایی برای پیشبینی جرم ساعتی براساس مدل ST-ResNet [ 28 ] پیشنهاد شد. با این حال، ST-ResNet فقط اطلاعات را در بازه های زمانی مجاور به عنوان کانال های متعدد در نظر می گیرد، از این رو اطلاعات زمانی ورودی پس از اولین لایه کانولوشن از بین می رود [ 14 ]. برای غلبه بر این محدودیت، گوو و همکاران. [ 14] یک شبکه پیش بینی ترافیک مکانی-زمانی به نام ST-3DNet را بر اساس یادگیری عمیق ارائه کرد. ST-3DNet از پیچیدگیهای سه بعدی و واحدهای باقیمانده برای ثبت ویژگیها از هر دو بعد مکانی و زمانی استفاده میکند و یک ماژول “کالیبراسیون مجدد” (Rc) را برای بیان واضح تفاوت مشارکت همبستگیهای مکانی-زمانی در فضا پیشنهاد کرد. با این حال، ST-3DNet را نمی توان برای پیش بینی جرم در مقیاس های زمانی مکانی خوب اعمال کرد، زیرا داده های جرم بسیار پراکنده هستند و روابط دینامیکی مکانی-زمانی پیچیده تری نسبت به داده های ترافیکی دارند. از این رو، ما از نتایج موجود در مورد پیشبینی جرم در مقیاسهای زمانی مکانی خوب استفاده میکنیم و ST-3DNet را برای به دست آوردن عملکرد بهتر پیشبینی جرم بهبود میدهیم.
3. مقدمات
3.1. تعریف مشکل
هدف این پژوهش پیشبینی جرم در مقیاسهای زمانی کوچک مکانی و ساعتی است. در اینجا، منطقه مورد بررسی بر اساس طول و عرض جغرافیایی به مناطق شبکه ای 16 در 16 تقسیم می شود. اجازه دهید ایکستی∈آر16×16ماتریس جرم را در شکاف زمانی t – که در آن عنصر است، نشان دهید(ایکستی)من،jتعداد جرم در گرید است (من،j)در زمان اسلات t . فاصله زمانی بین دو شکاف زمانی یک ساعت است. سپس مسئله پیشبینی جرم به شرح زیر بیان میشود.
تعریف 1.
(پیش بینی جنایت). با توجه به ماتریس های جرم مشاهده شده تاریخی {ایکستی|تی=0،1،⋯،n}، هدف یادگیری یک پیش بینی کننده جرم است که بتواند پیش بینی کند ایکسn+1یعنی توزیع جنایت در بازه زمانی n+1.
3.2. مدل ST-3DNet
ST-3DNet یک مدل یادگیری عمیق جدید است که ابتدا در [ 14 ] برای پیشبینی دادههای شطرنجی ترافیک توسعه یافت. شکل 1 ساختار ST-3DNet را نشان می دهد. اساساً از دو جزء تشکیل شده است، به عنوان مثال، یک مؤلفه نزدیکی که هدف آن گرفتن ویژگیهای مکانی-زمانی جدیدترین دادههای تاریخی است، و یک مؤلفه دوره هفتگی که هدف آن توصیف ویژگیهای دورهای و روند دادههای ترافیک است.
به طور خاص، یک شهر مورد مطالعه به یک تقسیم می شود من×جیشبکه ها بر اساس طول و عرض جغرافیایی نقشه می گیرند و یک شبکه یک منطقه را نشان می دهد. برای مولفه نزدیکی در سمت راست شکل 1 ، دنباله ای از داده های شطرنجی مکانی-زمانی از جدیدترین شکاف های زمانی به عنوان ورودی آن عمل می کند. به منظور استخراج ویژگیهای مکانی-زمانی از دادههای ترافیک، مؤلفه نزدیکی ابتدا از لایههای پیچیدگی سه بعدی و واحدهای باقیمانده دو بعدی استفاده میکند. سپس یک ماژول Rc برای تشخیص و تعیین کمیت سهم ویژگیهای هر منطقه استفاده میشود. برای مؤلفه دوره هفتگی در سمت چپ شکل 1، ورودی دنباله ای از داده های مکانی-زمانی چند هفته اخیر است. این کامپوننت از پیچیدگی های سه بعدی برای استخراج الگوهای مکانی-زمانی و یک ماژول Rc استفاده می کند که ویژگی های مفید را انتخاب می کند و موارد غیر مفید را برای هر منطقه سرکوب می کند. در مرحله بعد، دو خروجی با هم ادغام می شوند ایکسfبا توجه به ماتریس های پارامتری که می توان آنها را برای بیان تفاوت مشارکت بین دو ویژگی زمانی در فضا یاد گرفت که در بالای شکل 1 نشان داده شده است. در نهایت، یک تابع فعال سازی پس از آن دنبال می شود ایکسf.
4. روش شناسی
4.1. بررسی اجمالی چارچوب
شکل 2 چارچوب مدل پیش بینی جرم پیشنهادی ما را نشان می دهد. ورودیهای مدل سوابق جرم تاریخی خام هستند و خروجیها تعداد پیشبینیشده ساعتی جنایات برای همه مناطق یک شهر است. ST3DNetCrime پیشنهادی شامل سه ماژول اصلی، یعنی پیش پردازش داده، استخراج ویژگی های زمانی، و مدل سازی ویژگی های مکانی-زمانی است. در ادامه این سه ماژول به تفصیل توضیح داده شده است.
4.2. پیش پردازش داده ها
شکل 3 الف و شکل 4 به ترتیب توزیع جنایت در یک بازه زمانی تصادفی انتخاب شده و سری زمانی جرم ساعتی در دو هفته قبل در یک شبکه تصادفی انتخاب شده است. این نشان میدهد که دادههای جرم در مقیاسهای زمانی مکانی ظریف پراکنده و نامنظم هستند. به منظور اتخاذ بهتر مدلهای یادگیری عمیق، از نقشهبرداری انتگرال دورهای روزانه پیشنهاد شده در [ 13 ] برای افزایش نظم دادههای سری زمانی استفاده میکنیم:
جایی که Yتی∈آر16×16ماتریس جرم یکپارچه در شکاف زمانی t است وک=تی–تیمد24. شکل 3 ب و شکل 4 ب توزیع جرم یکپارچه و سری زمانی جرم ساعتی یکپارچه را به ترتیب مربوط به شکل 3 الف و شکل 4 الف نشان می دهد . داده های جرم یکپارچه متراکم تر می شوند و تناوب روزانه را نشان می دهند. علاوه بر این، به منظور جلوگیری از آموزش غیرعادی مدل یادگیری عمیق و اطمینان از اثر همگرایی خوب، ماتریس جرم یکپارچه Yتیاز طریق نرمال سازی حداقل حداکثر نرمال می شود. ماتریس جرم یکپارچه نرمال شده با نشان داده می شود Yتی*.
4.3. استخراج ویژگی های زمانی
سه دسته از ویژگی های زمانی جرم در مدل ST3DNetCrime پیشنهادی، یعنی نزدیکی، دوره و روند در نظر گرفته شده است. سه ویژگی زمانی به ترتیب تأثیر داده های جنایت اخیر، داده های تاریخی نزدیک و داده های تاریخی دور را بر جنایت آینده نشان می دهند. و به صورت زیر فرموله می شوند.
جایی که Yساعت، Yدو Ywتوالی وابسته به نزدیکی، توالی وابسته به دوره و توالی وابسته به روند نامیده می شوند. علاوه بر این، لساعت، لدو لwبه ترتیب طول سه دنباله وابسته هستند. پارامتر T به دلیل تناوب روزانه واضح از شکل 4 روی 24 تنظیم شده است . علاوه بر این، دامنه روند به طور تجربی به یک هفته ثابت می شود، به عنوان مثال، دبلیو=24×7=168. سه دنباله وابسته به ترتیب به عنوان ورودی مؤلفه نزدیکی، مؤلفه دوره و مؤلفه روند عمل می کنند.
4.4. مدلسازی ویژگیهای مکانی و زمانی
در مقایسه با دادههای ترافیک، دادههای جرم دارای روابط دینامیکی مکانی-زمانی پیچیدهتری هستند که ساختار ST-3DNet اصلی نمیتواند به خوبی آن را مدیریت کند. این امر عمدتاً در دو نکته زیر منعکس شده است. اولاً، در ساختار اصلی ST-3DNet، هر دو الگوی دوره ای و روند در داده های ترافیک توسط مؤلفه دوره هفتگی گرفته می شوند. با این حال، ویژگی دوره ای و ویژگی روند در داده های جرم، اثرات متفاوتی بر جرم دارد. بنابراین، بهتر است دو مولفه متفاوت طراحی شود تا به ترتیب الگوی دوره ای و الگوی روند را به تصویر بکشد. ثانیاً جرم در یک منطقه نه تنها متاثر از جنایت اخیر مناطق نزدیک یا دور آن است، بلکه متأثر از جرم مناطق دور یا نزدیک آن در گذشته است. از این رو، ما باید در نظر بگیریم که اجزای دوره و روند نیز میتوانند ویژگیهای مکانی-زمانی را ثبت کنند. در همین حال، جزء دوره هفتگی مدل اصلی ST-3DNet تنها از پیچیدگیهای سه بعدی برای استخراج ویژگیهای دورهای و روند استفاده میکند، و ویژگیهای فضایی به طور کامل بررسی نشدهاند. با انگیزه دو عامل فوق، ساختار ST-3DNet را اصلاح کردیم تا برای مدلسازی ویژگیهای مکانی-زمانی در دادههای جرم مناسب باشد، همانطور که در نشان داده شده است.شکل 5 .
در ساختار بهبود یافته ST-3DNet، هر دو جزء دوره و جزء روند همان ساختار شبکه را به عنوان مولفه نزدیک ساختار اصلی ST-3DNet اتخاذ می کنند. به طور خاص، به منظور استخراج ویژگیهای مکانی-زمانی از دادههای جرم اخیر، دادههای جرم تاریخی نزدیک و دادههای جرم تاریخی دور، ابتدا ورودیهای سه مؤلفه به طور جداگانه به لایههای پیچشی سهبعدی و واحدهای باقیمانده دو بعدی وارد میشوند. سپس، سهم ویژگیهای هر منطقه با استفاده از یک ماژول Rc مشخص و اندازهگیری میشود. Yساعت^، Yد^و Yw^خروجی های سه جزء را به ترتیب نشان می دهد. سپس سه خروجی به صورت زیر با هم ترکیب می شوند.
که در آن ∘ ضرب عنصری است. دبلیوساعت، دبلیودو دبلیوwپارامترهای قابل یادگیری هستند که درجات تحت تأثیر سه دسته از ویژگی های زمانی جرم را تنظیم می کنند. در نهایت، مقدار پیش بینی شده با نشان داده شده است Y^تی، به عنوان … تعریف شده است
که در آن f یک تابع غیرفعال سازی است.
5. ارزیابی
در اینجا، آزمایشهای گستردهای با مجموعه دادههای دنیای واقعی از لس آنجلس برای ارزیابی عملکرد پیشبینی جرم مدل ST3DNetCrime انجام میشود. هدف ما عمدتاً پاسخ به سؤالات زیر است:
(1) مدل ST3DNetCrime ما چقدر قوی است؟ به عبارت دیگر، تنظیمات مختلف پارامترهای مدل (به عنوان مثال، تعداد واحدهای باقیمانده دو بعدی) چگونه بر عملکرد ST3DNetCrime تأثیر میگذارند؟
(2) ST3DNetCrime در مقایسه با روش های پایه چگونه عمل می کند؟
(3) انواع ST3DNetCrime با ترکیب های مختلف سه مؤلفه و همچنین استفاده از ماژول پیش پردازش داده چقدر خوب عمل می کنند؟
5.1. تنظیمات
5.1.1. مجموعه داده ها
ما بر پیشبینی جرم در لس آنجلس تمرکز میکنیم، زیرا یکی از شهرهایی است که گستردهترین افشای دادههای آنلاین را دارد. مدل این پژوهش برای پیشبینی جرم قابل انتقال به محیطهای مختلف شهری است. ما دادههای جرم را از ساعت 00:00، 1 ژوئیه 2015 تا 00:00، 1 ژانویه 2016 جمعآوری کردیم. در مجموع، 110662 پرونده جرم معتبر وجود داشت. هر رکورد دارای اطلاعات دقیق در مورد زمان و مکان (به عنوان مثال، طول و عرض جغرافیایی) است. توزیع فضایی کل جرم در شکل 6 نشان داده شده است . از نظر جغرافیایی، این جنایات در محدوده طول و عرض جغرافیایی رخ داده است [33.7058∘،34.3343∘]و [–118.7668∘،–118.1574∘]، به ترتیب. از شکل 6 ، مشخص می شود که در بخش بزرگی از منطقه جرایم کم یا وجود ندارد. بنابراین جنایاتی که در داخل منطقه رخ داده است [33.9000∘،34.3000∘]×[–118.6000∘،–118.2000∘]در این مطالعه در نظر گرفته شدهاند که به صورت ناحیه Z در شکل 6 نشان داده شدهاند . 98731 پرونده جرم در منطقه مورد مطالعه وجود دارد که 89.2 درصد از کل جرایم را شامل می شود.
5.1.2. راه اندازی آزمایشی
بر اساس Keras، که از Tensorflow به عنوان موتور باطن خود استفاده می کند، ST3DNetCrime پیاده سازی شده است. تنظیمات اولیه آزمایشی به شرح زیر ارائه شده است.
(1) در مجموعه داده های جرم، ما تمام داده های قبل از دو هفته گذشته را به عنوان مجموعه آموزشی و داده های دو هفته گذشته را به عنوان مجموعه آزمایشی انتخاب می کنیم.
(2) عملکرد پیشبینی جرم توسط متداولترین معیارهای ارزیابی برای مشکلات رگرسیون [ 29 ]، یعنی ریشه میانگین مربعات خطا (RMSE) ارزیابی میشود.
(3) چندین فراپارامتر باید قبل از ساخت مدل ST3DNetCrime از پیش تنظیم شوند. با آزمایشهای کنتراست گسترده، ساختار اصلی مدل ST3DNetCrime به دست میآید. برای هر جزء، سه لایه کانولوشن سه بعدی وجود دارد. فیلترهای اندازه ل×3×3در اولین لایه کانولوشن سه بعدی استفاده می شود، جایی که l بزرگی بعد زمانی داده های ورودی است. فیلترهای اندازه 3×3×3در دو لایه کانولوشن سه بعدی باقی مانده استفاده می شود و لایه های پیچشی دو بعدی در واحدهای باقیمانده از فیلترهایی با اندازه استفاده می کنند. 3×3. توابع فعال سازی مدل همگی ReLU هستند. علاوه بر این، Adam با پارامترهای پیش فرض به عنوان بهینه ساز و L2-norm به عنوان تابع ضرر هنگام آموزش مدل استفاده می شود.
5.2. مطالعات حساسیت پارامتر
برای بحث در مورد استحکام مدل ST3DNetCrime، بررسی میکنیم که چگونه پیکربندیهای مختلف پارامترهای مدل (یعنی تعداد واحدهای باقیمانده دوبعدی، تعداد فیلترهای مورد استفاده در لایههای پیچشی، و طول سه دنباله وابسته) بر عملکرد آن تأثیر میگذارند. ST3DNetCrime. در این مطالعه، تعداد فیلترها در لایههای کانولوشن و تعداد واحدهای باقیمانده دوبعدی از مجموعههای کاندید انتخاب میشوند. {8،16،32،64}و {2،4،6،8}، به ترتیب. برای طول سه دنباله وابسته (یعنی دنباله وابسته به نزدیکی، دنباله وابسته به دوره و دنباله وابسته به روند)، آنها را به صورت لج∈2،4،6، لپ∈1،2،3، و لq∈1،2،3. از این رو، 27 ترکیب از سه طول دنباله مستقل وجود دارد. شکل 7 نتایج ارزیابی را نشان می دهد. ما دو مشاهدات کلیدی را از شکل 7 به دست می آوریم .
(الف) وقتی تعداد فیلترها در لایههای کانولوشن به ترتیب 8 و 16 باشد، تعداد واحدهای باقیمانده دو بعدی و طولهای سه دنباله وابسته تأثیر نسبتاً کمی بر عملکرد ST3DNetCrime دارند. علاوه بر این، در دو سناریو، ST3DNetCrime به عملکرد نسبتا مشابهی دست می یابد. هنگامی که تعداد فیلترها در لایههای کانولوشن به 32 افزایش مییابد، نوسان RMSE در طولهای مختلف سه دنباله وابسته نسبتاً زیاد است زمانی که تعداد واحدهای باقیمانده روی 8 و 16 تنظیم شود. اگر تعداد فیلترها در لایههای پیچشی برابر باشد. بیشتر به 64 افزایش یافته است، نوسان RMSE صرف نظر از اینکه تعداد واحدهای باقیمانده روی چه مقدار تنظیم شده است، آشکار می شود، و RMSE نیز به طور قابل توجهی بالاتر از زمانی است که تعداد فیلترها در لایه های پیچشی روی 8 تنظیم شود.
(ب) به طور کلی، هنگامی که تعداد واحدهای باقیمانده روی 2 و 4 تنظیم می شود، RMSE کمتر از زمانی است که تعداد واحدهای باقیمانده در اکثر ترکیبات مختلف از سه طول دنباله مستقل روی 8 و 16 تنظیم شود. حتی اگر تعداد فیلترها در لایه های پیچشی روی 8 و 16 تنظیم شود، اگر به شکل 7 a,b دقت کنیم این پدیده نیز وجود دارد.
مشاهدات نشان میدهد که ST3DNetCrime پیشنهادی زمانی که تعداد واحدهای باقیمانده دوبعدی کم است (یعنی ساختار مدل نسبتاً ساده است) و تعداد فیلترها در لایههای پیچشی کم است (یعنی آموزش مدل) عملکرد پیشبینی خوب و استحکام قوی دارد. زمان کاهش می یابد).
5.3. مقایسه عملکرد برای پیش بینی جرم
5.3.1. خطوط پایه
ما عملکرد ST3DNetCrime را با روشهای پایه زیر مقایسه کردیم.
-
رگرسیون بردار پشتیبان (SVR) [ 30 ]: SVR یک روش یادگیری ماشینی نماینده برای مدیریت مشکلات رگرسیون است. در اینجا، یک تابع هسته خطی استفاده میشود، و تاخیر زمانی از مجموعههای نامزد {2، 3، 4، 5، 6، 7، 8، 9، 10، 11، 12} برای یافتن بهترین مقدار RMSE انتخاب میشود.
-
شبکه عصبی حافظه کوتاه مدت طولانی (LSTM) [ 31 ]: LSTM نوعی شبکه عصبی بازگشتی است و می تواند داده های سری زمانی طولانی را یاد بگیرد. در این مورد از یک لایه LSTM استفاده می شود، و تعداد گره ها در لایه LSTM 200 است. علاوه بر این، تاخیر زمانی نیز از یک مجموعه نامزد انتخاب می شود {2، 3، 4، 5، 6، 7، 8، 9، 10، 11، 12}.
-
Convolutional LSTM (ConvLSTM) [ 32 ، 33 ]: ConvLSTM گونهای از مدل LSTM است که لایه کاملاً متصل LSTM سنتی را به لایه کانولوشنی تغییر میدهد. در گرفتن ویژگی های مکانی-زمانی خوب است. در اینجا از دو لایه ConvLSTM استفاده شده است. هر لایه ConvLSTM از 8 فیلتر با اندازه استفاده می کند 3×3. تأخیر زمانی نیز از مجموعه نامزدهای {2، 3، 4، 5، 6، 7، 8، 9، 10، 11، 12} انتخاب می شود.
-
ST-ResNet [ 25 ، 26 ]: ST-ResNet یک مدل پیشبینی مبتنی بر شبکه باقیمانده عمیق برای دادههای مکانی-زمانی است. در اینجا، کانولوشن ها در تمام واحدهای باقیمانده و Conv1 از فیلترهایی با اندازه استفاده می کنند 3×3و Conv2 از یک کانولوشن با یک فیلتر اندازه استفاده می کند 3×3. علاوه بر این، تعداد واحدهای باقیمانده دوبعدی، تعداد فیلترهای مورد استفاده در کانولوشن، و طول سه دنباله وابسته مانند موارد ST3DNetCrime تنظیم شده است.
-
ST-3DNet اصلی: مولفه دوره هفتگی دارای سه لایه کانولوشن سه بعدی است و ورودی آن مانند مولفه روند در ST3DNetCrime است. سایر پارامترها مانند پارامترهای ST3DNetCrime تنظیم می شوند.
-
ST-3DNet-s: ما همچنین یک سناریوی ویژه از ST-3DNet اصلی را در نظر می گیریم، که در آن جزء دوره هفتگی فقط از یک لایه پیچشی سه بعدی با فیلتر اندازه استفاده می کند. ل×1×1، جایی که l بزرگی بعد زمانی داده های ورودی است. در این مورد، لایه پیچیدگی سه بعدی فقط برای استخراج ویژگی های دوره ای و روند در امتداد بعد زمانی استفاده می شود.
5.3.2. مقایسه و تجزیه و تحلیل نتایج
جدول 1 RMSE تمام روش های مقایسه شده را نشان می دهد. به طور کلی، ST3DNetCrime ما از همه روشهای پایه بهتر عمل میکند. به طور خاص، ما مشاهدات زیر را انجام می دهیم.
(الف) RMSE SVR به طور قابل توجهی بالاتر از روش های یادگیری عمیق است. دلیل ممکن است این باشد که برای SVR، یک مدل یادگیری ماشین سنتی، گرفتن ویژگیهای پیچیده از دادههای جرم مکانی-زمانی دشوار است.
(ب) در مقایسه با LSTM و ConvLSTM، RMSE مدل ST3DNetCrime ما به ترتیب 24.5% و 22.6% کاهش یافته است. همانطور که مشاهده می شود، ConvLSTM بهتر از LSTM عمل می کند زیرا ConvLSTM می تواند به طور همزمان ویژگی های مکانی و زمانی را در داده های جرم ثبت کند. با این حال، ConvLSTM به دلیل ساختار پیچیدهاش فقط میتواند چند لایه را روی هم قرار دهد، بنابراین ConvLSTM فقط میتواند ویژگی فضایی نزدیک و ویژگی زمانی اخیر را ضبط کند، به عنوان مثال، ConvLSTM نمیتواند همبستگی مکانی-زمانی را در دادههای جرم بهاندازه کافی دریافت کند. در نتیجه، مزیت عملکرد ConvLSTM در مقایسه با LSTM به اندازه مورد انتظار نیست، در حالی که عملکرد ConvLSTM به طور قابلتوجهی بدتر از مدلهای پیشبینی مبتنی بر شبکه باقی مانده عمیق است (به عنوان مثال،
(ج) اگرچه ST-ResNet و ST-3DNet می توانند به طور موثری همبستگی های پیچیده داده های مکانی-زمانی را مدل کنند، RMSE ST3DNetCrime هنوز حدود 1.63٪ کاهش می یابد. این نشان میدهد که ST3DNetCrime ما برای ثبت ویژگیهای مکانی-زمانی در دادههای جرم و جنایت و پیشبینی جرم در مقیاسهای زمانی مکانی مناسبتر است. علاوه بر این، ما یک سناریوی خاص جالب از ST-3DNet اصلی پیدا کردیم (یعنی ST-3DNet-هایی که جزء دوره هفتگی آنها فقط برای استخراج ویژگی های دوره ای و روند در امتداد بعد زمانی استفاده می شود). در این مورد، اگرچه RMSE مدل ST3DNetCrime ما فقط کمی کمتر از ST-3DNet-s است، نوسان RMSE ST3DNetCrime تحت پارامترهای مختلف بسیار کمتر از ST-3DNet-s است، همانطور که در شکل 8 نشان داده شده است.. مشاهدات نشان میدهد که چارچوب ST3DNetCrime پیشنهادی نه تنها RMSE پیشبینی جرم را کاهش میدهد، بلکه از استحکام خوبی نیز برخوردار است.
5.4. ارزیابی در انواع ST3DNetCrime
به منظور درک بهتر مدل ST3DNetCrime پیشنهادی و ارزیابی اینکه آیا هر جزء نقش مهمی در پیشبینی جرم بازی میکند، ما چهار نوع مدل پیشنهادی را با توجه به ترکیبهای مختلف از سه دسته ویژگیهای زمانی و اینکه آیا ماژول پیشپردازش داده استفاده میشود، در نظر میگیریم. نسخه کامل ST3DNetCrime معرفی شده در بخش 4 به عنوان ST3DNetCrime-f تعریف شده است. جدول 2 تنظیمات ترکیبی خاص و تعاریف نام مدل مربوطه را ارائه می دهد. در ارزیابی، تعداد واحدهای باقیمانده دوبعدی و تعداد فیلترها در لایههای کانولوشن به ترتیب 2 و 16 ثابت میشوند. نتایج ارزیابی در شکل 9 نشان داده شده است. از نتایج، چهار مشاهدات کلیدی به شرح زیر خلاصه می شود.
(الف) در مقایسه با ST3DNetCrime-nopre، نه تنها RMSE ST3DNetCrime به طور قابل توجهی کاهش می یابد، بلکه نوسانات RMSE ST3DNetCrime تحت پارامترهای مختلف نیز بسیار کمتر است. این مشاهدات تأیید میکند که نقشهبرداری انتگرال دورهای روزانه که برای حل مشکل پراکندگی و نامنظم بودن دادههای جرم استفاده میشود، نه تنها به کاهش RMSE ST3DNetCrime کمک میکند، بلکه باعث بهبود استحکام نیز میشود.
(ب) ST3DNetCrime-f از ST3DNetCrime-cp، ST3DNetCrime-ct و همچنین ST3DNetCrime-pt بهتر عمل می کند. مقدار RMSE ST3DNetCrime-f در مقایسه با سه نوع، حداقل 1.07٪ کاهش یافته است. این مشاهدات نشان میدهد که ویژگیهای مکانی-زمانی که به ترتیب توسط مؤلفه نزدیکی، مؤلفه دوره و مؤلفه روند ثبت میشوند، همگی برای بهبود دقت پیشبینی مفید هستند.
(ج) به طور کلی، ST3DNetCrime-cp کمی بهتر از ST3DNetCrime-ct و ST3DNetCrime-ct کمی بهتر از ST3DNetCrime-pt عمل می کند. این نشان میدهد که مؤلفه نزدیکی بیشترین تأثیر را در کمک به ST3DNetCrime در پیشبینی صحیح دارد، در حالی که مؤلفه روند کمترین تأثیر را دارد. به عبارت دیگر، هر چه داده های جرم جدیدتر باشد، تأثیر بیشتری بر جرایم آینده خواهد داشت.
(د) تفاوت در عملکرد پیشبینی بین ST3DNetCrime-cp، ST3DNetCrime-ct و ST3DNetCrime-pt اندک است، در حالی که عملکرد پیشبینی ST3DNetCrime-f به وضوح بهتر از سه نوع ST3DNetCrime است. این نشان میدهد که تنها زمانی که ویژگیهای مکانی-زمانی در دادههای جنایی اخیر، دادههای تاریخی نزدیک و دادههای تاریخی فاصله به طور کامل به طور همزمان ضبط شوند، ST3DNetCrime میتواند بهترین عملکرد پیشبینی جرم را به دست آورد.
6. نتیجه گیری
در این مقاله، ما مدل ST3DNetCrime را برای پیشبینی جرم در مقیاسهای زمانی کوچک مکانی و ساعتی پیشنهاد کردیم، که بهترتیب شامل یک مؤلفه نزدیکی، مؤلفه دوره و مؤلفه روند است که برای ضبط ویژگیهای مکانی-زمانی دادههای جرم اخیر، نزدیک به جرم تاریخی طراحی شده است. داده ها و داده های جرم تاریخی دور. ما مدل طراحی شده را از طریق آزمایش های گسترده با مجموعه داده های دنیای واقعی از لس آنجلس ارزیابی می کنیم. نتایج نشان داد که ST3DNetCrime دارای عملکرد پیشبینی خوب و استحکام قوی است، بهویژه زمانی که تعداد واحدهای باقیمانده دوبعدی کم است (یعنی ساختار مدل نسبتاً ساده است) و تعداد فیلترها در لایههای پیچشی کم است (یعنی زمان آموزش مدل). کاهش می یابد). در مقایسه با روش های پایه، ST3DNetCrime نه تنها RMSE را کاهش می دهد، بلکه از استحکام خوبی نیز برخوردار است. علاوه بر این، ما کشف کردیم که تنها زمانی که ویژگیهای مکانی-زمانی در دادههای جرم اخیر، دادههای جرم تاریخی نزدیک و دادههای جرم تاریخی از راه دور به طور کامل به طور همزمان جمعآوری شوند، ST3DNetCrime میتواند به بهترین عملکرد پیشبینی جرم دست یابد.
در آینده، برخی از زمینه های تحقیقاتی ارزش کاوش وجود دارد. اول، ما میخواهیم مدل ST3DNetCrime پیشنهادی را با استفاده از دادههای کمکی مرتبط با جرم، مانند دادههای آبوهوا، دادههای تعطیلات، نقاط مورد علاقه (POI) و شکایات خدمات عمومی بهبود دهیم. دوم، ما معتقدیم که مطالعه پیشبینی جرم در مقیاسهای زمانی مکانی خوب در چارچوب مدیریت منظم ضد کووید-19 جالب اما چالش برانگیز است. سوم، ما بین انواع جرم تفاوت قائل نشدیم. در واقع، الگوهای مکانی-زمانی پشت انواع مختلف جرم بسیار متفاوت است و داده های جرم پراکنده تر است. از این رو، اگرچه یک شاهکار چالش برانگیز است، اما در نظر گرفتن مدل هایی برای انواع مختلف جرم به طور جداگانه ارزش دارد. در نهایت، ما باید اضافه کردن یک ماشه را در نظر بگیریم [ 34 ، 35] به مدل برای تعیین اینکه در چه بازه هایی مدل یادگیری عمیق باید بازسازی شود تا دقت پیش بینی جرم حفظ شود.
بدون دیدگاه