خلاصه

در حالی که استفاده از داده های جرم و جنایت به طور گسترده در ادبیات مورد حمایت قرار گرفته است، در دسترس بودن آن اغلب به شهرهای بزرگ شهری و پایگاه های داده مجزا محدود می شود که تمایل به مقایسه فضایی را ندارند. این مقاله یک چارچوب یادگیری ماشینی کارآمد را ارائه می‌کند که قادر به پیش‌بینی وقوع جرم فضایی، بدون استفاده از جنایات گذشته به عنوان پیش‌بینی‌کننده، و با وضوح نسبتاً بالا است: سطح گروه بلوک سرشماری ایالات متحده. چارچوب پیشنهادی مبتنی بر بررسی ادبیات چند رشته‌ای عمیق است که امکان انتخاب 188 پیش‌بینی‌کننده جرم مناسب را از داده‌های اجتماعی-اقتصادی، جمعیتی، مکانی و محیطی فراهم می‌کند. چنین داده هایی به صورت دوره ای برای کل ایالات متحده منتشر می شود. انتخاب مدل پیش‌بینی مناسب از طریق مطالعه مقایسه‌ای خانواده‌های مختلف الگوریتم‌های یادگیری ماشین انجام شد. از جمله مدل های خطی تعمیم یافته، یادگیری عمیق، و یادگیری گروهی. مدل تقویت گرادیان دقیق‌ترین پیش‌بینی‌ها را برای جنایات خشونت‌آمیز، جرایم اموال، سرقت وسایل نقلیه موتوری، خرابکاری و تعداد کل جرایم ارائه می‌دهد. آزمایش‌های گسترده بر روی مجموعه داده‌های دنیای واقعی جرایم گزارش‌شده در ۱۱ شهر ایالات متحده نشان داد که چارچوب پیشنهادی به ترتیب به دقت ۷۳ و ۷۷ درصد هنگام پیش‌بینی جرایم دارایی و جرایم خشونت‌آمیز دست می‌یابد.

کلید واژه ها:

پیش بینی جرم ; یادگیری گروهی ; یادگیری ماشینی ؛ پسرفت

1. معرفی

توانایی دسترسی به داده های جرایم قابل اعتماد و با وضوح بالا مدت هاست که توسط محققان حمایت شده است [ 1 ]. تجزیه و تحلیل داده های جرم می تواند در بسیاری از جنبه های سیاست اجرای قانون مفید باشد. در میان کاربردهای دیگر، ممکن است به تخصیص منابع اجرای قانون در جایی که بیشتر مورد نیاز است کمک کند [ 2 ] و سیاست های اجرای قانون را با محیطی دائما در حال تغییر تطبیق دهد [ 3 ].
در ایالات متحده، داده‌های جرم عمدتاً از طریق برنامه گزارش جرم یکنواخت FBI از طریق سیستم گزارش خلاصه (SRS) در دسترس است که در حال حاضر به سیستم گزارش‌دهی مبتنی بر رویداد ملی (NIBRS) منتقل می‌شود. با این حال، داده های موجود هنوز تکه تکه هستند و همیشه به طور مستقیم در سراسر ایالات متحده قابل مقایسه نیستند.
در زمینه یادگیری ماشینی (ML)، رویکردها و مدل‌های زیادی در رابطه با پیش‌بینی جرم از طریق روش‌های طبقه‌بندی، خوشه‌بندی، رگرسیون، یادگیری عمیق و یادگیری گروهی تعریف شده‌اند [4 ، 5 ] . با این حال، چنین مدل هایی با تعدادی چالش روبرو هستند. در میان آنها، بسیاری از مدل‌های ML که به پیش‌بینی جرم اختصاص داده شده‌اند، منحصراً در فرآیند انتخاب ویژگی خود مبتنی بر داده‌ها هستند: استفاده گسترده از مهندسی ویژگی و تکنیک‌های خودکار انتخاب ویژگی می‌تواند قابلیت اطمینان پیش‌بینی‌های خارج از نمونه را محدود کند. علاوه بر این، مدل‌های ML که در پیش‌بینی‌های خود به عملکرد رضایت‌بخشی می‌رسند، تمایل دارند از جرم گذشته به‌عنوان عامل تعیین‌کننده جرم آینده استفاده کنند [ 6 ، 7 ، 8]]. از آنجایی که چنین داده‌هایی فقط در مراکز اصلی شهری در دسترس هستند و معمولاً مقایسه آنها در مکان‌ها دشوار است، پایگاه‌های اطلاعاتی تمایل دارند یا در سطح انبوه (شهر، شهرستان و…) یا فقط در سطح محلی (به عنوان مثال، یک شبکه دقیق در فقط یک شهر).
در نتیجه، ارائه یک پیش‌بینی با پوشش گسترده و وضوح بالا، علاوه بر مزایای سنتی که توسط پلیس پیش‌بینی‌کننده به ارمغان می‌آورد، به سیاست‌گذاران و افراد با عناصر فضایی مقایسه در ایالات متحده و سایر کشورها بدون داده‌های جرم ملی ارائه می‌دهد [9 ] . .
در این مقاله، ما یک مدل ML را ارائه می‌کنیم که قادر به پیش‌بینی تعداد جرم در تمام گروه‌های بلوک سرشماری ایالات متحده است، با استفاده از داده‌های موجود در سراسر ایالات متحده، مدل ما بر یک بررسی کامل از ادبیات اثرات همسایگی برای شناسایی همبستگی‌های اجتماعی جرم متکی است.
به عنوان اولین گام، نظریه‌های مختلف جرم مرتبط با ویژگی‌های اجتماعی، اقتصادی و جمعیتی یک محله را بررسی کردیم و با ترکیب این رویکرد با تحلیل همبستگی، 188 پیش‌بینی‌کننده را انتخاب کردیم. این پیش‌بینی‌کننده‌ها، همراه با اهداف ما، شامل شمارش جرم برای انواع مختلف جرایم بین سال‌های 2014 و 2018، در سطح گروه بلوک سرشماری ایالات‌متحده برای بلوک‌های سرشماری ایالات متحده به هم پیوسته جمع‌آوری شده‌اند، مناطق محلی که شامل 600 تا 3000 نفر هستند، با میانگین مساحت BG حدود 1.3 کیلومتر مربع. استدلال شده است که آنها با ادراک ساکنان از محله خود همسو می شوند و پیشنهاد می کنند که آنها یک واحد تحلیل مناسب برای مطالعه اثرات محله تشکیل دهند [ 10 ]. برای ساخت مدل خود، از پایگاه داده باز جرم [ 11]، مدارک جغرافیایی جنایات در 11 شهر ایالات متحده بین سال های 2014 تا 2018، و در نتیجه ارائه انواع بافت های شهری.
سپس، از آنجایی که ما با یک مشکل رگرسیون سروکار داریم، خانواده‌های مختلف مدل‌سازی پیش‌بینی‌کننده، از جمله مدل‌های خطی تعمیم‌یافته (GLM)، یادگیری عمیق، و یادگیری گروهی را مورد مطالعه قرار دادیم. ما دقیق ترین مدل را برای اکثر انواع جرایم در نظر گرفته شده حفظ کردیم، یعنی: جرایم خشونت آمیز، جرایم اموال، سرقت وسایل نقلیه موتوری (MVT) و خرابکاری.
به طور خلاصه، عمده ترین مطالب این مقاله به شرح زیر است:
  • مشارکت 1: یک مدل پیش‌بینی جرم فضایی با استفاده از داده‌هایی که معمولاً در سرتاسر قاره ایالات متحده در دسترس است، در نتیجه امکان مقایسه فضایی را فراهم می‌کند.
  • مشارکت 2: یک استراتژی داده کارآمد مبتنی بر بررسی ادبیات چند رشته‌ای در مورد جرم و تکنیک‌های پیشرفته پیش‌بینی ML.
  • مشارکت 3: مقایسه مختصری از عملکرد سه مدل پیش بینی، یعنی: رگرسیون پواسون، شبکه عصبی متوالی، و تقویت گرادیان.
  • مشارکت 4: مجموعه ای از آزمایش های گسترده بر روی مجموعه داده های دنیای واقعی از جنایات گزارش شده در شهرهای مختلف ایالات متحده، و بحث مفصلی از پیش بینی های احتمالی جرم محلی به دست آمده است.
ساختار باقی مانده این مقاله به شرح زیر است: بخش 2 پیشینه نظری را ارائه می دهد که اثرات محله بر تحقیقات جنایی و برخی از پیشرفته ترین الگوریتم های پیش بینی ML را ارائه می دهد. بخش 3 استراتژی داده ای را که برای تولید مجموعه داده ورودی و روش پیش بینی پیشنهادی دنبال می شود، شرح می دهد. بخش 4 پیش بینی وقوع جرم به دست آمده را مورد بحث قرار می دهد. در نهایت، بخش 5 نتیجه گیری و برخی از جهت ها را برای تحقیقات آینده مشخص می کند.

2. پیشینه و کارهای مرتبط

2.1. پیش زمینه نظری

اثرات همسایگی یک مفهوم مهم در تحقیقات جغرافیایی، بهداشت عمومی و علوم اجتماعی است و به چگونگی تأثیر شرایط همسایگی بر نتایج اجتماعی مربوط می شود. این مفهوم را می‌توان به جامعه‌شناسان دانشگاه شیکاگو، شاو و مک‌کی [ 12 ] ردیابی کرد که قدیمی‌ترین دیدگاه نظری این رشته، بی‌سازمانی اجتماعی را پیشنهاد کردند و معتقد بودند که ساختارهای همسایگی مانند آسیب‌های اجتماعی-اقتصادی، ناهمگونی نژادی، و تحرک مسکونی، ساکنان را از شکل‌گیری روابط اجتماعی بازمی‌دارد . جرم و جنایت را تنظیم کند کار شاو و مک کی یک تغییر پارادایم بزرگ را از تئوری های سطح فردی جرم به سمت مدل های بوم شناختی خبر داد [ 13 ].
در حالی که نظریه بی‌سازمانی اجتماعی در دهه 1960 مورد توجه قرار نگرفت، این رویکرد در دهه 1980 توسط محققان در ایالات متحده با علاقه مجدد به پویایی محله‌ها به دلیل افزایش نرخ جرم و زوال شهری احیا شد. این نویسندگان چارچوب را با پرداختن به انتقادات [ 14 ]، آزمایش و شفاف سازی مفاهیم [ 15 ، 16 ] و گسترش مکانیسم های علی [ 17 ، 18 ، 19 ] به روز کردند.
یکی از بسط های مهم تئوری بی سازمانی اجتماعی مفهوم کارآمدی جمعی [ 18 ] بود که به توانایی ساکنان برای گرد هم آمدن برای دستیابی به یک تمایل مشترک برای یک محله امن اشاره دارد [ 20 ]. اثربخشی جمعی انسجام اجتماعی را که به عنوان اعتماد و احساس اجتماع بین همسایگان تعریف می شود، با کنترل اجتماعی غیررسمی ترکیب می کند که به توانایی ساکنان برای تنظیم بی نظمی جامعه اشاره دارد. تحقیقات بعدی مکرراً نشان داده است که کارآمدی جمعی تأثیر قوی بر جنایت و خشونت جامعه دارد [ 21 ، 22 ، 23 ].
نظریه فعالیت‌های معمول (RA) یکی دیگر از دیدگاه‌های برجسته اثرات همسایگی است و نشان می‌دهد که نحوه سازماندهی فعالیت‌های روزانه فرصت‌هایی را برای جرم ایجاد می‌کند. این تئوری به طور خاص بیان می‌کند که جرم زمانی رخ می‌دهد که سه عامل در زمان و مکان به هم برسند: یک مجرم با انگیزه، یک هدف در دسترس، و فقدان یک نگهبان توانا (مثلاً یک شخصیت معتبر) [24 ] . تحقیقات در این زمینه به اثرات زمانی و مکانی بر جرم و جنایت می پردازد و بر جغرافیای خرد، از جمله “نقاط داغ”، مانند بخش های خیابانی که در آن جرم رخ می دهد، تمرکز دارد [25 ] .
پرت و کالن [ 13 ] نظریه RA و نظریه بی‌سازمانی اجتماعی را همراه با سایر چارچوب‌های جرم‌شناختی در فراتحلیل خود از پیش‌بینی‌کننده‌های سطح کلان و نظریه‌های جرم ارزیابی کردند. آنها دریافتند که تئوری بی‌سازمانی اجتماعی و محرومیت از منابع، که نابرابری اقتصادی را با ناتوانی در تنظیم رفتار مطابق با هنجارهای اجتماعی مرتبط می‌کند، قوی‌ترین اثرات را بر جرم و جنایت دارد. نظریه RA تأثیر متوسطی بر جرم داشت. اسپانو و فریلیش [ 26] اعتبار تجربی نظریه RA را در پاسخ به حمایت مختلط در مطالعات چند متغیره موجود ارزیابی کرد. بر اساس بررسی 33 مقاله، آنها به حمایت کلی از این نظریه دست یافتند، اگرچه تجزیه و تحلیل ظریف برخی از محدودیت ها را آشکار کرد. برای مثال، مطالعاتی که از نمونه‌های ایالات متحده استفاده می‌کنند، تقریباً چهار برابر بیشتر از مطالعاتی که از نمونه‌های غیر آمریکایی استفاده می‌کنند، با اثرات فرضی مطابقت دارند.
بر اساس یافته‌های بالا، و این واقعیت که ما برای ورودی تا حد زیادی به مجموعه داده‌های سرشماری ایالات متحده وابسته بودیم، تصمیم گرفتیم روی پیش‌بینی‌کننده‌های اجتماعی-دموگرافیک و اجتماعی-اقتصادی مرتبط با نظریه بی‌سازمانی اجتماعی در چارچوب خود تمرکز کنیم. با این حال، با توجه به اثربخشی این نظریه در زمینه ایالات متحده، چند پیش‌بینی‌کننده سازگار با نظریه RA را در مدل خود، مانند آب و هوا، معرفی کردیم. علاوه بر این، برخی از متغیرهای ساختاری اجتماعی مورد استفاده در تحقیقات بی‌سازمانی اجتماعی برای نظریه RA قابل استفاده هستند (به عنوان مثال، ویژگی‌های جمعیت بر چه کسی مرتکب جرم شده و چه کسی قربانی شده است) و محققان قبلی از معیارهای داده‌های سرشماری برای ارائه نظریه RA استفاده کرده‌اند [27 ] .
پیش‌بینی‌کننده‌های جرم مرتبط با نظریه بی‌سازمانی اجتماعی را می‌توان به دو دسته کلی تقسیم کرد: شرایط همسایگی «ایستا» که شرایط ساختاری اجتماعی یک محله را منعکس می‌کند [ 28 ، 29 ] و فرآیندهای همسایگی «پویا»، مانند اثربخشی جمعی یا انسجام اجتماعی [ 18 ، 29 ، 30 ، 31 ]. متغیرهای ثابت منفرد با اثرات قابل توجه بر جرم شامل نابرابری درآمد [ 32 ، 33 ، 34 ، 35 ]، جدایی نژادی/قومی [ 36 ، 37 ، 38 ]، ناهمگونی نژادی [ 39]، 40 ، 41 ، 42 ]، بی ثباتی مسکونی [ 43 ]، جنسیت [ 44 ، 45 ، 46 ، 47 ]، و سن [ 48 ، 49 ، 50 ]، همه در مدل ما در نظر گرفته شده اند. جدول 1 پیش بینی های ساختاری اجتماعی اصلی جرم را فهرست می کند که در بررسی های قبلی [ 29 ، 51 ] و یک متاآنالیز [ 13 ] ارزیابی شده اند و اثرات آن ها (مثبت، منفی یا نامشخص) را بر جرم نشان می دهد.
چند خطی بودن در میان متغیرهای ساختاری اجتماعی یک چالش بالقوه در مدل‌های رگرسیون مرتبط با تحلیل علی جرم است. این به دلیل پیوندهای قوی بین بسیاری از عوامل ساختاری مرتبط با جرم است [ 52 ] و چیزی را ایجاد می کند که ویلسون [ 19 ] از آن به عنوان «اثرات تمرکز» یاد می کند. نقطه ضعف متمرکز یا «محرومیت منابع» [ 53 ] یکی از این متغیرهای شاخص است که شاخص هایی را برای نابرابری درآمد، فقر، تنوع نژادی، پیشرفت تحصیلی، تحرک مسکونی، بیکاری، و/یا اختلال در خانواده [52، 54، 55] در بر می گیرد .]. متغیر شاخص دیگر اختلال در خانواده است که معیارهای ثبات خانواده مانند عدم ازدواج، ازدواج زودهنگام، فرزندآوری زودهنگام، غیبت والدین، بیوه شدن و مرگ را ترکیب می کند [56 ، 57 ، 58 ] . در حالی که ما از مسائل چند خطی در تحقیقات جنایی آگاه هستیم، از متغیرهای شاخص در مدل خود استفاده نکردیم زیرا همخطی بودن فقط یک موضوع برای استنتاج علی است و نه پیش‌بینی – هدف چارچوب ما.
بریسون و رول [ 29 ] در بررسی خود چهار متغیر پویا یا فرآیندی را ارزیابی کردند که تمایل به تعامل با پیش‌بینی‌کننده‌های ثابت برای تأثیرگذاری بر جرم دارند. بریسون و رول با ارزیابی انسجام اجتماعی، شواهد محدودی از رابطه بین انسجام اجتماعی و جرم در مطالعات مربوط به جرایم ناشی از نفرت [ 59 ] و خشونت عمومی یا خشونت شریک صمیمی پیدا کردند [ 60 ]. نتایج برای کنترل اجتماعی غیررسمی ترکیبی بود، با یک مطالعه که رابطه بین کنترل اجتماعی غیررسمی و کاهش نرخ بزهکاری [ 61 ] را نشان می‌دهد و دیگری اثراتی را بر جنایت ضد نفرت سیاه‌پوستان نشان می‌دهد [ 59 ]]. با این حال، مطالعه سوم نتوانست ارتباط بین کنترل اجتماعی غیررسمی و خشونت عمومی و خشونت شریک صمیمی را نشان دهد [ 60 ]. تحقیقات در مورد پیوندهای اجتماعی، که مفهومی است نزدیک به انسجام اجتماعی که به تعداد روابط در یک جامعه می پردازد، نشان داده است که تأثیرات بر جرم به نوع و شدت روابط و تأثیر آنها بر کنترل اجتماعی غیررسمی بستگی دارد [42، 62 ] . ]. در نهایت، حمایت از اثر اثربخشی جمعی بر جرم قوی است و این مفهوم در سراسر مکان‌های شهری قابل اجرا است. کارآیی جمعی با کاهش قربانی خشونت [ 63 ]، کاهش در قتل [ 63 ]، کاهش ترس از جنایت [ 64] همراه بوده است.]، و کارآیی خیابانی را افزایش داد [ 55 ].
ادبیات جنایی روستایی نوپایی وجود دارد که عمدتاً تحت سلطه مطالعاتی است که حول نظریه بی‌سازمانی اجتماعی [ 65 ] متمرکز شده است. یافته‌ها متناقض بوده‌اند، شواهدی برای برخی جنبه‌های بی‌سازمانی اجتماعی وجود دارد، اما از سایرین حمایت اندک یا بدون حمایت [ 66 ] است. در نتیجه، اظهار نظر گسترده در مورد الگوهای جرم و جنایت دشوار است، اما تحقیقات اولیه نشان می دهد که متغیرهایی مانند فقر و گسست خانواده بر جرم در جوامع روستایی نسبت به مناطق شهری تأثیر متفاوتی دارند. به عنوان مثال، تحقیقات نشان می دهد که فقر هیچ رابطه یا رابطه معکوس با جرم و جنایت ندارد [ 65 ، 67 ، 68 ، 69 ، 70 ، 71.] احتمالاً به این دلیل که ثبات جامعه کنترل اجتماعی غیررسمی قوی تری را ایجاد می کند [ 72 ]. در مثالی دیگر، با توجه به نتایج مختلط مطالعات، به نظر می‌رسد ناهمگونی نژادی اثرات محدودی بر بی‌سازمانی اجتماعی در محیط‌های روستایی دارد. به عنوان مثال، Bouffard و Muftic [ 67 ] هیچ ارتباطی بین ناهمگونی قومی و جنایت خشونت آمیز پیدا نکردند، در حالی که سایر محققان رابطه مثبتی بین متغیرها، از جمله سرقت و حمله در شهرستان های روستایی [ 69 ] و جرایم خشن جوانان [ 73 ] یافته اند . جدول 2 نمای کلی از پیش بینی کننده های ساختاری اجتماعی جرم در جوامع روستایی را ارائه می دهد.
به دلیل عدم قطعیت در مورد مکانیسم های جرم در جوامع روستایی، مدل جداگانه ای برای پیش بینی جرم روستایی ایجاد نکردیم، بلکه همان مدل را در بافت های روستایی و شهری به کار بردیم. به طور مشابه، تحقیقات پراکنده در مورد جرایم حومه شهر [ 67 ، 70 ، 75 ] به این معنی است که ما قادر به ایجاد یک مدل متمایز برای پیش بینی جرم در محیط های حومه شهر نیستیم.
در مجموع، بر اساس بررسی کامل ما از ادبیات اثرات محله، تصمیم گرفتیم پیش‌بینی‌کننده‌های جرم شهری مرتبط با دیدگاه اثرات محله، عمدتاً نظریه بی‌سازمانی اجتماعی و تا حدی کمتر، نظریه RA را انتخاب کنیم تا چارچوب خود را مشخص کنیم. بیشتر اینها پیش بینی کننده های ساختاری اجتماعی بودند که در تحقیقات قبلی روابط قابل توجهی با جرم نشان داده اند (این موارد در جدول 3 خلاصه شده است ). ما متعاقباً از مجموعه داده‌ها، از جمله سرشماری ایالات متحده، استفاده کردیم تا شاخص‌های اجتماعی، اقتصادی و جمعیتی را برای نشان دادن این پیش‌بینی‌کننده‌ها انتخاب کنیم.

2.2. آثار مرتبط: ML و پیش‌بینی جرم

در این بخش، کار اخیر در زمینه پیش‌بینی جرم فضایی با استفاده از تکنیک‌های مختلف ML را با تأکید بر روش‌های تخمین نرخ یا وقوع جرم مرور می‌کنیم.
HW Kang و HB Kang [ 76] یک روش یادگیری عمیق مبتنی بر یک شبکه عصبی عمیق (DNN) برای پیش‌بینی وقوع جرم در سطح سرشماری ایالات متحده پیشنهاد کرد. در استراتژی داده خود، نویسندگان منابع مختلف داده، از جمله گزارش های وقوع جرم و اطلاعات جمعیتی و آب و هوایی را درگیر کردند. علاوه بر این، آنها اطلاعات زمینه محیطی را با استفاده از داده های تصویر از نمای خیابان گوگل در نظر گرفتند. در مدل پیش‌بینی خود، نویسندگان یک روش ترکیب داده‌های چندوجهی را اتخاذ کردند، به گونه‌ای که DNN با چهار گروه لایه تعریف می‌شود، یعنی: لایه‌های فضایی، زمانی، بافت محیطی و لایه‌های نمایش ویژگی مشترک. این مدل پیش بینی نتایج قابل توجهی از نظر دقت تولید می کند. با این حال، به دلیل محدودیت‌های در دسترس بودن داده، تنها با استفاده از مجموعه داده‌های دنیای واقعی جمع‌آوری‌شده از شهر شیکاگو، ایلینوی، آموزش و آزمایش شد. بدین ترتیب،
همچنین بر اساس خانواده روش های یادگیری عمیق، هوانگ و همکاران. [ 77] یک شبکه عصبی مکرر (RNN) برای پیش‌بینی وقوع جرم مکانی – زمانی در مناطق شهری پیشنهاد کرد. روش آنها با شناسایی الگوهای جرم پویا با استفاده از یک شبکه عصبی سلسله مراتبی بازگشتی از بردارهای نمایش پنهان مشخص می شود. این بردارها سیگنال‌های مکانی، زمانی و طبقه‌ای را تعبیه می‌کنند و در عین حال همبستگی بین وقوع جرم و شکاف‌های زمانی آن‌ها را حفظ می‌کنند. این روش با استفاده از مجموعه داده های دنیای واقعی جمع آوری شده از شهر نیویورک آموزش و ارزیابی شد. در این مجموعه داده، جرایم با دسته بندی، مکان و مهر زمانی مربوطه ثبت می شوند. با این حال، چنین روشی را نمی توان به طور یکسان برای همه مناطق شهری استفاده کرد، زیرا این نوع داده ها معمولاً برای شهرهای دیگر در دسترس نیستند.
یک مدل احتمالی مبتنی بر پارادایم بیزی توسط [ 78] پیشنهاد شد]. این مدل پیشنهادی برای پیش‌بینی نرخ جرم فضایی با استفاده از داده‌های جمعیتی و تاریخی جرم طراحی شد. این عدم قطعیت ها در پیش بینی های خروجی و پارامترهای مدل را با استفاده از ترکیبی از دو مدل رگرسیون خطی بیزی تعیین می کند. یک مدل پارامتری اول که رابطه بین نرخ جرم و عوامل خاص مکان را در نظر می گیرد و مدل دوم ناپارامتریک که به وابستگی های فضایی می پردازد. همچنین استنباط‌های پارامترهای رگرسیون را با تخمین توزیع احتمال خلفی با استفاده از روش مونت کارلو زنجیره مارکوف (MCMC) مدیریت می‌کند. نتایج مربوط به سه نوع جرم با مفروضات نظری جرم شناسی موجود مطابقت دارد. علاوه بر این، مدل پیشنهادی را می توان به تمام استرالیا تعمیم داد، زیرا از داده های سرشماری جمعیتی در دسترس تقریباً در همه مکان ها استفاده می کند.
علاوه بر این تلاش‌ها، متوجه شدیم که روش‌های یادگیری گروهی موضوع چندین مطالعه در ادبیات بوده‌اند و ثابت کرده‌اند که در زمینه پیش‌بینی جرم فضایی مؤثر هستند. این خانواده از مدل های ML قدرت خود را از این واقعیت می گیرد که از الگوریتم های یادگیری متعدد استفاده می کند. هر الگوریتم بر روی یک تکه یا کل مجموعه داده کار می کند تا پیش بینی های میانی تولید کند که برای به دست آوردن پیش بینی های نهایی جمع آوری و پردازش می شوند. نمونه هایی از مطالعات با تکیه بر روش های یادگیری گروهی شامل [ 6 ، 7 ، 79 ] است.
آلوز و همکاران [ 6] از یک رگرسیون تصادفی جنگل برای پیش بینی جرم در مناطق شهری استفاده کرد. با علم به اینکه این مدل ML نسبت به پارامترهای اصلی خود (تعداد درختان و حداکثر عمق هر درخت) بسیار حساس است، نویسندگان آنها را با استفاده از روش اعتبارسنجی متقاطع طبقه بندی شده k-fold تخمین زدند و سپس با استفاده از الگوریتم جستجوی شبکه ای آنها را تنظیم کردند. . بنابراین، آنها موفق به ایجاد یک مبادله بین خطاهای سوگیری و واریانس شدند. نویسندگان همچنین با استفاده از آزمون‌ها و معیارهای آماری مختلف، به بررسی رابطه بین حوادث جرم و شاخص‌های شهری پرداختند تا مهمترین شاخص‌های توضیحی را انتخاب کنند. مدل پیشنهادی آنها با استفاده از داده های شاخص شهری از تمام شهرهای برزیل آموزش و آزمایش شده است. آزمایش‌ها نشان داد که می‌تواند دقت امیدوارکننده‌ای را در پیش‌بینی جرم به 97 درصد بدهد. با این حال، پیش‌بینی‌ها فقط به یک نوع جنایت مربوط می‌شوند-یعنی،
اخیراً، کادار و همکاران. [ 7] یک رویکرد پیش‌بینی‌کننده برای پیش‌بینی کانون‌های جرم و جنایت مکانی-زمانی در مناطق کم تراکم جمعیت پیشنهاد کرد. نویسندگان عمدتاً بر روی مشکل عدم تعادل طبقاتی تمرکز کردند که از طریق تکنیک نمونه‌گیری مکرر انجام شد. در واقع، در مرحله یادگیری، مدل پیش‌بینی آن‌ها با استفاده از نمونه‌های فرعی متعادل از مجموعه داده ورودی، که با انتخاب تصادفی همان تعداد نمونه از کلاس‌های اکثریت و اقلیت ایجاد می‌شوند، آموزش داده می‌شود. به عنوان گام بعدی، آنها طبقه‌بندی‌کننده جنگل تصادفی را به عنوان یادگیرنده پایه برای پیش‌بینی نقاط داغ جرم پس از ارزیابی عمیق سایر مدل‌های ML اتخاذ کردند. نتایج با مجموعه داده ورودی متشکل از پیش‌بینی‌کننده‌های مختلف، مانند متغیرهای اجتماعی-اقتصادی، جغرافیایی، زمانی، هواشناسی و جرم نشان داد که این رویکرد از خطوط پایه رایج در پیش‌بینی نقاط حساس بهتر عمل می‌کند. با این حال،
یکی دیگر از رویکردهای پیش‌بینی گروهی در [ 79] پیشنهاد شد]. Ingilevich و Ivanov یک رویکرد سه مرحله ای برای پیش بینی وقوع جرم در یک منطقه شهری خاص تصور کردند. رویکرد آنها با یک مرحله خوشه‌بندی شروع می‌شود، که در آن نویسندگان الگوریتم خوشه‌بندی فضایی مبتنی بر چگالی برنامه‌ها با نویز (DBSCAN) را به منظور مطالعه الگوهای فضایی انواع جرم در نظر گرفته و حذف نویز از مجموعه داده‌ها اعمال کردند. این مرحله با یک مرحله انتخاب ویژگی دنبال می‌شود که در آن نویسندگان آزمون مجذور کای را به منظور مطالعه اهمیت نسبی ویژگی‌ها اعمال کردند. سرانجام، در مرحله سوم، نویسندگان پس از مقایسه عملکرد دو مدل دیگر – یعنی رگرسیون خطی و رگرسیون لجستیک – از مدل تقویت گرادیان برای پیش‌بینی وقوع جرم استفاده کردند. این مدل با استفاده از مجموعه داده های حوادث جنایی از سن پترزبورگ، روسیه آموزش و آزمایش شد.
با تکیه بر این کار قبلی و تلاش‌های خودمان، ما یک چارچوب پیش‌بینی را پیشنهاد می‌کنیم که به دقت برای پیش‌بینی فضایی وقوع جرم در سطح گروه سرشماری ایالات متحده، بر اساس مدل افزایش گرادیان، طراحی شده است.

3. روش شناسی

3.1. استراتژی داده ها

این مقاله از داده های جرم مشاهده شده از پایگاه داده باز جرم (Ashby، 2018)، موجود در https://osf.io/zyaqn/ استفاده می کند . ما یک مدل پیش بینی را بر اساس 13897 گروه بلوک ایالات متحده آموزش و آزمایش کردیم. سپس پیش‌بینی‌هایی را برای ایالات متحده به‌هم پیوسته تولید کردیم که نشان‌دهنده ۲۱۷۸۴۰ گروه بلوک است. با توجه به محدودیت های داده های این رویکرد، باید توجه داشت که نمونه ما تنها 6.4٪ از کل مشاهدات موجود ایالات متحده را نشان می دهد.
در نتیجه، طرح تحقیق ما برای رویارویی با این چالش اقتباس شد. انتخاب ویژگی در این مطالعه عمدتاً مبتنی بر نظریه بود، به منظور انتخاب پیش‌بینی‌کننده‌ها بر اساس رابطه علیت آنها با جرم و همانطور که توسط ادبیات در زمینه‌های مختلف شناسایی شده است، در نتیجه شانس ما برای حفظ عملکرد پیش‌بینی‌مان در خارج از نمونه ما افزایش می‌یابد. ابتدا، پیش‌بینی‌کننده‌های جرم مرتبط با استفاده از بینش‌هایی از ادبیات جامعه‌شناختی، جغرافیایی و ML شناسایی شدند که در بخش‌های پیش‌زمینه نظری و آثار مرتبط به تفصیل شرح داده شده است. دوم، همبستگی بین همه متغیرهای موجود از نظرسنجی جامعه آمریکایی و متغیرهای هدف ما مورد بررسی قرار گرفت و متغیرهایی که همبستگی بیش از 0.25 را با هدف تعداد کل جرم نشان می‌دادند حفظ شدند. سوم، متغیرها بر اساس ویژگی‌های گروه‌های بلوک همسایه تولید شدند تا امکان اثرات سرریز را فراهم کنند. برای هر ویژگی ACS، یک متغیر دوقلو تولید شد که به عنوان مجموع یا میانگین ویژگی ACS در تمام گروه‌های بلوک همسایه تعریف می‌شود. ویژگی های حاصل در این مقاله “متغیرهای سرریز” نامیده می شوند و در هنگام بحث با (سرریز) نشان داده می شوند.
به طور کلی، 164 ویژگی بر اساس تئوری گنجانده شد، در حالی که 24 ویژگی بر اساس تحلیل همبستگی ما با جرم تعریف شد. علاوه بر این، داده های مورد استفاده به 11 شهر در 9 ایالت اشاره داشت که ویژگی های آنها از نظر تراکم جمعیت، آب و هوا، مختصات و فرهنگ بسیار متفاوت است. یک نکته مهم این است که نمونه ما فقط بافت‌های شهری و حومه‌ای را پوشش می‌دهد، به دلیل فقدان داده‌های جرم جغرافیایی موجود در بافت‌های روستایی. آزمایش‌های اضافی در مورد پیش‌بینی‌های خارج از نمونه در بخش 4.4.2 با استفاده از مجموع دولت جرم NIBRS به عنوان مرجع ارائه شده است.
بخش‌های زیر به جزئیات منابع داده و مراحل پیش‌پردازش مورد استفاده در این مطالعه می‌پردازد.

3.1.1. منابع اطلاعات

مجموعه داده ورودی چارچوب پیشنهادی ما از منابع مختلفی ساخته شده است که در زیر ذکر شده است:
  • داده های اجتماعی-اقتصادی و جمعیت شناختی از برآوردهای 5 ساله جامعه آمریکایی (ACS) [ 80 ] استخراج شد. در کار حاضر، ما از مجموعه برآوردهای 5 ساله ACS که دوره 2014-2018 را برای همه گروه‌های بلوک ایالات متحده پوشش می‌دهد، استفاده کردیم.
  • داده های آب و هوا (میانگین ماهانه مربوط به باد، بارندگی و دما) از پروژه WorldClim 2 [ 81 ] بازیابی شد.
  • داده های اجرای قانون بر اساس داده های Homeland Infrastructure مربوط به سازمان های مجری قانون محلی در ایالات متحده جمع آوری شد.
  • شمارش جرم برای جرایم خشن، جنایت دارایی، و دو مورد فرعی خاص (وندالیسم و ​​سرقت وسایل نقلیه موتوری) در بازه زمانی 2014-2018 در سطح گروه سرشماری ایالات متحده از پایگاه داده باز جرم استخراج و جمع‌آوری شد . شهرهای تحت پوشش عبارتند از توسان، AZ. لس آنجلس، کالیفرنیا؛ سانفرانسیسکو، کالیفرنیا؛ شیکاگو، IL; لوئیزویل، KY; دیترویت، MI; کانزاس سیتی، MO; نیویورک، نیویورک؛ آستین، تگزاس؛ فورت ورث، تگزاس؛ و ویرجینیا بیچ، کالیفرنیا.
  • مجموع جنایات ایالتی از FBI Crime Data Explorer برای سال‌های 2018 و 2019 استخراج شد.
3.1.2. پیش پردازش داده ها
خط لوله پیش پردازش ویژگی که در استراتژی داده ما اتخاذ شده است از چهار مرحله تشکیل شده است: آماده سازی داده های جمع آوری شده، ایجاد ویژگی های جدید، مقیاس بندی ویژگی ها، و رفع انحراف، همانطور که در شکل 1 نشان داده شده است .
ابتدا داده های جمع آوری شده پاکسازی و قالب بندی شدند. سپس چند ویژگی جدید با ترکیب ویژگی های موجود با هدف افزودن اطلاعات صریح ایجاد شد. به عنوان مثال، برای هر متغیر اجتماعی-اقتصادی و جمعیتی، یک متغیر سرریز با استفاده از میانگین یا مجموع متغیر در گروه‌های بلوک همسایه ایجاد شد. در مرحله انتخاب ویژگی، تحلیلی از اهمیت ویژگی ها انجام شد. در زمینه یک الگوریتم مبتنی بر درخت، اهمیت ویژگی را می توان با مجموع تمام پیشرفت ها در تمام گره های داخلی که در آن از این ویژگی استفاده می شود، محاسبه کرد ([ 82 ]، به نقل از [ 6 ]). اهمیت ویژگی حاصل، همانطور که توسط رگرسیون LightGBM در کتابخانه Python SciKitlearn محاسبه شده است [ 83]، به 100 می رسد (در همه ویژگی های استفاده شده) و راهی برای توصیف اهمیت نسبی یک ویژگی در تولید پیش بینی نهایی ارائه می دهد. در مرحله مقیاس‌بندی ویژگی، نرمال‌سازی حداقل تا حداکثر به منظور تبدیل تمام مقادیر ویژگی ورودی به [0،1]دامنه. در نهایت، الف ورود به سیستم(1+ایکس)تابع de-skew فقط برای متغیرهایی با امتیاز چولگی بیشتر از 0.75 (که از نظر تجربی بهینه بود) اعمال شد. امتیاز چولگی با استفاده از تابع چولگی از کتابخانه Scipy [ 84 ] محاسبه شد. ورود به سیستم(1+ایکس)کج زدایی نیز در طول مرحله آموزش به متغیر هدف اعمال شد.
مراحل فوق یک مجموعه داده متشکل از 13897 مشاهده را به دست آورد که هر مشاهده دارای 188 ویژگی است. برای وضوح، ما تمام ویژگی های در نظر گرفته شده را در زیر 15 موضوع جمع آوری کردیم، همانطور که در جدول 3 نشان داده شده است . ما میانگین همبستگی مطلق ویژگی‌ها در هر موضوع را ارائه می‌کنیم تا علاوه بر میانگین اهمیت ویژگی در هر موضوع، همبستگی‌های مثبت و منفی را با ویژگی هدف تعداد جرم کل در نظر بگیریم. مقادیر بدست آمده بر حسب درصد بیان می شود.
متغیرهای هدف شامل چهار نوع شمارش جرم و یک متغیر منفرد است که ترکیبی از دو نوع شمارش جرم را نشان می‌دهد: جرایم خشن و دارایی. 5 هدف ما به همراه اطلاعات مربوط به توزیع آنها در جدول 4 آمده است :
مروری بر همبستگی‌های فهرست‌شده در جدول 3 نشان می‌دهد که عواملی که بیشترین همبستگی را با تعداد کل جرایم نشان می‌دهند به شرایط ساکن محله مانند فقر، بی‌ثباتی مسکونی، مسکن و رفت‌وآمد، و درآمد مربوط می‌شوند که همه به وضوح در ادبیات به عنوان عوامل تعیین‌کننده جرم شناخته شده‌اند [ 35 ، 43 ، 52 ، 85 ]، همراه با جمعیت و تراکم جمعیت. اهمیت ویژگی نشان می دهد که مساحت زمین تحت پوشش و جمعیت در یک گروه بلوک بیشترین اهمیت را دارند، زیرا گروه های بلوک می توانند به طور گسترده ای از نظر اندازه (با گروه های بلوک شهری کوچکتر از گروه های بلوک روستایی) و جمعیت (معمولاً 600 تا 3000) متفاوت باشند.

3.2. روش پیشنهادی

اهداف در نظر گرفته شده متغیرهای شمارشی هستند (مجموع حوادث نوع جرم در یک منطقه ثابت، یک گروه بلوک، در طول 5 سال) و می‌توانند با توزیع پواسون تقریبی شوند. بنابراین، ما ابتدا مدل رگرسیون پواسون را به دلیل توانایی آن در مدل سازی داده های شمارش انتخاب کردیم. متغیرهای هدف در نظر گرفته شده و لگاریتم مقادیر مورد انتظار آن را می توان با ترکیب خطی پارامترهای ناشناخته مدل کرد. با این حال، این مدل فرض می کند که میانگین و واریانس برابر هستند (تعادل پراکندگی). متأسفانه، این فرض اغلب در داده های مشاهده شده نقض می شود [ 86 ].

اجازه دهید yمنمتغیر پاسخ باشد. ما این را فرض می کنیم yمناز توزیع پواسون با میانگین پیروی می کند λمنبه عنوان تابعی از متغیرهای کمکی تعریف می شود ایکسمن. تابع جرم احتمال پواسون با معادله زیر به دست می آید:

پ(yمن)=ه-λمن λمنyمنλمن!

جایی که:  λمن=E(yمن|ایکسمن)، و پبعد بردار متغیرهای کمکی گنجانده شده در مدل را تعریف می کند.

ما همچنین امکان مدل‌سازی مسئله پرداخته شده در این مقاله را با استفاده از روش‌های یادگیری عمیق بررسی کردیم. پرسپترون چندلایه یکی از پرکاربردترین کلاس شبکه های عصبی مصنوعی (ANN) است. از چندین لایه تشکیل شده است. هر لایه شامل پرسپترون های متعدد، اما غیر متصل [ 87 ] است.

تعداد لایه ها به صورت تجربی با استفاده از 1 تا 10 لایه و 200 تا 1000 پرسپترون در هر لایه مورد آزمایش قرار گرفت. بهترین پیکربندی یافت شده بر اساس عملکرد مدل (یعنی متریک MAE) شامل 2 لایه پنهان است که اولی شامل 700 واحد و دومی شامل 25 واحد است. واحدهای ورودی خروجی خود را به واحدهای اولین لایه پنهان ارسال می کنند. هر یک از واحدهای لایه پنهان یک ثابت (“بایاس”) را به مجموع وزنی ورودی های خود اضافه می کند و سپس یک تابع فعال سازی نتیجه را محاسبه می کند، در مورد ما تابع فعال سازی ReLU :

y=حداکثر(0;ایکس)
ما همچنین استفاده از روش‌های یادگیری گروهی را بررسی کردیم. ما الگوریتم تقویت گرادیان [ 88 ] را انتخاب کردیم زیرا در وظایفی که تعداد ویژگی‌ها و مشاهدات نسبتاً محدود است و ردپای محاسباتی کمی دارند، به خوبی عمل می‌کند. مدل تقویت گرادیان مجموعه‌ای از مدل‌های پیش‌بینی ضعیف را تولید می‌کند، معمولاً درخت‌های تصمیم، و با اجازه دادن به بهینه‌سازی یک تابع زیان قابل تمایز دلخواه، در مورد ما، تابع ضرر منصفانه، آنها را تعمیم می‌دهد [89 ] .
در نهایت، مدل‌های دوجمله‌ای منفی نیز مورد آزمایش قرار گرفتند، اما نتایج آنها در اینجا گزارش نشد، زیرا عملکرد مدل پایین‌تر بود.
همانطور که مدل بر روی آموزش داده شد ورود به سیستم(1+ایکس)اهداف تبدیل شده، ما از معکوس استفاده کردیم هایکس-1بر روی پیش‌بینی‌های مدل هنگام استنباط به منظور بدست آوردن مقادیر مناسب شمارش جرم.
مجموعه داده به ترتیب با استفاده از نسبت 80:20 به طور تصادفی به مجموعه های قطار و تست تقسیم می شود. برای یافتن ابرپارامترهای مدل بهینه، از استراتژی اعتبارسنجی متقابل در مجموعه قطار (n_folds = 6) همراه با جستجوی شبکه برای جستجوی فضای فراپارامتر استفاده کردیم. اعتبارسنجی متقابل، فراپارامترهای بهینه را با توجه به کمترین میانگین نمره خطای مطلق منفی انتخاب می کند.
ما از اجرای الگوریتم تقویت گرادیان LightGBM استفاده کردیم. فراپارامترهای بهینه یافت شده با استفاده از جستجوی شبکه ای در جدول 5 نشان داده شده است :
تنظیم فراپارامتر بر روی متغیر هدف تعداد جرم کل انجام شد و از همان فراپارامترهای بهینه برای آموزش مدل‌ها برای چهار متغیر هدف باقی‌مانده استفاده شد. در پایان، هر متغیر هدف دارای یک مدل تقویت گرادیان اختصاصی است.

4. نتایج و بحث

4.1. تنظیمات آزمایشی

تمام عملیات مربوط به آموزش و آزمایش سه مدل – یعنی تقویت گرادیان، شبکه عصبی و رگرسیور پواسون، بر روی کامپیوتری انجام شد که دارای پردازنده Intel (R) Core (TM) i5 با فرکانس 2.40 گیگاهرتز و هشت گیگا بایت بود. از رم
چارچوب پیشنهادی با استفاده از پایتون 3.7، نصب شده بر روی یک محیط مجازی از مدیر بسته Anaconda پیاده سازی شد. برای اجرای مدل تقویت گرادیان، از کتابخانه Light GBM استفاده کردیم. برای پیاده سازی مدل پواسون، از بسته Scikit-learn استفاده کردیم. برای پیاده سازی مدل شبکه عصبی، ما از کتابخانه Keras بر اساس باطن TensorFlow استفاده کردیم.

4.2. معیارهای ارزیابی

به منظور ارزیابی کیفیت پیش‌بینی‌های به‌دست‌آمده با چارچوب پیشنهادی ما، ما به متداول‌ترین معیارهای ارزیابی برای مشکلات رگرسیونی، یعنی میانگین خطای مطلق (MAE) و ریشه میانگین مربعات خطا (RMSE) تکیه کردیم.

مآE=∑من=1n|rمن-r^من|n
آرماسE=∑من=1n(rمن-r^من)2n

جایی که rمنمقدار هدف حقیقت زمینی را برای i -امین نقطه داده نشان می دهد، r^مننشان دهنده مقدار هدف پیش بینی شده برای i -امین نقطه داده است و nتعداد کل نقاط داده است.

علاوه بر این، ما از یک متریک سوم برای تعیین کمیت درصد نزدیکی پیش‌بینی‌ها در برابر حقیقت اصلی استفاده کردیم: MAE تقسیم بر میانگین مقادیر هدف. این به منظور اجتناب از قضاوت مدل‌هایی تعریف شد که در آن خطای نسبی (مثلاً با میانگین درصد مطلق خطا بیان می‌شود) زیاد است، اما خطای مطلق کم است. برای انجام این کار، ما MAE را با میانگین هدف به جای مقدار هدف مقایسه کردیم. این معیار که در این مقاله آن را دقت می نامیم، به صورت زیر تعریف می شود:

آسیپ=1-(∑من=1n|rمن-r^من|/∑من=1nrمن)

4.3. نتایج آزمایش

جدول 6 عملکرد سه مدل مختلف پیش بینی، یعنی رگرسیون پواسون، یادگیری عمیق و تقویت گرادیان را نشان می دهد. ما این مدل‌ها را برای هر نوع جرم، علاوه بر تعداد کل جرایم، با استفاده از مجموعه داده ورودی یکسان و در شرایط یکسان اعمال کردیم. سپس، عملکرد آنها را با استفاده از MAE و RMSE که در بالا توضیح داده شد، همراه با خطای مطلق نسبی، مربع R و همبستگی خطی بین پیش‌بینی و مقادیر مشاهده‌شده اندازه‌گیری کردیم. علاوه بر این نتایج، منحنی های ویژگی های خطای رگرسیون (REC) در شکل 2 نشان داده شده است .
مدل تقویت گرادیان در همه انواع جرم و جنایت ارزیابی شده و در تمام معیارها از مدل های دیگر بهتر عمل می کند. با این حال، باید توجه داشت که مدل یادگیری عمیق نیز عملکردی نزدیک به نتایج تقویت گرادیان دارد.
به منظور ارزیابی بیشتر عملکرد این مدل‌های پیش‌بینی، مجموعه‌ای تصادفی از 1000 مشاهدات را از مجموعه داده ورودی انتخاب کردیم و سپس وقوع جرم پیش‌بینی‌شده هر نوع جرم را علاوه بر تعداد کل وقوع جرم، با هم مقایسه کردیم. حقیقت پایه، همانطور که در شکل 3 نشان داده شده است . در این نمونه مشاهدات، مدل‌های تقویت گرادیان و یادگیری عمیق نتایج رقابتی را در مقایسه با رگرسیون پواسون ارائه می‌دهند.
همانطور که قبلاً گفته شد، چارچوب ما می‌تواند رخدادهای جرم و جنایت پیش‌بینی‌شده را برای همه گروه‌های بلوک در ایالات متحده به‌هم‌پیوسته ارائه دهد. مرحله یادگیری بر روی 188 ویژگی شناسایی شده با استفاده از تقسیم‌بندی تعریف شده p.10 انجام شد که برای پیش‌بینی وقوع جرم برای 11 شهر ایالات متحده در 13897 بلوک استفاده می‌شود. گروه ها و به مدت 5 سال (2014–2018). سپس مدل حاصل پیش‌بینی‌هایی را برای وقوع جرم برای همان دوره و همه گروه‌های بلوک ایالات متحده ایجاد کرد. برای وضوح، شکل 4 یافته های ما را برای یک سال با استفاده از تجسم نقشه منطقه شهر نیویورک، با تمرکز بر منهتن نشان می دهد.

4.4. بحث

4.4.1. نتایج پیش‌بینی در نمونه آموزشی و آزمایشی

رویکرد ما میانگین خطاهای مطلق (MAE) بین 36% (وندالیسم) و 41% (جرایم ملکی) از میانگین اهداف را ایجاد می کند که نشان دهنده دقت بین 59% و 64% در توانایی ما برای پیش بینی تعداد دقیق جرایم رخ داده در یک بلوک است. گروه بین سال‌های 2014 و 2018. این عملکرد می‌تواند در مقایسه با مطالعاتی که از داده‌های انبوه (شهر، شهرستان، ایالت) و جرایم گذشته به‌عنوان ویژگی‌هایی که می‌توانند تا 97 درصد دقت دارند، متوسط ​​به نظر برسد [6 ]]. با این حال، ما معتقدیم که با توجه به اینکه (1) جرم را با وضوح بالاتر پیش‌بینی می‌کنیم (گروه‌های بلوک سرشماری) و (2) رویکرد ما از جنایات گذشته به عنوان پیش‌بینی‌کننده استفاده نمی‌کند، قابل توجه است. رویکرد ما این مزیت را دارد که فقط از ویژگی‌های موجود در سراسر ایالات متحده استفاده می‌کند. بنابراین، نتایج آن می‌تواند عناصری را برای مقایسه با سیاست‌گذاران در سطح ملی، از جمله در محیط‌های شهری که داده‌های جرم کمیاب است، فراهم کند. علاوه بر این، آزمایش‌های ما نشان می‌دهد که پیش‌بینی اینکه آیا یک مشاهده در یکی از دسته‌های نمایش‌داده‌شده در شکل 4 قرار دارد به جای تعداد دقیق جرم، می‌تواند دقت ما را در هنگام پیش‌بینی تعداد کل جرایم به 75 درصد افزایش دهد: 77 درصد برای جرایم خشونت‌آمیز، 73 درصد برای جرایم خشن. جرایم اموال، 77 درصد برای سرقت وسایل نقلیه موتوری، و 77 درصد برای اعمال خرابکارانه.
تجزیه و تحلیل اهمیت ویژگی های انتخاب شده در فرآیند تصمیم گیری می تواند چشم اندازی به نتایج ما بیافزاید. 30 ویژگی که مهمترین آنها در مدل ما هستند در جدول 7 آمده است .
کل منطقه تحت پوشش گروه بلوک، که می تواند به طور قابل توجهی متفاوت باشد (با گروه های بلوک بزرگتر واقع در مناطق روستایی)، مهم ترین پیش بینی کننده (3.6٪) است و پس از آن جمعیت و تراکم جمعیت. میانگین سنی (مجموع زن و مرد) سوم است و پس از آن فاصله تا نزدیکترین سازمان مجری قانون محلی قرار دارد. با این حال، این ویژگی ها در مجموع کمتر از 11٪ از اهمیت کل ویژگی را توضیح می دهند (با 10 مورد مهم، شامل عوامل اضافی مرتبط با تحرک اجتماعی و تحصیلات، توضیح دهنده 17٪ از اهمیت کل). تنوع عوامل نسبتاً مهم پیچیدگی جرم را به عنوان یک پدیده اجتماعی برجسته می کند: تعداد مهمی از ویژگی ها در چارچوب ما به طور قابل توجهی توانایی ما را برای پیش بینی وقوع جرم بهبود می بخشد.
به‌علاوه، در بسیاری از موارد، ویژگی‌های سرریز (یعنی ویژگی‌هایی که ویژگی‌های گروه‌های بلوک همسایه را توصیف می‌کنند) مهم‌تر از ویژگی‌های اصلی (توصیف ویژگی یک گروه بلوک منفرد) بودند. این بیشتر توسط یک خودهمبستگی فضایی مهم در جرایم پیش بینی شده نشان داده می شود. اگر کل جرم و جنایت را در سراسر ایالات متحده در نظر بگیریم، Moran’s I (یعنی همبستگی بین جرم در یک گروه بلوکی و میانگین جرم پیش بینی شده در گروه های بلاک همسایه) پیش بینی شده توسط رویکرد ما حدود 0.7 در سراسر کشور است و وجود خوشه ها به ویژه واضح است. در مورد جنایات خشونت آمیز، خرابکاری، و سرقت وسایل نقلیه موتوری ( به شکل 4 b,d,e برای مورد نیویورک مراجعه کنید).
4.4.2. نتایج پیش بینی خارج از نمونه آموزش و آزمایش
همانطور که در بخش 3 ذکر شد ، مدل ما بر اساس 6.4٪ از کل گروه های بلوک ایالات متحده آموزش و آزمایش شده است. با این حال، پیش‌بینی‌های ما کل ایالات متحده را پوشش می‌دهد، بنابراین، یک ضعف بالقوه مدل ما این است که اعتبار پیش‌بینی‌های ما می‌تواند تحت تأثیر تفاوت‌های بین نمونه ما و کل جمعیت باشد. به منظور ارائه دیدگاهی بیشتر در مورد نتایج ما، پیش‌بینی‌های جرم سالانه جمع‌آوری شده در سطح ایالت با داده‌های جرم NIBRS در 17 ایالت که در آن داده‌های کافی وجود دارد (یعنی حداقل 90٪ سازمان‌های مجری قانون داده‌ها را به برنامه NIBRS گزارش کردند) مقایسه شد. برای سال‌های 2018 و 2019 با استفاده از پرونده جرایم خشن در دسترس بودند. در جایی که داده‌های NIBRS x% از جمعیت یک ایالت را پوشش می‌دهد، تخمین تعداد جنایات NIBRS در ضرب می‌شود. [1+(1-ایکس100)]. نتایج در شکل 5 نشان داده شده است .
در سطح کل حالت، مقایسه بین پیش‌بینی‌های ما و داده‌های NIBRS در سال 2019 همبستگی 90.8٪ را نشان می‌دهد. به طور کلی، R2 رگرسیون خطی داده‌های NIBRS در پیش‌بینی‌ها 82.4 درصد است که نشان می‌دهد پیش‌بینی‌های ما منعکس‌کننده روند مشاهده‌شده در داده‌های جرم در سراسر ایالت‌هایی است که می‌توان آن را مشاهده کرد.
با این حال، در مورد جرایم خشونت‌آمیز، می‌توان به یک گرایش کلی به سمت بیش از حد برآورد جرم به صورت مطلق اشاره کرد. در ایالت هایی مانند ویرجینیا، کانکتیکات و کنتاکی، تخمین بیش از حد بالا است و می تواند قابلیت استفاده مدل ما را محدود کند. این ایالت‌ها تمایل دارند میزان جرم کمتر از میانگین را طبق برنامه NIBRS نشان دهند (204.2، 209.6 و 217.9 جرم در هر 100 هزار نفر در مقابل میانگین 383.4 ایالات متحده).
در مقابل، پیش‌بینی‌ها به داده‌های NIBRS در ایالت‌هایی مانند داکوتای جنوبی و مونتانا نزدیک است، جایی که شکاف بین پیش‌بینی‌ها و کل NIBRS به ترتیب 2- و 1 درصد کل NIBRS را نشان می‌دهد. توجه داشته باشید که این مقایسه‌ها باید با احتیاط تجزیه و تحلیل شوند، به دلیل تفاوت در منابع داده‌ای درگیر: نمونه ما بر اساس پایگاه داده جرایم باز است که داده‌های حادثه را از پایگاه‌های جغرافیایی مختلف در سطح شهر جمع‌آوری می‌کند [11]، در حالی که داده‌های NIBRS بر اساس FBI است . برنامه گزارش جرم یکنواخت
در نهایت، اگر رتبه هر ایالت را از نظر تعداد جرم در نظر بگیریم، مدل ما عملکرد رضایت‌بخشی را نشان می‌دهد: همبستگی رتبه‌بندی بین پیش‌بینی و داده‌های NIBRS 2018 95.8٪ است و حداکثر خطا چهار رتبه است (یعنی رود آیلند برابر است با پیش بینی می شود رتبه 14 را داشته باشد، اما در داده های NIBRS در رتبه 18 قرار دارد؛ ویرجینیا در بین 20 ایالت در نظر گرفته شده در رتبه دوم پیش بینی شده است. مدل ما با موفقیت پیش‌بینی می‌کند که آیا یک ایالت از نظر جرم خشن جمع‌آوری شده در چارک اول، دوم، سوم یا چهارم در میان 20 ایالت در نظر گرفته شده در 60 درصد موارد است.
به طور کلی، مقایسه بین پیش‌بینی‌های مدل و داده‌های NIBRS 2018 در سطح انبوه ایالتی نشان می‌دهد که مدل ما پیش‌بینی‌هایی را تولید می‌کند که شامل تخمین‌های بیش‌ازحد قابل‌توجهی به صورت مطلق (پیش‌بینی‌های تعداد جرم) است، اما روند جرم و جنایت را در سراسر ایالت‌ها بازتولید می‌کند (همانطور که با همبستگی و R-squared نشان داده می‌شود) و عملکرد معقولی در پیش بینی رتبه یک ایالت از نظر جرایم خشن نشان می دهد.
4.4.3. محدودیت ها
در نهایت، تعدادی محدودیت باید بیان شود. اول، با توجه به چارچوب روش‌شناختی مورد استفاده، می‌توانیم ویژگی‌های مهم را شناسایی کنیم، اما تأثیر آنها (مثبت یا منفی) بر جرم را در مدل خود نداریم. دوم، رویکرد ما بر اساس بیش از 180 ویژگی است که از چندین منبع مختلف جمع آوری شده است. بنابراین، از نظر پردازش داده ها حجم قابل توجهی از کار را در بر می گیرد. سوم، دقت ما را می توان با افزودن انواع دیگری از ویژگی ها به تجزیه و تحلیل بهبود بخشید. اینها می تواند شامل نقاط مورد علاقه (شامل میزان قابل توجهی از تعامل اجتماعی)، مانند ایستگاه های اتوبوس [ 2 ]، مراکز خرید، کافه ها، کلیساها، یا مدارس [ 79 ]، عوامل مرتبط با چراغ های خیابان [ 76 ] و/یا داده های شبکه های اجتماعی باشد. [ 90] برای تکمیل تحلیل ما و به طور بالقوه کاهش برآوردهای بیش از حد شناسایی شده در برخی از ایالت ها. در نظر گرفتن جمعیت محیط به جای جمعیت مسکونی [ 91 ] نیز چشم اندازی امیدوارکننده برای تحقیقات آینده است. در برخی از ایالت ها، بخش 4.4.2 ، علی رغم عملکرد نسبی معقول، بیش از حد قابل توجهی را در شمارش جنایات پیش بینی شده شناسایی کرد. در نهایت، مدل ما در زمینه‌های مختلف شهری آموزش داده شده است، به این معنی که لزوماً پویایی جرم در محیط‌های روستایی را نشان نمی‌دهد. در نتیجه، پیش‌بینی‌های مربوط به مناطق روستایی ممکن است نسبت به همتایان شهری خود نامطمئن‌تر باشند.

5. نتیجه گیری ها

در این مقاله، ما یک چارچوب ML پیشنهاد کردیم که قادر به ارائه پیش‌بینی‌هایی برای وقوع جرم فضایی در تمام گروه‌های بلوک سرشماری ایالات متحده در ایالات متحده است. چارچوب پیشنهادی پیش‌بینی‌های دقیقی را برای انواع مختلف جرایم در نظر گرفته شده به دست می‌دهد – به عنوان مثال، جرایم خشونت‌آمیز، جرایم اموال، سرقت وسایل نقلیه موتوری، اقدامات خرابکارانه، و تعداد کل وقوع جرم. برای این انواع جرم، توانایی ما برای پیش‌بینی اینکه آیا تعداد جرم در یک گروه بلوکی متعلق به چارک اول، دوم، سوم یا چهارم است یا دو صدک بالاتر بین 73 تا 77 درصد است. مقایسه پیش‌بینی‌های مدل و داده‌های جرم NIBRS خارج از نمونه مورد استفاده برای آموزش و آزمایش مدل، گرایش قابل‌توجهی به سمت تخمین‌های بیش از حد در پیش‌بینی‌های تعداد مطلق جرم، به ویژه برای ایالت‌های خاص، از جمله ویرجینیا و کنتاکی، نشان می‌دهد. با این حال، مدل عملکرد رضایت‌بخشی را در شرایط نسبی نشان می‌دهد، همانطور که با همبستگی رتبه‌بندی بین پیش‌بینی‌های حالت‌ها و NIBRS و تجزیه و تحلیل چارک اندازه‌گیری می‌شود.
ما معتقدیم که یافته‌های ما (و به‌ویژه تخمین‌های بیش‌ازحد ذکر شده) را می‌توان با در نظر گرفتن ویژگی‌های اضافی، مانند داده‌های شبکه‌های اجتماعی، سایت‌هایی که میزان قابل توجهی از تعاملات اجتماعی (مرکز خرید، بارها، کلیساها، مدارس، و غیره) را در بر می‌گیرند، افزایش داد. ، و چراغ های خیابان. یکی دیگر از مسیرهایی که می توان در تحقیقات آینده عمیقاً کاوش کرد، موضوع جرم روستایی است. اگرچه بسیاری از عوامل تعیین کننده مناطق روستایی (مانند تراکم جمعیت کمتر) در واقع توسط مدل ما در نظر گرفته شده است، چارچوب های اجتماعی متفاوت ممکن است استفاده از یک مدل جداگانه را در آینده توجیه کند.

منابع

  1. کلنسی، جی. آیا ما هنوز “پرواز کور هستیم؟ داده های جرم و جنایت و پیشگیری از جرم محلی در نیو ساوت ولز. Curr. مسائل جرم. عدالت 2011 ، 22 ، 491-500. [ Google Scholar ] [ CrossRef ]
  2. Cichosz, P. پیش‌بینی خطر جرم شهری با استفاده از داده‌های نقطه‌نظر. ISPRS Int. J. Geo-Inf. 2020 ، 9 ، 459. [ Google Scholar ] [ CrossRef ]
  3. عنایت الله، س. آینده پلیس: فراتر رفتن از خط آبی نازک. آتی 2013 ، 49 ، 1-8. [ Google Scholar ] [ CrossRef ]
  4. الماو، ع. Kadam, K. مقاله بررسی پیش بینی جرم با استفاده از رویکرد گروهی. بین المللی J. Pure Appl. ریاضی. 2018 ، 118 ، 133-139. [ Google Scholar ]
  5. پرابکاران، س. میترا، اس. بررسی تحلیل تکنیک های کشف جرم با استفاده از داده کاوی و یادگیری ماشینی. J. Phys. Conf. سر. 2018 , 1000 , 012046. [ Google Scholar ] [ CrossRef ]
  6. Alves، LGA؛ ریبیرو، HV; رودریگز، پیش‌بینی جرم FA از طریق معیارهای شهری و یادگیری آماری. فیزیک یک آمار مکانیک. برنامه آن است. 2018 ، 505 ، 435-443. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  7. کادار، سی. ماکولان، آر. Feuerriegel، S. پشتیبانی تصمیم‌گیری عمومی برای مناطق با تراکم جمعیت پایین: مجموعه‌ای از عدم تعادل آگاه برای پیش‌بینی جرم فضایی-زمانی. تصمیم می گیرد. سیستم پشتیبانی 2019 ، 119 ، 107–117. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  8. لین، Y.-L. ین، M.-F. یو، ال.-سی. پیش‌بینی جرم مبتنی بر شبکه با استفاده از ویژگی‌های جغرافیایی. ISPRS Int. J. Geo-Inf. 2018 ، 7 ، 298. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  9. مایجر، ع. وسلز، ام. پلیس پیش بینی: بررسی مزایا و معایب. بین المللی J. Public Adm. 2019 ، 42 ، 1031–1039. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  10. Konkel، RH; راتکوفسکی، دی. Tapp, SN تأثیرات اختلالات فیزیکی، اجتماعی و مسکن بر جنایت محله: آزمون معاصر نظریه ویندوز شکسته. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 583. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  11. Ashby، MPJ Studying Crime and Place with the Crime Open Database: Social and Behavioral Scienes. Res. داده J. Humanit. Soc. علمی 2018 . [ Google Scholar ] [ CrossRef ]
  12. شاو، CR; مک کی، HD بزهکاری نوجوانان و مناطق شهری ؛ انتشارات دانشگاه شیکاگو: شیکاگو، IL، ایالات متحده آمریکا، 1942. [ Google Scholar ]
  13. پرات، TC; کالن، FT ارزیابی پیش‌بینی‌کننده‌های سطح کلان و نظریه‌های جرم: یک متاآنالیز. عدالت جنایی 2005 ، 32 ، 373-450. [ Google Scholar ] [ CrossRef ]
  14. Bursik، RJ بی‌سازمانی اجتماعی و نظریه‌های جرم و بزهکاری: مشکلات و چشم‌اندازها. جرم شناسی 1988 ، 26 ، 519-552. [ Google Scholar ] [ CrossRef ]
  15. کورنهاوزر، RR منابع اجتماعی بزهکاری: ارزیابی مدل های تحلیلی . انتشارات دانشگاه شیکاگو: شیکاگو، IL، ایالات متحده آمریکا، 1978. [ Google Scholar ]
  16. سامپسون، آر. گرووز، ساختار جامعه و جرم و جنایت: آزمایش نظریه بی‌سازمانی اجتماعی. صبح. جی. سوسیول. 1989 . [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  17. Bursik، RJJ; Grasmick، HG محرومیت اقتصادی و نرخ جرم محله 1960-1980. جامعه حقوقی Rev. 1993 , 27 , 263. [ Google Scholar ]
  18. سامپسون، RJ; Raudenbush، SW; Earls, F. Neighborhoods and Violent Crime: A Study Multilevel of Collective Efficiency. علوم 1997 ، 277 ، 918-924. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  19. ویلسون، WJ افراد واقعاً محروم: شهر داخلی، طبقه پایین و سیاست عمومی . انتشارات دانشگاه شیکاگو: شیکاگو، IL، ایالات متحده آمریکا، 1987. [ Google Scholar ]
  20. کول، اس‌جی اثرات و جرم همسایگی اجتماعی و فیزیکی: گردهم آوردن دامنه‌ها از طریق نظریه اثربخشی جمعی. Soc. علمی 2019 ، 8 ، 147. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  21. براونینگ، CR گستره اثربخشی جمعی: گسترش نظریه بی‌سازمانی اجتماعی به خشونت شریک. J. ازدواج فام. 2002 ، 64 ، 833-850. [ Google Scholar ] [ CrossRef ]
  22. مورنوف، جی دی. سامپسون، RJ; Raudenbush، نابرابری محله SW، اثربخشی جمعی، و پویایی فضایی خشونت شهری. جرم شناسی 2001 ، 39 ، 517-558. [ Google Scholar ] [ CrossRef ]
  23. سامپسون، RJ; Wikström، P.-OH نظم اجتماعی خشونت در محله‌های شیکاگو و استکهلم: یک تحقیق مقایسه‌ای. در نظم، درگیری و خشونت ؛ Shapiro, I., Kalyvas, SN, Masoud, T., Eds.; انتشارات دانشگاه کمبریج: کمبریج، انگلستان، 2008; صص 97-119. [ Google Scholar ] [ CrossRef ]
  24. کوهن، LE; فلسون، ام. تغییر اجتماعی و روند نرخ جرم: رویکرد فعالیت معمول. صبح. اجتماعی Rev. 1979 , 44 , 588-608. [ Google Scholar ] [ CrossRef ]
  25. ویزبرد، دی. گراف، ای آر. یانگ، اس.-ام. جرم‌شناسی مکان: بخش‌های خیابان و درک ما از مسئله جرم ؛ انتشارات دانشگاه آکسفورد: آکسفورد، انگلستان، 2012. [ Google Scholar ]
  26. اسپانو، آر. فریلیچ، جی دی ارزیابی اعتبار تجربی و مفهوم‌سازی مطالعات چند متغیره در سطح فردی نظریه سبک زندگی/فعالیت‌های روتین منتشر شده از سال 1995 تا 2005. J. Crim. عدالت 2009 ، 37 ، 305-314. [ Google Scholar ] [ CrossRef ]
  27. آندرسن، کارشناسی ارشد، تحلیل فضایی جرم در ونکوور، بریتیش کلمبیا: ترکیبی از بی‌سازمانی اجتماعی و نظریه فعالیت معمول. می توان. Geogr./Le Géographe Can. 2006 ، 50 ، 487-502. [ Google Scholar ] [ CrossRef ]
  28. Furstenberg، FF; کوک، تی دی; اکلس، جی. Elder، GH; سامروف، الف. مدیریت ساختن آن: خانواده های شهری و موفقیت نوجوانان. مطالعات رشد موفق نوجوانان ; انتشارات دانشگاه شیکاگو: شیکاگو، IL، ایالات متحده آمریکا، 2000. [ Google Scholar ]
  29. بریسون، دی. رول، اس. تأثیر همسایگی بر جنایت و ایمنی: مروری بر شواهد. نول 2012 ، 9 ، 333-350. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  30. کلمن، سرمایه اجتماعی JS در ایجاد سرمایه انسانی. صبح. جی. سوسیول. 1988 ، 94 ، S95–S120. [ Google Scholar ] [ CrossRef ]
  31. پاتنام، آردی بولینگ تنهایی: فروپاشی و احیای جامعه آمریکایی. در بولینگ تنهایی: فروپاشی و احیای جامعه آمریکایی ; Touchstone Books/Simon & Schuster: New York, NY, USA, 2000; پ. 541. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  32. چیو، WH; مدن، پی دزدی و نابرابری درآمد. جی. اقتصاد عمومی. 1998 ، 69 ، 123-141. [ Google Scholar ] [ CrossRef ]
  33. حسیه، سی. Pugh، MD فقر، نابرابری درآمد، و جنایت خشونت آمیز: فراتحلیلی از مطالعات اخیر داده های کل. جنایت. Justice Rev. 1993 , 18 , 182-202. [ Google Scholar ] [ CrossRef ]
  34. کلی، ام. نابرابری و جنایت. کشیش Econ. آمار 2000 ، 82 ، 530-539. [ Google Scholar ] [ CrossRef ]
  35. Weatherburn, D. چه چیزی باعث جنایت می شود؟ دفتر آمار و تحقیقات جنایت NSW: سیدنی، استرالیا، 2001.
  36. Feldmeyer, B. اثرات تفکیک نژادی/قومی بر قتل لاتین و سیاهپوستان. اجتماعی Q. 2010 , 51 , 600-623. [ Google Scholar ] [ CrossRef ]
  37. کریو، ال جی. پترسون، RD; کوهل، جداسازی دی سی، ساختار نژادی، و جنایات خشونت آمیز همسایگی. صبح. جی. سوسیول. 2009 ، 114 ، 1765-1802. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  38. پترسون، RD; Krivo، LJ جهان‌های اجتماعی متفاوت: جنایت‌های همسایگی و شکاف نژادی- فضایی . بنیاد راسل سیج: نیویورک، نیویورک، ایالات متحده آمریکا، 2010. [ Google Scholar ]
  39. Balkwell، JW نابرابری قومی و میزان قتل. Soc. نیروها 1990 ، 69 ، 53-70. [ Google Scholar ] [ CrossRef ]
  40. بلاو، PM; گلدن، ساختار متروپولیتن RM و خشونت جنایی. اجتماعی Q. 1986 , 27 , 15-26. [ Google Scholar ] [ CrossRef ]
  41. کوبرین، سی. ناهمگونی و جنایت نژادی: اندازه گیری اثرات ایستا و پویا. Res. جامعه اجتماعی 2000 ، 10 ، 189-219. [ Google Scholar ]
  42. وارنر، بی.دی. رانتری، روابط اجتماعی محلی PW در یک جامعه و مدل جرم: زیر سوال بردن ماهیت سیستمی کنترل اجتماعی غیررسمی. Soc. مشکل 1997 ، 44 ، 520-536. [ Google Scholar ] [ CrossRef ]
  43. شیمن، اس. ثبات مسکونی و تأثیر اجتماعی مضرات محله: مطالعه اثرات احتمالی جنسیت و نژاد. Soc. نیروها 2005 ، 83 ، 1031-1064. [ Google Scholar ] [ CrossRef ]
  44. برتون، وی اس، جونیور؛ کالن، FT; ایوانز، تی دی; الارید، LF; داناوی، RG جنسیت، خودکنترلی، و جنایت. J. Res. جنایت دلینق. 1998 ، 35 ، 123-147. [ Google Scholar ] [ CrossRef ]
  45. کارابین، ای. ایگانسکی، پی. جنوب، ن. لی، ام. پلامر، ک. تورتون، جی. ایگانسکی، پی. جنوب، ن. لی، ام. پلامر، ک. و همکاران جرم شناسی: مقدمه ای جامعه شناسانه ; Routledge: Arbington، UK، 2004. [ Google Scholar ] [ CrossRef ]
  46. کریسلر، جی سی. McCreary, DR Handbook of Gender Research in Psychology ; Springer: برلین/هایدلبرگ، آلمان، 2010; جلد 1. [ Google Scholar ]
  47. رو، دی سی؛ Vazsonyi، AT; تفاوت‌های جنسی فلانری، دی‌جی در جنایت: آیا ابزارها و تنوع درون جنسی دلایل مشابهی دارند؟ J. Res. جنایت دلینق. 1995 ، 32 ، 84-100. [ Google Scholar ] [ CrossRef ]
  48. هیرشی، تی. گاتفردسون، ام. ایج و تبیین جنایت. صبح. جی. سوسیول. 1983 ، 89 ، 552-584. [ Google Scholar ] [ CrossRef ]
  49. Farrington، DP پرخاشگری کودکی و خشونت بزرگسالان: پیش سازهای اولیه و پیامدهای بعدی زندگی. توسعه دهنده درمان شود. کودک. پرخاشگری 1991 ، 5 ، 29. [ Google Scholar ]
  50. فلانگان، تی جی; Maguire, K. Sourcebook of Criminal Justice Statistics-1989 ; وزارت دادگستری، اداره آمار دادگستری: واشنگتن، دی سی، ایالات متحده آمریکا، 1990.
  51. سامپسون، RJ; مورنوف، جی دی. Gannon-Rowley، T. ارزیابی “اثرات همسایگی”: فرآیندهای اجتماعی و جهت گیری های جدید در پژوهش. آنو. کشیش سوسیول. 2002 ، 28 ، 443-478. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  52. زمین، KC; مک کال، PL; کوهن، LE متغیرهای ساختاری نرخ قتل: آیا هیچ گونه تغییری در زمان و فضای اجتماعی وجود دارد؟ صبح. جی. سوسیول. 1990 ، 95 ، 922-963. [ Google Scholar ] [ CrossRef ]
  53. مسنر، اس.اف. روزنفلد، آر. بامر، EP ابعاد سرمایه اجتماعی و نرخ قتل جنایی. صبح. اجتماعی Rev. 2004 , 69 , 882-903. [ Google Scholar ] [ CrossRef ]
  54. Lo, CC; ژونگ، اچ. پیوند نرخ جرم و جنایت با عوامل رابطه: استفاده از داده های جنسیتی خاص. جی. جنایت. عدالت 2006 ، 34 ، 317-329. [ Google Scholar ] [ CrossRef ]
  55. شارکی، پی تی پیمایش در خیابان های خطرناک: منابع و پیامدهای اثربخشی خیابان. صبح. اجتماعی Rev. 2006 , 71 , 826-846. [ Google Scholar ] [ CrossRef ]
  56. مک لاناهان، اس. Bumpass, L. پیامدهای بین نسلی از هم گسیختگی خانواده. صبح. جی. سوسیول. 1988 ، 94 ، 130-152. [ Google Scholar ] [ CrossRef ]
  57. مسنر، اس.اف. Sampson، RJ نسبت جنسی، اختلال در خانواده، و نرخ جرم و جنایت خشونت آمیز: پارادوکس ساختار جمعیتی. Soc. نیروهای 1991 ، 69 ، 693-713. [ Google Scholar ] [ CrossRef ]
  58. سامپسون، ساختار خانواده محله RJ و خطر قربانی شدن شخصی. در بوم شناسی اجتماعی جرم ; Springer: برلین/هایدلبرگ، آلمان، 1986; صص 25-46. [ Google Scholar ]
  59. لیون، سازمان CJ Community (Dis) و جنایت با انگیزه نژادی. صبح. جی. سوسیول. 2007 ، 113 ، 815-863. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  60. فرای، وی. کنترل اجتماعی غیررسمی خشونت شرکای صمیمی علیه زنان: بررسی نگرش های شخصی و انسجام اجتماعی محله ادراک شده. J. روانی جامعه. 2007 ، 35 ، 1001-1018. [ Google Scholar ] [ CrossRef ]
  61. Cantillon، D. سازمان اجتماعی جامعه، والدین، و همسالان به عنوان میانجی ویژگی های بلوک همسایگی درک شده در فعالیت های بزهکارانه و اجتماعی. صبح. J. روانی جامعه. 2006 ، 37 ، 111-127. [ Google Scholar ] [ CrossRef ]
  62. بلیر، تعامل اجتماعی PE و جرم اجتماعی: بررسی اهمیت شبکه های همسایه. جرم شناسی 1997 ، 35 ، 677-704. [ Google Scholar ] [ CrossRef ]
  63. براونینگ، CR; دیتز، RD; فاینبرگ، SL پارادوکس سازمان اجتماعی: شبکه ها، اثربخشی جمعی و جنایت خشونت آمیز در محله های شهری. Soc. نیروهای 2004 ، 83 ، 503-534. [ Google Scholar ] [ CrossRef ]
  64. گیبسون، CL; ژائو، جی. Lovrich، NP; گافنی، ام جی ادغام اجتماعی، ادراکات فردی از کارآیی جمعی، و ترس از جنایت در سه شهر. عدالت Q. 2002 ، 19 ، 537-564. [ Google Scholar ] [ CrossRef ]
  65. ولز، LE; Weisheit، RA الگوهای جرم روستایی و شهری: مقایسه سطح شهرستان. جنایت. Justice Rev. 2004 , 29 , 1-22. [ Google Scholar ] [ CrossRef ]
  66. کایلن، ام تی؛ پرایدور، بی‌سازمانی اجتماعی و جرم و جنایت در جوامع روستایی: اولین آزمون مستقیم مدل سیستمی. برادر J. Criminol. 2013 ، 53 ، 905-923. [ Google Scholar ] [ CrossRef ]
  67. بوفارد، لس آنجلس; Muftić، LR “رمز روستایی”: بی‌سازمانی اجتماعی و خشونت فراتر از جوامع شهری. غرب. Criminol. Rev. 2006 , 7 , 56-66. [ Google Scholar ]
  68. لی، ی.-ای. ساختار اجتماعی و کنترل اجتماعی غیررسمی در جوامع روستایی. بین المللی J. Rural Criminol. 2011 ، 1 ، 63-88. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  69. پیتی، TA; کوالسکی، GS مدل سازی نرخ جرم خشونت آمیز روستایی: آزمونی از نظریه بی سازمانی اجتماعی. اجتماعی تمرکز 1993 ، 26 ، 87-89. [ Google Scholar ] [ CrossRef ]
  70. Osgood، DW; چمبرز، JM بی سازمانی اجتماعی خارج از کلان شهر: تحلیلی از خشونت جوانان روستایی. جرم شناسی 2000 ، 38 ، 81-116. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  71. ولز، LE; Weisheit، RA توضیح جنایت در جوامع متروپولیتن و غیر متروپولیتن. بین المللی J. Rural Criminol. 2013 ، 1 ، 153-183. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  72. بارنت، سی. منکن، نظریه بی‌سازمانی اجتماعی FC و ماهیت بافتی جرم در شهرستان‌های غیر شهری. جامعه روستایی 2002 ، 67 ، 372-393. [ Google Scholar ] [ CrossRef ]
  73. Osgood، DW; چمبرز، JM جامعه همبستگی خشونت جوانان روستایی. Juv. گاو عدالت. 2003 ، 1-12. در دسترس آنلاین: https://www.ncjrs.gov/pdffiles1/ojjdp/193591.pdf (در 29 اکتبر 2020 قابل دسترسی است).
  74. بخش، KC; کرشنر، EE; تامپسون، ای جی بی‌سازمانی اجتماعی و نرخ جرم روستایی/شهری: مقایسه عوامل مؤثر در سطح شهرستان. بین المللی J. روستایی. Criminol. 2018 ، 4 ، 43-65. [ Google Scholar ] [ CrossRef ]
  75. کایلن، م. پرایدور، WA; Roche, SP تأثیر تغییر ترکیب جمعیتی بر قربانی شدن حملات تشدید شده در طول انحطاط بزرگ جنایت آمریکا: تحلیل خلاف واقع نرخ‌ها در مناطق شهری، حومه‌ای و روستایی. جنایت. Justice Rev. 2017 , 42 , 291-314. [ Google Scholar ] [ CrossRef ]
  76. کانگ، H.-W. کانگ، اچ.-بی. پیش‌بینی وقوع جرم از داده‌های چندوجهی با استفاده از یادگیری عمیق. PLoS ONE 2017 , 12 , e0176244. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  77. هوانگ، سی. ژانگ، جی. ژنگ، ی. Chawla، NV DeepCrime: شبکه‌های تکراری سلسله مراتبی توجه برای پیش‌بینی جرم. در مجموعه مقالات بیست و هفتمین کنفرانس بین المللی ACM در مدیریت اطلاعات و دانش، CIKM ’18 ; انجمن ماشین‌های محاسباتی: تورینو، ایتالیا، 2018؛ ص 1423-1432. [ Google Scholar ] [ CrossRef ]
  78. مارچانت، آر. هان، اس. کلنسی، جی. کریپس، اس. کاربرد یادگیری ماشینی در جرم شناسی: رگرسیون بیزی فضایی-دموگرافیک نیمه پارامتریک. امن آگاه کردن. 2018 ، 7 ، 1. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  79. اینگیلویچ، وی. ایوانف، اس. پیش بینی میزان جرم و جنایت در محیط شهری با استفاده از عوامل اجتماعی. Procedia Comput. علمی 2018 ، 136 ، 472-478. [ Google Scholar ] [ CrossRef ]
  80. اداره سرشماری ایالات متحده برآوردهای 5 ساله ACS 2014–2018. در دسترس آنلاین: https://www.census.gov/programs-surveys/acs/technical-documentation/table-and-geography-changes/2018/5-year.html (در 18 اوت 2020 قابل دسترسی است).
  81. فیک، SE; Hijmans، RJ WorldClim 2: سطوح جدید آب و هوایی با وضوح فضایی 1 کیلومتری برای مناطق زمینی جهانی. بین المللی جی.کلیماتول. 2017 ، 37 ، 4302-4315. [ Google Scholar ] [ CrossRef ]
  82. بریمن، ال. فریدمن، جی. استون، سی جی; اولشن، RA طبقه بندی و رگرسیون درختان ; Routledge & CRC Press: Abingdon، UK، 1984. [ Google Scholar ]
  83. پدرگوسا، اف. واروکو، جی. گرامفورت، آ. میشل، وی. تیریون، بی. گریزل، او. بلوندل، م. پرتنهوفر، پی. ویس، آر. دوبورگ، وی. و همکاران Scikit-Learn: یادگیری ماشینی در پایتون. جی. ماخ. فرا گرفتن. Res. 2011 ، 12 ، 2825-2830. [ Google Scholar ]
  84. ویرتانن، پی. گومرز، آر. Oliphant، TE; هابرلند، ام. ردی، تی. کورناپو، دی. بوروسکی، ای. پترسون، پی. وکسر، دبلیو. برایت، جی. و همکاران SciPy 1.0–الگوریتم های اساسی برای محاسبات علمی در پایتون. نات. روش‌ها 2020 ، 17 ، 261-272. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  85. آرمیتاژ، آر. مونچوک، ال. راجرسون، ام. به نظر خوب است، اما زندگی در آنجا چگونه است؟ بررسی تأثیر طراحی ابتکاری مسکن بر جرم و جنایت. یورو جی. جنایت. نتیجه سیاست 2011 ، 17 ، 29-54. [ Google Scholar ] [ CrossRef ]
  86. معتصم، ی. عزهید، رگرسیون EH پواسون و رگرسیون پواسون با تورم صفر: کاربرد در داده های بیمه درمانی خصوصی. یورو آکتوار. J. 2012 , 2 , 187-204. [ Google Scholar ] [ CrossRef ]
  87. فلاح، ن. گو، اچ. محمد، ک. سیدصالحی، س. نوریجلیانی، ک. اشراقیان، MR رگرسیون پواسون غیرخطی با استفاده از شبکه های عصبی: مطالعه شبیه سازی. محاسبات عصبی Appl. 2009 ، 18 ، 939. [ Google Scholar ] [ CrossRef ]
  88. فریدمن، تقریب تابع حریص JH: ماشین تقویت کننده گرادیان. ان آمار 2001 ، 29 ، 1189-1232. [ Google Scholar ] [ CrossRef ]
  89. Zhang, Z. تکنیک های تخمین پارامتر: یک آموزش با کاربرد در اتصال مخروطی . گزارش تحقیق RR-2676; INRIA: سوفیا آنتیپولیس، فرانسه، 1995; صص 59-76. [ Google Scholar ]
  90. بوگومولوف، آ. لپری، بی. استایانو، جی. الیور، ن. پیانسی، اف. Pentland، A. Once Upon a Crime: Towards Crime Prediction from Demographics and Mobile Data. در مجموعه مقالات شانزدهمین کنفرانس بین المللی تعامل چندوجهی، ICMI ’14، استانبول، ترکیه، 12-16 نوامبر 2014; انجمن ماشین‌های محاسباتی: نیویورک، نیویورک، ایالات متحده آمریکا، 2014. ص 427-434. [ Google Scholar ] [ CrossRef ]
  91. او، ال. پائز، آ. جیائو، جی. آن، پ. لو، سی. مائو، دبلیو. لانگ، دی. جمعیت محیط و سرقت-سرقت: تحلیل فضایی با استفاده از داده های تلفن همراه. Isprs Int. J. Geo-Inf. 2020 ، 9 ، 342. [ Google Scholar ] [ CrossRef ]
شکل 1. مراحل پیش پردازش داده ها.
شکل 2. منحنی های مشخصه خطای رگرسیون (REC) برای ( الف ) مدل تقویت گرادیان، ( ب ) مدل پواسون، و ( ج ) مدل یادگیری عمیق.
شکل 3. مقایسه وقوع پیش بینی شده جرایم علیه حقیقت با استفاده از سه مدل مختلف. ( الف ) تعداد کل جرم: پیش‌بینی‌ها در مقابل مشاهدات واقعی. ( ب ) جنایات خشونت آمیز: پیش بینی ها در مقابل مشاهدات واقعی. ( ج ) جرایم دارایی: پیش بینی ها در مقابل مشاهدات واقعی. ( د ) MVT: پیش‌بینی‌ها در مقابل مشاهدات واقعی. ( ه ) وندالیسم: پیش بینی ها در مقابل مشاهدات واقعی.
شکل 4. نقشه تجسم وقوع جرم سالانه پیش بینی شده در شهر نیویورک. ( الف ) کل جرایم پیش بینی شده (تعداد) وقوع؛ ( ب ) وقوع جرم خشونت آمیز پیش بینی شده؛ ج ) وقوع جرم ملکی پیش بینی شده ؛ د ) پیش بینی وقوع MVT. ( ه ) اقدامات وندالیسم پیش بینی شده. مقوله‌هایی که برای تولید نقشه‌ها (از روشن تا تاریکی) استفاده می‌شوند، به ترتیب با چارک اول، ربع دوم، ربع سوم، چارک چهارم (به استثنای 2 صدک بالاتر)، و دو صدک بالاترین پیش‌بینی تعداد جرم مطابقت دارند. Basemap به‌دست‌آمده از OpenStreetMap، و تعیین حدود گروه‌های سرشماری ایالات متحده از Shapefiles سرشماری ببر استخراج شد.
شکل 5. مقایسه وقوع جرم پیش بینی شده در برابر داده های NIBRS در سطح ایالت.

بدون دیدگاه

دیدگاهتان را بنویسید