1. مقدمه
با توسعه جامعه و فناوری علم، فناوری جرم و جنایت پیچیده تر می شود و آسیب های ناشی از جرم افزایش می یابد. با این حال، در شرایطی که جمعیت در یک منطقه خاص متمرکز شده و شهر به سرعت در حال تغییر است، پیشگیری یا واکنش به جرم آسان نیست. از این رو اقدامات مختلفی برای پیشگیری از وقوع جرم در حوزه شهرسازی به عنوان بخشی از طرح شهر هوشمند ارائه شده است. در کره، تلاش های مختلفی در حال انجام است. به عنوان مثال، یک سیستم پیوند برای ارائه اطلاعات تصویر دوربین مدار بسته به مرکز شهر هوشمند و مرکز موقعیت یابی وزارت دادگستری در حال ایجاد و پیاده سازی است و شبکه ایمنی شهر هوشمند مرتبط با سیستم ملی ایمنی در برابر بلایا نیز به عنوان پلتفرم یکپارچه شهر هوشمند علاوه بر این، مطالعات اخیر در زمینه پیش بینی جرم برای پیشگیری موثرتر از جرم به طور فعال در حال انجام است. جرم یک پدیده اجتماعی است که در آن عوامل متعددی مانند عناصر فیزیکی، اجتماعی و اقتصادی به صورت ترکیبی عمل می کنند. از آنجایی که عوامل جرم زا متعددی وجود دارد، همبستگی بین عوامل و جرایم خارج از محدوده درک انسان است. برای غلبه بر این محدودیت ها، هوش مصنوعی به طور فعال در تحقیقات جنایی، به ویژه در فعالیت های پیش بینی جرم با استفاده از داده کاوی استفاده می شود. داده کاوی تکنیکی است که تجربیات کاربر یا ذهنیت را در حجم زیادی از داده ها حذف می کند و قوانین، الگوها و همبستگی های آماری را کاملاً بر اساس داده ها شناسایی می کند. این ابزار قدرتمندی است که بازرسان جرم را قادر میسازد تا به سرعت و کارآمد در پایگاههای اطلاعاتی بزرگ حرکت کنند [ جرم یک پدیده اجتماعی است که در آن عوامل متعددی مانند عناصر فیزیکی، اجتماعی و اقتصادی به صورت ترکیبی عمل می کنند. از آنجایی که عوامل جرم زا متعددی وجود دارد، همبستگی بین عوامل و جرایم خارج از محدوده درک انسان است. برای غلبه بر این محدودیت ها، هوش مصنوعی به طور فعال در تحقیقات جنایی، به ویژه در فعالیت های پیش بینی جرم با استفاده از داده کاوی استفاده می شود. داده کاوی تکنیکی است که تجربیات کاربر یا ذهنیت را در حجم زیادی از داده ها حذف می کند و قوانین، الگوها و همبستگی های آماری را کاملاً بر اساس داده ها شناسایی می کند. این ابزار قدرتمندی است که بازرسان جرم را قادر میسازد تا به سرعت و کارآمد در پایگاههای اطلاعاتی بزرگ حرکت کنند [ جرم یک پدیده اجتماعی است که در آن عوامل متعددی مانند عناصر فیزیکی، اجتماعی و اقتصادی به صورت ترکیبی عمل می کنند. از آنجایی که عوامل جرم زا متعددی وجود دارد، همبستگی بین عوامل و جرایم خارج از محدوده درک انسان است. برای غلبه بر این محدودیت ها، هوش مصنوعی به طور فعال در تحقیقات جنایی، به ویژه در فعالیت های پیش بینی جرم با استفاده از داده کاوی استفاده می شود. داده کاوی تکنیکی است که تجربیات کاربر یا ذهنیت را در حجم زیادی از داده ها حذف می کند و قوانین، الگوها و همبستگی های آماری را کاملاً بر اساس داده ها شناسایی می کند. این ابزار قدرتمندی است که بازرسان جرم را قادر میسازد تا به سرعت و کارآمد در پایگاههای اطلاعاتی بزرگ حرکت کنند [ از آنجایی که عوامل جرم زا متعددی وجود دارد، همبستگی بین عوامل و جرایم خارج از محدوده درک انسان است. برای غلبه بر این محدودیت ها، هوش مصنوعی به طور فعال در تحقیقات جنایی، به ویژه در فعالیت های پیش بینی جرم با استفاده از داده کاوی استفاده می شود. داده کاوی تکنیکی است که تجربیات کاربر یا ذهنیت را در حجم زیادی از داده ها حذف می کند و قوانین، الگوها و همبستگی های آماری را کاملاً بر اساس داده ها شناسایی می کند. این ابزار قدرتمندی است که بازرسان جرم را قادر میسازد تا به سرعت و کارآمد در پایگاههای اطلاعاتی بزرگ حرکت کنند [ از آنجایی که عوامل جرم زا متعددی وجود دارد، همبستگی بین عوامل و جرایم خارج از محدوده درک انسان است. برای غلبه بر این محدودیت ها، هوش مصنوعی به طور فعال در تحقیقات جنایی، به ویژه در فعالیت های پیش بینی جرم با استفاده از داده کاوی استفاده می شود. داده کاوی تکنیکی است که تجربیات کاربر یا ذهنیت را در حجم زیادی از داده ها حذف می کند و قوانین، الگوها و همبستگی های آماری را کاملاً بر اساس داده ها شناسایی می کند. این ابزار قدرتمندی است که بازرسان جرم را قادر میسازد تا به سرعت و کارآمد در پایگاههای اطلاعاتی بزرگ حرکت کنند [ داده کاوی تکنیکی است که تجربیات کاربر یا ذهنیت را در حجم زیادی از داده ها حذف می کند و قوانین، الگوها و همبستگی های آماری را کاملاً بر اساس داده ها شناسایی می کند. این ابزار قدرتمندی است که بازرسان جرم را قادر میسازد تا به سرعت و کارآمد در پایگاههای اطلاعاتی بزرگ حرکت کنند [ داده کاوی تکنیکی است که تجربیات کاربر یا ذهنیت را در حجم زیادی از داده ها حذف می کند و قوانین، الگوها و همبستگی های آماری را کاملاً بر اساس داده ها شناسایی می کند. این ابزار قدرتمندی است که بازرسان جرم را قادر میسازد تا به سرعت و کارآمد در پایگاههای اطلاعاتی بزرگ حرکت کنند [1 ].
یک روش طبقه بندی برای پیش بینی رویدادهای جرم بالقوه در زمان ها و مناطق خاص، از طریق خوشه بندی، که نوعی تکنیک داده کاوی است، استفاده می شود. خوشهبندی به گروهبندی دادهها با ویژگیهای مشابه و طبقهبندی کل مجموعه دادهها به چند خوشه، یعنی طبقهبندی اشاره دارد. در صورتی که جرایم با در نظر گرفتن همزمان چند دسته فرعی مانند مکان، زمان و نحوه وقوع جرم دسته بندی شوند، می توان به مشخصات جزئی هر جرم پی برد. پیشبینی دقیقتر جرم در صورتی امکانپذیر است که بازرسان جرم بتوانند انواع خاصی از رویدادهای جرم را در مناطق خاص و در زمانهای خاص پیشبینی کنند. با این حال، در حالی که طبقه بندی به رهبری انسان از نظر در نظر گرفتن چندین عامل به طور همزمان محدودیت هایی دارد. طبقه بندی عینی به دلیل تفسیر ذهنی محققین غیرممکن است. از سوی دیگر، خوشهبندی محققین را قادر میسازد تا چندین عامل را بهطور عینی طبقهبندی کنند، از آنها به عنوان متغیر استفاده کنند و در نهایت به طور عینی جرایم را دستهبندی کنند. در تحقیقات مرتبط با جرم، خوشهبندی عمدتاً برای تجزیه و تحلیل نقاط وقوع جرم و جنایت، عمدتاً با خوشهبندی مکانهای جرم یا جریانهای سری زمانی استفاده میشود.2 ، 3 ]، در حالی که الگوهای مشتق شده از خوشه بندی برای شناسایی روند جرم استفاده می شود [ 4 ].
طبقهبندی جرم بر اساس مکانهای جرم یا جریانهای سریهای زمانی یک اقدام اساسی برای پیشگیری از جرم است و میتوان آن را در روشهای مختلف پیشبینی اضافی اعمال کرد. ویژگیهای جرم، مانند تکنیکهای دقیق، اهداف و عوامل محیطی مؤثر بر وقوع آن، الگوهای جرم متفاوتی از اهداف جرم، نقشههای جنایت و نقشههای فرار را حتی برای انواع مشابه جرم نشان میدهند. بنابراین از نظر پیشبینی جرم، میتوان الگوهای جرم را با جزئیات و وضوح بیشتری بر اساس مکان، تاریخ و زمان وقوع جرم و ویژگیهای هر جرم پیشبینی کرد.
این مطالعه یک مدل شبکه عصبی مصنوعی را پیشنهاد میکند که انواع جرم واقعی را با دستهبندی جرایم خاص از طریق خوشهبندی پیشبینی میکند. علاوه بر پیشبینی مکانهای جرم و جریانهای سری زمانی، پیشبینی انواع جرم خاص به عنوان روشی برای پیشبینی جرم پیشنهاد میشود. اگر جنایات پس از استفاده از عناصر مرتبط با جرم به عنوان متغیر و خوشهبندی، دستهبندی شوند و اگر دادههای نوع جرم مشتقشده در یک مدل شبکه عصبی مصنوعی آموخته شوند، میتوان مدلی را توسعه داد که بتواند نوع جرم را پیشبینی کند. از آنجایی که پیشبینی نوع جرم به افراد اجازه میدهد تا ویژگیهای متداولترین جنایات را در مناطق تصادفی از قبل تعیین کنند، استقرار کارآمد پلیس و مناسبترین اقدامات تاکتیکی را ممکن میسازد.
برای پیش بینی انواع جرم باید عوامل موثر بر وقوع جرم را یافت. از زمان فیلم «فضای قابل دفاع» اسکار نیومن [ 5] این امکان را ارائه کرد که می توان از طریق طراحی شهری از وقوع جرم جلوگیری کرد، تحقیقات در مورد جرم شناسی محیطی با تمرکز بر عوامل محیطی در جوامع، نه مجرمان، در یافتن عوامل جرم زا افزایش یافته است. به طور خاص، جرم شناسی محیطی عمدتاً بر یک محیط فضایی در میان عوامل محیطی مؤثر بر رویدادهای جرم تمرکز دارد. نظریه الگوی جرم، یکی از مبانی نظری جرم شناسی محیطی، به تعاملات بین محیط اطراف و تصمیمات محل وقوع جرم مجرمان مربوط می شود. این نظریه بر اهمیت استفاده از زمین و امکانات، درک الگوهای جرم و جنایت و شناسایی امکاناتی که بر وقوع جرم تأثیر میگذارند، تأکید میکند [ 6 ]]. علاوه بر این، در نظریه پیشگیری از جرم از طریق طراحی محیطی که توسط جفری [بر اساس جرمشناسی محیطی، چراغهای خیابان و دوربینهای مداربسته از عوامل مهم نظارت طبیعی هستند که وقوع جرم را کاهش میدهند. مطالعات قبلی که اثرات عوامل محیطی محلی را بر میزان وقوع جرم و جنایت بر اساس چنین نظریههایی تجزیه و تحلیل کردند، نشان دادند که ویژگیهای فضایی خاص و محیطهای همسایگی (تاسیسات، دوربینهای مدار بسته و غیره) بر نرخ وقوع جرم تأثیر میگذارند [ 8 ].
این مطالعه سرقت را از میان پنج نوع جرم مورد هدف قرار داد، زیرا این نوع بیشتر از محیط های مجاور متاثر می شود. جنایاتی مانند قتل و تجاوز به شدت تحت تأثیر احساسات شخصی بین مجرمان و قربانیان قرار دارند زیرا هدف افراد خاص هستند. از سوی دیگر، سرقت بیشتر تحت تأثیر محیط های مجاور و ویژگی های رفتاری مجرمین قرار می گیرد تا احساسات شخصی، زیرا اهداف جرم ساختمان ها یا اشیاء خاصی هستند [ 9 ].]. با این وجود، هنوز مطالعات تحلیل فضایی کافی در مورد جرایم خاص مانند سرقت وجود ندارد و همچنین لازم است که جرایم در محیط کره جنوبی تجزیه و تحلیل شود. بر این اساس، این پژوهش تلاش میکند تا تفاوتهای منطقهای مکانهای سرقت را در یک بافت فضایی برآورد کند و با توجه به تمرکز این تحقیق بر عوامل محیطی، اتخاذ رویکرد جرمشناسی محیطی نسبت به سرقت در نظر گرفته میشود.
در نهایت، این پژوهش به دستهبندی سرقت از طریق خوشهبندی با توجه به ویژگیهای مختلف جرم به طور همزمان پرداخته است. بر اساس عوامل محیطی محلی که بر سرقت تأثیر میگذارند، این مطالعه یک مدل ANN را پیشنهاد میکند که میتواند انواع سرقتهایی را که به احتمال زیاد در مناطق تصادفی رخ میدهند، پیشبینی کند. به جای پیشبینی جرایم صرفاً با استفاده از عوامل محیطی، جرایم خاص را دستهبندی میکند و روابط بین طبقهبندیهای مشتق شده و عوامل محیطی را تقسیم میکند و در نتیجه به روشهای پیشبینی با استفاده از ANN تنوع میدهد. این تجزیه و تحلیل به سیاستگذاران امکان می دهد تا انواع سرقت هایی را که به احتمال زیاد در مناطق تصادفی رخ می دهد استخراج کنند، پرسنل پلیس را به طور مؤثر مستقر کنند و مناسب ترین اقدامات تاکتیکی را انجام دهند. علاوه بر این، اگر ویژگی های محلی موثر بر سرقت شناسایی شود،
2. پیشینه نظری
2.1. جرم و جنایت و محیط زیست
جرم شناسی زیست محیطی نظریه ای است که در آن جرم ناشی از چهار عامل «قوانین، اشیاء، مجرمان و مکان ها» است. به ویژه، “موقعیت ها” را به عنوان عامل مهم در نظر می گیرد [ 10]. نظریه الگوی جرم، یکی از مبانی نظری جرمشناسی محیطی، مکانهای جرم را این گونه تعریف میکند: «مکانهایی که سرنخهای محیطی را ارائه میدهند که معیارهای مجرمانی را که ویژگیهای مکانهای جرم مناسب را آموختهاند، برآورده میکنند». عوامل ایجاد و بازدارندگی جرم و عوامل انتخاب هدف بر اساس انواع منطقه، شبکه های خیابانی، مکان ساختمان، سطوح اقتصادی و قابلیت نظارت برای شناسایی الگوهای وقوع جرم دسته بندی می شوند. این نظریه نحوه تعامل رفتارهای انسان با محیط را برای ایجاد الگوهای رویداد جرم توصیف می کند و به طور کلی بر اهمیت انواع کاربری و امکانات زمین تاکید می کند. برخی از کاربریها و امکانات با فعالیتهای روزانه مردم مرتبط است و تعداد و نوع استفادهکنندگان از آنها بر وقوع جرم تأثیر میگذارد. از این رو،11 ].
کاربری زمین یک اصطلاح چتر برای فعالیت های کاربری زمین توسط انسان است. این به انتخاب فضا برای فعالیت های روزانه افراد مربوط می شود و می توان آن را به عنوان فعالیت های مختلف افراد در زمین با ساختارهای فیزیکی خاص یا به عنوان اشکال خاصی از استفاده از قبیل انواع، اهداف و تراکم برای تطبیق فعالیت ها در نظر گرفت [ 12 ]. از آنجایی که فعالیت های مجرمانه در کاربری ها رخ می دهد، تحلیل ویژگی های وقوع جرم مرتبط با کاربری زمین ضروری است. مطالعات قبلی در مورد رابطه بین جرم و کاربری زمین بر اساس جرم شناسی محیطی [ 13] انجمن را تجزیه و تحلیل کرد و دریافت که کاربری های خاص زمین بر وقوع جرم تأثیر می گذارد. به طور خاص، زمین های تجاری و مناطق مسکونی با تراکم بالا به شدت با وقوع جرم مرتبط بودند، در حالی که گورستان ها، رودخانه ها و سایت های کارخانه ارتباط کمتری با وقوع جرم داشتند. این نشان میدهد که همه کاربریهای غیر مسکونی ارتباط زیادی با جرم و جنایت ندارند. مطالعات در مورد رابطه در کره جنوبی نیز بیشتر بر اساس نظریه جرم شناسی محیطی است. در مطالعه ای توسط کیم، یون و آن [ 14]، چهار منطقه در سئول برای تجزیه و تحلیل همبستگی بین کاربری زمین و تراکم جرم مورد هدف قرار گرفتند و تأیید کردند که احتمالات مختلف وقوع جرم بر اساس کاربری زمین وجود دارد. علاوه بر این، نتایج آنها نشان داد که تراکم جرم نسبتاً کمتر بود زمانی که منطقه یک نوع کاربری خاص را نشان داد، در حالی که تراکم زمانی که کاربری های مخلوط وجود داشت بیشتر بود. با این حال، محدودیتی وجود داشت که این مطالعه به تحلیل همبستگی محدود شد. لی [ 15] رابطه فضایی بین کاربری زمین و فراوانی جرم را از طریق تحلیل خوشهای شاخصهای همبستگی دو متغیره نشان داد. نتایج تأیید کرد که عوامل فضایی تأثیر قابلتوجهی بر همبستگی بین کاربری زمین و جرم داشتند و همبستگی وقوع جرم با مناطق مسکونی با خانههای آپارتمانی بیشتر از سایر کاربریها بود. اگرچه مشخص است که میزان جرم و جنایت در سایتهای تجاری بالاتر است، اما مشخص شد که اگر جرایم در مناطق مسکونی با خانههای آپارتمانی شروع شود، احتمال زیادی وجود دارد که جرایم خوشهای شوند در حالی که وقوع آنها گسترش مییابد. با این حال، مطالعه با استفاده از تعداد وقوع جرم به عنوان یک متغیر بدون طبقهبندی انواع جرم محدود میشود.
تسهیلات، مانند کاربریها، ساختارهای فیزیکی هستند که فضایی را برای زندگی روزمره در اختیار افراد قرار میدهند و تعداد و نوع استفادهکنندگان بر وقوع جرم تأثیر میگذارند. مطالعات قبلی در مورد این انجمن نشان داده است که بسیاری از امکانات بر وقوع جرم تأثیر می گذارد. به طور خاص، از آنجایی که ساکنان محلی و بسیاری از افراد خارجی از امکانات تجاری استفاده می کنند، به دلیل جمعیت شناور زیاد، برای متخلفان آسان است که بدون شناسایی به اهداف نزدیک شوند [ 13 ]. چندین مطالعه در حال انجام در مورد تأثیر مدارس، یک مرکز آموزشی و پژوهشی نماینده، بر وقوع جرم وجود دارد، که نشان میدهد که آنها عمدتاً تأثیر زیادی دارند. گوویس رومن [ 16 ] دریافت که مناطق نزدیک به مدارس میزان جرم و جنایت بالاتری نسبت به سایر مناطق مسکونی نشان می دهند، در حالی که Kaut و Roncek [ 17 ]] همچنین نشان داد که وجود مدارس بر فراوانی جرم در محله تأثیر می گذارد. انگستاد [ 18 ] تعداد جرایم در یک منطقه با هتل ها را با تعداد جنایات مشابه در یک منطقه مجاور بدون هتل مقایسه کرد. تعداد جرایم بسته به تعداد ساکنان منطقه استاندارد شد و نتایج نشان داد که وجود هتل ها بر وقوع جرم تأثیر می گذارد. ایستگاههای حملونقل عمومی مکانهایی هستند که ساکنان محلی و بسیاری از افراد خارجی از آن عبور میکنند و افراد مختلفی را به منطقه اطراف جذب میکنند. بنابراین، مکانها بهعنوان امکانات جرمزا شناخته میشوند، زیرا تعداد زیادی از افراد مست یا کسانی که با محیط اطراف آشنا نیستند را جذب میکنند، بنابراین به اهداف آسانی برای مجرمان تبدیل میشوند [ 6 ]. بلاک و دیویس [ 19] غلظت جرم و جنایت را در خیابان ها در فاصله یک بلوک و نیم از ایستگاه های مترو شیکاگو تعیین کرد. Block and Block [ 20 ] همچنین الگوهای مشابهی را در اطراف ایستگاه متروی برانکس یافتند. سطح قدیمی این تسهیلات، یعنی گروه های سنی ساختمان ها نیز بر وقوع جرم تأثیر می گذارد. مناطق با گروه های سنی بالاتر ساختمان ها عموماً زیبایی شناسی ضعیفی در اطراف خیابان ها و ساختمان های خود دارند. چنین خرابی مسکن ترس از جرم را در میان ساکنان محلی افزایش می دهد و به یک عامل اصلی در وقوع جرم تبدیل می شود [ 21 ].
از آنجایی که تسهیلاتی که نرخ جرم را افزایش میدهند و تسهیلات پیشگیری از وقوع جرم که برای پیشگیری از جرم تعبیه شدهاند، متعلق به عوامل محیطی محلی هستند، این مطالعه سعی دارد بررسی کند که آیا آنها بر وقوع جرم در واقعیت تأثیر میگذارند یا خیر. دوربین مدار بسته میتواند صحنههای جرم و جنایت را بگیرد و فرصتی برای استقرار مناسب پرسنل امنیتی یا پلیس فراهم کند. بسیاری از مطالعات اثرات عملی دوربین مدار بسته را ثابت کرده اند. Brandon C. Welsh [ 22 ] اثرات دوربین مدار بسته بر جرم و جنایت در مکان های عمومی را تجزیه و تحلیل کرد و دریافت که به کاهش میزان جرم و جنایت در مناطق آزمایشی کمک می کند. نصب موثر دوربین مدار بسته در پارکینگ ها منجر به کاهش جرم و جنایت 51 درصدی شد. 23 درصد از نصب در وسایل حمل و نقل عمومی؛ و 7 درصد در خانه های آپارتمانی. فیلیپس [ 23] بررسی کرد که آیا دوربین مداربسته در کاهش وقوع جرم مؤثر است یا خیر و دریافت که سرقت کمتری در مناطق خاصی که دوربین مداربسته نصب شده است وجود دارد. چراغ های خیابانی به دلیل اینکه روشی مقرون به صرفه و کارآمد برای کاهش جرایم هستند، عنصری ضروری برای پیشگیری از وقوع جرم محسوب می شوند. در واقع، خو و همکاران. [ 24 ] رابطه بین تراکم نور خیابان و وقوع جرم را تأیید کرد، و تأیید کرد که هر چه اولی بالاتر باشد، دومی کمتر است.
2.2. دسته بندی جرایم
این مطالعه مطالعات مرتبط قبلی را مورد بررسی قرار داد تا مشخص شود که آیا طبقه بندی جرم عملاً در پیشگیری از جرم مفید است یا خیر. طبقه بندی یک تکنیک داده کاوی است که برای تجزیه و تحلیل الگوهای جرم و جنایت و همچنین یکی از رایج ترین تکنیک های اصلی مورد استفاده قرار می گیرد. استخراج اطلاعات معنی دار از داده های در مقیاس بزرگ امکان پذیر است که می تواند به طور موثر برای پیش بینی انواع تعریف نشده جرم مورد استفاده قرار گیرد. چنین پتانسیل و اثربخشی به تحقیقات بیشتر در مورد طبقه بندی جرایم کمک می کند و بیشتر مطالعات بر تجزیه و تحلیل تغییرات زمانی و مکانی جرم از طریق طبقه بندی متمرکز شده اند. ناکایا و یانو [ 3] تایید کرد که گستره جغرافیایی و مدت جرایم سرقت و فرار در شهر کیوتو بین سالهای 2003 و 2004 میتواند به طور همزمان از طریق خوشهبندی تجسم شود. علاوه بر این، همبستگی بین خوشه های زمانی با استفاده از تخمین تراکم هسته مکانی-زمانی (STKDE) و آمار اسکن فضا-زمان (STSS) به صورت موازی پیدا شد. در نتیجه، خوشههای گذرا وجود داشتند که به طور متناوب بین دو خوشه ایجاد میشدند، به این معنی که یک پدیده جابهجایی وجود داشت که در آن مجرمان مناطق دارای وقوع جرم را به عنوان مناطق هدف جرم انتخاب کردند. بر اساس این نتایج، مطالعه به این نتیجه رسید که تجزیه و تحلیل دادههای فضا-زمان خوشهها در «استخراج دانش جدید اپیدمیولوژی جرم» ارزشمند است. پارک [ 25] از تکنیک خوشهبندی K-means به عنوان روشی برای تجزیه و تحلیل الگوهای فضایی دادههای جرم و توزیع فضایی کانونهای جرم استفاده کرد. در نتیجه استخراج 10 خوشه برای هر سال از سال 2000 تا 2002، مشخص شد که اندازه و الگوی خوشه ها شباهت بالایی داشته و مکان های جرم نشان دهنده الگوهای فضایی مشابه در دوره مشخص شده است. فاکتورهای حاصل دیجیتالی شدند و در نهایت نقشه پیشبینی جرم اجرا شد. انتظار می رفت این نقشه در کنار توزیع کارآمد نیروی پلیس به پیشگیری از وقوع جرم کمک کند، با این مفهوم که در صورت انجام تحلیل مقایسه ای با داده های جرم جمع آوری شده در آینده، دقت نقشه بهبود می یابد. اگرچه مطالعات کمی برای دسته بندی جرم در کره جنوبی انجام شده است، برخی از تحقیقات تأثیر محیط فیزیکی را در ارتباط با انواع جرم و زمان وقوع جرم مورد تجزیه و تحلیل قرار داده اند. کواک و همکاران [26] پیش بینی کرد که انتظار می رود عوامل محیطی بسته به نوع جرم و زمان وقوع جرم، مانند روز و شب، تأثیرات متفاوتی بر وقوع جرم داشته باشند. آنها این تأثیرات را بر اساس آن عوامل تجزیه و تحلیل کردند و دریافتند که تأثیر تراکم هر نوع کاربری ساختمان بر وقوع جرم در شب بیشتر از روز است. به طور خاص، مناطق با امکانات کارخانه متمرکز از نظر وقوع جرم در طول روز اهمیتی نداشتند، اما چنین اهمیتی در شب نشان داده شد. مشخص شد که این فقط روی سرقت ها تأثیر بیشتری دارد، نه بر همه جرایم. به این ترتیب، مشخص شد که عوامل محیطی شهری بر حسب نوع جرم و زمان وقوع جرم، روابط تأثیرگذاری متفاوتی دارند.
2.3. پیشبینی جرم با استفاده از ANN
شبکه عصبی مصنوعی (ANN) یک روش پردازش داده منحصر به فرد است که به طور مداوم توسعه یافته است و یک الگوریتم یادگیری آماری است که رابطه نگاشت بین سیگنال های ورودی و خروجی را با استفاده از مدلی الهام گرفته شده از نحوه پاسخ بیولوژیکی مغز به محرک های حسی تقریبی می کند. ANN به عنوان یک مدل پیشبینی جرم در تحقیقات جنایی مورد استفاده قرار گرفته است و دقت بالایی را نشان میدهد. مطالعه محمود و همکاران [ 27 ] Crimecast را معرفی کردند، یک سرویس پیشبینی جرم و هدایت استراتژی که یک مدل ANN را با استفاده از متغیرهایی مانند نرخ جرم، مکان جرم، تاریخ جرم، نوع جرم و غیره اتخاذ کرد و ثابت کرد که مدل دقت بالایی دارد کانگ و کانگ [ 28] همچنین یک مدل پیشبینی جرم را با استفاده از عوامل محیطی مبتنی بر مدل ANN توسعه داد و دقت یک ANN را با استفاده از عوامل محیطی نشان داد. این مطالعات قبلی نشان داد که ANN یک مدل پیشبینی مناسب برای جرایم است.
3. روش تحقیق و طرح تحقیق
3.1. روش های پژوهش
در این مطالعه، به جای پیشبینی جرایم صرفاً با استفاده از عوامل محیطی، جرایم خاص دستهبندی میشوند و روابط بین دستهبندیهای مشتقشده و عوامل محیطی تقسیمبندی میشوند، در نتیجه روشهای پیشبینی با استفاده از ANN متنوع میشوند ( شکل 1 ).شکل 2جریان این مطالعه را به تصویر می کشد. ابتدا، پس از پیش پردازش داده های سرقت در منطقه دونگجاک، خوشه ها با استفاده از خوشه بندی k-modes استخراج شدند. پس از انجام تحلیل رگرسیون خطی چندگانه با استفاده از خوشه های مشتق شده و داده های عامل محیطی منطقه، عوامل محیطی مؤثر بر هر خوشه استخراج شد. یک مدل ANN با استفاده از عوامل تأثیرگذار در هر خوشه به عنوان داده ورودی ساخته شد و مدلی که خوشهها را پیشبینی میکرد، پیادهسازی شد. در نهایت، این مطالعه عملکرد مدل را با استفاده از تمام عوامل محیطی به عنوان داده های ورودی با مدل با استفاده از عوامل محیطی با اهمیت برای هر خوشه به عنوان داده ورودی مقایسه کرد. هر تحلیل رگرسیون و ساخت مدل پیشبینی برای هر خوشه برای استخراج عوامل دقیق و ساخت مدلهای پیشبینی انجام شد.
3.2. منطقه هدف تحقیق
یک منطقه در سئول، کره جنوبی، به عنوان سایت هدف برای تجزیه و تحلیل انتخاب شد. سئول دارای محیط فیزیکی پیچیده و تراکم جمعیت بالاتری نسبت به سایر مناطق است. ارزش کلان داده زمانی افزایش مییابد که ویژگیهای داده متنوعتر، پیچیدهتر و گستردهتر باشند. نتایج تحقیقات پیچیده تری را می توان با تجزیه و تحلیل محیط فیزیکی سئول انتظار داشت. این مطالعه منطقه دونجاک را به عنوان محل تجزیه و تحلیل در میان بسیاری از مناطق در سئول انتخاب کرد. دوره تجزیه و تحلیل از سال 2004 تا 2015، که در آن ساختار داده های مناسبی برای مطالعه وجود دارد، متغیر بود. در سال 2015، منطقه دونگجاک از نظر ایمنی در رتبه 18 از 25 منطقه در سئول قرار گرفت. لی و کیم [ 29] فراوانی پنج جنایت خشونتآمیز ثبت شده 792260 بار در سئول از سال 2005 تا 2011 را تجزیه و تحلیل کرد و رتبهبندی خطر جرم در 25 منطقه در سئول را با استفاده از “شاخص نقطه داغ جنایت” که خود توسعه داده بود محاسبه کرد. اصطلاح “نقطه داغ” در این مطالعه به شاخصی اشاره دارد که فراوانی پنج جرم را در هر 1 تجزیه و تحلیل می کند. کمتر2در داخل منطقه؛ اگر بیش از 105 حمله، 0.3 قتل، 1.6 سرقت، 69.7 مورد سرقت یا 0.6 جرم جنسی در سال وجود داشته باشد، منطقه به عنوان کانون طبقه بندی می شود و به هر بخش جرم یک امتیاز اختصاص می یابد. هر چه امتیاز بالاتر باشد، منطقه خطرناک تر است. مناطق خودمختار با سطح ایمنی پایین تر، عمدتاً مناطق سرگرمی متمرکز بودند. از سوی دیگر، منطقه دونگجاک یک منطقه مسکونی معمولی متراکم با یک منطقه تجاری (2.1٪) است که در بین 25 منطقه خودمختار سئول رتبه 24 را دارد، اما نرخ جرم و جنایت بالاتری را نسبت به سایر مناطق نشان داد. به ویژه، با توجه به روند وقوع جرم در این ولسوالی برای سه سال 1390 تا 1393، سرقت حاکی از بیشترین افزایش در بین پنج جنایت خشن بوده است.
3.3. خوشه بندی
3.3.1. تعریف
خوشه بندی یکی از انواع تکنیک های داده کاوی است که در زمینه های مختلف مانند رسانه و بازاریابی مورد استفاده قرار می گیرد. معرف ترین تکنیک خوشه بندی، خوشه بندی k-means است که توسط مک کوین در سال 1967 پیشنهاد شد. این روش یک روش خوشه بندی است که در آن داده هایی با ویژگی های مشابه خوشه بندی می شوند، مناسب ترین مقادیر مرکزی را پیدا می کنند و گروه بندی هایی با ویژگی های مشابه ایجاد می کنند. با این حال، این روش فقط برای داده های پیوسته با مقادیر مشخصه کمی قابل استفاده است. از آنجایی که این مطالعه خوشهبندی را با استفاده از دادههای مرتبط با جرم انجام داد، خوشهبندی k-means روش مناسبی نبود. بیشتر داده های مقیاس بزرگ از داده های کمی و طبقه ای تشکیل شده اند. بنابراین، استفاده از یک روش خوشهبندی برای هدف قرار دادن دادههای طبقهبندی برای خوشهبندی مقادیر زیادی از دادهها ضروری است [ 30 ]. هوانگ [31 ] خوشهبندی k-modes را به عنوان یک روش خوشهبندی با هدف قرار دادن دادههای طبقهبندی پیشنهاد کرد. این روش برای داده های طبقه بندی شده قابل استفاده است. یعنی داده های متشکل از متغیرهای اسمی در حالی که ساختار اولیه خوشه بندی k-means حفظ می شود.
خوشهبندی K-modes شباهتهای دادههای طبقهبندی را محاسبه میکند که شامل یک «تابع فاصله» است که فاصله بین اشیاء را اندازهگیری میکند و یک «تابع هزینه» که تحلیل را بهینه میکند. مجموعه شی X متشکل از متغیرهای اسمی است D، در حالی که تعداد ایکسn است. معادله به صورت زیر است: D=ایکس1،ایکس2،…،ایکسn1≤من≤n. اگر شی ایکس1دارد متر(تعداد) متغیرهای اسمی، معادله به شرح زیر است: ایکسمن=ایکسمن،1،ایکسمن،2،…،ایکسمن،n1≤j≤متر. معادله ز=ز1،ز2،…،زک( 1≤j≤ک)مجموعه ای از ک(تعداد) مراکز خوشه ای. اگر ز1، مرکز سیلخوشه، دارد متر(تعداد) متغیرهای اسمی، معادله به صورت زیر است: زل=zل،1،zل،2،…،zل،متر1≤j≤متر
اول، معادله (1) معادله ای است که فاصله بین آن ها را محاسبه می کند سیلمرکز خوشه، زل=zل،1،zل،2،…،zل،مترو شیء ایکسمن=ایکسمن،1،ایکسمن،2،…،ایکسمن،nاز طریق “تابع فاصله”. کارکرد دایکسمن،j ، zل،j، که فاصله بین آنها را اندازه گیری می کند ایکسمنو زل, دارای مقدار 1 هنگامی که دو مقدار مطابقت ندارند و مقدار 0 در صورت تطبیق می باشد. فاصله بین دو جسم را از طریق مقایسه آنها محاسبه می کند jمتغیرهای عددی از طریق معادله تابع فاصله، فواصل بین هر جسم ایکسو مرکز خوشه زهنگام بهینه سازی مدل در جهتی که مقدار نتیجه معادله (2) به حداقل می رسد، محاسبه می شوند.
U=تومن،لماتریسی متشکل از 0 و 1 به شکل است n×ک، معادله تومن،ل=1نشان دهنده شیء است، ایکسمنبه نزدیکترین خوشه اختصاص داده می شود سیل. مدل بهینه شده و نتیجه تجزیه و تحلیل خوشه با تنظیم مجدد مراکز خوشه و تجزیه و تحلیل مکرر آنها و محاسبه حداقل مقدار تابع هزینه به دست می آید. پU، ز.
3.3.2. استقرار تجزیه و تحلیل محیط
این مطالعه داده های سرقت را که از ایستگاه های پلیس منطقه به دست آمده بود، تجزیه و تحلیل کرد. داده ها شامل 45888 پرونده جنایی است که در منطقه دونگجاک از سال 2004 تا 2015 رخ داده است. موارد منطقه زمانی وقوع، آدرس وقوع، طبقهبندی مکان، جنسیت قربانی و روشهای جرم انتخاب و برای تحلیل خوشهبندی k-modes استفاده شد. پس از پاکسازی داده ها با منطقه زمانی یا آدرس نادرست، در نهایت از داده های 4464 مورد سرقت استفاده شد. سپس مجموعه داده ها با سازماندهی 4464 مورد در مجموع چهار بخش تهیه شد. زمان وقوع جرم با تقسیم آن به صبح (6-12)، بعد از ظهر (12-18)، عصر (18-0) و سحر (0-6) تعیین شد. در مورد موارد طبقه بندی مکان و روش های جرم، طبقه بندی بر اساس داده های سرقت در منطقه دونجاک انجام شد. طبقه بندی مکان به 16 دسته تقسیم شد: محل اقامت، کلیسا، سایت ساخت و ساز، موسسه آموزشی، تفریحی، بیمارستان، موسسه مالی، اداره، پارک، پارکینگ، توالت عمومی، محل سکونت، فروشگاه، خیابان، وسایل نقلیه و غیره. روش های جرم طبقه بندی شدند. به سرقت نفوذی، دزدی ضربه زدن، سرقت مربوط به وسیله نقلیه، سرقت ترفند و غیره؛ “و غیره.” گروهی را که به عنوان دزدی دیگر در دادههای سرقت در منطقه دونگجاک یا روشهای جرم و جنایت با نقاط داده بسیار کمی برای طبقهبندی به اقلام فردی، مانند سرقت هنگام چرت زدن، دزدی از مغازه، و سرقت از رختکن، تحت پوشش قرار داد. جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از دادههای سرقت در منطقه در چهار آیتم طبقهبندی شدند و مجموعه دادهها مطابق شکل زیر ساخته شدند. طبقه بندی مکان به 16 دسته تقسیم شد: محل اقامت، کلیسا، سایت ساخت و ساز، موسسه آموزشی، تفریحی، بیمارستان، موسسه مالی، اداره، پارک، پارکینگ، توالت عمومی، محل سکونت، فروشگاه، خیابان، وسایل نقلیه و غیره. روش های جرم طبقه بندی شدند. به سرقت نفوذی، دزدی ضربه زدن، سرقت مربوط به وسیله نقلیه، سرقت ترفند و غیره؛ “و غیره.” گروهی را که به عنوان دزدی دیگر در دادههای سرقت در منطقه دونگجاک یا روشهای جرم و جنایت با نقاط داده بسیار کمی برای طبقهبندی به اقلام فردی، مانند سرقت هنگام چرت زدن، دزدی از مغازه، و سرقت از رختکن، تحت پوشش قرار داد. جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از دادههای سرقت در منطقه در چهار آیتم طبقهبندی شدند و مجموعه دادهها مطابق شکل زیر ساخته شدند. طبقه بندی مکان به 16 دسته تقسیم شد: محل اقامت، کلیسا، سایت ساخت و ساز، موسسه آموزشی، تفریحی، بیمارستان، موسسه مالی، اداره، پارک، پارکینگ، توالت عمومی، محل سکونت، فروشگاه، خیابان، وسایل نقلیه و غیره. روش های جرم طبقه بندی شدند. به سرقت نفوذی، دزدی ضربه زدن، سرقت مربوط به وسیله نقلیه، سرقت ترفند و غیره؛ “و غیره.” گروهی را که به عنوان دزدی دیگر در دادههای سرقت در منطقه دونگجاک یا روشهای جرم و جنایت با نقاط داده بسیار کمی برای طبقهبندی به اقلام فردی، مانند سرقت هنگام چرت زدن، دزدی از مغازه، و سرقت از رختکن، تحت پوشش قرار داد. جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از دادههای سرقت در منطقه در چهار آیتم طبقهبندی شدند و مجموعه دادهها مطابق شکل زیر ساخته شدند. سایت ساختمانی، موسسه آموزشی، تفریحی، بیمارستان، موسسه مالی، اداره، پارک، پارکینگ، توالت عمومی، محل سکونت، فروشگاه، خیابان، وسایل نقلیه و غیره. سرقت و غیره؛ “و غیره.” گروهی را که به عنوان دزدی دیگر در دادههای سرقت در منطقه دونگجاک یا روشهای جرم و جنایت با نقاط داده بسیار کمی برای طبقهبندی به اقلام فردی، مانند سرقت هنگام چرت زدن، دزدی از مغازه، و سرقت از رختکن، تحت پوشش قرار داد. جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از دادههای سرقت در منطقه در چهار آیتم طبقهبندی شدند و مجموعه دادهها مطابق شکل زیر ساخته شدند. سایت ساختمانی، موسسه آموزشی، تفریحی، بیمارستان، موسسه مالی، اداره، پارک، پارکینگ، توالت عمومی، محل سکونت، فروشگاه، خیابان، وسایل نقلیه و غیره. سرقت و غیره؛ “و غیره.” گروهی را که به عنوان دزدی دیگر در دادههای سرقت در منطقه دونگجاک یا روشهای جرم و جنایت با نقاط داده بسیار کمی برای طبقهبندی به اقلام فردی، مانند سرقت هنگام چرت زدن، دزدی از مغازه، و سرقت از رختکن، تحت پوشش قرار داد. جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از دادههای سرقت در منطقه در چهار آیتم طبقهبندی شدند و مجموعه دادهها مطابق شکل زیر ساخته شدند. وسایل نقلیه، و غیره. روش های جرم به سرقت نفوذی، سرقت ضربه ای، سرقت مربوط به وسیله نقلیه، سرقت ترفند و غیره طبقه بندی شدند. “و غیره.” گروهی را که به عنوان دزدی دیگر در دادههای سرقت در منطقه دونگجاک یا روشهای جرم و جنایت با نقاط داده بسیار کمی برای طبقهبندی به اقلام فردی، مانند سرقت هنگام چرت زدن، دزدی از مغازه، و سرقت از رختکن، تحت پوشش قرار داد. جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از دادههای سرقت در منطقه در چهار آیتم طبقهبندی شدند و مجموعه دادهها مطابق شکل زیر ساخته شدند. وسایل نقلیه، و غیره. روش های جرم به سرقت نفوذی، سرقت ضربه ای، سرقت مربوط به وسیله نقلیه، سرقت ترفند و غیره طبقه بندی شدند. “و غیره.” گروهی را که به عنوان دزدی دیگر در دادههای سرقت در منطقه دونگجاک یا روشهای جرم و جنایت با نقاط داده بسیار کمی برای طبقهبندی به اقلام فردی، مانند سرقت هنگام چرت زدن، دزدی از مغازه، و سرقت از رختکن، تحت پوشش قرار داد. جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از دادههای سرقت در منطقه در چهار آیتم طبقهبندی شدند و مجموعه دادهها مطابق شکل زیر ساخته شدند. دزدی مغازه و دزدی از رختکن جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از دادههای سرقت در منطقه در چهار آیتم طبقهبندی شدند و مجموعه دادهها مطابق شکل زیر ساخته شدند. دزدی مغازه و دزدی از رختکن جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از دادههای سرقت در منطقه در چهار آیتم طبقهبندی شدند و مجموعه دادهها مطابق شکل زیر ساخته شدند.جدول 1 . سپس محیط تحلیل برای خوشهبندی k-modes با استفاده از Python 3.7.6 ساخته شد.
3.3.3. تنظیم بهینه K-Value
خوشهبندی K-modes بسته به مقدار k نتایج متفاوتی را برمیگرداند، و سپس لازم است آنالیز برای هر k تکرار شود تا یک k بهینهسازی پیدا شود که تابع هزینه آن حداقل مقدار را داشته باشد. در این مطالعه از روش زانویی برای دستیابی به مقادیر k استفاده شد و هر تحلیل مقدار k هزار بار تکرار شد. خوشه بندی K-modes در سه مرحله به شرح زیر اجرا شد:
-
k خوشه تصادفی را تعریف کنید.
-
فاصله مرکز خوشه و هر شی را محاسبه کنید و هر شی را به نزدیکترین مرکز خوشه نسبت دهید. همه اشیا به خوشه ها اختصاص داده می شوند و مرکز خوشه در جهتی حرکت می کند که فاصله بین هر شی و مرکز خوشه نزدیکتر شود.
-
اگر هر مرکز خوشه منتقل شده دارای مقدار نتیجه متفاوتی با مقدار مرکزی قبلی است، باید به مرحله 2 برگردید، تجزیه و تحلیل را دوباره اجرا کنید و این مرحله را تکرار کنید. اگر مقدار نتیجه آن با مقدار مرکزی قبلی یکسان باشد، تجزیه و تحلیل متوقف می شود.
3.4. تحلیل رگرسیون خطی چندگانه
3.4.1. تعریف
تجزیه و تحلیل رگرسیون خطی چندگانه برای استخراج عوامل محیطی قابل توجه برای هر خوشه برای تأیید تأثیرات فردی عوامل برای هر خوشه مشتق شده انجام شد. از برنامه آماری SPSS 18.0 برای تجزیه و تحلیل رگرسیون خطی چندگانه برای استخراج عوامل محیطی مهم استفاده شد.
در تجزیه و تحلیل رگرسیون خطی چندگانه، نوع سرقت (خوشه) به دست آمده از خوشه بندی، همانطور که در رابطه (3) نشان داده شده است، برای متغیر وابسته اعمال شد. Yک) عوامل محیطی محلی به متغیر مستقل وارد شد ( ایکسn، سپس ضریب ( بn) از هر متغیر و جمله ثابت ( آn) از مدل برآورد شد. عبارت k و n نشان دهنده متغیرهای ناشناخته است. فرضیه تأثیر متغیرهای مستقل تعیین شده در این تحقیق بر خوشه بندی به شرح زیر است. اگر در عوامل محیطی مربوط به هر خوشه تفاوت وجود داشته باشد و عوامل محیطی مرتبط بر نتایج خوشه بندی تأثیر داشته باشند، تأثیر عوامل محیطی بر هر خوشه متفاوت خواهد بود.
3.4.2. تنظیم متغیر
داده های کاربری زمین، تأسیسات و سن ساختمان از پورتال ملی زیرساخت داده های مکانی به دست آمده است. داده های کاربری اراضی دارای طبقه بندی های زیر بودند: منطقه مسکونی عمومی کلاس 1، منطقه مسکونی عمومی کلاس 2، منطقه مسکونی عمومی کلاس 3، منطقه شبه مسکونی، منطقه تجاری همجوار، منطقه تجاری توزیع، منطقه تجاری عمومی، منطقه سبز طبیعی، جاده و مناطق دیگر. مناطق مسکونی عمومی کلاس 1 شامل مناطق مسکونی کم ارتفاع است و نیاز به ایجاد یک محیط مسکونی مناسب دارند. مناطق مسکونی عمومی کلاس 2 شامل مسکن های سطح متوسط است و نیاز به ایجاد یک محیط مسکونی مناسب دارند. مناطق مسکونی کلاس 3 شامل ساختمان های متوسط و بلند برای یک محیط مسکونی راحت است. و مناطق شبه مسکونی به مکان هایی اطلاق می شود که برای رفاه ساکنان و حفظ محیط زیست سالم ضروری است. مناطق تجاری مجاور برای تامین مایحتاج و خدمات روزانه محله می باشد. مناطق تجاری توزیع برای بهبود توزیع در داخل و بین شهرها طراحی شده اند. و مناطق تجاری عمومی برای کارکردهای تجاری و تجاری عمومی وجود دارد. داده های تسهیلات در مجموع از 28 دسته اصلی تشکیل شده است و نتیجه زیر طبقه بندی مجدد بر اساس هدف واقعی استفاده است، یعنی 14 دسته: خانه های مستقل، خانه های آپارتمانی، امکانات تجاری، امکانات آموزشی و تحقیقاتی، امکانات عمومی، تجاری. تسهیلات، امکانات پزشکی، تسهیلات اقامتی، تسهیلات سالمندان، کارخانهها، انبارها، امکانات مرتبط با گورستان، ذخیره سازی مواد خطرناک، امکانات تصفیه و پارکینگ ها. با توجه به دادههای مربوط به ایستگاههای اتوبوس و ایستگاههای مترو، محدودههایی برای تعیین وجود جرایم در محدوده تعیین شد تا تأثیرات دقیق آنها مشخص شود. بر اساس مطالعات قبلی، برد برای ایستگاه های اتوبوس 100 متر و برای ایستگاه های مترو 200 متر تعیین شد.32 ، 33 ]. داده های مربوط به چراغ های خیابان و دوربین های مدار بسته از پلازای Open Data Plaza در سئول به دست آمد.
3.4.3. واحد تحلیل شبکه
واحدهای فضایی آماری نماینده شامل شبکه، منطقه خروجی سرشماری، ناحیه اداری و غیره است و در حال حاضر منطقه خروجی سرشماری و ناحیه اداری به طور گسترده مورد استفاده قرار میگیرند. با این حال، هنگام تقسیم فضا به منطقه خروجی سرشماری یا مناطق اداری، شکل و اندازه مناطق حاصل احتمالاً تغییر می کند زیرا نامنظم هستند و مرزها مطابق با تغییرات زمانی تنظیم می شوند. از طرف دیگر، از آنجایی که یک شبکه یک شکل و اندازه ثابت دارد، برخلاف آن دو واحد، اطلاعات آماری را می توان به طور عینی تخمین زد و انعطاف پذیری برای تغییرات در مقیاس های نقشه قابل اعمال است. 34 ].]. تحقیقات مربوط به تحلیل جرم عمدتاً از واحدهای ناحیه اداری برای تجزیه و تحلیل صحنههای جرم کلان استفاده میکند. بنابراین، از آنجایی که محدودیتهایی دارد که نمیتواند محیطهای خرد را منعکس کند، این مطالعه سعی دارد رابطه بین سرقت و عوامل محیطی را از منظر میکروسکوپی تحلیل کند.
این مطالعه استفاده از شبکه های شش ضلعی مشابه دایره ها را به دلایل زیر پیشنهاد می کند. اولاً، اگر محیط شهری به شش ضلعی شبیه به دایره تقسیم شود، کمترین خطر از دست رفتن داده ها وجود دارد. دوم، از طریق تجزیه و تحلیل مقایسه ای کاربری های زمین با مساحت مشابه، بهبودهایی در سازگاری، دقت و کارایی داده ها وجود دارد. سوم، شبکههای شش ضلعی نتایج بصری واضحتری نسبت به شبکههای شبکه نشان میدهند. 35]. شعاع 25 و 50 متر به ترتیب برای تحلیل رگرسیون برای تعیین اندازه شبکه شش ضلعی استفاده شد و شعاع 50 متر نتایج واضح تری را نشان داد. بنابراین، این مطالعه با استفاده از اطلاعات سیستم اطلاعات جغرافیایی، مناطق مورد نظر را با استفاده از یک شبکه شش ضلعی به شعاع 50 متر تقسیم کرد و سپس با وارد کردن دادههای عامل محیطی در هر سلول، آنالیز را انجام داد ( شکل 3 ).
3.5. شبکه های عصبی مصنوعی
یک شبکه عصبی مصنوعی (ANN) یک الگوریتم یادگیری ماشینی است که اولین بار توسط وارن مککالوچ و والتر پیتس ارائه شد. آنها یک مدل محاسباتی ساده از نحوه تعامل نورون های بیولوژیکی برای محاسبات پیچیده با استفاده از منطق گزاره ای ارائه کردند. برخلاف انتظار مردم، ANN نتوانست مشکل XOR را حل کند و در دهه 1990، با ظهور ماشین بردار پشتیبان (SVM) و دیگر الگوریتمهای یادگیری ماشینی با عملکرد خوب، ANN توجهی را به خود جلب نکرد. با این حال، با توسعه مدل شبکه عصبی عمیق (DNN) که یک مدل شبکه عصبی مصنوعی است که از چندین لایه پنهان بین لایههای ورودی و خروجی تشکیل شده است، امکان مدیریت حجم وسیعی از دادهها فراهم شد که برای آن استفاده نشده بود. تحلیل و بررسی؛36 ].
شکل 4 ساختار اصلی ANN را نشان می دهد و (4) معادله آن را نشان می دهد. R تعداد متغیرهای ورودی، S تعداد نورون های پنهان، p متغیر ورودی، b لایه پنهان است و w است.وزن است. وزن هر عنصر محاسبه شده به عنوان ورودی تابع فعال سازی استفاده می شود. خروجی از مجموع این مقادیر وزنی به دست می آید. به طور کلی، مطالعات قبلی از تابع سیگموئید به عنوان یک تابع فعال سازی استفاده می کردند. با این حال، تابع پدیده ناپدید شدن گرادیان را نشان می دهد که در آن اطلاعات موجود با گسترش شبکه عصبی به صفر همگرا می شود. علاوه بر این، تابع سیگموئید به زمان محاسبات اضافی نیاز دارد که یک تابع نمایی است. در تلاش برای رسیدگی به این چالش، تابع غیرخطی ReLU پیشنهاد شد. این تابع اطلاعات را از دست نمی دهد زیرا وقتی از مقدار آستانه فراتر می رود، مقدار ورودی را بدون هیچ تغییری خروجی می دهد و سرعت محاسبه با یک مقدار گرادیان ساده 0 یا 1 سریع است.37 ].
تنظیم پیکربندی گرهها و لایههای پنهان برای ایجاد یک مدل پیشبینی ANN بهینه بسیار مهم است، اما هیچ معیار یا روش روشنی برای این فرآیند وجود ندارد. بنابراین، لازم است مدل بهینه با کمترین مقدار MSE با هرچه بیشتر تلاش پیدا شود. حداقل تعداد گره ها و لایه های پنهان باید بیشتر از تعداد متغیرهای ورودی باشد و حداکثر تعداد برای آموزش مدل نباید از 2n+1 تجاوز کند. 38 ]]؛ n به تعداد متغیرهای ورودی اشاره دارد. در این تحقیق مدل هایی با حداقل یک تا حداکثر هفت لایه مورد بررسی قرار گرفت. همراه با تعداد لایهها، حداقل، میانه و حداکثر تعداد گرههای پنهان قرار بود در سه تا پنج مورد پردازش شوند و مدل بهینه با کمترین مقدار MSE بررسی شود. علاوه بر این، برای تأیید عملکرد مدل، این مطالعه سعی دارد هر عملکرد را با پیکربندی عوامل محیطی که دادههای ورودی هستند، به روشهای مختلف مقایسه کند. این مطالعه به دنبال مقایسه عملکرد مدل با استفاده از تمام عوامل محیطی به عنوان داده های ورودی و مدل با استفاده از تنها عوامل محیطی است که بر هر خوشه به عنوان داده ورودی از طریق تحلیل رگرسیون خطی چندگانه تأثیر می گذارد.
4. نتایج و بحث
4.1. دسته بندی جرم و جنایت
در نتیجه خوشهبندی k-modes، مشخص شد که معمولاً چهار نوع سرقت در منطقه دونگجاک وجود دارد. ارقام هر دسته در شکل 5 نشان داده شده استبرای تعریف انواع سرقت خوشه A نشان دهنده سرقت های دیگر (53٪) در تأسیسات تجاری (43٪) است که عمدتاً مردان (76٪) در عصر (62٪) را هدف قرار می دهد. روش های جرم شامل دزدی نفوذی (16%)، دزدی با ضربه زدن (19%)، سرقت مربوط به وسیله نقلیه (8%)، سرقت ترفند (4%) و سایر سرقت ها (53%) است. نسبت سایر دزدی ها و ضربه زدن به سرقت با نرخ های بالاتری نسبت به سایر خوشه ها ثبت شد. جنایات در عصر (62%) سه برابر بیشتر از زمان های دیگر رخ داده است. این را می توان به این معنا تفسیر کرد که در زمان ازدحام دزدی هایی صورت می گرفت زیرا جمعیت شناور زیادی در ساعات عصر با استفاده بیشتر از امکانات تجاری وجود داشت. خوشه B نشان می دهد سرقت از خانه (58٪) (76٪) عمدتاً زنان (71٪) را در طول صبح (50٪) هدف قرار می دهد. لازم به ذکر است که جرایم بیشتر در ساعات صبح رخ می دهد و سرقت نفوذی (76%) بیش از 8 برابر سایر روش های جرم بوده است. با توجه به این نتایج، می توان این گونه تفسیر کرد که با توجه به وجود سه دانشگاه در منطقه دونگجک به همراه بسیاری از آکادمی ها و قرائتخانه ها، بسیاری از مجرمان سرقت عمدتاً پس از مراجعه مردم به آکادمی، مطالعه و یا دانشگاه در صبح خانه های خالی را هدف قرار دادند. در مورد جنسیت قربانیان، قربانیان زن دو برابر قربانیان مرد بودند. هوانگ [ اتاق های مطالعه یا دانشگاه ها در صبح. در مورد جنسیت قربانیان، قربانیان زن دو برابر قربانیان مرد بودند. هوانگ [ اتاق های مطالعه یا دانشگاه ها در صبح. در مورد جنسیت قربانیان، قربانیان زن دو برابر قربانیان مرد بودند. هوانگ [39] دریافت که مزاحمان اغلب قربانیان زن را عمدا انتخاب می کردند. در میان دلایل این انتخاب، «آسانی کنترل» رایجترین دلیل بود که نشان میدهد آنها تصور میکردند که زنان اهداف آسانی برای کنترل هستند، حتی اگر در جریان جنایت با قربانیان مواجه شوند. این نتایج حاکی از آن است که جنسیت ساکنان نیز در انتخاب هدف جرم مزاحمان نقش داشته است. خوشه C نشان دهنده سرقت مربوط به وسیله نقلیه (65٪) و سرقت خیابانی (67٪) است که عمدتاً مردان (90٪) در سحر (49٪) را هدف قرار می دهد. در میان سرقتهای مربوط به وسیله نقلیه، سرقت موتورسیکلت بیشترین اتفاق افتاده است (24%). با توجه به بالا بودن نسبت “سپیده دم” و “سرقت خیابانی”، اغلب جرایم با هدف قرار دادن موتورسیکلت های پارک شده در خیابان در هنگام سحر رخ می داد، جایی که به دلیل تعداد کمی از رهگذران، نظارت طبیعی دشوار بود. قربانیان مرد (90 درصد) بیشتر از قربانیان زن در چنین جنایاتی بودند زیرا مردان دارای گواهینامه موتورسیکلت بیشتری نسبت به زنان بودند. بر اساس آمار سال 2015 دارندگان گواهینامه رانندگی در سئول که توسط آژانس پلیس کلان شهر سئول ارائه شده است، 90018 مرد و 1353 زن دارای گواهینامه برای وسایل نقلیه کوچک بودند. خوشه D سرقت های دیگری را نشان می دهد (78%) که بیشتر مردان (73%) را در بعدازظهر (74%) هدف قرار می دهند.
همانطور که ارقام برای هر آیتم طبقه بندی شده برای هر خوشه متفاوت بود، تایید شد که توزیع فضایی خوشه ها نیز دارای الگوهای متفاوتی است. بنابراین، از طریق تحلیل رگرسیون، رابطه بین خوشهها و عوامل محیطی منطقهای با جزییات بیشتری برآورد شد و عوامل محیطی معنیداری برای هر خوشه استخراج شد.
4.2. استخراج عوامل محیطی مهم
جدول 2 تجزیه و تحلیل رگرسیون خطی چندگانه را نشان می دهد که برای تأیید تأثیر متغیرهای عامل محیطی بر چهار نوع سرقت به دست آمده توسط خوشه بندی k-modes انجام شد. تعداد کل موارد 2965 بود و خلاصه مدل تحلیل رگرسیون خطی چندگانه در جدول 3 نشان داده شده است . هر چهار مدل رگرسیون از نظر آماری برازش دارند زیرا مقدار دوربین-واتسون نزدیک به 2 بود و نزدیک به 0 یا 4 نبود، بنابراین هیچ ارتباطی بین باقیماندهها وجود ندارد. توان توضیحی برای هر مدل 27.3٪ (A)، 22.3٪ (B)، 25.3٪ (C) و 16.2٪ (D) بود. f2 کوهن، که عموماً در تحلیل های آماری در زمینه علوم اجتماعی استفاده می شود، معیاری رایج برای محاسبه انواع مختلف اندازه اثر هنگام استفاده از آزمون F برای ANOVA و تحلیل رگرسیون چندگانه است. کوهن [ 40] پیشنهاد کرد که R2 = 0.02 به عنوان اندازه اثر کوچک در نظر گرفته شود، 0.13 نشان دهنده اندازه اثر متوسط، و 0.26 یک اندازه اثر بزرگ است. بنابراین، مدل های تحلیل رگرسیون چندگانه در این مطالعه همگی دارای مقادیری بین 0.16 تا 0.28 هستند که نشان می دهد مدل ها به اندازه کافی اعتبار دارند.
متغیرها شامل 10 متغیر کاربری اراضی، 17 متغیر تسهیلات، 2 متغیر تاسیسات امنیتی و متغیر سن ساختمان بودند. در مورد متغیرهای اسمی، تحلیل رگرسیون از طریق کدگذاری ساختگی انجام شد. قبل از تجزیه و تحلیل، یک آزمون چند خطی برای تأیید چند خطی بودن زمانی که همبستگی بین متغیرهای مستقل زیاد باشد، انجام شد. در نتیجه، از آنجایی که مقادیر VIF همه متغیرها کمتر از 10 بود، هیچ خط خطی بین متغیرها وجود نداشت.
در نتیجه تحلیل رگرسیون خطی چندگانه، عوامل محیطی مؤثر بر هر خوشه در جدول 4 نشان داده شده است. نتایج تجزیه و تحلیل دقیق را می توان در جدول A1 یافت. نتایج تجزیه و تحلیل نشان داد که تأثیر عوامل محیطی بر هر خوشه با توجه به فرضیهای که قبلاً ایجاد شده بود متفاوت است. اگر سطح معناداری pمقدار کمتر از 0.10 است، سطح اطمینان مربوطه 90٪ است، اگر کمتر از 0.05 باشد، 95٪ و اگر کمتر از 0.01 باشد، 99٪ است. در مورد متغیرهای پیوسته، زمانی که 1 افزایش می یابند، فرض می شود که با مقدار ضریب غیر استانداردسازی (B) بر ایجاد خوشه تأثیر می گذارند. متغیرهای رمزگذاری شده در مقایسه با گروه مرجع تحلیل می شوند.
در مجموع سه عامل محیطی بیشترین تأثیر را در هر خوشه داشتند. در خوشه A، تأسیسات تجاری (13.277) بیشترین تأثیر را نشان دادند و پس از آن منطقه تجاری عمومی (5.630) و منطقه مسکونی عمومی کلاس 3 (4.089) قرار گرفتند. در خوشه B، خانه های مستقل (9.538) بیشترین تأثیر را داشتند، پس از آن خانه های آپارتمانی (5.095) و امکانات تجاری (4.419) قرار گرفتند. در خوشه های C و D، امکانات تجاری (8.059، 7.042) بالاترین، پس از آن منطقه تجاری عمومی (7.880، 6.511) و امکانات پزشکی (5.514، 3.143) بودند. منطقه تجاری عمومی و امکانات تجاری و پزشکی در همه خوشه ها تأثیر داشتند. منطقه تجاری عمومی و تأسیسات تجاری تأثیرات زیادی را در همه خوشه ها نشان دادند، که نشان می دهد با وجود اینکه منطقه دونگجاک دارای مناطق تجاری کمتری بود (2. 1٪ از مناطق مسکونی، رویدادهای جرم و جنایت بیشتر در مناطق تجاری متمرکز شده است. مناطقی که دارای تسهیلات تجاری متمرکز هستند تا اواخر وقت دارای جمعیت شناور هستند و بر این اساس، درجه مشخصی از ناشناس بودن تضمین می شود، بنابراین جرم و جنایت مستعد وقوع است. علاوه بر این، مناطق تجاری در ناحیه دونگجاک دارای ساختمانهای بسیاری بود که امکانات تجاری و مسکونی در آنها ترکیب شده بود. کیم و همکاران [14 ] نشان داد که وقتی امکانات تجاری و سایر کاربریها با هم ترکیب میشدند، تعداد جرم و جنایت بیشتر بود. Stucky و Ottensmann [ 13 ] دریافتند که احتمال بیشتری برای جرائم جنایی عمده در مراکز پزشکی وجود دارد، زیرا در آنجا غریبه ها جمع می شوند، که از نتیجه زیر پشتیبانی می کند: این امکانات بیشترین تأثیر را در خوشه C داشتند (5.514).
4.3. مدل شبکه عصبی مصنوعی
این مطالعه یک مدل ANN برای چهار خوشه ایجاد کرد و عوامل محیطی را با تأثیرات در هر خوشه به عنوان متغیرهای ورودی برای تجزیه و تحلیل قرار داد. با توجه به متغیرهای اسمی، مدل ANN با گنجاندن گروه مرجع در متغیر ورودی پس از کدگذاری ساختگی ساخته شد. در مورد متغیرهای ورودی هر مدل خوشه ای بر اساس عوامل محیطی معنادار، خوشه A دارای 9 متغیر ورودی، خوشه B دارای 12، خوشه C دارای 8 و خوشه D دارای 5 متغیر بود. در مجموع، 1763 نقطه داده برای تجزیه و تحلیل استفاده شد: 1234. (70٪) داده برای آموزش، 264 (15٪) داده برای اعتبار سنجی، و 264 (15٪) داده برای آزمایش.
جدول 5 حالتی را نشان می دهد که در آن مدل بهترین عملکرد را در بین ترکیبات گره مطابق با شماره لایه مدل پیش بینی برای هر خوشه نشان داد. Min و Max به معنای حداقل و حداکثر تعداد مجموع لایه های پنهان و گره های پنهان است و لایه و نورون به ترتیب تعداد لایه های پنهان و گره های پنهان را نشان می دهد. در موردی که لایههای بیشتری از آنچه در جدول پیشنهاد شده وجود دارد، این نشاندهنده مشکل ناپدید شدن گرادیان است، به این معنی که نمیتوان از آن به عنوان یک مدل پیشبینی استفاده کرد. مشکل ناپدید شدن گرادیان به پدیدهای اشاره دارد که در آن گرادیان ناپدید میشود، زیرا خطا پس از چندین بار عبور از لایههای پنهان به میزان قابل توجهی کاهش مییابد که منجر به ناتوانی در آموزش مدل میشود.
شکل 7 مقادیر R آموزش، اعتبار سنجی و آزمون مدل را با بهترین عملکرد در بین مدل های پیش بینی خوشه A نشان می دهد. ارزش آموزش 0.54997، اعتبارسنجی 0.57652 و آزمون 0.69375 بود. مقدار MSE بود 106× 1.8745 و مدل DNN بهترین عملکرد را با دو لایه و هفت گره در مدل نشان داد.
شکل 8 مقادیر R آموزش، اعتبار سنجی و آزمون مدل را با بهترین عملکرد در بین مدل های پیش بینی خوشه B نشان می دهد. ارزش آموزش 0.42745، اعتبارسنجی 0.48754 و آزمون 0.36094 ارزش داشت. مقدار MSE بود 106× 0.9120، در حالی که مدل DNN بهترین عملکرد را با چهار لایه و شش گره در مدل نشان داد.
شکل 9 مقادیر R آموزش، اعتبار سنجی و آزمون مدل را با بهترین عملکرد در بین مدل های پیش بینی خوشه C نشان می دهد. ارزش آموزش 0.59363، اعتبارسنجی 0.50849 و آزمون 0.40477 ارزش داشت. مقدار MSE بود 106× 0.6586، در حالی که مدل DNN بهترین عملکرد را با دو لایه و هفت گره در مدل نشان داد.
شکل 10 مقادیر R آموزش، اعتبار سنجی و آزمون مدل را با بهترین عملکرد در بین مدل های پیش بینی خوشه D نشان می دهد. ارزش آموزش 0.39989، اعتبار سنجی 0.44619 و آزمون دارای ارزش 0.38010 بود. مقدار MSE بود 106× 0.3960، در حالی که مدل ANN بهترین عملکرد را با یک لایه و نه گره در مدل نشان داد.
جدول 6مقایسه عملکرد مدل ها را با تقسیم ویژگی های داده های ورودی به دو نوع نشان می دهد. نوع I مدلی است که از تمام داده های عامل محیطی به عنوان داده ورودی استفاده می کند، در حالی که نوع S مدلی است که تنها از عوامل محیطی استفاده می کند که بر هر خوشه به عنوان داده ورودی از طریق تحلیل رگرسیون خطی چندگانه تأثیر می گذارد. تعداد لایهها و نورونها برای همه انواع یکسان تنظیم شد تا تأثیرات غیر از دادههای ورودی کنترل شود. در نتیجه مقایسه دو نوع مدل، مدل Type S دقت بالاتری را نشان داد که در آن تنها عوامل محیطی مؤثر بر هر خوشه به عنوان داده ورودی از طریق تحلیل رگرسیون خطی چندگانه استفاده شد. نوع I با مشکل بیش از حد برازش مواجه شد زیرا تفاوت زیادی در نرخ پیشبینی بین مدلهای آموزشی و آزمایشی وجود داشت. بر اساس تحلیل تطبیقی دو نوع مدل، هنگامی که یک پیشبینی با عوامل محیطی مرتبط با جرم بهعنوان متغیر انجام میشود، تحلیل رگرسیون خطی چندگانه باید برای استخراج متغیرهای مهمی که به عنوان دادههای ورودی استفاده میشوند، ادامه یابد. به نظر می رسد این روش عملکرد مدل را بهبود می بخشد.
5. نتیجه گیری ها
این مطالعه از داده های سرقت در منطقه دونگجک از سال 2004 تا 2015 استفاده کرد و سپس آن جرم را طبقه بندی کرد. بر اساس عوامل محیطی محلی که بر جنایت تأثیر گذاشتند، یک مدل شبکه عصبی مصنوعی برای پیشبینی انواع سرقت که به احتمال زیاد در مناطق تصادفی رخ میدهند، پیشنهاد شد. ابتدا با استفاده از خوشهبندی k-modes، سرقت جرم در منطقه دونگجک طبقهبندی شد و در مجموع چهار نوع استخراج شد. علاوه بر این، با استفاده از تحلیل رگرسیون خطی چندگانه تأیید شد که هر طبقهبندی دارای عوامل محیطی متناظر متفاوتی است. مشخص شد که عوامل محیطی بسته به نوع سرقت، تأثیرات و اهمیت متفاوتی دارند. عوامل محیطی مشابه سطوح مختلفی از تأثیر را بر اساس انواع سرقت نشان دادند. این نتایج را می توان برای اتخاذ مناسب ترین اقدامات تاکتیکی برای هر نوع جرم در هنگام جلوگیری از سرقت مورد استفاده قرار داد. مدل پیشبینی توسعهیافته در مرحله پیشگیری از جرم این مطالعه به ما امکان میدهد تا انواع جرم سرقت را که به احتمال زیاد در یک منطقه خاص اتفاق میافتد پیشبینی کنیم و عوامل محیطی مؤثر بر وقوع نوع جرم را شناسایی کنیم. بنابراین، یک سیستم موثر پیشگیری از جرم می تواند ایجاد شود، زیرا مدل یک عامل محیطی را شناسایی می کند که باید در درجه اول برای هر نوع جرم بهبود یابد. مناطق با احتمال وقوع جرم بالا در خوشه A به اقدامات پیشگیرانه با تمرکز بر سایت های تجاری که در ساعات عصر فعال می شوند نیاز دارند. در حالی که مناطق با احتمال جرم بالا در خوشه B باید اقدامات پیشگیرانه ای را با هدف محافظت از خانه های خالی در مجتمع های مسکونی در برابر نفوذ صبحگاهی انجام دهند. مناطق با احتمال وقوع جرم در خوشه C باید اقداماتی را برای جلوگیری از سرقت های مرتبط با وسایل نقلیه که در خیابان های اطراف مناطق تجاری در سپیده دم رخ می دهد، آماده کنند، در حالی که مناطق با احتمال وقوع جرم در خوشه D به اقدامات پیشگیرانه، به ویژه برای مناطق تجاری نیاز دارند. که بعد از ظهر فعال می شوند.
این مطالعه از این جهت معنادار است که میتواند با ارائه روشهای مقابلهای مؤثر برای پیشگیری از جرم، به ایجاد مناطقی در امان از جرم کمک کند. از نظر جرم شناسی محیطی، به طور تجربی تأثیر عوامل محیطی بر وقوع سرقت را تحلیل کرد. استفاده از تکنیکهای آمار فضایی به کمک به سیاستگذاران کمک میکند تا به طور سیستماتیک کل الگوهای توزیع فضایی سرقتها در سطح محلی را درک کنند. به این ترتیب، همبستگی معنادار بین سرقت و عوامل محیطی محلی، ضرورت رویکرد جرمشناسی محیطی را برای پیشگیری از سرقت نشان میدهد.
با توجه به مدل پیشبینی نوع سرقت، برازش مدل از طریق مقایسه دو نوع مدل ارزیابی شد. مدل نوع I از کل داده های محیطی به عنوان داده ورودی استفاده می کند، در حالی که نوع S تنها از عوامل محیطی استفاده می کند که بر هر خوشه به عنوان داده ورودی با انجام تحلیل رگرسیون خطی چندگانه تأثیر می گذارد. در نتیجه مقایسه برازش مدلها، تأیید شد که مدل نوع S که با انجام تحلیل رگرسیون خطی چندگانه تنها از عوامل محیطی تأثیرگذار بر هر خوشه به عنوان داده ورودی استفاده میکرد، برازش بالاتری را نشان داد. به طور کلی، انتظار می رود که هر چه تعداد متغیرها بیشتر باشد، نرخ پیش بینی مدل بالاتر خواهد بود. اگرچه انتظار می رود که متغیرهای بیشتر منجر به همبستگی بیشتر بین متغیرها شود، احتمال مشکلات چند خطی زیاد است. همانطور که مدل پیچیده می شود، به احتمال زیاد مشکلات بیش از حد برازش دارد. بر این اساس، زمانی که یک مدل پیشبینی جرم با استفاده از عوامل محیطی در آینده اجرا میشود، در صورتی که عوامل پس از تأیید تأثیر عوامل محیطی فردی از طریق تحلیل رگرسیون خطی چندگانه بر روی مدل اعمال شوند، میتوان مدل پیشبینی با عملکرد بالاتر را پیادهسازی کرد. در مورد ترکیب مدل پیشبینی در این پژوهش، از آنجایی که میتوان عوامل تأثیرگذار را شناسایی کرد، میتوان اطلاعات مفیدی را نه تنها برای پیشبینی ساده نوع جرم، بلکه برای تهیه طرحهایی برای کاهش جرم ارائه کرد. همچنین به جای پیشبینی جرم، با استفاده از عوامل محیطی، جرایم خاص دستهبندی میشد. و همچنین تقسیمی از رابطه بین انواع مشتق شده و عوامل محیطی. در نهایت تنوع به روش های پیش بینی از طریق یک شبکه عصبی مصنوعی داده شد.
از آنجایی که جرم یک پدیده اجتماعی است که در آن عوامل متعددی از جمله عناصر فیزیکی، اجتماعی و اقتصادی به صورت ترکیبی عمل می کنند، این پژوهش با توجه به تجزیه و تحلیل جرم و در عین حال صرفاً بر عوامل محیطی محلی، دارای محدودیت هایی است. این مطالعه تنها متغیرهای عامل محیطی را مورد توجه قرار داده است زیرا یک مطالعه اساسی برای پیشبینی انواع سرقت با تایید رابطه بین این نوع و عوامل محیطی و با استفاده از عوامل به عنوان متغیر است. این معنادار است، زیرا این امکان را تعیین کرده است که مطالعات آتی می توانند مستحکم شوند و آنها را قادر می سازد تا با در نظر گرفتن عوامل مختلف مرتبط با جرم به عنوان متغیر، نتایج واضح تر و تجربی بیشتری بدست آورند. این مطالعه می تواند به عنوان یک مطالعه اساسی در هنگام انجام مطالعات پیچیده تر پیش بینی جرم با ادغام تمام جنبه های فیزیکی، اجتماعی،
بدون دیدگاه