تحقیقات پیش‌بینی جرم با استفاده از هوش مصنوعی به طور فعال برای پیش‌بینی جرایم احتمالی – به طور کلی، مکان‌های جرم یا جریان‌های سری زمانی انجام شده است. پیش بینی این جرایم بالقوه در صورتی امکان پذیر است که ویژگی های جرم مانند تکنیک های دقیق، اهداف و عوامل محیطی مؤثر بر وقوع جرم به طور همزمان در نظر گرفته شود. بنابراین، این مطالعه با هدف طبقه‌بندی سرقت با انجام خوشه‌بندی k-modes با استفاده از ویژگی‌های مرتبط با جرم به عنوان متغیرها و ارائه یک مدل ANN که طبقه‌بندی‌های مشتق شده را پیش‌بینی می‌کند، انجام می‌شود. از آنجایی که پیش‌بینی انواع سرقت به مردم اجازه می‌دهد تا ویژگی‌های احتمالاً متداول‌ترین سرقت‌ها را از قبل در مناطق تصادفی تخمین بزنند، استقرار کارآمد پلیس و مناسب‌ترین اقدامات تاکتیکی را ممکن می‌سازد. منطقه Dongjak به عنوان منطقه هدف برای تجزیه و تحلیل انتخاب شد. سرقت ها در منطقه چهار نوع خوشه را نشان داد. عوامل محیطی، عناصر نماینده مؤثر بر وقوع سرقت، به عنوان داده های ورودی برای یک مدل پیش بینی استفاده شد، در حالی که عوامل مؤثر بر هر خوشه از طریق تحلیل رگرسیون خطی چندگانه مشتق شدند. بر اساس نتایج، متغیرهای ورودی برای آموزش مدل ANN در هر خوشه انتخاب شدند و مدل برای پیش‌بینی نوع سرقت بر اساس عوامل محیطی پیاده‌سازی شد. این مطالعه برای ارائه تنوع به روش‌های پیش‌بینی با استفاده از ANN قابل توجه است. در حالی که عوامل موثر بر هر خوشه از طریق تحلیل رگرسیون خطی چندگانه استخراج شد. بر اساس نتایج، متغیرهای ورودی برای آموزش مدل ANN در هر خوشه انتخاب شدند و مدل برای پیش‌بینی نوع سرقت بر اساس عوامل محیطی پیاده‌سازی شد. این مطالعه برای ارائه تنوع به روش‌های پیش‌بینی با استفاده از ANN قابل توجه است. در حالی که عوامل موثر بر هر خوشه از طریق تحلیل رگرسیون خطی چندگانه استخراج شد. بر اساس نتایج، متغیرهای ورودی برای آموزش مدل ANN در هر خوشه انتخاب شدند و مدل برای پیش‌بینی نوع سرقت بر اساس عوامل محیطی پیاده‌سازی شد. این مطالعه برای ارائه تنوع به روش‌های پیش‌بینی با استفاده از ANN قابل توجه است.

کلید واژه ها:

شبکه عصبی مصنوعی ; خوشه بندی k-modes ; پیش بینی جرم ; شهر هوشمند ؛ امنیت شهری

1. مقدمه

با توسعه جامعه و فناوری علم، فناوری جرم و جنایت پیچیده تر می شود و آسیب های ناشی از جرم افزایش می یابد. با این حال، در شرایطی که جمعیت در یک منطقه خاص متمرکز شده و شهر به سرعت در حال تغییر است، پیشگیری یا واکنش به جرم آسان نیست. از این رو اقدامات مختلفی برای پیشگیری از وقوع جرم در حوزه شهرسازی به عنوان بخشی از طرح شهر هوشمند ارائه شده است. در کره، تلاش های مختلفی در حال انجام است. به عنوان مثال، یک سیستم پیوند برای ارائه اطلاعات تصویر دوربین مدار بسته به مرکز شهر هوشمند و مرکز موقعیت یابی وزارت دادگستری در حال ایجاد و پیاده سازی است و شبکه ایمنی شهر هوشمند مرتبط با سیستم ملی ایمنی در برابر بلایا نیز به عنوان پلتفرم یکپارچه شهر هوشمند علاوه بر این، مطالعات اخیر در زمینه پیش بینی جرم برای پیشگیری موثرتر از جرم به طور فعال در حال انجام است. جرم یک پدیده اجتماعی است که در آن عوامل متعددی مانند عناصر فیزیکی، اجتماعی و اقتصادی به صورت ترکیبی عمل می کنند. از آنجایی که عوامل جرم زا متعددی وجود دارد، همبستگی بین عوامل و جرایم خارج از محدوده درک انسان است. برای غلبه بر این محدودیت ها، هوش مصنوعی به طور فعال در تحقیقات جنایی، به ویژه در فعالیت های پیش بینی جرم با استفاده از داده کاوی استفاده می شود. داده کاوی تکنیکی است که تجربیات کاربر یا ذهنیت را در حجم زیادی از داده ها حذف می کند و قوانین، الگوها و همبستگی های آماری را کاملاً بر اساس داده ها شناسایی می کند. این ابزار قدرتمندی است که بازرسان جرم را قادر می‌سازد تا به سرعت و کارآمد در پایگاه‌های اطلاعاتی بزرگ حرکت کنند [ جرم یک پدیده اجتماعی است که در آن عوامل متعددی مانند عناصر فیزیکی، اجتماعی و اقتصادی به صورت ترکیبی عمل می کنند. از آنجایی که عوامل جرم زا متعددی وجود دارد، همبستگی بین عوامل و جرایم خارج از محدوده درک انسان است. برای غلبه بر این محدودیت ها، هوش مصنوعی به طور فعال در تحقیقات جنایی، به ویژه در فعالیت های پیش بینی جرم با استفاده از داده کاوی استفاده می شود. داده کاوی تکنیکی است که تجربیات کاربر یا ذهنیت را در حجم زیادی از داده ها حذف می کند و قوانین، الگوها و همبستگی های آماری را کاملاً بر اساس داده ها شناسایی می کند. این ابزار قدرتمندی است که بازرسان جرم را قادر می‌سازد تا به سرعت و کارآمد در پایگاه‌های اطلاعاتی بزرگ حرکت کنند [ جرم یک پدیده اجتماعی است که در آن عوامل متعددی مانند عناصر فیزیکی، اجتماعی و اقتصادی به صورت ترکیبی عمل می کنند. از آنجایی که عوامل جرم زا متعددی وجود دارد، همبستگی بین عوامل و جرایم خارج از محدوده درک انسان است. برای غلبه بر این محدودیت ها، هوش مصنوعی به طور فعال در تحقیقات جنایی، به ویژه در فعالیت های پیش بینی جرم با استفاده از داده کاوی استفاده می شود. داده کاوی تکنیکی است که تجربیات کاربر یا ذهنیت را در حجم زیادی از داده ها حذف می کند و قوانین، الگوها و همبستگی های آماری را کاملاً بر اساس داده ها شناسایی می کند. این ابزار قدرتمندی است که بازرسان جرم را قادر می‌سازد تا به سرعت و کارآمد در پایگاه‌های اطلاعاتی بزرگ حرکت کنند [ از آنجایی که عوامل جرم زا متعددی وجود دارد، همبستگی بین عوامل و جرایم خارج از محدوده درک انسان است. برای غلبه بر این محدودیت ها، هوش مصنوعی به طور فعال در تحقیقات جنایی، به ویژه در فعالیت های پیش بینی جرم با استفاده از داده کاوی استفاده می شود. داده کاوی تکنیکی است که تجربیات کاربر یا ذهنیت را در حجم زیادی از داده ها حذف می کند و قوانین، الگوها و همبستگی های آماری را کاملاً بر اساس داده ها شناسایی می کند. این ابزار قدرتمندی است که بازرسان جرم را قادر می‌سازد تا به سرعت و کارآمد در پایگاه‌های اطلاعاتی بزرگ حرکت کنند [ از آنجایی که عوامل جرم زا متعددی وجود دارد، همبستگی بین عوامل و جرایم خارج از محدوده درک انسان است. برای غلبه بر این محدودیت ها، هوش مصنوعی به طور فعال در تحقیقات جنایی، به ویژه در فعالیت های پیش بینی جرم با استفاده از داده کاوی استفاده می شود. داده کاوی تکنیکی است که تجربیات کاربر یا ذهنیت را در حجم زیادی از داده ها حذف می کند و قوانین، الگوها و همبستگی های آماری را کاملاً بر اساس داده ها شناسایی می کند. این ابزار قدرتمندی است که بازرسان جرم را قادر می‌سازد تا به سرعت و کارآمد در پایگاه‌های اطلاعاتی بزرگ حرکت کنند [ داده کاوی تکنیکی است که تجربیات کاربر یا ذهنیت را در حجم زیادی از داده ها حذف می کند و قوانین، الگوها و همبستگی های آماری را کاملاً بر اساس داده ها شناسایی می کند. این ابزار قدرتمندی است که بازرسان جرم را قادر می‌سازد تا به سرعت و کارآمد در پایگاه‌های اطلاعاتی بزرگ حرکت کنند [ داده کاوی تکنیکی است که تجربیات کاربر یا ذهنیت را در حجم زیادی از داده ها حذف می کند و قوانین، الگوها و همبستگی های آماری را کاملاً بر اساس داده ها شناسایی می کند. این ابزار قدرتمندی است که بازرسان جرم را قادر می‌سازد تا به سرعت و کارآمد در پایگاه‌های اطلاعاتی بزرگ حرکت کنند [1 ].
یک روش طبقه بندی برای پیش بینی رویدادهای جرم بالقوه در زمان ها و مناطق خاص، از طریق خوشه بندی، که نوعی تکنیک داده کاوی است، استفاده می شود. خوشه‌بندی به گروه‌بندی داده‌ها با ویژگی‌های مشابه و طبقه‌بندی کل مجموعه داده‌ها به چند خوشه، یعنی طبقه‌بندی اشاره دارد. در صورتی که جرایم با در نظر گرفتن همزمان چند دسته فرعی مانند مکان، زمان و نحوه وقوع جرم دسته بندی شوند، می توان به مشخصات جزئی هر جرم پی برد. پیش‌بینی دقیق‌تر جرم در صورتی امکان‌پذیر است که بازرسان جرم بتوانند انواع خاصی از رویدادهای جرم را در مناطق خاص و در زمان‌های خاص پیش‌بینی کنند. با این حال، در حالی که طبقه بندی به رهبری انسان از نظر در نظر گرفتن چندین عامل به طور همزمان محدودیت هایی دارد. طبقه بندی عینی به دلیل تفسیر ذهنی محققین غیرممکن است. از سوی دیگر، خوشه‌بندی محققین را قادر می‌سازد تا چندین عامل را به‌طور عینی طبقه‌بندی کنند، از آنها به عنوان متغیر استفاده کنند و در نهایت به طور عینی جرایم را دسته‌بندی کنند. در تحقیقات مرتبط با جرم، خوشه‌بندی عمدتاً برای تجزیه و تحلیل نقاط وقوع جرم و جنایت، عمدتاً با خوشه‌بندی مکان‌های جرم یا جریان‌های سری زمانی استفاده می‌شود.2 ، 3 ]، در حالی که الگوهای مشتق شده از خوشه بندی برای شناسایی روند جرم استفاده می شود [ 4 ].
طبقه‌بندی جرم بر اساس مکان‌های جرم یا جریان‌های سری‌های زمانی یک اقدام اساسی برای پیشگیری از جرم است و می‌توان آن را در روش‌های مختلف پیش‌بینی اضافی اعمال کرد. ویژگی‌های جرم، مانند تکنیک‌های دقیق، اهداف و عوامل محیطی مؤثر بر وقوع آن، الگوهای جرم متفاوتی از اهداف جرم، نقشه‌های جنایت و نقشه‌های فرار را حتی برای انواع مشابه جرم نشان می‌دهند. بنابراین از نظر پیش‌بینی جرم، می‌توان الگوهای جرم را با جزئیات و وضوح بیشتری بر اساس مکان، تاریخ و زمان وقوع جرم و ویژگی‌های هر جرم پیش‌بینی کرد.
این مطالعه یک مدل شبکه عصبی مصنوعی را پیشنهاد می‌کند که انواع جرم واقعی را با دسته‌بندی جرایم خاص از طریق خوشه‌بندی پیش‌بینی می‌کند. علاوه بر پیش‌بینی مکان‌های جرم و جریان‌های سری زمانی، پیش‌بینی انواع جرم خاص به عنوان روشی برای پیش‌بینی جرم پیشنهاد می‌شود. اگر جنایات پس از استفاده از عناصر مرتبط با جرم به عنوان متغیر و خوشه‌بندی، دسته‌بندی شوند و اگر داده‌های نوع جرم مشتق‌شده در یک مدل شبکه عصبی مصنوعی آموخته شوند، می‌توان مدلی را توسعه داد که بتواند نوع جرم را پیش‌بینی کند. از آنجایی که پیش‌بینی نوع جرم به افراد اجازه می‌دهد تا ویژگی‌های متداول‌ترین جنایات را در مناطق تصادفی از قبل تعیین کنند، استقرار کارآمد پلیس و مناسب‌ترین اقدامات تاکتیکی را ممکن می‌سازد.
برای پیش بینی انواع جرم باید عوامل موثر بر وقوع جرم را یافت. از زمان فیلم «فضای قابل دفاع» اسکار نیومن [ 5] این امکان را ارائه کرد که می توان از طریق طراحی شهری از وقوع جرم جلوگیری کرد، تحقیقات در مورد جرم شناسی محیطی با تمرکز بر عوامل محیطی در جوامع، نه مجرمان، در یافتن عوامل جرم زا افزایش یافته است. به طور خاص، جرم شناسی محیطی عمدتاً بر یک محیط فضایی در میان عوامل محیطی مؤثر بر رویدادهای جرم تمرکز دارد. نظریه الگوی جرم، یکی از مبانی نظری جرم شناسی محیطی، به تعاملات بین محیط اطراف و تصمیمات محل وقوع جرم مجرمان مربوط می شود. این نظریه بر اهمیت استفاده از زمین و امکانات، درک الگوهای جرم و جنایت و شناسایی امکاناتی که بر وقوع جرم تأثیر می‌گذارند، تأکید می‌کند [ 6 ]]. علاوه بر این، در نظریه پیشگیری از جرم از طریق طراحی محیطی که توسط جفری [بر اساس جرم‌شناسی محیطی، چراغ‌های خیابان و دوربین‌های مداربسته از عوامل مهم نظارت طبیعی هستند که وقوع جرم را کاهش می‌دهند. مطالعات قبلی که اثرات عوامل محیطی محلی را بر میزان وقوع جرم و جنایت بر اساس چنین نظریه‌هایی تجزیه و تحلیل کردند، نشان دادند که ویژگی‌های فضایی خاص و محیط‌های همسایگی (تاسیسات، دوربین‌های مدار بسته و غیره) بر نرخ وقوع جرم تأثیر می‌گذارند [ 8 ].
این مطالعه سرقت را از میان پنج نوع جرم مورد هدف قرار داد، زیرا این نوع بیشتر از محیط های مجاور متاثر می شود. جنایاتی مانند قتل و تجاوز به شدت تحت تأثیر احساسات شخصی بین مجرمان و قربانیان قرار دارند زیرا هدف افراد خاص هستند. از سوی دیگر، سرقت بیشتر تحت تأثیر محیط های مجاور و ویژگی های رفتاری مجرمین قرار می گیرد تا احساسات شخصی، زیرا اهداف جرم ساختمان ها یا اشیاء خاصی هستند [ 9 ].]. با این وجود، هنوز مطالعات تحلیل فضایی کافی در مورد جرایم خاص مانند سرقت وجود ندارد و همچنین لازم است که جرایم در محیط کره جنوبی تجزیه و تحلیل شود. بر این اساس، این پژوهش تلاش می‌کند تا تفاوت‌های منطقه‌ای مکان‌های سرقت را در یک بافت فضایی برآورد کند و با توجه به تمرکز این تحقیق بر عوامل محیطی، اتخاذ رویکرد جرم‌شناسی محیطی نسبت به سرقت در نظر گرفته می‌شود.
در نهایت، این پژوهش به دسته‌بندی سرقت از طریق خوشه‌بندی با توجه به ویژگی‌های مختلف جرم به طور همزمان پرداخته است. بر اساس عوامل محیطی محلی که بر سرقت تأثیر می‌گذارند، این مطالعه یک مدل ANN را پیشنهاد می‌کند که می‌تواند انواع سرقت‌هایی را که به احتمال زیاد در مناطق تصادفی رخ می‌دهند، پیش‌بینی کند. به جای پیش‌بینی جرایم صرفاً با استفاده از عوامل محیطی، جرایم خاص را دسته‌بندی می‌کند و روابط بین طبقه‌بندی‌های مشتق شده و عوامل محیطی را تقسیم می‌کند و در نتیجه به روش‌های پیش‌بینی با استفاده از ANN تنوع می‌دهد. این تجزیه و تحلیل به سیاستگذاران امکان می دهد تا انواع سرقت هایی را که به احتمال زیاد در مناطق تصادفی رخ می دهد استخراج کنند، پرسنل پلیس را به طور مؤثر مستقر کنند و مناسب ترین اقدامات تاکتیکی را انجام دهند. علاوه بر این، اگر ویژگی های محلی موثر بر سرقت شناسایی شود،

2. پیشینه نظری

2.1. جرم و جنایت و محیط زیست

جرم شناسی زیست محیطی نظریه ای است که در آن جرم ناشی از چهار عامل «قوانین، اشیاء، مجرمان و مکان ها» است. به ویژه، “موقعیت ها” را به عنوان عامل مهم در نظر می گیرد [ 10]. نظریه الگوی جرم، یکی از مبانی نظری جرم‌شناسی محیطی، مکان‌های جرم را این گونه تعریف می‌کند: «مکان‌هایی که سرنخ‌های محیطی را ارائه می‌دهند که معیارهای مجرمانی را که ویژگی‌های مکان‌های جرم مناسب را آموخته‌اند، برآورده می‌کنند». عوامل ایجاد و بازدارندگی جرم و عوامل انتخاب هدف بر اساس انواع منطقه، شبکه های خیابانی، مکان ساختمان، سطوح اقتصادی و قابلیت نظارت برای شناسایی الگوهای وقوع جرم دسته بندی می شوند. این نظریه نحوه تعامل رفتارهای انسان با محیط را برای ایجاد الگوهای رویداد جرم توصیف می کند و به طور کلی بر اهمیت انواع کاربری و امکانات زمین تاکید می کند. برخی از کاربری‌ها و امکانات با فعالیت‌های روزانه مردم مرتبط است و تعداد و نوع استفاده‌کنندگان از آن‌ها بر وقوع جرم تأثیر می‌گذارد. از این رو،11 ].
کاربری زمین یک اصطلاح چتر برای فعالیت های کاربری زمین توسط انسان است. این به انتخاب فضا برای فعالیت های روزانه افراد مربوط می شود و می توان آن را به عنوان فعالیت های مختلف افراد در زمین با ساختارهای فیزیکی خاص یا به عنوان اشکال خاصی از استفاده از قبیل انواع، اهداف و تراکم برای تطبیق فعالیت ها در نظر گرفت [ 12 ]. از آنجایی که فعالیت های مجرمانه در کاربری ها رخ می دهد، تحلیل ویژگی های وقوع جرم مرتبط با کاربری زمین ضروری است. مطالعات قبلی در مورد رابطه بین جرم و کاربری زمین بر اساس جرم شناسی محیطی [ 13] انجمن را تجزیه و تحلیل کرد و دریافت که کاربری های خاص زمین بر وقوع جرم تأثیر می گذارد. به طور خاص، زمین های تجاری و مناطق مسکونی با تراکم بالا به شدت با وقوع جرم مرتبط بودند، در حالی که گورستان ها، رودخانه ها و سایت های کارخانه ارتباط کمتری با وقوع جرم داشتند. این نشان می‌دهد که همه کاربری‌های غیر مسکونی ارتباط زیادی با جرم و جنایت ندارند. مطالعات در مورد رابطه در کره جنوبی نیز بیشتر بر اساس نظریه جرم شناسی محیطی است. در مطالعه ای توسط کیم، یون و آن [ 14]، چهار منطقه در سئول برای تجزیه و تحلیل همبستگی بین کاربری زمین و تراکم جرم مورد هدف قرار گرفتند و تأیید کردند که احتمالات مختلف وقوع جرم بر اساس کاربری زمین وجود دارد. علاوه بر این، نتایج آنها نشان داد که تراکم جرم نسبتاً کمتر بود زمانی که منطقه یک نوع کاربری خاص را نشان داد، در حالی که تراکم زمانی که کاربری های مخلوط وجود داشت بیشتر بود. با این حال، محدودیتی وجود داشت که این مطالعه به تحلیل همبستگی محدود شد. لی [ 15] رابطه فضایی بین کاربری زمین و فراوانی جرم را از طریق تحلیل خوشه‌ای شاخص‌های همبستگی دو متغیره نشان داد. نتایج تأیید کرد که عوامل فضایی تأثیر قابل‌توجهی بر همبستگی بین کاربری زمین و جرم داشتند و همبستگی وقوع جرم با مناطق مسکونی با خانه‌های آپارتمانی بیشتر از سایر کاربری‌ها بود. اگرچه مشخص است که میزان جرم و جنایت در سایت‌های تجاری بالاتر است، اما مشخص شد که اگر جرایم در مناطق مسکونی با خانه‌های آپارتمانی شروع شود، احتمال زیادی وجود دارد که جرایم خوشه‌ای شوند در حالی که وقوع آنها گسترش می‌یابد. با این حال، مطالعه با استفاده از تعداد وقوع جرم به عنوان یک متغیر بدون طبقه‌بندی انواع جرم محدود می‌شود.
تسهیلات، مانند کاربری‌ها، ساختارهای فیزیکی هستند که فضایی را برای زندگی روزمره در اختیار افراد قرار می‌دهند و تعداد و نوع استفاده‌کنندگان بر وقوع جرم تأثیر می‌گذارند. مطالعات قبلی در مورد این انجمن نشان داده است که بسیاری از امکانات بر وقوع جرم تأثیر می گذارد. به طور خاص، از آنجایی که ساکنان محلی و بسیاری از افراد خارجی از امکانات تجاری استفاده می کنند، به دلیل جمعیت شناور زیاد، برای متخلفان آسان است که بدون شناسایی به اهداف نزدیک شوند [ 13 ]. چندین مطالعه در حال انجام در مورد تأثیر مدارس، یک مرکز آموزشی و پژوهشی نماینده، بر وقوع جرم وجود دارد، که نشان می‌دهد که آنها عمدتاً تأثیر زیادی دارند. گوویس رومن [ 16 ] دریافت که مناطق نزدیک به مدارس میزان جرم و جنایت بالاتری نسبت به سایر مناطق مسکونی نشان می دهند، در حالی که Kaut و Roncek [ 17 ]] همچنین نشان داد که وجود مدارس بر فراوانی جرم در محله تأثیر می گذارد. انگستاد [ 18 ] تعداد جرایم در یک منطقه با هتل ها را با تعداد جنایات مشابه در یک منطقه مجاور بدون هتل مقایسه کرد. تعداد جرایم بسته به تعداد ساکنان منطقه استاندارد شد و نتایج نشان داد که وجود هتل ها بر وقوع جرم تأثیر می گذارد. ایستگاه‌های حمل‌ونقل عمومی مکان‌هایی هستند که ساکنان محلی و بسیاری از افراد خارجی از آن عبور می‌کنند و افراد مختلفی را به منطقه اطراف جذب می‌کنند. بنابراین، مکان‌ها به‌عنوان امکانات جرم‌زا شناخته می‌شوند، زیرا تعداد زیادی از افراد مست یا کسانی که با محیط اطراف آشنا نیستند را جذب می‌کنند، بنابراین به اهداف آسانی برای مجرمان تبدیل می‌شوند [ 6 ]. بلاک و دیویس [ 19] غلظت جرم و جنایت را در خیابان ها در فاصله یک بلوک و نیم از ایستگاه های مترو شیکاگو تعیین کرد. Block and Block [ 20 ] همچنین الگوهای مشابهی را در اطراف ایستگاه متروی برانکس یافتند. سطح قدیمی این تسهیلات، یعنی گروه های سنی ساختمان ها نیز بر وقوع جرم تأثیر می گذارد. مناطق با گروه های سنی بالاتر ساختمان ها عموماً زیبایی شناسی ضعیفی در اطراف خیابان ها و ساختمان های خود دارند. چنین خرابی مسکن ترس از جرم را در میان ساکنان محلی افزایش می دهد و به یک عامل اصلی در وقوع جرم تبدیل می شود [ 21 ].
از آنجایی که تسهیلاتی که نرخ جرم را افزایش می‌دهند و تسهیلات پیشگیری از وقوع جرم که برای پیشگیری از جرم تعبیه شده‌اند، متعلق به عوامل محیطی محلی هستند، این مطالعه سعی دارد بررسی کند که آیا آنها بر وقوع جرم در واقعیت تأثیر می‌گذارند یا خیر. دوربین مدار بسته می‌تواند صحنه‌های جرم و جنایت را بگیرد و فرصتی برای استقرار مناسب پرسنل امنیتی یا پلیس فراهم کند. بسیاری از مطالعات اثرات عملی دوربین مدار بسته را ثابت کرده اند. Brandon C. Welsh [ 22 ] اثرات دوربین مدار بسته بر جرم و جنایت در مکان های عمومی را تجزیه و تحلیل کرد و دریافت که به کاهش میزان جرم و جنایت در مناطق آزمایشی کمک می کند. نصب موثر دوربین مدار بسته در پارکینگ ها منجر به کاهش جرم و جنایت 51 درصدی شد. 23 درصد از نصب در وسایل حمل و نقل عمومی؛ و 7 درصد در خانه های آپارتمانی. فیلیپس [ 23] بررسی کرد که آیا دوربین مداربسته در کاهش وقوع جرم مؤثر است یا خیر و دریافت که سرقت کمتری در مناطق خاصی که دوربین مداربسته نصب شده است وجود دارد. چراغ های خیابانی به دلیل اینکه روشی مقرون به صرفه و کارآمد برای کاهش جرایم هستند، عنصری ضروری برای پیشگیری از وقوع جرم محسوب می شوند. در واقع، خو و همکاران. [ 24 ] رابطه بین تراکم نور خیابان و وقوع جرم را تأیید کرد، و تأیید کرد که هر چه اولی بالاتر باشد، دومی کمتر است.

2.2. دسته بندی جرایم

این مطالعه مطالعات مرتبط قبلی را مورد بررسی قرار داد تا مشخص شود که آیا طبقه بندی جرم عملاً در پیشگیری از جرم مفید است یا خیر. طبقه بندی یک تکنیک داده کاوی است که برای تجزیه و تحلیل الگوهای جرم و جنایت و همچنین یکی از رایج ترین تکنیک های اصلی مورد استفاده قرار می گیرد. استخراج اطلاعات معنی دار از داده های در مقیاس بزرگ امکان پذیر است که می تواند به طور موثر برای پیش بینی انواع تعریف نشده جرم مورد استفاده قرار گیرد. چنین پتانسیل و اثربخشی به تحقیقات بیشتر در مورد طبقه بندی جرایم کمک می کند و بیشتر مطالعات بر تجزیه و تحلیل تغییرات زمانی و مکانی جرم از طریق طبقه بندی متمرکز شده اند. ناکایا و یانو [ 3] تایید کرد که گستره جغرافیایی و مدت جرایم سرقت و فرار در شهر کیوتو بین سال‌های 2003 و 2004 می‌تواند به طور همزمان از طریق خوشه‌بندی تجسم شود. علاوه بر این، همبستگی بین خوشه های زمانی با استفاده از تخمین تراکم هسته مکانی-زمانی (STKDE) و آمار اسکن فضا-زمان (STSS) به صورت موازی پیدا شد. در نتیجه، خوشه‌های گذرا وجود داشتند که به طور متناوب بین دو خوشه ایجاد می‌شدند، به این معنی که یک پدیده جابه‌جایی وجود داشت که در آن مجرمان مناطق دارای وقوع جرم را به عنوان مناطق هدف جرم انتخاب کردند. بر اساس این نتایج، مطالعه به این نتیجه رسید که تجزیه و تحلیل داده‌های فضا-زمان خوشه‌ها در «استخراج دانش جدید اپیدمیولوژی جرم» ارزشمند است. پارک [ 25] از تکنیک خوشه‌بندی K-means به عنوان روشی برای تجزیه و تحلیل الگوهای فضایی داده‌های جرم و توزیع فضایی کانون‌های جرم استفاده کرد. در نتیجه استخراج 10 خوشه برای هر سال از سال 2000 تا 2002، مشخص شد که اندازه و الگوی خوشه ها شباهت بالایی داشته و مکان های جرم نشان دهنده الگوهای فضایی مشابه در دوره مشخص شده است. فاکتورهای حاصل دیجیتالی شدند و در نهایت نقشه پیش‌بینی جرم اجرا شد. انتظار می رفت این نقشه در کنار توزیع کارآمد نیروی پلیس به پیشگیری از وقوع جرم کمک کند، با این مفهوم که در صورت انجام تحلیل مقایسه ای با داده های جرم جمع آوری شده در آینده، دقت نقشه بهبود می یابد. اگرچه مطالعات کمی برای دسته بندی جرم در کره جنوبی انجام شده است، برخی از تحقیقات تأثیر محیط فیزیکی را در ارتباط با انواع جرم و زمان وقوع جرم مورد تجزیه و تحلیل قرار داده اند. کواک و همکاران [26] پیش بینی کرد که انتظار می رود عوامل محیطی بسته به نوع جرم و زمان وقوع جرم، مانند روز و شب، تأثیرات متفاوتی بر وقوع جرم داشته باشند. آنها این تأثیرات را بر اساس آن عوامل تجزیه و تحلیل کردند و دریافتند که تأثیر تراکم هر نوع کاربری ساختمان بر وقوع جرم در شب بیشتر از روز است. به طور خاص، مناطق با امکانات کارخانه متمرکز از نظر وقوع جرم در طول روز اهمیتی نداشتند، اما چنین اهمیتی در شب نشان داده شد. مشخص شد که این فقط روی سرقت ها تأثیر بیشتری دارد، نه بر همه جرایم. به این ترتیب، مشخص شد که عوامل محیطی شهری بر حسب نوع جرم و زمان وقوع جرم، روابط تأثیرگذاری متفاوتی دارند.

2.3. پیش‌بینی جرم با استفاده از ANN

شبکه عصبی مصنوعی (ANN) یک روش پردازش داده منحصر به فرد است که به طور مداوم توسعه یافته است و یک الگوریتم یادگیری آماری است که رابطه نگاشت بین سیگنال های ورودی و خروجی را با استفاده از مدلی الهام گرفته شده از نحوه پاسخ بیولوژیکی مغز به محرک های حسی تقریبی می کند. ANN به عنوان یک مدل پیش‌بینی جرم در تحقیقات جنایی مورد استفاده قرار گرفته است و دقت بالایی را نشان می‌دهد. مطالعه محمود و همکاران [ 27 ] Crimecast را معرفی کردند، یک سرویس پیش‌بینی جرم و هدایت استراتژی که یک مدل ANN را با استفاده از متغیرهایی مانند نرخ جرم، مکان جرم، تاریخ جرم، نوع جرم و غیره اتخاذ کرد و ثابت کرد که مدل دقت بالایی دارد کانگ و کانگ [ 28] همچنین یک مدل پیش‌بینی جرم را با استفاده از عوامل محیطی مبتنی بر مدل ANN توسعه داد و دقت یک ANN را با استفاده از عوامل محیطی نشان داد. این مطالعات قبلی نشان داد که ANN یک مدل پیش‌بینی مناسب برای جرایم است.

3. روش تحقیق و طرح تحقیق

3.1. روش های پژوهش

در این مطالعه، به جای پیش‌بینی جرایم صرفاً با استفاده از عوامل محیطی، جرایم خاص دسته‌بندی می‌شوند و روابط بین دسته‌بندی‌های مشتق‌شده و عوامل محیطی تقسیم‌بندی می‌شوند، در نتیجه روش‌های پیش‌بینی با استفاده از ANN متنوع می‌شوند ( شکل 1 ).شکل 2جریان این مطالعه را به تصویر می کشد. ابتدا، پس از پیش پردازش داده های سرقت در منطقه دونگجاک، خوشه ها با استفاده از خوشه بندی k-modes استخراج شدند. پس از انجام تحلیل رگرسیون خطی چندگانه با استفاده از خوشه های مشتق شده و داده های عامل محیطی منطقه، عوامل محیطی مؤثر بر هر خوشه استخراج شد. یک مدل ANN با استفاده از عوامل تأثیرگذار در هر خوشه به عنوان داده ورودی ساخته شد و مدلی که خوشه‌ها را پیش‌بینی می‌کرد، پیاده‌سازی شد. در نهایت، این مطالعه عملکرد مدل را با استفاده از تمام عوامل محیطی به عنوان داده های ورودی با مدل با استفاده از عوامل محیطی با اهمیت برای هر خوشه به عنوان داده ورودی مقایسه کرد. هر تحلیل رگرسیون و ساخت مدل پیش‌بینی برای هر خوشه برای استخراج عوامل دقیق و ساخت مدل‌های پیش‌بینی انجام شد.

3.2. منطقه هدف تحقیق

یک منطقه در سئول، کره جنوبی، به عنوان سایت هدف برای تجزیه و تحلیل انتخاب شد. سئول دارای محیط فیزیکی پیچیده و تراکم جمعیت بالاتری نسبت به سایر مناطق است. ارزش کلان داده زمانی افزایش می‌یابد که ویژگی‌های داده متنوع‌تر، پیچیده‌تر و گسترده‌تر باشند. نتایج تحقیقات پیچیده تری را می توان با تجزیه و تحلیل محیط فیزیکی سئول انتظار داشت. این مطالعه منطقه دونجاک را به عنوان محل تجزیه و تحلیل در میان بسیاری از مناطق در سئول انتخاب کرد. دوره تجزیه و تحلیل از سال 2004 تا 2015، که در آن ساختار داده های مناسبی برای مطالعه وجود دارد، متغیر بود. در سال 2015، منطقه دونگجاک از نظر ایمنی در رتبه 18 از 25 منطقه در سئول قرار گرفت. لی و کیم [ 29] فراوانی پنج جنایت خشونت‌آمیز ثبت شده 792260 بار در سئول از سال 2005 تا 2011 را تجزیه و تحلیل کرد و رتبه‌بندی خطر جرم در 25 منطقه در سئول را با استفاده از “شاخص نقطه داغ جنایت” که خود توسعه داده بود محاسبه کرد. اصطلاح “نقطه داغ” در این مطالعه به شاخصی اشاره دارد که فراوانی پنج جرم را در هر 1 تجزیه و تحلیل می کند. کمتر2در داخل منطقه؛ اگر بیش از 105 حمله، 0.3 قتل، 1.6 سرقت، 69.7 مورد سرقت یا 0.6 جرم جنسی در سال وجود داشته باشد، منطقه به عنوان کانون طبقه بندی می شود و به هر بخش جرم یک امتیاز اختصاص می یابد. هر چه امتیاز بالاتر باشد، منطقه خطرناک تر است. مناطق خودمختار با سطح ایمنی پایین تر، عمدتاً مناطق سرگرمی متمرکز بودند. از سوی دیگر، منطقه دونگجاک یک منطقه مسکونی معمولی متراکم با یک منطقه تجاری (2.1٪) است که در بین 25 منطقه خودمختار سئول رتبه 24 را دارد، اما نرخ جرم و جنایت بالاتری را نسبت به سایر مناطق نشان داد. به ویژه، با توجه به روند وقوع جرم در این ولسوالی برای سه سال 1390 تا 1393، سرقت حاکی از بیشترین افزایش در بین پنج جنایت خشن بوده است.

3.3. خوشه بندی

3.3.1. تعریف

خوشه بندی یکی از انواع تکنیک های داده کاوی است که در زمینه های مختلف مانند رسانه و بازاریابی مورد استفاده قرار می گیرد. معرف ترین تکنیک خوشه بندی، خوشه بندی k-means است که توسط مک کوین در سال 1967 پیشنهاد شد. این روش یک روش خوشه بندی است که در آن داده هایی با ویژگی های مشابه خوشه بندی می شوند، مناسب ترین مقادیر مرکزی را پیدا می کنند و گروه بندی هایی با ویژگی های مشابه ایجاد می کنند. با این حال، این روش فقط برای داده های پیوسته با مقادیر مشخصه کمی قابل استفاده است. از آنجایی که این مطالعه خوشه‌بندی را با استفاده از داده‌های مرتبط با جرم انجام داد، خوشه‌بندی k-means روش مناسبی نبود. بیشتر داده های مقیاس بزرگ از داده های کمی و طبقه ای تشکیل شده اند. بنابراین، استفاده از یک روش خوشه‌بندی برای هدف قرار دادن داده‌های طبقه‌بندی برای خوشه‌بندی مقادیر زیادی از داده‌ها ضروری است [ 30 ]. هوانگ [31 ] خوشه‌بندی k-modes را به عنوان یک روش خوشه‌بندی با هدف قرار دادن داده‌های طبقه‌بندی پیشنهاد کرد. این روش برای داده های طبقه بندی شده قابل استفاده است. یعنی داده های متشکل از متغیرهای اسمی در حالی که ساختار اولیه خوشه بندی k-means حفظ می شود.

خوشه‌بندی K-modes شباهت‌های داده‌های طبقه‌بندی را محاسبه می‌کند که شامل یک «تابع فاصله» است که فاصله بین اشیاء را اندازه‌گیری می‌کند و یک «تابع هزینه» که تحلیل را بهینه می‌کند. مجموعه شی X متشکل از متغیرهای اسمی است D، در حالی که تعداد ایکسn است. معادله به صورت زیر است: D=ایکس1،ایکس2،…،ایکسn1≤من≤n. اگر شی ایکس1دارد متر(تعداد) متغیرهای اسمی، معادله به شرح زیر است: ایکسمن=ایکسمن،1،ایکسمن،2،…،ایکسمن،n1≤j≤متر. معادله ز=ز1،ز2،…،زک( 1≤j≤ک)مجموعه ای از ک(تعداد) مراکز خوشه ای. اگر ز1، مرکز سیلخوشه، دارد متر(تعداد) متغیرهای اسمی، معادله به صورت زیر است: زل=zل،1،zل،2،…،zل،متر1≤j≤متر

دایکسمن،j،zل،j=0، ایکسمن،j = zل،j 1، ایکسمن،j ≠ zل،j

اول، معادله (1) معادله ای است که فاصله بین آن ها را محاسبه می کند سیلمرکز خوشه، زل=zل،1،zل،2،…،zل،مترو شیء ایکسمن=ایکسمن،1،ایکسمن،2،…،ایکسمن،nاز طریق “تابع فاصله”. کارکرد دایکسمن،j ، zل،j، که فاصله بین آنها را اندازه گیری می کند ایکسمنو زل, دارای مقدار 1 هنگامی که دو مقدار مطابقت ندارند و مقدار 0 در صورت تطبیق می باشد. فاصله بین دو جسم را از طریق مقایسه آنها محاسبه می کند jمتغیرهای عددی از طریق معادله تابع فاصله، فواصل بین هر جسم ایکسو مرکز خوشه زهنگام بهینه سازی مدل در جهتی که مقدار نتیجه معادله (2) به حداقل می رسد، محاسبه می شوند.

پU، ز=∑ل=1ک∑من=1n∑j=1مترتومن،لدایکسمن،j ، zل،j
U=تومن،لماتریسی متشکل از 0 و 1 به شکل است n×ک، معادله تومن،ل=1نشان دهنده شیء است، ایکسمنبه نزدیکترین خوشه اختصاص داده می شود سیل. مدل بهینه شده و نتیجه تجزیه و تحلیل خوشه با تنظیم مجدد مراکز خوشه و تجزیه و تحلیل مکرر آنها و محاسبه حداقل مقدار تابع هزینه به دست می آید. پU، ز.
3.3.2. استقرار تجزیه و تحلیل محیط
این مطالعه داده های سرقت را که از ایستگاه های پلیس منطقه به دست آمده بود، تجزیه و تحلیل کرد. داده ها شامل 45888 پرونده جنایی است که در منطقه دونگجاک از سال 2004 تا 2015 رخ داده است. موارد منطقه زمانی وقوع، آدرس وقوع، طبقه‌بندی مکان، جنسیت قربانی و روش‌های جرم انتخاب و برای تحلیل خوشه‌بندی k-modes استفاده شد. پس از پاکسازی داده ها با منطقه زمانی یا آدرس نادرست، در نهایت از داده های 4464 مورد سرقت استفاده شد. سپس مجموعه داده ها با سازماندهی 4464 مورد در مجموع چهار بخش تهیه شد. زمان وقوع جرم با تقسیم آن به صبح (6-12)، بعد از ظهر (12-18)، عصر (18-0) و سحر (0-6) تعیین شد. در مورد موارد طبقه بندی مکان و روش های جرم، طبقه بندی بر اساس داده های سرقت در منطقه دونجاک انجام شد. طبقه بندی مکان به 16 دسته تقسیم شد: محل اقامت، کلیسا، سایت ساخت و ساز، موسسه آموزشی، تفریحی، بیمارستان، موسسه مالی، اداره، پارک، پارکینگ، توالت عمومی، محل سکونت، فروشگاه، خیابان، وسایل نقلیه و غیره. روش های جرم طبقه بندی شدند. به سرقت نفوذی، دزدی ضربه زدن، سرقت مربوط به وسیله نقلیه، سرقت ترفند و غیره؛ “و غیره.” گروهی را که به عنوان دزدی دیگر در داده‌های سرقت در منطقه دونگجاک یا روش‌های جرم و جنایت با نقاط داده بسیار کمی برای طبقه‌بندی به اقلام فردی، مانند سرقت هنگام چرت زدن، دزدی از مغازه، و سرقت از رختکن، تحت پوشش قرار داد. جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از داده‌های سرقت در منطقه در چهار آیتم طبقه‌بندی شدند و مجموعه داده‌ها مطابق شکل زیر ساخته شدند. طبقه بندی مکان به 16 دسته تقسیم شد: محل اقامت، کلیسا، سایت ساخت و ساز، موسسه آموزشی، تفریحی، بیمارستان، موسسه مالی، اداره، پارک، پارکینگ، توالت عمومی، محل سکونت، فروشگاه، خیابان، وسایل نقلیه و غیره. روش های جرم طبقه بندی شدند. به سرقت نفوذی، دزدی ضربه زدن، سرقت مربوط به وسیله نقلیه، سرقت ترفند و غیره؛ “و غیره.” گروهی را که به عنوان دزدی دیگر در داده‌های سرقت در منطقه دونگجاک یا روش‌های جرم و جنایت با نقاط داده بسیار کمی برای طبقه‌بندی به اقلام فردی، مانند سرقت هنگام چرت زدن، دزدی از مغازه، و سرقت از رختکن، تحت پوشش قرار داد. جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از داده‌های سرقت در منطقه در چهار آیتم طبقه‌بندی شدند و مجموعه داده‌ها مطابق شکل زیر ساخته شدند. طبقه بندی مکان به 16 دسته تقسیم شد: محل اقامت، کلیسا، سایت ساخت و ساز، موسسه آموزشی، تفریحی، بیمارستان، موسسه مالی، اداره، پارک، پارکینگ، توالت عمومی، محل سکونت، فروشگاه، خیابان، وسایل نقلیه و غیره. روش های جرم طبقه بندی شدند. به سرقت نفوذی، دزدی ضربه زدن، سرقت مربوط به وسیله نقلیه، سرقت ترفند و غیره؛ “و غیره.” گروهی را که به عنوان دزدی دیگر در داده‌های سرقت در منطقه دونگجاک یا روش‌های جرم و جنایت با نقاط داده بسیار کمی برای طبقه‌بندی به اقلام فردی، مانند سرقت هنگام چرت زدن، دزدی از مغازه، و سرقت از رختکن، تحت پوشش قرار داد. جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از داده‌های سرقت در منطقه در چهار آیتم طبقه‌بندی شدند و مجموعه داده‌ها مطابق شکل زیر ساخته شدند. سایت ساختمانی، موسسه آموزشی، تفریحی، بیمارستان، موسسه مالی، اداره، پارک، پارکینگ، توالت عمومی، محل سکونت، فروشگاه، خیابان، وسایل نقلیه و غیره. سرقت و غیره؛ “و غیره.” گروهی را که به عنوان دزدی دیگر در داده‌های سرقت در منطقه دونگجاک یا روش‌های جرم و جنایت با نقاط داده بسیار کمی برای طبقه‌بندی به اقلام فردی، مانند سرقت هنگام چرت زدن، دزدی از مغازه، و سرقت از رختکن، تحت پوشش قرار داد. جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از داده‌های سرقت در منطقه در چهار آیتم طبقه‌بندی شدند و مجموعه داده‌ها مطابق شکل زیر ساخته شدند. سایت ساختمانی، موسسه آموزشی، تفریحی، بیمارستان، موسسه مالی، اداره، پارک، پارکینگ، توالت عمومی، محل سکونت، فروشگاه، خیابان، وسایل نقلیه و غیره. سرقت و غیره؛ “و غیره.” گروهی را که به عنوان دزدی دیگر در داده‌های سرقت در منطقه دونگجاک یا روش‌های جرم و جنایت با نقاط داده بسیار کمی برای طبقه‌بندی به اقلام فردی، مانند سرقت هنگام چرت زدن، دزدی از مغازه، و سرقت از رختکن، تحت پوشش قرار داد. جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از داده‌های سرقت در منطقه در چهار آیتم طبقه‌بندی شدند و مجموعه داده‌ها مطابق شکل زیر ساخته شدند. وسایل نقلیه، و غیره. روش های جرم به سرقت نفوذی، سرقت ضربه ای، سرقت مربوط به وسیله نقلیه، سرقت ترفند و غیره طبقه بندی شدند. “و غیره.” گروهی را که به عنوان دزدی دیگر در داده‌های سرقت در منطقه دونگجاک یا روش‌های جرم و جنایت با نقاط داده بسیار کمی برای طبقه‌بندی به اقلام فردی، مانند سرقت هنگام چرت زدن، دزدی از مغازه، و سرقت از رختکن، تحت پوشش قرار داد. جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از داده‌های سرقت در منطقه در چهار آیتم طبقه‌بندی شدند و مجموعه داده‌ها مطابق شکل زیر ساخته شدند. وسایل نقلیه، و غیره. روش های جرم به سرقت نفوذی، سرقت ضربه ای، سرقت مربوط به وسیله نقلیه، سرقت ترفند و غیره طبقه بندی شدند. “و غیره.” گروهی را که به عنوان دزدی دیگر در داده‌های سرقت در منطقه دونگجاک یا روش‌های جرم و جنایت با نقاط داده بسیار کمی برای طبقه‌بندی به اقلام فردی، مانند سرقت هنگام چرت زدن، دزدی از مغازه، و سرقت از رختکن، تحت پوشش قرار داد. جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از داده‌های سرقت در منطقه در چهار آیتم طبقه‌بندی شدند و مجموعه داده‌ها مطابق شکل زیر ساخته شدند. دزدی مغازه و دزدی از رختکن جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از داده‌های سرقت در منطقه در چهار آیتم طبقه‌بندی شدند و مجموعه داده‌ها مطابق شکل زیر ساخته شدند. دزدی مغازه و دزدی از رختکن جنسیت قربانی برای زنان روی «Y» و برای مردان «N» تنظیم شد. بنابراین، 4464 مورد از داده‌های سرقت در منطقه در چهار آیتم طبقه‌بندی شدند و مجموعه داده‌ها مطابق شکل زیر ساخته شدند.جدول 1 . سپس محیط تحلیل برای خوشه‌بندی k-modes با استفاده از Python 3.7.6 ساخته شد.
3.3.3. تنظیم بهینه K-Value
خوشه‌بندی K-modes بسته به مقدار k نتایج متفاوتی را برمی‌گرداند، و سپس لازم است آنالیز برای هر k تکرار شود تا یک k بهینه‌سازی پیدا شود که تابع هزینه آن حداقل مقدار را داشته باشد. در این مطالعه از روش زانویی برای دستیابی به مقادیر k استفاده شد و هر تحلیل مقدار k هزار بار تکرار شد. خوشه بندی K-modes در سه مرحله به شرح زیر اجرا شد:
  • k خوشه تصادفی را تعریف کنید.
  • فاصله مرکز خوشه و هر شی را محاسبه کنید و هر شی را به نزدیکترین مرکز خوشه نسبت دهید. همه اشیا به خوشه ها اختصاص داده می شوند و مرکز خوشه در جهتی حرکت می کند که فاصله بین هر شی و مرکز خوشه نزدیکتر شود.
  • اگر هر مرکز خوشه منتقل شده دارای مقدار نتیجه متفاوتی با مقدار مرکزی قبلی است، باید به مرحله 2 برگردید، تجزیه و تحلیل را دوباره اجرا کنید و این مرحله را تکرار کنید. اگر مقدار نتیجه آن با مقدار مرکزی قبلی یکسان باشد، تجزیه و تحلیل متوقف می شود.

3.4. تحلیل رگرسیون خطی چندگانه

3.4.1. تعریف

تجزیه و تحلیل رگرسیون خطی چندگانه برای استخراج عوامل محیطی قابل توجه برای هر خوشه برای تأیید تأثیرات فردی عوامل برای هر خوشه مشتق شده انجام شد. از برنامه آماری SPSS 18.0 برای تجزیه و تحلیل رگرسیون خطی چندگانه برای استخراج عوامل محیطی مهم استفاده شد.

Yک=آn+ب1ایکس1+ب2ایکس2+⋯+بnایکسn
در تجزیه و تحلیل رگرسیون خطی چندگانه، نوع سرقت (خوشه) به دست آمده از خوشه بندی، همانطور که در رابطه (3) نشان داده شده است، برای متغیر وابسته اعمال شد. Yک) عوامل محیطی محلی به متغیر مستقل وارد شد ( ایکسn، سپس ضریب ( بn) از هر متغیر و جمله ثابت ( آn) از مدل برآورد شد. عبارت k و n نشان دهنده متغیرهای ناشناخته است. فرضیه تأثیر متغیرهای مستقل تعیین شده در این تحقیق بر خوشه بندی به شرح زیر است. اگر در عوامل محیطی مربوط به هر خوشه تفاوت وجود داشته باشد و عوامل محیطی مرتبط بر نتایج خوشه بندی تأثیر داشته باشند، تأثیر عوامل محیطی بر هر خوشه متفاوت خواهد بود.
3.4.2. تنظیم متغیر
داده های کاربری زمین، تأسیسات و سن ساختمان از پورتال ملی زیرساخت داده های مکانی به دست آمده است. داده های کاربری اراضی دارای طبقه بندی های زیر بودند: منطقه مسکونی عمومی کلاس 1، منطقه مسکونی عمومی کلاس 2، منطقه مسکونی عمومی کلاس 3، منطقه شبه مسکونی، منطقه تجاری همجوار، منطقه تجاری توزیع، منطقه تجاری عمومی، منطقه سبز طبیعی، جاده و مناطق دیگر. مناطق مسکونی عمومی کلاس 1 شامل مناطق مسکونی کم ارتفاع است و نیاز به ایجاد یک محیط مسکونی مناسب دارند. مناطق مسکونی عمومی کلاس 2 شامل مسکن های سطح متوسط ​​است و نیاز به ایجاد یک محیط مسکونی مناسب دارند. مناطق مسکونی کلاس 3 شامل ساختمان های متوسط ​​و بلند برای یک محیط مسکونی راحت است. و مناطق شبه مسکونی به مکان هایی اطلاق می شود که برای رفاه ساکنان و حفظ محیط زیست سالم ضروری است. مناطق تجاری مجاور برای تامین مایحتاج و خدمات روزانه محله می باشد. مناطق تجاری توزیع برای بهبود توزیع در داخل و بین شهرها طراحی شده اند. و مناطق تجاری عمومی برای کارکردهای تجاری و تجاری عمومی وجود دارد. داده های تسهیلات در مجموع از 28 دسته اصلی تشکیل شده است و نتیجه زیر طبقه بندی مجدد بر اساس هدف واقعی استفاده است، یعنی 14 دسته: خانه های مستقل، خانه های آپارتمانی، امکانات تجاری، امکانات آموزشی و تحقیقاتی، امکانات عمومی، تجاری. تسهیلات، امکانات پزشکی، تسهیلات اقامتی، تسهیلات سالمندان، کارخانه‌ها، انبارها، امکانات مرتبط با گورستان، ذخیره سازی مواد خطرناک، امکانات تصفیه و پارکینگ ها. با توجه به داده‌های مربوط به ایستگاه‌های اتوبوس و ایستگاه‌های مترو، محدوده‌هایی برای تعیین وجود جرایم در محدوده تعیین شد تا تأثیرات دقیق آنها مشخص شود. بر اساس مطالعات قبلی، برد برای ایستگاه های اتوبوس 100 متر و برای ایستگاه های مترو 200 متر تعیین شد.32 ، 33 ]. داده های مربوط به چراغ های خیابان و دوربین های مدار بسته از پلازای Open Data Plaza در سئول به دست آمد.
3.4.3. واحد تحلیل شبکه
واحدهای فضایی آماری نماینده شامل شبکه، منطقه خروجی سرشماری، ناحیه اداری و غیره است و در حال حاضر منطقه خروجی سرشماری و ناحیه اداری به طور گسترده مورد استفاده قرار می‌گیرند. با این حال، هنگام تقسیم فضا به منطقه خروجی سرشماری یا مناطق اداری، شکل و اندازه مناطق حاصل احتمالاً تغییر می کند زیرا نامنظم هستند و مرزها مطابق با تغییرات زمانی تنظیم می شوند. از طرف دیگر، از آنجایی که یک شبکه یک شکل و اندازه ثابت دارد، برخلاف آن دو واحد، اطلاعات آماری را می توان به طور عینی تخمین زد و انعطاف پذیری برای تغییرات در مقیاس های نقشه قابل اعمال است. 34 ].]. تحقیقات مربوط به تحلیل جرم عمدتاً از واحدهای ناحیه اداری برای تجزیه و تحلیل صحنه‌های جرم کلان استفاده می‌کند. بنابراین، از آنجایی که محدودیت‌هایی دارد که نمی‌تواند محیط‌های خرد را منعکس کند، این مطالعه سعی دارد رابطه بین سرقت و عوامل محیطی را از منظر میکروسکوپی تحلیل کند.
این مطالعه استفاده از شبکه های شش ضلعی مشابه دایره ها را به دلایل زیر پیشنهاد می کند. اولاً، اگر محیط شهری به شش ضلعی شبیه به دایره تقسیم شود، کمترین خطر از دست رفتن داده ها وجود دارد. دوم، از طریق تجزیه و تحلیل مقایسه ای کاربری های زمین با مساحت مشابه، بهبودهایی در سازگاری، دقت و کارایی داده ها وجود دارد. سوم، شبکه‌های شش ضلعی نتایج بصری واضح‌تری نسبت به شبکه‌های شبکه نشان می‌دهند. 35]. شعاع 25 و 50 متر به ترتیب برای تحلیل رگرسیون برای تعیین اندازه شبکه شش ضلعی استفاده شد و شعاع 50 متر نتایج واضح تری را نشان داد. بنابراین، این مطالعه با استفاده از اطلاعات سیستم اطلاعات جغرافیایی، مناطق مورد نظر را با استفاده از یک شبکه شش ضلعی به شعاع 50 متر تقسیم کرد و سپس با وارد کردن داده‌های عامل محیطی در هر سلول، آنالیز را انجام داد ( شکل 3 ).

3.5. شبکه های عصبی مصنوعی

یک شبکه عصبی مصنوعی (ANN) یک الگوریتم یادگیری ماشینی است که اولین بار توسط وارن مک‌کالوچ و والتر پیتس ارائه شد. آنها یک مدل محاسباتی ساده از نحوه تعامل نورون های بیولوژیکی برای محاسبات پیچیده با استفاده از منطق گزاره ای ارائه کردند. برخلاف انتظار مردم، ANN نتوانست مشکل XOR را حل کند و در دهه 1990، با ظهور ماشین بردار پشتیبان (SVM) و دیگر الگوریتم‌های یادگیری ماشینی با عملکرد خوب، ANN توجهی را به خود جلب نکرد. با این حال، با توسعه مدل شبکه عصبی عمیق (DNN) که یک مدل شبکه عصبی مصنوعی است که از چندین لایه پنهان بین لایه‌های ورودی و خروجی تشکیل شده است، امکان مدیریت حجم وسیعی از داده‌ها فراهم شد که برای آن استفاده نشده بود. تحلیل و بررسی؛36 ].

nکساعت=∑j=1آرwکjساعتپj+بساعتکک=1 تیo اس
شکل 4 ساختار اصلی ANN را نشان می دهد و (4) معادله آن را نشان می دهد. R تعداد متغیرهای ورودی، S تعداد نورون های پنهان، p متغیر ورودی، b لایه پنهان است و w است.وزن است. وزن هر عنصر محاسبه شده به عنوان ورودی تابع فعال سازی استفاده می شود. خروجی از مجموع این مقادیر وزنی به دست می آید. به طور کلی، مطالعات قبلی از تابع سیگموئید به عنوان یک تابع فعال سازی استفاده می کردند. با این حال، تابع پدیده ناپدید شدن گرادیان را نشان می دهد که در آن اطلاعات موجود با گسترش شبکه عصبی به صفر همگرا می شود. علاوه بر این، تابع سیگموئید به زمان محاسبات اضافی نیاز دارد که یک تابع نمایی است. در تلاش برای رسیدگی به این چالش، تابع غیرخطی ReLU پیشنهاد شد. این تابع اطلاعات را از دست نمی دهد زیرا وقتی از مقدار آستانه فراتر می رود، مقدار ورودی را بدون هیچ تغییری خروجی می دهد و سرعت محاسبه با یک مقدار گرادیان ساده 0 یا 1 سریع است.37 ].
تنظیم پیکربندی گره‌ها و لایه‌های پنهان برای ایجاد یک مدل پیش‌بینی ANN بهینه بسیار مهم است، اما هیچ معیار یا روش روشنی برای این فرآیند وجود ندارد. بنابراین، لازم است مدل بهینه با کمترین مقدار MSE با هرچه بیشتر تلاش پیدا شود. حداقل تعداد گره ها و لایه های پنهان باید بیشتر از تعداد متغیرهای ورودی باشد و حداکثر تعداد برای آموزش مدل نباید از 2n+1 تجاوز کند. 38 ]]؛ n به تعداد متغیرهای ورودی اشاره دارد. در این تحقیق مدل هایی با حداقل یک تا حداکثر هفت لایه مورد بررسی قرار گرفت. همراه با تعداد لایه‌ها، حداقل، میانه و حداکثر تعداد گره‌های پنهان قرار بود در سه تا پنج مورد پردازش شوند و مدل بهینه با کمترین مقدار MSE بررسی شود. علاوه بر این، برای تأیید عملکرد مدل، این مطالعه سعی دارد هر عملکرد را با پیکربندی عوامل محیطی که داده‌های ورودی هستند، به روش‌های مختلف مقایسه کند. این مطالعه به دنبال مقایسه عملکرد مدل با استفاده از تمام عوامل محیطی به عنوان داده های ورودی و مدل با استفاده از تنها عوامل محیطی است که بر هر خوشه به عنوان داده ورودی از طریق تحلیل رگرسیون خطی چندگانه تأثیر می گذارد.

4. نتایج و بحث

4.1. دسته بندی جرم و جنایت

در نتیجه خوشه‌بندی k-modes، مشخص شد که معمولاً چهار نوع سرقت در منطقه دونگجاک وجود دارد. ارقام هر دسته در شکل 5 نشان داده شده استبرای تعریف انواع سرقت خوشه A نشان دهنده سرقت های دیگر (53٪) در تأسیسات تجاری (43٪) است که عمدتاً مردان (76٪) در عصر (62٪) را هدف قرار می دهد. روش های جرم شامل دزدی نفوذی (16%)، دزدی با ضربه زدن (19%)، سرقت مربوط به وسیله نقلیه (8%)، سرقت ترفند (4%) و سایر سرقت ها (53%) است. نسبت سایر دزدی ها و ضربه زدن به سرقت با نرخ های بالاتری نسبت به سایر خوشه ها ثبت شد. جنایات در عصر (62%) سه برابر بیشتر از زمان های دیگر رخ داده است. این را می توان به این معنا تفسیر کرد که در زمان ازدحام دزدی هایی صورت می گرفت زیرا جمعیت شناور زیادی در ساعات عصر با استفاده بیشتر از امکانات تجاری وجود داشت. خوشه B نشان می دهد سرقت از خانه (58٪) (76٪) عمدتاً زنان (71٪) را در طول صبح (50٪) هدف قرار می دهد. لازم به ذکر است که جرایم بیشتر در ساعات صبح رخ می دهد و سرقت نفوذی (76%) بیش از 8 برابر سایر روش های جرم بوده است. با توجه به این نتایج، می توان این گونه تفسیر کرد که با توجه به وجود سه دانشگاه در منطقه دونگجک به همراه بسیاری از آکادمی ها و قرائتخانه ها، بسیاری از مجرمان سرقت عمدتاً پس از مراجعه مردم به آکادمی، مطالعه و یا دانشگاه در صبح خانه های خالی را هدف قرار دادند. در مورد جنسیت قربانیان، قربانیان زن دو برابر قربانیان مرد بودند. هوانگ [ اتاق های مطالعه یا دانشگاه ها در صبح. در مورد جنسیت قربانیان، قربانیان زن دو برابر قربانیان مرد بودند. هوانگ [ اتاق های مطالعه یا دانشگاه ها در صبح. در مورد جنسیت قربانیان، قربانیان زن دو برابر قربانیان مرد بودند. هوانگ [39] دریافت که مزاحمان اغلب قربانیان زن را عمدا انتخاب می کردند. در میان دلایل این انتخاب، «آسانی کنترل» رایج‌ترین دلیل بود که نشان می‌دهد آن‌ها تصور می‌کردند که زنان اهداف آسانی برای کنترل هستند، حتی اگر در جریان جنایت با قربانیان مواجه شوند. این نتایج حاکی از آن است که جنسیت ساکنان نیز در انتخاب هدف جرم مزاحمان نقش داشته است. خوشه C نشان دهنده سرقت مربوط به وسیله نقلیه (65٪) و سرقت خیابانی (67٪) است که عمدتاً مردان (90٪) در سحر (49٪) را هدف قرار می دهد. در میان سرقت‌های مربوط به وسیله نقلیه، سرقت موتورسیکلت بیشترین اتفاق افتاده است (24%). با توجه به بالا بودن نسبت “سپیده دم” و “سرقت خیابانی”، اغلب جرایم با هدف قرار دادن موتورسیکلت های پارک شده در خیابان در هنگام سحر رخ می داد، جایی که به دلیل تعداد کمی از رهگذران، نظارت طبیعی دشوار بود. قربانیان مرد (90 درصد) بیشتر از قربانیان زن در چنین جنایاتی بودند زیرا مردان دارای گواهینامه موتورسیکلت بیشتری نسبت به زنان بودند. بر اساس آمار سال 2015 دارندگان گواهینامه رانندگی در سئول که توسط آژانس پلیس کلان شهر سئول ارائه شده است، 90018 مرد و 1353 زن دارای گواهینامه برای وسایل نقلیه کوچک بودند. خوشه D سرقت های دیگری را نشان می دهد (78%) که بیشتر مردان (73%) را در بعدازظهر (74%) هدف قرار می دهند.
همانطور که ارقام برای هر آیتم طبقه بندی شده برای هر خوشه متفاوت بود، تایید شد که توزیع فضایی خوشه ها نیز دارای الگوهای متفاوتی است. بنابراین، از طریق تحلیل رگرسیون، رابطه بین خوشه‌ها و عوامل محیطی منطقه‌ای با جزییات بیشتری برآورد شد و عوامل محیطی معنی‌داری برای هر خوشه استخراج شد.

4.2. استخراج عوامل محیطی مهم

جدول 2 تجزیه و تحلیل رگرسیون خطی چندگانه را نشان می دهد که برای تأیید تأثیر متغیرهای عامل محیطی بر چهار نوع سرقت به دست آمده توسط خوشه بندی k-modes انجام شد. تعداد کل موارد 2965 بود و خلاصه مدل تحلیل رگرسیون خطی چندگانه در جدول 3 نشان داده شده است . هر چهار مدل رگرسیون از نظر آماری برازش دارند زیرا مقدار دوربین-واتسون نزدیک به 2 بود و نزدیک به 0 یا 4 نبود، بنابراین هیچ ارتباطی بین باقیمانده‌ها وجود ندارد. توان توضیحی برای هر مدل 27.3٪ (A)، 22.3٪ (B)، 25.3٪ (C) و 16.2٪ (D) بود. f2 کوهن، که عموماً در تحلیل های آماری در زمینه علوم اجتماعی استفاده می شود، معیاری رایج برای محاسبه انواع مختلف اندازه اثر هنگام استفاده از آزمون F برای ANOVA و تحلیل رگرسیون چندگانه است. کوهن [ 40] پیشنهاد کرد که R2 = 0.02 به عنوان اندازه اثر کوچک در نظر گرفته شود، 0.13 نشان دهنده اندازه اثر متوسط، و 0.26 یک اندازه اثر بزرگ است. بنابراین، مدل های تحلیل رگرسیون چندگانه در این مطالعه همگی دارای مقادیری بین 0.16 تا 0.28 هستند که نشان می دهد مدل ها به اندازه کافی اعتبار دارند.
متغیرها شامل 10 متغیر کاربری اراضی، 17 متغیر تسهیلات، 2 متغیر تاسیسات امنیتی و متغیر سن ساختمان بودند. در مورد متغیرهای اسمی، تحلیل رگرسیون از طریق کدگذاری ساختگی انجام شد. قبل از تجزیه و تحلیل، یک آزمون چند خطی برای تأیید چند خطی بودن زمانی که همبستگی بین متغیرهای مستقل زیاد باشد، انجام شد. در نتیجه، از آنجایی که مقادیر VIF همه متغیرها کمتر از 10 بود، هیچ خط خطی بین متغیرها وجود نداشت.
در نتیجه تحلیل رگرسیون خطی چندگانه، عوامل محیطی مؤثر بر هر خوشه در جدول 4 نشان داده شده است. نتایج تجزیه و تحلیل دقیق را می توان در جدول A1 یافت. نتایج تجزیه و تحلیل نشان داد که تأثیر عوامل محیطی بر هر خوشه با توجه به فرضیه‌ای که قبلاً ایجاد شده بود متفاوت است. اگر سطح معناداری pمقدار کمتر از 0.10 است، سطح اطمینان مربوطه 90٪ است، اگر کمتر از 0.05 باشد، 95٪ و اگر کمتر از 0.01 باشد، 99٪ است. در مورد متغیرهای پیوسته، زمانی که 1 افزایش می یابند، فرض می شود که با مقدار ضریب غیر استانداردسازی (B) بر ایجاد خوشه تأثیر می گذارند. متغیرهای رمزگذاری شده در مقایسه با گروه مرجع تحلیل می شوند.
در مجموع سه عامل محیطی بیشترین تأثیر را در هر خوشه داشتند. در خوشه A، تأسیسات تجاری (13.277) بیشترین تأثیر را نشان دادند و پس از آن منطقه تجاری عمومی (5.630) و منطقه مسکونی عمومی کلاس 3 (4.089) قرار گرفتند. در خوشه B، خانه های مستقل (9.538) بیشترین تأثیر را داشتند، پس از آن خانه های آپارتمانی (5.095) و امکانات تجاری (4.419) قرار گرفتند. در خوشه های C و D، امکانات تجاری (8.059، 7.042) بالاترین، پس از آن منطقه تجاری عمومی (7.880، 6.511) و امکانات پزشکی (5.514، 3.143) بودند. منطقه تجاری عمومی و امکانات تجاری و پزشکی در همه خوشه ها تأثیر داشتند. منطقه تجاری عمومی و تأسیسات تجاری تأثیرات زیادی را در همه خوشه ها نشان دادند، که نشان می دهد با وجود اینکه منطقه دونگجاک دارای مناطق تجاری کمتری بود (2. 1٪ از مناطق مسکونی، رویدادهای جرم و جنایت بیشتر در مناطق تجاری متمرکز شده است. مناطقی که دارای تسهیلات تجاری متمرکز هستند تا اواخر وقت دارای جمعیت شناور هستند و بر این اساس، درجه مشخصی از ناشناس بودن تضمین می شود، بنابراین جرم و جنایت مستعد وقوع است. علاوه بر این، مناطق تجاری در ناحیه دونگجاک دارای ساختمان‌های بسیاری بود که امکانات تجاری و مسکونی در آنها ترکیب شده بود. کیم و همکاران [14 ] نشان داد که وقتی امکانات تجاری و سایر کاربری‌ها با هم ترکیب می‌شدند، تعداد جرم و جنایت بیشتر بود. Stucky و Ottensmann [ 13 ] دریافتند که احتمال بیشتری برای جرائم جنایی عمده در مراکز پزشکی وجود دارد، زیرا در آنجا غریبه ها جمع می شوند، که از نتیجه زیر پشتیبانی می کند: این امکانات بیشترین تأثیر را در خوشه C داشتند (5.514).

4.3. مدل شبکه عصبی مصنوعی

این مطالعه یک مدل ANN برای چهار خوشه ایجاد کرد و عوامل محیطی را با تأثیرات در هر خوشه به عنوان متغیرهای ورودی برای تجزیه و تحلیل قرار داد. با توجه به متغیرهای اسمی، مدل ANN با گنجاندن گروه مرجع در متغیر ورودی پس از کدگذاری ساختگی ساخته شد. در مورد متغیرهای ورودی هر مدل خوشه ای بر اساس عوامل محیطی معنادار، خوشه A دارای 9 متغیر ورودی، خوشه B دارای 12، خوشه C دارای 8 و خوشه D دارای 5 متغیر بود. در مجموع، 1763 نقطه داده برای تجزیه و تحلیل استفاده شد: 1234. (70٪) داده برای آموزش، 264 (15٪) داده برای اعتبار سنجی، و 264 (15٪) داده برای آزمایش.
جدول 5 حالتی را نشان می دهد که در آن مدل بهترین عملکرد را در بین ترکیبات گره مطابق با شماره لایه مدل پیش بینی برای هر خوشه نشان داد. Min و Max به معنای حداقل و حداکثر تعداد مجموع لایه های پنهان و گره های پنهان است و لایه و نورون به ترتیب تعداد لایه های پنهان و گره های پنهان را نشان می دهد. در موردی که لایه‌های بیشتری از آنچه در جدول پیشنهاد شده وجود دارد، این نشان‌دهنده مشکل ناپدید شدن گرادیان است، به این معنی که نمی‌توان از آن به عنوان یک مدل پیش‌بینی استفاده کرد. مشکل ناپدید شدن گرادیان به پدیده‌ای اشاره دارد که در آن گرادیان ناپدید می‌شود، زیرا خطا پس از چندین بار عبور از لایه‌های پنهان به میزان قابل توجهی کاهش می‌یابد که منجر به ناتوانی در آموزش مدل می‌شود.
شکل 7 مقادیر R آموزش، اعتبار سنجی و آزمون مدل را با بهترین عملکرد در بین مدل های پیش بینی خوشه A نشان می دهد. ارزش آموزش 0.54997، اعتبارسنجی 0.57652 و آزمون 0.69375 بود. مقدار MSE بود 106× 1.8745 و مدل DNN بهترین عملکرد را با دو لایه و هفت گره در مدل نشان داد.
شکل 8 مقادیر R آموزش، اعتبار سنجی و آزمون مدل را با بهترین عملکرد در بین مدل های پیش بینی خوشه B نشان می دهد. ارزش آموزش 0.42745، اعتبارسنجی 0.48754 و آزمون 0.36094 ارزش داشت. مقدار MSE بود 106× 0.9120، در حالی که مدل DNN بهترین عملکرد را با چهار لایه و شش گره در مدل نشان داد.
شکل 9 مقادیر R آموزش، اعتبار سنجی و آزمون مدل را با بهترین عملکرد در بین مدل های پیش بینی خوشه C نشان می دهد. ارزش آموزش 0.59363، اعتبارسنجی 0.50849 و آزمون 0.40477 ارزش داشت. مقدار MSE بود 106× 0.6586، در حالی که مدل DNN بهترین عملکرد را با دو لایه و هفت گره در مدل نشان داد.
شکل 10 مقادیر R آموزش، اعتبار سنجی و آزمون مدل را با بهترین عملکرد در بین مدل های پیش بینی خوشه D نشان می دهد. ارزش آموزش 0.39989، اعتبار سنجی 0.44619 و آزمون دارای ارزش 0.38010 بود. مقدار MSE بود 106× 0.3960، در حالی که مدل ANN بهترین عملکرد را با یک لایه و نه گره در مدل نشان داد.
جدول 6مقایسه عملکرد مدل ها را با تقسیم ویژگی های داده های ورودی به دو نوع نشان می دهد. نوع I مدلی است که از تمام داده های عامل محیطی به عنوان داده ورودی استفاده می کند، در حالی که نوع S مدلی است که تنها از عوامل محیطی استفاده می کند که بر هر خوشه به عنوان داده ورودی از طریق تحلیل رگرسیون خطی چندگانه تأثیر می گذارد. تعداد لایه‌ها و نورون‌ها برای همه انواع یکسان تنظیم شد تا تأثیرات غیر از داده‌های ورودی کنترل شود. در نتیجه مقایسه دو نوع مدل، مدل Type S دقت بالاتری را نشان داد که در آن تنها عوامل محیطی مؤثر بر هر خوشه به عنوان داده ورودی از طریق تحلیل رگرسیون خطی چندگانه استفاده شد. نوع I با مشکل بیش از حد برازش مواجه شد زیرا تفاوت زیادی در نرخ پیش‌بینی بین مدل‌های آموزشی و آزمایشی وجود داشت. بر اساس تحلیل تطبیقی ​​دو نوع مدل، هنگامی که یک پیش‌بینی با عوامل محیطی مرتبط با جرم به‌عنوان متغیر انجام می‌شود، تحلیل رگرسیون خطی چندگانه باید برای استخراج متغیرهای مهمی که به عنوان داده‌های ورودی استفاده می‌شوند، ادامه یابد. به نظر می رسد این روش عملکرد مدل را بهبود می بخشد.

5. نتیجه گیری ها

این مطالعه از داده های سرقت در منطقه دونگجک از سال 2004 تا 2015 استفاده کرد و سپس آن جرم را طبقه بندی کرد. بر اساس عوامل محیطی محلی که بر جنایت تأثیر گذاشتند، یک مدل شبکه عصبی مصنوعی برای پیش‌بینی انواع سرقت که به احتمال زیاد در مناطق تصادفی رخ می‌دهند، پیشنهاد شد. ابتدا با استفاده از خوشه‌بندی k-modes، سرقت جرم در منطقه دونگجک طبقه‌بندی شد و در مجموع چهار نوع استخراج شد. علاوه بر این، با استفاده از تحلیل رگرسیون خطی چندگانه تأیید شد که هر طبقه‌بندی دارای عوامل محیطی متناظر متفاوتی است. مشخص شد که عوامل محیطی بسته به نوع سرقت، تأثیرات و اهمیت متفاوتی دارند. عوامل محیطی مشابه سطوح مختلفی از تأثیر را بر اساس انواع سرقت نشان دادند. این نتایج را می توان برای اتخاذ مناسب ترین اقدامات تاکتیکی برای هر نوع جرم در هنگام جلوگیری از سرقت مورد استفاده قرار داد. مدل پیش‌بینی توسعه‌یافته در مرحله پیشگیری از جرم این مطالعه به ما امکان می‌دهد تا انواع جرم سرقت را که به احتمال زیاد در یک منطقه خاص اتفاق می‌افتد پیش‌بینی کنیم و عوامل محیطی مؤثر بر وقوع نوع جرم را شناسایی کنیم. بنابراین، یک سیستم موثر پیشگیری از جرم می تواند ایجاد شود، زیرا مدل یک عامل محیطی را شناسایی می کند که باید در درجه اول برای هر نوع جرم بهبود یابد. مناطق با احتمال وقوع جرم بالا در خوشه A به اقدامات پیشگیرانه با تمرکز بر سایت های تجاری که در ساعات عصر فعال می شوند نیاز دارند. در حالی که مناطق با احتمال جرم بالا در خوشه B باید اقدامات پیشگیرانه ای را با هدف محافظت از خانه های خالی در مجتمع های مسکونی در برابر نفوذ صبحگاهی انجام دهند. مناطق با احتمال وقوع جرم در خوشه C باید اقداماتی را برای جلوگیری از سرقت های مرتبط با وسایل نقلیه که در خیابان های اطراف مناطق تجاری در سپیده دم رخ می دهد، آماده کنند، در حالی که مناطق با احتمال وقوع جرم در خوشه D به اقدامات پیشگیرانه، به ویژه برای مناطق تجاری نیاز دارند. که بعد از ظهر فعال می شوند.
این مطالعه از این جهت معنادار است که می‌تواند با ارائه روش‌های مقابله‌ای مؤثر برای پیشگیری از جرم، به ایجاد مناطقی در امان از جرم کمک کند. از نظر جرم شناسی محیطی، به طور تجربی تأثیر عوامل محیطی بر وقوع سرقت را تحلیل کرد. استفاده از تکنیک‌های آمار فضایی به کمک به سیاست‌گذاران کمک می‌کند تا به طور سیستماتیک کل الگوهای توزیع فضایی سرقت‌ها در سطح محلی را درک کنند. به این ترتیب، همبستگی معنادار بین سرقت و عوامل محیطی محلی، ضرورت رویکرد جرم‌شناسی محیطی را برای پیشگیری از سرقت نشان می‌دهد.
با توجه به مدل پیش‌بینی نوع سرقت، برازش مدل از طریق مقایسه دو نوع مدل ارزیابی شد. مدل نوع I از کل داده های محیطی به عنوان داده ورودی استفاده می کند، در حالی که نوع S تنها از عوامل محیطی استفاده می کند که بر هر خوشه به عنوان داده ورودی با انجام تحلیل رگرسیون خطی چندگانه تأثیر می گذارد. در نتیجه مقایسه برازش مدل‌ها، تأیید شد که مدل نوع S که با انجام تحلیل رگرسیون خطی چندگانه تنها از عوامل محیطی تأثیرگذار بر هر خوشه به عنوان داده ورودی استفاده می‌کرد، برازش بالاتری را نشان داد. به طور کلی، انتظار می رود که هر چه تعداد متغیرها بیشتر باشد، نرخ پیش بینی مدل بالاتر خواهد بود. اگرچه انتظار می رود که متغیرهای بیشتر منجر به همبستگی بیشتر بین متغیرها شود، احتمال مشکلات چند خطی زیاد است. همانطور که مدل پیچیده می شود، به احتمال زیاد مشکلات بیش از حد برازش دارد. بر این اساس، زمانی که یک مدل پیش‌بینی جرم با استفاده از عوامل محیطی در آینده اجرا می‌شود، در صورتی که عوامل پس از تأیید تأثیر عوامل محیطی فردی از طریق تحلیل رگرسیون خطی چندگانه بر روی مدل اعمال شوند، می‌توان مدل پیش‌بینی با عملکرد بالاتر را پیاده‌سازی کرد. در مورد ترکیب مدل پیش‌بینی در این پژوهش، از آنجایی که می‌توان عوامل تأثیرگذار را شناسایی کرد، می‌توان اطلاعات مفیدی را نه تنها برای پیش‌بینی ساده نوع جرم، بلکه برای تهیه طرح‌هایی برای کاهش جرم ارائه کرد. همچنین به جای پیش‌بینی جرم، با استفاده از عوامل محیطی، جرایم خاص دسته‌بندی می‌شد. و همچنین تقسیمی از رابطه بین انواع مشتق شده و عوامل محیطی. در نهایت تنوع به روش های پیش بینی از طریق یک شبکه عصبی مصنوعی داده شد.
از آنجایی که جرم یک پدیده اجتماعی است که در آن عوامل متعددی از جمله عناصر فیزیکی، اجتماعی و اقتصادی به صورت ترکیبی عمل می کنند، این پژوهش با توجه به تجزیه و تحلیل جرم و در عین حال صرفاً بر عوامل محیطی محلی، دارای محدودیت هایی است. این مطالعه تنها متغیرهای عامل محیطی را مورد توجه قرار داده است زیرا یک مطالعه اساسی برای پیش‌بینی انواع سرقت با تایید رابطه بین این نوع و عوامل محیطی و با استفاده از عوامل به عنوان متغیر است. این معنادار است، زیرا این امکان را تعیین کرده است که مطالعات آتی می توانند مستحکم شوند و آنها را قادر می سازد تا با در نظر گرفتن عوامل مختلف مرتبط با جرم به عنوان متغیر، نتایج واضح تر و تجربی بیشتری بدست آورند. این مطالعه می تواند به عنوان یک مطالعه اساسی در هنگام انجام مطالعات پیچیده تر پیش بینی جرم با ادغام تمام جنبه های فیزیکی، اجتماعی،

پیوست اول

جدول A1. نتایج حاصل از عناصری که بر وقوع خوشه‌بندی تأثیر می‌گذارند.

منابع

  1. چن، اچ. چانگ، دبلیو. خو، جی جی. وانگ، جی. Qin، Y. Chau، M. داده کاوی جرم: یک چارچوب کلی و چند مثال. کامپیوتر 2004 ، 37 ، 50-56. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  2. لیو، اچ. براون، DE پیش‌بینی حادثه جنایی با استفاده از مدل چگالی مبتنی بر الگوی نقطه‌ای. بین المللی J. پیش بینی. 2003 ، 19 ، 603-622. [ Google Scholar ] [ CrossRef ]
  3. ناکایا، تی. یانو، ک. تجسم خوشه‌های جرم در مکعب فضا-زمان: یک رویکرد تحلیل داده‌های اکتشافی با استفاده از تخمین چگالی هسته فضا-زمان و آمار اسکن. معاملات 2010 ، 14 ، 223-239. [ Google Scholar ] [ CrossRef ]
  4. چاندرا، بی. گوپتا، م. گوپتا، MP یک رویکرد خوشه‌بندی سری زمانی چند متغیره برای پیش‌بینی روند جرم و جنایت. در مجموعه مقالات کنفرانس بین المللی IEEE 2008 در مورد سیستم ها، انسان و سایبرنتیک، سنگاپور، 12 تا 15 اکتبر 2008. صص 892-896. [ Google Scholar ]
  5. Newman, O. Defensible Space: Architectural Design for Crime Prevention ; اداره کمک به اجرای قانون وزارت دادگستری ایالات متحده خدمات مرجع ملی عدالت کیفری: واشنگتن، دی سی، ایالات متحده آمریکا، 1973; پ. 53.
  6. برانتینگهام، پی. برانتینگهام، پی. جرم و جنایت مکان. یورو جی. جنایت. پول Res. 1995 ، 3 ، 5-26. [ Google Scholar ] [ CrossRef ]
  7. جفری، CR پیشگیری از جرم از طریق طراحی محیطی . انتشارات سیج: بورلی هیلز، کالیفرنیا، ایالات متحده آمریکا، 1971; جلد 91. [ Google Scholar ]
  8. کالن، جی بی. لویت، SD Crime، پرواز شهری، و پیامدهای شهرها ؛ دفتر ملی تحقیقات اقتصادی: کمبریج، MA، ایالات متحده آمریکا، 1996. [ Google Scholar ]
  9. اک، جی. Weisburd، DL Crime مکان‌هایی در نظریه جنایت. محل جرم جنایت قبلی گل میخ. 2015 ، 4 ، 1-33. [ Google Scholar ]
  10. برانتینگهام، پی جی. برانتینگهام، جرم شناسی محیطی PL ; انتشارات سیج: بورلی هیلز، کالیفرنیا، ایالات متحده آمریکا، 1981; ص 27-54. [ Google Scholar ]
  11. مک کورد، ES؛ جری، تحلیل ارزش شدت منابع انسانی و اثرات جرم زایی ویژگی های کاربری زمین بر الگوهای جرم محلی. الگوهای جرم مقعدی. 2009 ، 2 ، 17-30. [ Google Scholar ]
  12. Bae، WK; کیم، اچ جی. Kwon, GO مطالعه ای در مورد رابطه بین الگوهای استفاده از زمین و نرخ جرم و جنایت – متمرکز بر بوندانگ نیوتاون در سال 2006. J. Urban Des. Inst. دس شهری کره 2009 ، 10 ، 5-20. [ Google Scholar ]
  13. گیر کرده، TD; Ottensmann، JR استفاده از زمین و جنایات خشونت آمیز. جرم شناسی 2009 ، 47 ، 1223-1264. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  14. کیم، DK; یون، YJ; Ahn, KH مطالعه ای در مورد جرم شهری در رابطه با الگوهای کاربری زمین. طرح J. کره. دانشیار 2007 ، 42 ، 155-168. [ Google Scholar ]
  15. لی، کی جی؛ کیم، وای جی؛ Hong, SJ یک مطالعه تجربی در مورد اکتشاف ارتباط فضایی بین جرم و استفاده از زمین. J. کره شهری Manag. دانشیار 2015 ، 28 ، 245-267. [ Google Scholar ]
  16. گوویس، مدارس RC به عنوان مولد جرم: فعالیت های معمول و جامعه شناسی مکان . دانشگاه آمریکایی: واشنگتن، دی سی، ایالات متحده آمریکا، 2002. [ Google Scholar ]
  17. Kautt، PM; دنیس، مدارس WR به عنوان نقاط داغ جنایی ابتدایی، متوسطه، و فراتر از آن. جنایت. Justice Rev. 2007 , 32 , 339-357. [ Google Scholar ] [ CrossRef ]
  18. انگستاد، فرصت های زیست محیطی PA و محیط زیست جنایت. در جنایت در جامعه کانادا ; Silverman, RA, Teevan, JJ, Eds. Butterworths: تورنتو، ON، کانادا، 1975. [ Google Scholar ]
  19. بلوک، RL; دیویس، اس. محیط ایستگاه های حمل و نقل سریع: کانونی برای جنایات خیابانی یا فقط یک مکان خطرناک دیگر؟ در جلوگیری از حمل و نقل انبوه جنایت ؛ کلارک، آر وی، اد. مطبوعات عدالت کیفری: مونسی، نیویورک، ایالات متحده آمریکا، 1996; صص 237-257. [ Google Scholar ]
  20. بلوک، RL; Block, CR برانکس و شیکاگو: سرقت خیابانی در محیط ایستگاه های حمل و نقل سریع. در تحلیل الگوهای جرم: مرزها در عمل . گلداسمیت، وی.، مک گوایر، پی جی، مولنکوپف، جی اچ، ویرایش. انتشارات Sage: Thousand Oaks, CA, USA, 2000; صص 137-152. [ Google Scholar ]
  21. گرینبرگ، ترس SW و رابطه آن با جنایت، زوال محله، و کنترل اجتماعی غیررسمی. بوم شناسی اجتماعی جرم ; Springer: نیویورک، نیویورک، ایالات متحده آمریکا، 1986; صص 47-62. [ Google Scholar ]
  22. ولز، BC; Farrington، DP Public CCTV و پیشگیری از جرم: بررسی سیستماتیک و متاآنالیز به روز شده. بخش عدالت. 2009 ، 26 ، 716-745. [ Google Scholar ] [ CrossRef ]
  23. فیلیپس، سی. بررسی ارزیابی های دوربین مدار بسته: اثرات کاهش جرم و نگرش نسبت به استفاده از آن. پیشگیری از جرم گل میخ. 1999 ، 10 ، 123-155. [ Google Scholar ]
  24. خو، ی. فو، سی. کندی، ای. جیانگ، اس. Owusu-Agyemang، S. تاثیر چراغ های خیابان بر الگوهای مکانی-زمانی جرم در دیترویت، میشیگان. شهرها 2018 ، 79 ، 45-52. [ Google Scholar ] [ CrossRef ]
  25. Park, MK پیاده‌سازی نقشه پیش‌بینی جرم با استفاده از تحلیل فضایی GIS: مطالعه موردی Seongbuk-gu ; دانشگاه کیونگ هی: سئول، کره، 2003. [ Google Scholar ]
  26. کواک، ام اس؛ کوون، جی جی؛ Sung, HG تأثیر محیط فیزیکی شهری بر وقوع جرم بر حسب نوع و زمان آن. طرح J. کره. دانشیار 2017 ، 52 ، 225-236. [ Google Scholar ] [ CrossRef ]
  27. محمود، ن. Zinnah، KI; رحمان، YA; احمد، N. Crimecast: پیش‌بینی جرم و خدمات هدایت استراتژی. در مجموعه مقالات نوزدهمین کنفرانس بین المللی کامپیوتر و فناوری اطلاعات (ICCIT) در سال 2016، داکا، بنگلادش، 18 تا 20 دسامبر 2016؛ ص 414-418. [ Google Scholar ]
  28. کانگ، HW; کانگ، HB پیش‌بینی وقوع جرم از داده‌های چندوجهی با استفاده از یادگیری عمیق. PLoS ONE 2017 , 12 , e0176244. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  29. لی، HI; کیم، KM تحلیل الگوی فضایی جرم شهری در منطقه شهری سئول. کره ای J. Public Saf. جنایت. فقط 2013 ، 22 ، 217-246. [ Google Scholar ]
  30. کیم، BH; Kim, KS مقالات تحقیقاتی عمومی: بهبود الگوریتم K-modes و الگوریتم ROCK. کره ای J. Appl. آمار 2002 ، 15 ، 381-393. [ Google Scholar ]
  31. Huang, Z. الگوریتم خوشه‌بندی سریع برای خوشه‌بندی مجموعه‌های داده‌های طبقه‌بندی بسیار بزرگ در داده کاوی. Res. مسائل حداقل داده بدانید. کشف کنید. 1997 ، 3 ، 281-297. [ Google Scholar ]
  32. لوکایتو، SA نقاط داغ جنایت در ایستگاه اتوبوس: اهمیت ویژگی های زیست محیطی. مربا. طرح. دانشیار 1999 ، 65 ، 395-411. [ Google Scholar ] [ CrossRef ]
  33. گراف، ای آر. Lockwood، B. امکانات جرم زا و جرم در سراسر بخش های خیابان در فیلادلفیا: کشف شواهد در مورد وسعت فضایی نفوذ تسهیلات. J. Res. جنایت دلینق. 2014 ، 51 ، 277-314. [ Google Scholar ] [ CrossRef ]
  34. کیم، ام اس؛ Lee, JY یک روش تبدیل داده برای تجسم اطلاعات آماری بر اساس شبکه. جی کره اسپات. به اطلاع رساندن. Soc. 2015 ، 23 ، 31-40. [ Google Scholar ]
  35. توس، CP; اوم، اس پی; شبکه های مستطیلی و شش ضلعی بیچم، JA برای مشاهده، آزمایش و شبیه سازی در اکولوژی استفاده می شود. Ecol. مدل. 2007 ، 206 ، 347-359. [ Google Scholar ] [ CrossRef ]
  36. سالاخوتدینوف، ر. منیح، ع. هینتون، جی. ماشین های بولتزمن را برای فیلتر مشترک محدود کرد. در سال 2007، مجموعه مقالات بیست و چهارمین کنفرانس بین المللی یادگیری ماشین، کوروالیس، OR، ایالات متحده آمریکا، 20 ژوئن 2007 . انجمن ماشین های محاسباتی: نیویورک، نیویورک، ایالات متحده آمریکا، 2007; صص 791-798. [ Google Scholar ]
  37. لی، اس. یونگ، اس. مدل پیش‌بینی لی، جی بر اساس یک شبکه عصبی مصنوعی برای مصرف انرژی ساختمان مبتنی بر کاربر در کره جنوبی. Energies 2019 ، 12 ، 608. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  38. هوانگ، دبلیو. Foo, S. مدل‌سازی شبکه عصبی تغییرات شوری در رودخانه آپالاچیکولا. Water Res. 2002 ، 36 ، 356-362. [ Google Scholar ] [ CrossRef ]
  39. Hwang, JT مطالعه ای در مورد انتخاب هدف سارقان، سارقان و سارقان. موسسه کره ای Criminol. 2004 ، 04-26 ، 217-247. [ Google Scholar ]
  40. Cohen, J. Statistical Power Analysis for the Behavioral Sciences , 2nd ed.; لارنس ارلباوم همکاران: هیلزدیل، نیوجرسی، ایالات متحده آمریکا، 1988. [ Google Scholar ]
شکل 1. تفاوت در روند توسعه مدل پیش بینی جرم ANN. ( الف ) فرآیند توسعه مدل پیش‌بینی جرم عمومی؛ ( ب ) فرآیند توسعه مدل پیش‌بینی جرم پیشنهاد شده در این مطالعه.
شکل 2. فرآیند تحقیق.
شکل 3. نقشه ای از ناحیه دونگجاک، سئول در یک شبکه شش ضلعی با شعاع 50 متر.
شکل 4. ساختار مدل شبکه عصبی مصنوعی (ANN).
شکل 5. مقادیر بر اساس دسته بندی مورد دسته بندی. الف ) روش جرم؛ ب ) زمان وقوع جرم. ج ) جنسیت قربانی؛ ( د ) طبقه بندی مکان. ( ه ) نرخ جرم در هر خوشه.
شکل 6. توزیع فضایی خوشه ها. ( الف ) توزیع خوشه A. ( ب ) توزیع خوشه B. ( ج ) توزیع خوشه C. ( د ) توزیع خوشه D.
شکل 7. خوشه مدلی برای پیش بینی وقوع جرم (لایه: 2، گره: 7). ( الف ) نتیجه رگرسیون داده های آموزشی. ( ب ) رگرسیون داده های اعتبارسنجی. ( ج ) نتایج رگرسیون داده را آزمایش کنید.
شکل 8. مدل خوشه B برای پیش بینی وقوع جرم (لایه: 4، گره: 6). ( الف ) نتیجه رگرسیون داده های آموزشی. ( ب ) رگرسیون داده های اعتبارسنجی. ( ج ) نتایج رگرسیون داده را آزمایش کنید.
شکل 9. مدل خوشه C برای پیش بینی وقوع جرم (لایه: 2، گره: 7). ( الف ) نتیجه رگرسیون داده های آموزشی. ( ب ) رگرسیون داده های اعتبارسنجی. ( ج ) نتایج رگرسیون داده را آزمایش کنید.
شکل 10. مدل خوشه ای D برای پیش بینی وقوع جرم (لایه: 1، گره: 9). ( الف ) نتیجه رگرسیون داده های آموزشی. ( ب ) رگرسیون داده های اعتبارسنجی. ( ج ) نتایج رگرسیون داده را آزمایش کنید.
جدول 1. مجموعه داده برای خوشه بندی K-modes.
جدول 2. ساخت داده ها، آمار توصیفی و نتایج تجزیه و تحلیل عامل تورم واریانس (VIF).
جدول 3. نتایج تحلیل تناسب و توان توضیحی مدل.
جدول 4. فهرست متغیرهای مهم برای خوشه بندی.
جدول 5. عملکرد یک مدل برای پیش بینی انواع سرقت توسط لایه های پنهان.
جدول 6. عملکرد مدل های پیش بینی با توجه به نوع داده های ورودی.

بدون دیدگاه

دیدگاهتان را بنویسید