مدیریت پایگاه داده های جغرافیایی

هدف یادگیری

  1. هدف این بخش درک ویژگی های اساسی یک سیستم مدیریت پایگاه داده رابطه ای است.

پایگاه داده مجموعه ای ساختار یافته از فایل های داده است. سیستم مدیریت پایگاه داده (DBMS)یک بسته نرم افزاری است که امکان ایجاد، ذخیره سازی، نگهداری، دستکاری و بازیابی مجموعه داده های بزرگی را که در یک یا چند فایل توزیع شده اند را فراهم می کند. یک DBMS و عملکردهای مرتبط با آن معمولاً از طریق بسته های نرم افزاری تجاری مانند Microsoft Access، Oracle، FileMaker Pro یا Avanquest MyDataBase قابل دسترسی هستند. مدیریت پایگاه داده معمولاً به مدیریت داده های جدولی در قالب ردیف و ستون اشاره دارد و اغلب برای فعالیت های شخصی، تجاری، دولتی و علمی استفاده می شود. سیستم های مدیریت پایگاه داده جغرافیایی، به طور متناوب، شامل عملکرد یک DBMS است، اما همچنین حاوی اطلاعات جغرافیایی خاصی در مورد هر نقطه داده مانند هویت، مکان، شکل و جهت می باشد.

انواع مختلفی از مدل های پایگاه داده وجود دارد، مانند مدل های مسطح، سلسله مراتبی، شبکه ای و رابطه ای (Worboys 1995؛ Jackson 1999). Worboys, MF 1995. GIS: A Computing Perspective . لندن: تیلور و فرانسیس. ، جکسون، M. 1999. “سی سال (و بیشتر) از پایگاه های داده.” فناوری اطلاعات و نرم افزار 41: 969-78. یک پایگاه داده مسطح اساساً صفحه گسترده ای است که به موجب آن همه داده ها در یک جدول واحد و بزرگ ذخیره می شوند ( شکل 5.4 “پایگاه داده تخت” ). یک پایگاه داده سلسله مراتبی همچنین یک مدل نسبتاً ساده است که داده ها را در یک انجمن “یک به چند” در سراسر سطوح سازماندهی می کند ( شکل 5.5 “پایگاه داده سلسله مراتبی”). نمونه‌های رایج این مدل شامل درختان فیلوژنتیک برای طبقه‌بندی گیاهان و جانوران و درختان تبارشناسی خانوادگی است که روابط والد-فرزند را نشان می‌دهد. پایگاه داده های شبکه مشابه پایگاه های داده سلسله مراتبی هستند، با این حال، زیرا آنها همچنین از روابط “چند به چند” پشتیبانی می کنند ( شکل 5.6 “پایگاه داده شبکه” ). این قابلیت گسترش یافته انعطاف پذیری بیشتری را در جستجوی مجموعه داده ها فراهم می کند و افزونگی احتمالی اطلاعات را کاهش می دهد. از طرف دیگر، هر دو مدل سلسله مراتبی و شبکه می توانند بسته به اندازه پایگاه های داده و تعداد تعاملات بین نقاط داده، بسیار پیچیده شوند. نرم افزار مدرن سیستم اطلاعات جغرافیایی (GIS) معمولاً از مدل چهارمی استفاده می کند که به عنوان پایگاه داده رابطه ای نامیده می شود (Codd 1970).Codd, E. 1970. “یک مدل رابطه ای از داده ها برای بانک های داده های مشترک بزرگ.” ارتباطات انجمن ماشین های محاسباتی 13 (6): 377-87.

شکل 5.4 پایگاه داده تخت

شکل 5.5 پایگاه داده سلسله مراتبی

شکل 5.6 پایگاه داده شبکه

سیستم های مدیریت پایگاه داده رابطه ای

سیستم مدیریت پایگاه داده رابطه ای (RDBMS) مجموعه ای از جداول است که به گونه ای به هم متصل شده اند که بدون سازماندهی مجدد جداول می توان به داده ها دسترسی داشت. جداول به گونه ای ایجاد می شوند که هر ستون یک ویژگی خاص را نشان می دهد (به عنوان مثال، نوع خاک، شماره پین، نام خانوادگی، سطح زمین) و هر ردیف شامل یک نمونه منحصر به فرد از داده ها برای آن ویژگی ستونی است (به عنوان مثال، خاک های دهلی ساندز، 5555، اسمیت، 412.3 هکتار)

در مدل رابطه ای، هر جدول (که تعجب آور نیست یک رابطه نامیده می شود ) از طریق کلیدهای از پیش تعیین شده به جدول دیگری مرتبط می شود (تاریخ 1995). تاریخ، C. 1995. مقدمه ای بر سیستم های پایگاه داده . ریدینگ، MA: ادیسون-وسلی. کلید اصلی نشان دهنده ویژگی (ستون) است که مقدار آن به طور منحصر به فرد یک رکورد (ردیف) خاص را در رابطه (جدول) مشخص می کند. کلید اولیه ممکن است حاوی مقادیر گمشده نباشد، زیرا چندین مقدار از دست رفته نشان دهنده موجودیت های غیر منحصر به فردی است که قانون اساسی کلید اصلی را نقض می کند. کلید اولیه مربوط به یک ویژگی یکسان در جدول ثانویه (و احتمالاً سوم، چهارم، پنجم و غیره) به نام کلید خارجی است.. این باعث می شود که تمام اطلاعات جدول اول مستقیماً با اطلاعات جدول دوم از طریق کلیدهای اصلی و خارجی مرتبط باشد، از این رو اصطلاح DBMS “رابطه ای” نامیده می شود. با وجود این پیوندها، جداول درون پایگاه داده را می توان بسیار ساده نگه داشت و در نتیجه حداقل زمان محاسبات و پیچیدگی فایل را به همراه داشت. این فرآیند را می توان در بسیاری از جداول تکرار کرد تا زمانی که هر یک حاوی یک کلید خارجی باشد که با کلید اصلی جدول دیگر مطابقت دارد.

مدل رابطه ای دو مزیت اصلی نسبت به سایر مدل های پایگاه داده که قبلا توضیح داده شد، دارد. ابتدا، اکنون می توان هر جدول را جداگانه تهیه، نگهداری و ویرایش کرد. این به ویژه هنگامی مفید است که اندازه بالقوه عظیم بسیاری از پایگاه های داده مدرن امروزی را در نظر بگیریم. دوم، جداول ممکن است به طور جداگانه نگهداری شوند تا زمانی که نیاز به یک پرس و جو یا تجزیه و تحلیل خاص، جداول را به هم مرتبط کند. این کارایی بالایی را برای پردازش اطلاعات در یک پایگاه داده معین ایجاد می کند.

ممکن است برای خواننده آشکار شود که پتانسیل زیادی برای افزونگی در این مدل وجود دارد، زیرا هر جدول باید دارای یک ویژگی باشد که با یک ویژگی در هر جدول مرتبط دیگر مطابقت دارد. بنابراین، افزونگی باید به طور فعال در یک RDBMS نظارت و مدیریت شود. برای انجام این کار، مجموعه‌ای از قوانین به نام اشکال عادی ایجاد شده است (Codd 1970). Codd, E. 1970. “یک مدل رابطه ای از داده ها برای بانک های داده های مشترک بزرگ.” ارتباطات انجمن ماشین های محاسباتی 13 (6): 377-87. سه شکل عادی اساسی وجود دارد. اولین فرم عادی ( شکل 5.7 “نقض اولین فرم عادی (بالا) و رفع (در زیر)” ) به پنج شرطی اشاره دارد که باید رعایت شوند (تاریخ 1995). تاریخ، C. 1995.مقدمه ای بر سیستم های پایگاه داده . ریدینگ، MA: ادیسون-وسلی. آنها به شرح زیر است:

  1. ترتیب ترتیب ردیف ها وجود ندارد.
  2. هیچ ترتیبی برای ترتیب ستون ها وجود ندارد.
  3. هر ردیف منحصر به فرد است.
  4. هر سلول حاوی یک و تنها یک مقدار است.
  5. تمام مقادیر در یک ستون به یک موضوع مربوط می شود.

شکل 5.7 اولین نقض فرم عادی (بالا) و رفع (زیر)

دومین شکل عادی بیان می کند که هر ستونی که کلید اصلی نیست باید به کلید اصلی وابسته باشد. این امر با حذف پتانسیل چند کلید اصلی در چندین جدول، افزونگی را کاهش می دهد. این مرحله اغلب شامل ایجاد جداول جدید برای حفظ عادی سازی است.

شکل 5.8 دوم نقض فرم عادی (بالا) و رفع (زیر)

سومین شکل عادی بیان می کند که همه کلیدهای غیر اصلی باید به کلید اصلی وابسته باشند، در حالی که کلید اصلی مستقل از همه کلیدهای غیر اصلی باقی می ماند. این فرم به طرز زیرکانه ای توسط کنت (1983) Kent, W. 1983 خلاصه شد. “راهنمای ساده ای برای پنج فرم رسمی در نظریه پایگاه داده رابطه ای.” ارتباطات انجمن محاسبات و ماشین آلات . 26 (2): 120-25. او با کنایه گفت که همه کلیدهای غیراصولی “باید یک واقعیت در مورد کلید، کل کلید و چیزی جز کلید ارائه دهند.” تکرار این نقل قول پاسخی است: “پس به من کمک کن کاد” (ارتباط شخصی با فورسمن 1989).

شکل 5.9 سومین نقض فرم عادی (بالا) و رفع (زیر)

می پیوندد و مرتبط می شود

یک مزیت اضافی RDBMS این است که به داده های ویژگی در جداول جداگانه اجازه می دهد تا به صورت post hoc پیوند داده شوند. دو عملیاتی که معمولاً برای انجام این کار مورد استفاده قرار می‌گیرند، Join و Relate هستند. پیوستن _عملیات فیلدهای یک جدول را با استفاده از یک ویژگی یا فیلد مشترک در هر دو جدول به جدول دوم اضافه می کند. این معمولاً برای ترکیب اطلاعات ویژگی از یک یا چند جدول داده غیرمکانی (یعنی اطلاعات گرفته شده از گزارش ها یا اسناد) با یک لایه ویژگی GIS صریح فضایی استفاده می شود. نوع دوم پیوستن اطلاعات ویژگی‌ها را بر اساس موقعیت مکانی و ارتباط به جای ویژگی‌های مشترک ترکیب می‌کند. در ArcGIS سه نوع اتصال فضایی موجود است. کاربران ممکن است (1) هر ویژگی را با نزدیکترین ویژگی مطابقت دهند، (2) هر ویژگی را با ویژگی که بخشی از آن است، یا (3) هر ویژگی را با ویژگی که قطع می کند مطابقت دهند.

از طرف دیگر، عملیات Relate به طور موقت دو لایه یا جدول نقشه را به هم مرتبط می کند در حالی که آنها را از نظر فیزیکی جدا نگه می دارد. Relate ها دو طرفه هستند، بنابراین می توان به داده ها از یکی از جداول با انتخاب رکوردها در جدول دیگر دسترسی پیدا کرد. عملیات Relate همچنین امکان ارتباط سه یا چند جدول را در صورت لزوم فراهم می کند.

گاهی اوقات ممکن است مشخص نباشد که از کدام عملیات باید استفاده کرد. به عنوان یک قاعده کلی، اتصال ها برای نمونه هایی که شامل روابط یک به یک یا چند به یک هستند مناسب هستند. اتصالات همچنین به دلیل این واقعیت که داده های دو جدول به راحتی در جدول خروجی منفرد قابل مشاهده هستند سودمند هستند. از سوی دیگر، استفاده از Relate ها برای همه روابط جدول (یک به یک، یک به چند، چند به یک و چند به چند) مناسب است. با این حال، آنها می توانند زمان دسترسی به رایانه را کاهش دهند، اگر جداول به ویژه بزرگ باشند یا در مکان های دور پخش شده باشند.

خوراکی های کلیدی

  • سیستم های مدیریت پایگاه داده می توانند مسطح، سلسله مراتبی، شبکه ای یا رابطه ای باشند.
  • سیستم های مدیریت پایگاه داده رابطه ای (RDBMS) از کلیدهای اولیه و کلیدهای خارجی برای پیوند دادن جداول داده استفاده می کنند.
  • مدل RDBMS با استفاده از سه “شکل عادی” اساسی، افزونگی داده ها را کاهش می دهد.

ورزش

  1. در جدول زیر سه تخلف از اشکال عادی را مشخص کنید.
مربی کلاس شماره کلاس ثبت نام
لنون حساب دیفرانسیل و انتگرال پیشرفته 10073 34
مک کارتنی تربیت بدنی مقدماتی 10045 23
هریسون تعمیر خودرو و فمینیسم 10045 54
ستاره، بهترین فیزیک کوانتوم 10023 39

9 نظرات

دیدگاهتان را بنویسید