مدل های داده برداری

هدف یادگیری

  1. هدف این بخش درک چگونگی پیاده سازی مدل های داده برداری در برنامه های GIS است.

در مقابل مدل داده های شطرنجی، مدل داده های برداری است. در این مدل، فضا مانند مدل شطرنجی به سلول‌های شبکه‌ای مجزا تبدیل نمی‌شود. مدل‌های داده برداری از نقاط و جفت‌های مختصات X، Y مرتبط با آن‌ها برای نمایش رئوس ویژگی‌های فضایی استفاده می‌کنند، دقیقاً مثل اینکه آنها با دست روی نقشه ترسیم می‌شوند (آرونوف 1989). Aronoff, S. 1989. سیستم های اطلاعات جغرافیایی: دیدگاه مدیریت . اتاوا، کانادا: انتشارات WDL. سپس ویژگی های داده این ویژگی ها در یک سیستم مدیریت پایگاه داده جداگانه ذخیره می شود. اطلاعات مکانی و اطلاعات ویژگی برای این مدل‌ها از طریق یک شماره شناسایی ساده که به هر ویژگی در نقشه داده می‌شود، مرتبط می‌شوند.

سه نوع بردار اساسی در سیستم های اطلاعات جغرافیایی (GIS) وجود دارد: نقاط، خطوط و چندضلعی ها ( شکل 4.8 “نقاط، خطوط و چند ضلعی” ). نقاط اشیایی با ابعاد صفر هستند که فقط یک جفت مختصات دارند. نقاط معمولاً برای مدل‌سازی ویژگی‌های مجزا و منفرد مانند ساختمان‌ها، چاه‌ها، تیرهای برق، مکان‌های نمونه و غیره استفاده می‌شوند. نقاط فقط دارای خاصیت مکان هستند. انواع دیگر ویژگی های نقطه شامل گره و راس است. به طور خاص، یک نقطه یک ویژگی مستقل است، در حالی که یک گره یک اتصال توپولوژیکی است که یک جفت مختصات مشترک X، Y بین خطوط متقاطع و/یا چندضلعی ها را نشان می دهد. رئوس به عنوان هر خم در امتداد یک خط یا ویژگی چند ضلعی که محل تلاقی خطوط یا چندضلعی ها نیست، تعریف می شود.

شکل 4.8 نقاط، خطوط و چندضلعی ها

نقاط را می توان به صورت فضایی به هم پیوند داد تا ویژگی های پیچیده تری را تشکیل دهند. خطوط ، ویژگی های یک بعدی هستند که از چندین نقطه به طور صریح به هم متصل شده اند. خطوط برای نشان دادن ویژگی های خطی مانند جاده ها، نهرها، گسل ها، مرزها و غیره استفاده می شوند. خطوط دارای خاصیت طول هستند. خطوطی که مستقیماً دو گره را به هم متصل می کنند، گاهی اوقات به عنوان زنجیره، لبه، بخش یا قوس نامیده می شوند .

چند ضلعی ها ویژگی های دو بعدی هستند که توسط چندین خط ایجاد می شوند که برای ایجاد یک ویژگی “بسته” به عقب برمی گردند. در مورد چند ضلعی ها، اولین جفت مختصات (نقطه) در پاره خط اول با آخرین جفت مختصات در آخرین پاره خط یکسان است. چند ضلعی ها برای نشان دادن ویژگی هایی مانند مرزهای شهر، سازندهای زمین شناسی، دریاچه ها، انجمن های خاک، جوامع گیاهی و غیره استفاده می شوند. چند ضلعی ها دارای خواص مساحت و محیط هستند. به چند ضلعی ها ناحیه نیز گفته می شود .

ساختارهای مدل های داده برداری

مدل های داده برداری را می توان به روش های مختلفی ساختار داد. ما در اینجا دو مورد از رایج‌ترین ساختارهای داده را بررسی خواهیم کرد. ساده ترین ساختار داده برداری، مدل داده اسپاگتی نامیده می شود (دانگرموند 1982). Dangermond، J. 1982. “طبقه بندی اجزای نرم افزاری که معمولا در سیستم های اطلاعات جغرافیایی استفاده می شود.” در مجموعه مقالات کارگاه آموزشی ایالات متحده و استرالیا در مورد طراحی و پیاده سازی سیستم های اطلاعات جغرافیایی مبتنی بر رایانه ، 70-91. هونولولو، HI. در مدل اسپاگتی، هر نقطه، خط، و/یا ویژگی چند ضلعی به صورت رشته‌ای از جفت مختصات X، Y (یا به صورت یک جفت مختصات X، Y در مورد یک تصویر برداری با یک نقطه) نشان داده می‌شود. ساختار ذاتی ( شکل 4.9 “مدل داده اسپاگتی”). می توان هر خط را در این مدل به عنوان یک رشته اسپاگتی تصور کرد که با افزودن رشته های بیشتر و بیشتر اسپاگتی به اشکال پیچیده تبدیل می شود. قابل توجه است که در این مدل، هر چند ضلعی که در مجاورت یکدیگر قرار می گیرد باید از خطوط خود یا پایه های اسپاگتی تشکیل شده باشد. به عبارت دیگر، هر چند ضلعی باید به طور منحصربه‌فرد توسط مجموعه‌ای از جفت‌های مختصات X، Y تعریف شود، حتی اگر چند ضلعی‌های مجاور دقیقاً اطلاعات مرزی یکسانی را به اشتراک بگذارند. این باعث ایجاد برخی افزونگی ها در مدل داده شده و در نتیجه کارایی را کاهش می دهد.

شکل 4.9 مدل داده اسپاگتی

علیرغم تعیین مکان های مرتبط با هر خط یا رشته اسپاگتی، روابط فضایی به صراحت در مدل اسپاگتی کدگذاری نشده است. بلکه با موقعیت مکانی آنها دلالت دارند. این منجر به کمبود اطلاعات توپولوژیکی می شود که اگر کاربر تلاش کند اندازه گیری یا تجزیه و تحلیل کند مشکل ساز است. بنابراین، اگر هر تکنیک تحلیلی پیشرفته ای بر روی فایل های برداری که به این ترتیب ساختار یافته اند به کار گرفته شود، الزامات محاسباتی بسیار زیاد است. با این وجود، ساختار ساده مدل داده اسپاگتی امکان بازتولید کارآمد نقشه ها و گرافیک ها را فراهم می کند زیرا این اطلاعات توپولوژیکی برای رسم و چاپ غیر ضروری است.

برخلاف مدل داده اسپاگتی، مدل داده توپولوژیکی با گنجاندن اطلاعات توپولوژیکی در مجموعه داده مشخص می شود، همانطور که از نام آن پیداست. توپولوژیمجموعه ای از قوانین است که روابط بین نقاط، خطوط و چندضلعی های همسایه را مدل می کند و نحوه اشتراک هندسه آنها را تعیین می کند. به عنوان مثال، دو چند ضلعی مجاور را در نظر بگیرید. در مدل اسپاگتی، مرز مشترک دو چند ضلعی مجاور به صورت دو خط مجزا و یکسان تعریف می شود. گنجاندن توپولوژی در مدل داده به یک خط اجازه می دهد تا این مرز مشترک را با یک مرجع صریح نشان دهد تا مشخص کند کدام سمت خط به کدام چند ضلعی تعلق دارد. توپولوژی همچنین به حفظ ویژگی‌های فضایی زمانی که فرم‌ها خم شده، کشیده می‌شوند یا تحت تغییرات هندسی مشابه قرار می‌گیرند، مرتبط است، که امکان پیش‌بینی و بازپخش کارآمدتر فایل‌های نقشه را فراهم می‌کند.

سه قانون اساسی توپولوژیکی که برای درک مدل داده های توپولوژیکی ضروری است در اینجا تشریح شده است. ابتدا، اتصال ، توپولوژی گره قوس را برای مجموعه داده ویژگی توصیف می کند. همانطور که قبلاً بحث شد، گره ها چیزی بیش از نقاط ساده هستند. در مدل داده های توپولوژیکی، گره ها نقاط تقاطعی هستند که در آن دو یا چند قوس به هم می رسند. در مورد توپولوژی گره قوس، کمان ها دارای هر دو گره از گره (یعنی گره شروع) هستند که نشان می دهد قوس از کجا شروع می شود و یک گره به گره (یعنی گره پایانی) نشان می دهد که قوس در کجا به پایان می رسد ( شکل 4.10 “Arc-Node” توپولوژی” ). علاوه بر این، بین هر جفت گره یک پاره خط وجود دارد که گاهی پیوند نامیده می شود که شماره شناسایی خاص خود را دارد و هم از گره و هم به گره آن را ارجاع می دهد. در شکل 4.10 “توپولوژی گره قوس”، کمان های 1، 2 و 3 همگی با هم قطع می شوند زیرا گره 11 را به اشتراک می گذارند. بنابراین، رایانه می تواند تعیین کند که امکان حرکت در امتداد قوس 1 و چرخش به قوس 3 وجود دارد، در حالی که امکان حرکت از قوس 1 به قوس 5 وجود ندارد. ، زیرا آنها یک گره مشترک ندارند.

شکل 4.10 توپولوژی گره قوس

دومین دستور توپولوژیکی پایه، تعریف ناحیه است . تعریف ناحیه بیان می‌کند که کمانی که به اطراف یک ناحیه متصل می‌شود، یک چند ضلعی را تعریف می‌کند که توپولوژی چندضلعی-قوسی نیز نامیده می‌شود. در مورد توپولوژی قوس چند ضلعی، از کمان ها برای ساخت چند ضلعی ها استفاده می شود و هر کمان فقط یک بار ذخیره می شود ( شکل 4.11 “توپولوژی چند ضلعی-قوس” ). این منجر به کاهش مقدار داده های ذخیره شده می شود و تضمین می کند که مرزهای چند ضلعی مجاور همپوشانی ندارند. در شکل 4.11 “توپولوژی چند ضلعی-قوس” ، توپولوژی چند ضلعی-قوسی مشخص می کند که چند ضلعی F از کمان های 8، 9 و 10 تشکیل شده است.

شکل 4.11 توپولوژی Polygon-Arc

مجاورت ، سومین حکم توپولوژیکی، مبتنی بر این مفهوم است که چند ضلعی هایی که یک مرز مشترک دارند مجاور تلقی می شوند. به طور خاص، توپولوژی چند ضلعی مستلزم این است که همه کمان‌ها در یک چند ضلعی یک جهت داشته باشند (یک گره از گره و یک به گره)، که امکان تعیین اطلاعات مجاورت را فراهم می‌کند ( شکل 4.12 “توپولوژی چند ضلعی” ). چند ضلعی هایی که یک کمان مشترک دارند مجاور یا به هم پیوسته در نظر گرفته می شوند و بنابراین می توان ضلع “چپ” و “راست” هر کمان را تعریف کرد. این اطلاعات چند ضلعی چپ و راست به صراحت در اطلاعات ویژگی مدل داده توپولوژیکی ذخیره می شود. “چند ضلعی جهان” جزء ضروری توپولوژی چند ضلعی است که ناحیه خارجی واقع در خارج از منطقه مورد مطالعه را نشان می دهد. شکل 4.12 “توپولوژی چند ضلعی”نشان می دهد که کمان 6 در سمت چپ توسط چند ضلعی B و به سمت راست توسط چند ضلعی C محدود شده است.

شکل 4.12 توپولوژی چند ضلعی

توپولوژی به رایانه اجازه می دهد تا به سرعت روابط فضایی همه ویژگی های شامل آن را تعیین و تجزیه و تحلیل کند. علاوه بر این، اطلاعات توپولوژیکی مهم است زیرا امکان تشخیص خطای کارآمد در یک مجموعه داده برداری را فراهم می کند. در مورد ویژگی‌های چند ضلعی، چند ضلعی‌های باز یا بسته نشده، که زمانی رخ می‌دهند که یک قوس به طور کامل به خودش حلقه نمی‌زند، و چند ضلعی‌های بدون برچسب، که زمانی رخ می‌دهند که ناحیه‌ای حاوی اطلاعات ویژگی نباشد، قوانین توپولوژی قوس چند ضلعی را نقض می‌کنند. یکی دیگر از خطاهای توپولوژیکی که در ویژگی های چند ضلعی یافت می شود، sliver است. برش زمانی رخ می دهد که مرز مشترک دو چند ضلعی دقیقاً به هم نمی رسد ( شکل 4.13 “خطاهای توپولوژیکی رایج” ).

در مورد ویژگی های خط، خطاهای توپولوژیکی زمانی رخ می دهد که دو خط به طور کامل در یک گره به هم نمی رسند. این خطا زمانی که خطوط به اندازه کافی امتداد نمی‌یابند تا به یکدیگر برسند و زمانی که خط فراتر از ویژگی‌ای که باید به آن متصل شود گسترش می‌یابد، «بیش از حد» نامیده می‌شود ( شکل 4.13 «خطاهای توپولوژیکی رایج» ). نتیجه بیش از حد و زیر شاخه یک “گره آویزان” در انتهای خط است. گره‌های آویزان همیشه یک خطا نیستند، زیرا در خیابان‌های بن‌بست در نقشه راه رخ می‌دهند.

شکل 4.13 خطاهای توپولوژیکی رایج

بسیاری از انواع تحلیل فضایی نیاز به درجه سازماندهی ارائه شده توسط مدل های داده صریح توپولوژیکی دارند. به طور خاص، تجزیه و تحلیل شبکه (به عنوان مثال، یافتن بهترین مسیر از یک مکان به مکان دیگر) و اندازه گیری (به عنوان مثال، یافتن طول یک بخش رودخانه) به شدت بر مفهوم گره های to- و from- تکیه دارد و از این اطلاعات، همراه با اطلاعات ویژگی، برای محاسبه مسافت ها، کوتاه ترین مسیرها، سریع ترین مسیرها و غیره. توپولوژی همچنین امکان تجزیه و تحلیل پیچیده همسایگی مانند تعیین مجاورت، خوشه بندی، نزدیکترین همسایگان و غیره را فراهم می کند.

اکنون که اصول اولیه مفاهیم توپولوژی بیان شد، می‌توانیم مدل داده‌های توپولوژیکی را بهتر درک کنیم. در این مدل، گره بیش از یک نقطه ساده در امتداد یک خط یا چند ضلعی عمل می کند. گره نشان دهنده نقطه تقاطع دو یا چند قوس است. کمان ها ممکن است در چند ضلعی حلقه شوند یا نباشند. صرف نظر از این، همه گره ها، کمان ها و چند ضلعی ها به صورت جداگانه شماره گذاری می شوند. این شماره گذاری امکان ارجاع سریع و آسان در مدل داده را فراهم می کند.

مزایا/معایب مدل برداری

در مقایسه با مدل داده‌های شطرنجی، مدل‌های داده برداری به دلیل دقت و دقت نقاط، خطوط و چند ضلعی‌ها روی سلول‌های شبکه با فاصله منظم مدل شطرنجی، نمایش بهتری از واقعیت دارند. این منجر به داده های برداری می شود که از نظر زیبایی شناختی دلپذیرتر از داده های شطرنجی هستند.

داده های برداری همچنین توانایی افزایش یافته ای را برای تغییر مقیاس مشاهده و تجزیه و تحلیل فراهم می کند. از آنجایی که هر جفت مختصات مرتبط با یک نقطه، خط و چند ضلعی یک مکان بی نهایت دقیق را نشان می‌دهد (البته با تعداد ارقام مهم و/یا روش‌های اکتساب داده محدود شده است)، بزرگ‌نمایی عمیق در یک تصویر برداری، نمای گرافیک برداری را تغییر نمی‌دهد. به روشی که یک گرافیک شطرنجی را انجام می دهد ( شکل 4.1 “تصویر دیجیتالی با داخل بزرگنمایی شده نمایش پیکسل شدن تصویر شطرنجی” را ببینید).

داده‌های برداری از نظر ساختار داده فشرده‌تر هستند، بنابراین اندازه فایل‌ها معمولاً بسیار کوچک‌تر از همتایان شطرنجی خود هستند. اگرچه توانایی کامپیوترهای مدرن اهمیت حفظ اندازه فایل های کوچک را به حداقل رسانده است، داده های برداری اغلب در مقایسه با داده های شطرنجی به کسری از فضای ذخیره سازی کامپیوتر نیاز دارند.

مزیت نهایی داده های برداری این است که توپولوژی در مدل برداری ذاتی است. این اطلاعات توپولوژیکی منجر به تجزیه و تحلیل فضایی ساده شده (به عنوان مثال، تشخیص خطا، تجزیه و تحلیل شبکه، تجزیه و تحلیل مجاورت، و تبدیل فضایی) هنگام استفاده از یک مدل برداری می شود.

روش دیگر، دو نقطه ضعف اصلی مدل داده برداری وجود دارد. اولاً، ساختار داده‌ها بسیار پیچیده‌تر از مدل داده‌های شطرنجی ساده است. از آنجایی که مکان هر رأس باید به طور صریح در مدل ذخیره شود، هیچ میانبری برای ذخیره سازی داده ها مانند مدل های شطرنجی وجود ندارد (مثلاً روش های رمزگذاری طول اجرا و چهار درخت).

دوم، اجرای تحلیل فضایی نیز می‌تواند به دلیل تفاوت‌های جزئی در دقت و دقت بین مجموعه داده‌های ورودی، نسبتاً پیچیده باشد. به طور مشابه، الگوریتم‌های دستکاری و تحلیل داده‌های برداری پیچیده هستند و می‌توانند به نیازمندی‌های پردازشی فشرده منجر شوند، به‌ویژه زمانی که با مجموعه داده‌های بزرگ سروکار داریم.

خوراکی های کلیدی

  • داده های برداری از نقاط، خطوط و چندضلعی ها برای نمایش ویژگی های فضایی در نقشه استفاده می کنند.
  • توپولوژی یک ویژگی جغرافیایی اطلاعاتی است که اتصال، تعریف ناحیه و مجاورت نقاط، خطوط و چندضلعی مرتبط با هم را توصیف می کند.
  • بسته به ساختار داده فایل، داده های برداری ممکن است از نظر توپولوژیکی صریح باشند یا نباشند.
  • باید دقت کرد که آیا مدل داده‌های شطرنجی یا برداری برای داده‌ها و/یا نیازهای تحلیلی شما مناسب‌تر است یا خیر.

تمرینات

  1. کدام نوع برداری (نقطه، خط یا چند ضلعی) ویژگی های زیر را به بهترین شکل نشان می دهد: مرزهای ایالت، قطب های تلفن، ساختمان ها، شهرها، شبکه های جریان، قله های کوه، انواع خاک، مسیرهای پرواز؟ کدام یک از این ویژگی ها را می توان با چندین نوع برداری نشان داد؟ چه شرایطی ممکن است باعث شود یک نوع برداری را بر دیگری انتخاب کنید؟
  2. بر روی یک سیستم مختصات دکارتی یک ویژگی نقطه، خط و چندضلعی رسم کنید. از این نقاشی، یک مدل داده اسپاگتی ایجاد کنید که به شکل های نشان داده شده در آن تقریبی دارد.
  3. سه چند ضلعی مجاور را بر روی یک سیستم مختصات دکارتی ساده رسم کنید. از این نقشه، یک مدل داده توپولوژیکی ایجاد کنید که توپولوژی گره قوس، چندضلعی-قوس و چندضلعی را در خود جای دهد.

6 نظرات

دیدگاهتان را بنویسید