مدل دادههای رستری
مدل دادههای رستری بر اساس نمای میدانی فضای جغرافیایی است. فضای جغرافیایی را با استفاده از شبکه ای از سلولها پوشش میدهد که هر سلول دارای یک مقدار است. بنابراین، مدل دادههای رستری ویژگیهای جغرافیایی و ویژگیهای آنها را در هر مکان ثبت میکند. این شامل مفاهیم سلول، ارزش سلول و اندازه سلول است. شبکه اغلب رستر نامیده میشود.
سلولهای رستری معمولاً مربعهایی با اندازه مساوی هستند. مطابق شکل 2-26 ویژگی نقطه با یک سلول واحد، ویژگی خط با توالی سلولهای متصل و ویژگی منطقه توسط گروهی از سلولهای پیوسته نشان داده میشود.
هر سلول دارای یک مقدار است که نمایانگر ویژگی یک ویژگی جغرافیایی در سلول است. یک مقدار سلول میتواند یک مقدار عددی (به عنوان مثال نشان دهنده شیب)، یا یک کد (به عنوان مثال1 نشان دهنده زمین کشاورزی، 2 زمین شهری و غیره، مانند شکل 2-26) یا یک برچسب (به عنوان مثال نام یک نوع خاک). مقادیر سلول همچنین میتواند برای نشان دادن وجود یا عدم وجود یک ویژگی جغرافیایی استفاده شود. به عنوان مثال در رسترهایی که خانهها و جادهها را در شکل 2-26 نشان میدهند، اگر سلولی توسط خانه یا جاده اشغال شده باشد، مقدار سلولی 1 به آن اختصاص داده میشود. در غیر این صورت مقدار سلول صفر را دریافت میکند.
مکان یک سلول با شماره ردیف و ستون آن تعریف میشود (شکل 2-27). به طور کلی رستر با جهت شمال در بالا است. ردیفهای موازی با جهت غرب به شرق و ستونهای موازی با جهت شمال به جنوب هستند.
اندازه سلول به عنوان طول جانبی سلول، اغلب بر حسب متر تعریف میشوند. وقتی اندازه سلول، جهت گیری و مختصات دنیای واقعی گوشه سمت چپ بالای رستری مشخص باشد، مختصات دنیای واقعی سلول را میتوان محاسبه کرد. بنابراین میتوان موقعیت ویژگی جغرافیایی را در سطح زمین بدست آورد. روابط توپولوژیکی به صراحت در مدل دادههای رستری نشان داده نمیشود میتوان بر اساس موقعیت سلولها استنباط میشوند. به عنوان مثال اگر شماره سطر و ستون یک سلول را بدانیم سلولهای مجاور آن به راحتی قابل تشخیص هستند.
اندازه سلول تفکیک مکانی یک رستر است. تعیین میکند یک نمایش رستری چقدر دقیق است. همانطور که در بخش 2-1 مورد بحث قرار گرفت هرچه اندازه سلول بزرگتر باشد نمایش رستر دقیق تر نیست. شکل 2-28 سه تصویر رستری از یک دریاچه (شامل یک جزیره کوچک) با اندازه سلولهای مختلف را نشان میدهد. بدیهی است که اندازه سلول بزرگتر یا وضوح مکانی کوچکتر منجر به از دست دادن جزئیات بیشتر در مورد دریاچه میشود. در نمایش رستری با کوچکترین اندازه سلول، جزیره گرفته میشود، در حالی که در دو نمایش رستری دیگر با اندازه سلولهای بزرگتر گم میشود. شکل دریاچه نیز در دو نمای رستری با اندازه سلول بزرگتر به شدت مخدوش است. با این حال مهم نیست که اندازه سلول کوچک است، هر سلول فقط میتواند یک مقدار داشته باشد. بنابراین تغییرات مکانی ویژگی جغرافیایی در یک سلول از بین میرود. هر سلول همگن در نظر گرفته میشود. هنگامی که یک سلول شامل دو یا چند دسته ویژگی است ، اغلب دو قانون برای اختصاص مقادیر سلول اعمال میشود: قانون حداکثر مساحت و قانون مکان مرکزی. قانون حداکثر مساحت مقدار سلول را به دسته ای اختصاص میدهد که بیشترین درصد از سطح سلول را اشغال میکند. قانون مکان مرکزی مقدار سلول را به دسته ای که در مرکز سلول قرار دارد اختصاص میدهد. که در شکل 2-28 قانون حداکثر مساحت اعمال شده است.
شکل 2-26 دادههای مکانی توصیف ویژگیهای جغرافیایی با مدل دادههای رستری
شکل 2-27 عناصر یک رستر
دادههای مکانی نشان داده شده در مدل دادههای رستری به عنوان دادههای رستری شناخته میشوند. عمدتا سه روش برای ساختاربندی و ذخیره دادههای رستری وجود دارد که در GIS استفاده شده است: کدگذاری سلول به سلول، کدگذاری طول اجرا و چهار درخت.
کدگذاری سلول به سلول
ساده ترین ساختار داده رستری یک آرایه داده است که ماتریس مقادیر سلول را در یک فایل واحد ذخیره میکند. به عبارت دیگر، تمام مقادیر سلولها توسط سطر و ستون ثبت و ذخیره میشوند. این روش کدگذاری سلول به سلول نامیده میشود. فایل دادهها معمولاً دارای یک سرصفحه است که تعداد سطرها (نولها) و ستونها (ncols)، اندازه سلولها، مختصات دنیای واقعی گوشه سمت چپ پایین راستر (xllcorner و yllcorner) و مقدار NoData (نشان میدهد که هیچ اندازه گیریهایی برای آن سلول انجام شده است)، همانطور که در شکل 2-29 نشان داده شده است. مدلهای ارتفاع دیجیتال (DEMs رستری که مقادیر سلول آنها مقادیر ارتفاع است) به طور کلی با استفاده از این ساختار داده ساده ذخیره میشوند. اکثر سیستمهای نرم افزاری GIS که از مدل دادههای رستری پشتیبانی میکنند مانند ArcGIS GRASS و IDRISI ، میتوانند از این ساختار برای ذخیره دادههای رستری استفاده کنند. با این حال این ساختار دادههای رستری نیاز به ذخیره هر مقدار سلول جداگانه دارد. اگر رستری که توزیع چهل نوع خاک را در یک منطقه نشان میدهد دارای m سطر و n ستون باشد، باید m × n مقادیر سلول را ذخیره کند. استفاده از رستری با همان اندازه برای نشان دادن یک دریاچه واحد در همان منطقه مستلزم ذخیره همان مقدار داده است. ساختار داده در بسیاری از موارد حاوی دادههای اضافی زیادی است که ممکن است منجر به حجم فایل بزرگ شود. دو ساختار داده رستری زیر ممکن است بر مسئله افزونگی دادهها غلبه کنند.
شکل 2-28 نمایشهای رستری با اندازههای مختلف سلول
شکل 2-29 رمزگذاری سلول به سلول و طول اجرا
رمزگذاری طول اجرا
رمزگذاری طول اجرا، توالی سلولهای متوالی را با مقدار یکسان از چپ به راست گروه بندی میکند و هر دنباله را به عنوان یک مقدار داده واحد ذخیره میکند و به صورت ردیف به ردیف شمارش میکند. به عنوان مثال در فایل حاوی دادههای رمزگذاری طول اجرا در شکل 2-29 خط اول در قسمت داده شامل دو جفت داده است که نشان میدهد ردیف اول رستر با سه خانه با مقدار 1 شروع میشود و به دنبال آن پنج خانه با مقدار 2 قرار میگیرد. خط دوم دادهها را نشان میدهد. که ردیف دوم رستر با چهار سلول با مقدار 1 و سپس چهار سلول با مقدار 2 و غیره شروع میشود. رمزگذاری طول اجرا نیازی به ذخیره هر مقدار سلولی ندارد، بنابراین دادههای رستر فشرده میشود. با این حال هنگامی که درجه بالایی از تنوع در مقادیر سلولی مجاور وجود داشته باشد مانند DEM، اثربخشی آن کاهش مییابد. در چنین مواردی روش کدگذاری سلول به سلول که تمام مقادیر سلول را حفظ میکند مناسب تر است. ESRI Grid که توسط ArcGIS پشتیبانی میشود، یک فرمت داده رستری با استفاده از رمزگذاری طول اجرا است ( کادر 2-5 را ببینید). GRASS و IDRISI نیز از این ساختار داده پشتیبانی میکنند.
شکل 2-30 شبکه VAT
سیستم مختصات یک شبکه با اندازه سلول، تعداد سطرها و ستونها و مختصات x، y گوشه سمت چپ بالا تعریف میشود. سطرها و ستونها موازی با محورهای x و y سیستم مختصات هستند. شبکه مانند پوشش به عنوان فهرست با نام شبکه، با جداول و فایلهای مرتبط که حاوی اطلاعات خاصی در مورد شبکه هستند ذخیره میشود. فهرست شبکه اساساً شامل جدول BND (dblbnd.adf) است که مرزهای آن را ذخیره میکند. فایل HDR (hdr.adf) شامل اندازه سلول و سایر اطلاعات خاص در مورد شبکه است. جدول STA (sta.adf) آمار شبکه را ذخیره میکند. جدول VAT (vat.adf) اگر یک شبکه صحیح باشد فایل LOG که عملیات انجام شده روی شبکه را ثبت میکند. فایل داده (w001001.adf)، که دادههای سلولی و فایل فهرست همراه (w001001x.adf) را ذخیره میکند. هنگامی که یک شبکه اصلاح میشود دادههای ذخیره شده در پروندهها و جداول بلافاصله به روز میشوند.
کادر 2-5- شبکه ESRI
تکنیک گرید فرمت داده شطرنجی بومی ArcGIS است. از روش رمزگذاری با سلول یا روش رمزگذاری طول اجرا برای ذخیره دادههای شطرنجی بسته به اینکه کدام کارآمدتر است استفاده میکند. شبکه ای که مقادیر سلول آن اعداد صحیح است (بدون جزء کسری یا اعشاری، مثلاً 24 و 80) شبکه اعداد صحیح نامیده میشود. شبکههای اعداد صحیح عمدتاً برای نمایش دادههای مقوله ای یا گسسته استفاده میشوند. یک شبکه در صورتی که مقادیر سلول آن اعداد ممیز شناور باشد (با یک جزء کسری یا اعشاری، به عنوان مثال 24/44 و 588/80 ) شبکه نقطه ای شناور نامیده میشود. شبکههای نقطه ای شناور در درجه اول برای نمایش دادههای پیوسته استفاده میشوند. شبکههای اعداد صحیح معمولاً یک جدول ویژگی ارزش (VAT) با خود دارند، در حالی که شبکههای نقطه ای شناور اینطور نیستند. VAT معمولاً حاوی مقادیر سلولی است که یک کلاس، گروه یا دسته را تعریف میکند. این شامل حداقل سه فیلد است: OID، VALUE و COUNT. شکل 2.30 یک شبکه خاک با مالیات بر ارزش افزوده را نشان میدهد. OID منحصر به فرد است، شناسه شی توسط سیستم برای هر ردیف در جدول تعریف شده است. VALUE هر مقدار سلول منحصر به فرد را در رستر ذخیره میکند. COUNT تعداد سلولها را در رستر با مقدار سلول در فیلد VALUE نشان میدهد. به عنوان مثال ردیف اول VAT VALUE = 1 و COUNT = 7294 را نشان میدهد، که نشان میدهد 7294 سلول دارای مقدار 1 هستند که نشان دهنده سنگ بستر در شبکه است. به سلولهای بدون اندازهگیری یا مقادیر واقعی NoData اختصاص داده میشود. NoData یک مقدار خاص و تعریف شده توسط سیستم است که 0 (صفر) نیست. 0 یک مقدار سلول معتبر است. سلولهای NoData در VAT نشان داده نمیشوند. |
سیستم مختصات یک شبکه با اندازه سلول، تعداد سطرها و ستونها و مختصات x، y گوشه سمت چپ بالا تعریف میشود. سطرها و ستونها موازی با محورهای x و y سیستم مختصات هستند. شبکه مانند پوشش به عنوان فهرست با نام شبکه، با جداول و فایلهای مرتبط که حاوی اطلاعات خاصی در مورد شبکه هستند ذخیره میشود. فهرست شبکه اساساً شامل جدول BND (dblbnd.adf) است که مرزهای آن را ذخیره میکند. فایل HDR (hdr.adf) شامل اندازه سلول و سایر اطلاعات خاص در مورد شبکه است. جدول STA (sta.adf) آمار شبکه را ذخیره میکند. جدول VAT (vat.adf) اگر یک شبکه صحیح باشد فایل LOG که عملیات انجام شده روی شبکه را ثبت میکند. فایل داده (w001001.adf)، که دادههای سلولی و فایل فهرست همراه (w001001x.adf) را ذخیره میکند. هنگامی که یک شبکه اصلاح میشود دادههای ذخیره شده در پروندهها و جداول بلافاصله به روز میشوند.
برگرفته از کتاب کاربرد GISدر محیط زیست
ترجمه:سعید جوی زاده،شهناز تیموری،فاطمه حسین پور فرزانه
مصاحبه با دکتر سعید جویزاده: مدل دادههای رستری و کاربردهای آن در علوم مکانی
مصاحبهکننده: نیما رضوی
مقدمه:
دکتر سعید جویزاده، استاد برجسته ژئوماتیک و سامانههای اطلاعات مکانی (GIS) در کشور ایران، با سابقهٔ بیش از ۲۰ سال تحقیق در حوزههای پردازش دادههای رستری و کاربردهای آن در محیطزیست و برنامهریزی شهری، میهمان امروز ماست. در این گفتوگو، ایشان به بررسی مدل دادههای رستری، چالشها، و تحولات اخیر این حوزه میپردازند.
۱. تعریف مدل دادههای رستری و اجزای اصلی آن
رضوی: جناب دکتر، لطفاً برای شروع، مدل دادههای رستری را به زبان ساده توضیح دهید.
جویزاده: داده رستری به ساختاری ماتریسمانند از پیکسلها (سلولها) اشاره دارد که هر کدام مقداری عددی را نشان میدهند. این مقادیر میتوانند ویژگیهایی مانند ارتفاع در نقشههای DEM، شدت دمایی در تصاویر ماهوارهای، یا حتی رنگ در عکسها باشند. دو جزء اصلی این مدل، اندازه پیکسل (رزولوشن) و محدوده مکانی (Extent) هستند که دقت و وسعت داده را تعیین میکنند.
۲. تفاوت مدل رستری با وکتوری
رضوی: مهمترین تفاوت این دو مدل داده چیست؟
جویزاده: مدل وکتوری بر پایه نقاط، خطوط، و چندضلعیهاست و برای نمایش عوارض گسسته (مثل مرزهای اداری) ایدهآل است. اما داده رستری برای پدیدههای پیوسته (مانند بارش یا شیب زمین) مناسبتر است. نقطه ضعف رستر، حجم بالای داده و محدودیت در نمایش جزئیات بدون کاهش رزولوشن است، در حالی که مدل وکتور مقیاسپذیری بهتری دارد.
۳. کاربردهای کلیدی دادههای رستری
رضوی: نمونههای عملی استفاده از این مدل در صنایع مختلف کدامند؟
جویزاده:
- محیطزیست: پایش تغییرات جنگلها با تصاویر ماهوارهای.
- کشاورزی: تحلیل شوری خاک با دادههای طیفی.
- شهرسازی: شبیهسازی سیلاب با DEM.
- هواشناسی: پیشبینی الگوهای بارش با رادار.
در همه این موارد، رستر به ما امکان میدهد تغییرات تدریجی را کمیسازی کنیم.
۴. چالشهای کار با داده رستری
رضوی: بزرگترین مشکلات در پردازش این دادهها چیست؟
جویزاده:
- حجم داده: یک تصویر با رزولوشن ۱ متر از تهران، به ترابایت فضای ذخیرهسازی نیاز دارد!
- پیچیدگی محاسباتی: عملیاتی مانند Reclassification یا فیلترگذاری روی دادههای بزرگ، زمانبر است.
- خطاهای ناشی از رزولوشن: انتخاب اندازه پیکسل نامناسب میتواند به تحریف نتایج منجر شود.
راهحل؟ استفاده از فناوریهایی مانند محاسبات ابری و الگوریتمهای فشردهسازی پیشرفته (مثل COG یا Cloud Optimized GeoTIFF).
۵. نقش هوش مصنوعی در تحول دادههای رستری
رضوی: آیا یادگیری ماشین آینده این حوزه را متحول خواهد کرد؟
جویزاده: قطعاً! امروزه، مدلهای یادگیری عمیق (Deep Learning) برای استخراج خودکار عوارض از تصاویر (مثل شناسایی ساختمانها) استفاده میشوند. همچنین، تکنیکهای فوقتشخیص (Super-Resolution) رزولوشن دادههای قدیمی را بهبود میبخشند. این پیشرفتها تحلیل دادههای رستری را دموکراتیک کرده است.
۶. توصیه به علاقهمندان
رضوی: برای کسانی که میخواهند در این حوزه وارد شوند، چه ابزارهایی پیشنهاد میکنید؟
جویزاده:
- نرمافزارها: QGIS برای شروع، ArcGIS Pro برای تحلیلهای پیشرفته.
- کتابخانههای برنامهنویسی: GDAL در پایتون برای خواندن/نوشتن دادهها، و TensorFlow برای پیادهسازی مدلهای ML.
- دورههای آموزشی: دورههای رایگان سایت Coursera در زمینه سنجش از دور.
فراموش نکنید که تسلط بر مفاهیم پایه ریاضی (مثل جبر خطی) ضروری است!
سخن پایانی
رضوی: سپاسگزارم از وقتی که در اختیار ما گذاشتید. کلام آخر؟
جویزاده: دادههای رستری تنها مجموعای از پیکسلها نیستند؛ آنها پنجرهای به دنیای پیچیده طبیعت هستند. آینده این حوزه در ادغام با فناوریهایی مانند IoT و Big Data است که نیازمند همکاری متخصصان GIS و دادهکاوان است.
مصاحبه قبلی با دکتر سعید جوی زاده
مصاحبهکننده: سلام و وقت بخیر، دکتر جوی زاده. خیلی خوشحالیم که امروز فرصتی فراهم شد تا با شما درباره موضوع مدل دادههای رستری صحبت کنیم. میتوانید برای شروع کمی درباره خودتان و زمینه کاریتان بگویید؟
دکتر سعید جوی زاده: سلام، وقت شما هم بخیر. من سعید جوی زاده هستم، پژوهشگر و مشاور در حوزه سیستمهای اطلاعات جغرافیایی (GIS) و سنجش از دور (RS). سالهاست که در موسسه علمی تحقیقاتی چشمانداز هزاره سوم ملل فعالیت میکنم و تمرکزم بر کاربرد فناوریهای مکانی در علوم جغرافیایی، هیدرولوژی، و مدیریت منابع طبیعی است. عاشق این هستم که دادههای پیچیده را به شکلی ساده و کاربردی برای حل مسائل واقعی تبدیل کنم.
مصاحبهکننده: بسیار عالی. امروز میخواهیم درباره مدل دادههای رستری صحبت کنیم. به نظر شما چرا این مدل در GIS اینقدر اهمیت دارد؟
دکتر سعید جوی زاده: مدل دادههای رستری به دلیل ساختار ساده و در عین حال قدرتمندش در نمایش پدیدههای پیوسته، نقش کلیدی در GIS داره. برخلاف مدل برداری که برای عوارض گسسته مثل جادهها یا مرزها مناسبه، مدل رستری با شبکهای از سلولها (پیکسلها) کار میکنه و برای تحلیل پدیدههایی مثل دما، بارش، ارتفاع یا حتی کیفیت آب که بهصورت تدریجی در فضا تغییر میکنن، بسیار ایدهآله. این مدل به ما اجازه میده تغییرات فضایی رو بهصورت عددی و قابل محاسبه بررسی کنیم.
مصاحبهکننده: تفاوت اصلی مدل رستری با مدل برداری چیه و چه زمانی باید از رستری استفاده کنیم؟
دکتر سعید جوی زاده: تفاوت اصلی در نوع نمایش دادههاست. مدل برداری از اشکال هندسی مثل نقطه، خط و پلیگون استفاده میکنه و دقت بالایی در نمایش موقعیتهای مشخص داره، اما برای پدیدههای پیوسته محدودیت داره. مدل رستری اما فضا رو به سلولهای منظم تقسیم میکنه و هر سلول یک مقدار مشخص داره. مثلاً اگر بخواهیم تغییرات ارتفاع رو در یک منطقه بررسی کنیم، مدل رستری مثل DEM (مدل رقومی ارتفاعی) بهترین انتخابه. یا در سنجش از دور، تصاویر ماهوارهای معمولاً بهصورت رستری هستن و برای تحلیل تغییرات پوشش زمین عالی عمل میکنن.
مصاحبهکننده: چه چالشهایی در کار با دادههای رستری وجود داره؟
دکتر سعید جوی زاده: یکی از چالشهای اصلی، حجم بالای دادههاست. چون هر سلول یک مقدار داره، با افزایش وسعت منطقه یا دقت (رزولوشن)، حجم دادهها بهسرعت زیاد میشه و پردازشش سنگین میشه. چالش دیگه دقت و مقیاسه؛ اگر اندازه سلولها خیلی بزرگ باشه، جزئیات از دست میره، و اگر خیلی کوچک باشه، مدیریت دادهها سخت میشه. همچنین تبدیل دادههای رستری به برداری یا برعکس گاهی باعث از دست رفتن اطلاعات میشه که باید با دقت انجام بشه.
مصاحبهکننده: در پروژههای خودتون بیشتر از مدل رستری استفاده میکنید یا ترکیبی از هر دو؟
دکتر سعید جوی زاده: بستگی به پروژه داره. مثلاً در پایش خشکسالی یا مدلسازی کیفیت آب، مدل رستری حرف اول رو میزنه چون دادههای ماهوارهای و هواشناسی معمولاً رستری هستن. اما در پروژههای شهری مثل نقشهبرداری معابر، مدل برداری غالبه. من معمولاً ترکیبی کار میکنم؛ مثلاً از دادههای رستری برای تحلیلهای محیطی و از دادههای برداری برای تعریف دقیقتر عوارض استفاده میکنم. این ترکیب قدرت GIS رو چند برابر میکنه.
مصاحبهکننده: آینده مدل دادههای رستری رو چطور میبینید، با توجه به پیشرفت تکنولوژی؟
دکتر سعید جوی زاده: آینده خیلی روشنه. با رشد هوش مصنوعی و یادگیری ماشین، مدلهای رستری میتونن دادههای حجیمتری رو با سرعت بیشتری تحلیل کنن. همچنین پلتفرمهایی مثل Google Earth Engine که من باهاش کار میکنم، دسترسی به دادههای رستری رو آسونتر کردن. در کنار این، ادغام دادههای رستری با فناوریهایی مثل پهپادها و حسگرهای پیشرفته، دقت و کاربردشون رو بیشتر میکنه. فکر میکنم در سالهای آینده، این مدل نقش پررنگتری در مدیریت بحران، تغییرات اقلیمی و حتی شهرسازی هوشمند پیدا کنه.
مصاحبهکننده: حرف آخر برای علاقهمندان به GIS و مدل دادههای رستری؟
دکتر سعید جوی زاده: اگر به دنیای دادههای مکانی علاقه دارید، مدل رستری یکی از ابزارهای قدرتمندیه که باید باهاش آشنا بشید. پیشنهادم اینه که با نرمافزارهایی مثل ArcGIS یا QGIS شروع کنید، دادههای واقعی رو تحلیل کنید و از منابع آموزشی مثل کتابها و دورههای آنلاین استفاده کنید. این حوزه پر از فرصته و هر روز چیز جدیدی برای یاد گرفتن داره.
مصاحبهکننده: خیلی ممنون، دکتر جوی زاده، که وقتتون رو در اختیار ما گذاشتید. امیدواریم باز هم فرصتی برای صحبت با شما داشته باشیم.
دکتر سعید جوی زاده: من هم تشکر میکنم. خوشحال شدم که این موضوع رو با شما به اشتراک گذاشتم.
بدون دیدگاه