Форматы хранения пространственных данных в геоинформационных системах

Как было уже отмечено, обычная карта, назовем ее аналоговой моделью территории или аналоговой картой, имеет высокую информативность для пользователя. Глядя на карту, человек легко ориентируется в пространственной ситуации. На карте наглядно видно, например, какие населенные пункты соединяет шоссейная дорога, что слева от дороги расположен лес, а справа протекает река и т. д. Можно ли эту информацию представить другим образом? Очевидно можно в виде словесного описания положения объектов на местности, в виде таблиц координат этих объектов и т. д. Но при этом теряется информативность, наглядность и многие другие свойства, которые имеет аналоговая карта местности.

В связи с этим при создании геоинформационных систем первостепенной проблемой являлась разработка способов представления в кодах компьютерного языка такой сложной и наглядной модели местности как карта. Необходимо было создать язык, который позволил бы компьютеру использовать его цифровое представление информации для определения пространственного положения объектов, их пространственную (территориальную) взаимосвязь, опознавать и сортировать объекты по форме, положению и т.п.

Главная трудность состоит в том, что наше графическое восприятие подразумевает отношения между элементами, расположенными на бумаге. Например, одни линии замкнутые, другие – нет, и список таких взаимоотношений практически бесконечен. Мы воспринимаем информацию «параллельным» целостным способом, для компьютера эту пространственную информацию необходимо представить в последовательном виде, найти способы представления каждого объекта и каждого отношения в виде набора явных правил или так называемого языка пространственных отношений. Кроме того, способы представления пространственных данных в компьютере (модели пространственных данных) должны обеспечивать визуальное представление по этим данным карты территории на экране или в виде твердых копий, показывать однозначную связь между пространственными и атрибутивными данными, а также возможность манипулировать пространственными данными совместно с атрибутивными, то есть возможность анализа и моделирования.

Хотя круг задач пространственного анализа и моделирования довольно широк, практически все эти задачи начинаются с двух основных вопросов:

- что находится в данном месте?

- где находится объект?

Для ответа на первый вопрос наиболее естественной и простой является позиционная модель пространственных данных. Это такая модель, где атрибутивные данные о территории связаны непосредственно с пространственным положением (с позицией) конкретного участка территории. Так как информация о положении (позиции) представляется в квантованном виде, такая модель данных носит название мозаичная, сеточная или растровая [15]. Все эти термины по сути являются синонимами, но наибольшее распространение получил термин растровая модель или растровый формат пространственных данных, который заимствован из технического термина «растровое получение изображения» или «растр», то есть получение изображения путем построчного сканирования электронного луча дисплея. Поэтому в дальнейшем будем использовать как синонимы термины позиционный и растровый формат (модель) пространственных данных.

Математически на языке теории множеств позиционная модель описывается следующим образом. Учитывая, что информация представляется в квантованном виде, обозначим через W множество элементов w, на котором описывается состояние исследуемой территории. Это множество определим следующим образом

, (1.1)

где (1.2)

дискретные значения координат положения элементарных участков (ЭУ) по осям X и Y.

В соответствии с (1.1) и (1.2) множество W будет иметь следующий вид

, (1.3)

где индексы n и m – соответствуют значениям координат положения ЭУ по оси X (M -множество) и по оси Y (N -множество).

Для сокращения записи в дальнейшем двойку чисел m, n обозначим одним индексом i – номером ЭУ. Упорядоченное множество ЭУ будем в дальнейшем ранжировать в порядке возрастания номеров этих участков по строкам, то есть по принципу сканирования:

(1.4)

где С₁,С₂,...,С_N – первая, вторая и т. д. строки, где M – число ЭУ в строке по оси X, N – число строк по оси Y.

В соответствии с этим множество W определяется как

. (1.5)

Если отдельная часть территории, представляемая множеством W, имеет свойство a, то

(1.6)

где A – часть территории, имеющая свойство a.

На рис. 1.6 представлено схематическое изображение получения позиционной модели пространственных данных.

Основное преимущество позиционных (растровых) форм представления – слияние пространственной и атрибутивной информации в единой прямоугольной матрице, положения элементов которой (координаты пикселей или ячеек), привязанные либо к центроидам, либо к углам, являются непосредственным указателем (идентификатором) их атрибутивной определенности. С каждым таким идентификатором может быть связан неограниченный набор атрибутов от кодов цветового изображения данного пикселя на экране, до записи в базе данных с любым набором полей. Таким образом, становится необязательным разделение на пространственную и атрибутивную составляющие, отпадает необходимость в особых способах хранения и манипулирования атрибутикой пространственных данных, существенно упрощаются аналитические операции, многие из которых сводятся к попиксельным операциям с «пакетом» растровых слоев.

Простота машинной реализации позиционных представлений пространственных данных находится в противоречии с необходимостью значительных затрат объема памяти ЭВМ. Поэтому большое количество работ посвящено сжатию растровых данных, что позволяет частично компенсировать этот недостаток.

Одним из распространенных методов сжатия растровых данных является метод группового кодирования. ГИС первых поколений (60 – 70х годов) использовали регулярно-ячеистую модель данных. Первоначально растровые данные вводились в ГИС с помощью пронумерованной прозрачной сетки, которая накладывалась на кодируемую карту.

Этот процесс представлен на рис. 1.6.

Каждая ячейка имела численное значение, соответствующее информации на карте. Это число вводилось с клавиатуры. В настоящее время получение цифровых карт в растровом формате с помощью сканеров автоматизировано. Но проблема сжатия информации остается, т.к. объем хранимой информации из-за высокой разрешающей способности сканеров (от 200 до 2800 точек на дюйм) резко возрастает.

Идея метода группового кодирования довольно очевидна. Например, разновидность этого метода – цепочное кодирование, основано на указании координат начальной ячейки растра (пикселя) и последнего, между которыми находится цепочка ячеек с одинаковым значением атрибутивного кода. При этом задается вектор направления движения: где повернуть и как далеко идти. Вектор описывается количеством ячеек, а направление – условным кодом.

Другой разновидностью является блочное кодирование, при котором выбираются квадратные группы ячеек растра (в том числе, как частный случай, отдельные ячейки), выделяется центральная или угловая ячейка и задается ширина квадрата.

Рис. 1.6. Растровый (позиционный) способ представления

пространственной информации:

а) растровая сетка;

б) исходная графическая информация;

в) растровое представление информации.

Схожим с блочным кодированием является метод сжатия данных с использованием квадродеревьев. Идея состоит в следующем. Вся карта делится на квадранты с одинаковыми атрибутами внутри. Если один из квадрантов однороден, он фиксируется и больше не участвует в делении. Каждый из оставшихся квадрантов делится на четыре квадранта. Затем эти квадранты проверяются на однородность. Все однородные квадранты записываются, а оставшиеся делятся далее. Процесс повторяется до полного описания карты.

Перечисленные методы, конечно, не охватывают все многообразие процедур сжатия пространственных данных в растровом формате, и эти процедуры постоянно совершенствуются.

Сейчас существуют десятки форматов хранения растровой информации - IDB, PCX, TIFF и др. [16].

Благодаря рассмотренным выше возможностям позиционные модели форматов данных используются в большинстве ГИС для рабочих станций (ARC/INFO 7.0, SICAD), а также в ГИС, специализированных для проведения полигонального (площадного) анализа, например, “ИНФОСО” (Россия), IDRISI (США).

В тоже время из-за потребностей в больших объемах машинной памяти, неструктурированности информации по отдельным объектам, в последнее время интенсивно развивались векторные (структурные) модели представления пространственной информации.в картографической системе координат.

Cтруктурные (векторные) модели форматы пространственных данных

В основу такого представления структурного или векторного представления пространственных данных положены понятие «объект» и ответ на второй вопрос: «где находится объект?». Объект - это физическая сущность естественного или искусственного происхождения, занимающая ограниченную часть рассматриваемой территории, имеющая конкретное пространственное положение, однозначно определяемое в картографической системе координат.

Все многообразие объектов можно свести к трем основным видам: нульмерным, одномерным и двумерным. Соответствующие им геометрические образы - точки, линии, контуры (полигоны) представлены на рис. 1.7.

Рис. 1.7. Векторное кодирование пространственно-локализованных объектов: точка, полилиния, полигон (площадь)

Векторная модель или векторный формат, по существу, представляет собой первый уровень языка карты (см. пар. 1.3). В дальнейшем на эту «контурную» карту из специальной базы данных при представлении карты на экране компьютера наносятся условные обозначения (второй уровень языка карты).

Представление пространственных данных в виде структуры этих элементарных объектов традиционно называется представлением в векторном формате. Данное название отражает лишь тот факт, что любая кривая может быть описана с заданной точностью совокупностью фиксированного числа допустимых направлений и длин элементарных отрезков (рис. 1.8).

а)

б)

Рис. 1.8. Векторное представление контура объекта:

а) фиксированный набор векторов;

б) аппроксимация кривой совокупностью

элементарных отрезков (векторов).

В настоящее время нет необходимости именно такого представления, жестко связанного с фиксированными векторами перемещения курсора. Сейчас оцифровка карт осуществляется с помощью более совершенных средств: дигитайзеров или автоматической или ручной векторизацией растрового изображения каты на экране компьютера.

Дигитайзер представляет собой поверхность, на которую закрепляется бумажная карта. Под этой поверхностью имеется сеть проводников, образующая координатную сетку. Для оцифровки карты используют графический манипулятор типа «мыши» с прозрачным окошком и перекрестием на нем. При нажатии на кнопку мыши в компьютер с координатной сетки дигитайзера поступают электрические сигналы, по которым в память машины заносятся координаты точки карты, находящейся под перекрестьем. Современные дигитайзеры могут обеспечить разрешение порядка 0,03 мм.

Оцифровка линейных объектов осуществляется путем передвижения визирного перекрестья мыши вдоль этой линии с нажатием на кнопку мыши в местах изменения направления линии. Таким образом, линейный объект с карты заносится (оцифровывается) в виде последовательных координат точек, и линейный объект аппроксимируется отрезками прямых линий. Точность такой аппроксимации зависит от кривизны линейного объекта, масштаба карты и квалификации оператора. Оцифровка полигональных объектов производится путем оцифровки границ этого объекта, т.е по существу технология такая же как при оцифровке линейных объектов, только линия должна быть замкнута. Следовательно, первая и последняя точки должны совпадать.

В настоящее время более распространен метод векторной оцифровки растрового изображения карты, получаемого с помощью сканерного устройства. Технология оцифровки аналогичная предыдущей, только она производится с помощью обычной мыши, которой оснащен компьютер. Достоинство данного метода в том, что растровое изображение карты на экране компьютера можно увеличивать и таким образом обеспечивать большую точность оцифровки.

Для автоматизации труда оператора разработано достаточно большое количество специальных программ, называемых векторизаторами. С помощью них осуществляется автоматическая векторная оцифровка карт по их растровому изображению. Векторизатор «захватывает» линию и автоматически движется по ней, занося в базу данных координаты текущих точек этой линии. Однако для работы векторизаторов требуется высокое качество исходного изображения карт. Кроме того, при разветвлении линейного объекта, его пересечении с другими линиями и т.д. возникают проблемы адекватной оцифровки. Поэтому программы-векторизаторы чаще всего используются в интерактивном (диалоговом) режиме работы.

Каждый объект в векторной модели (формате) должен иметь свой идентификатор для связи с базой данных атрибутивных свойств этого объекта. Более того, если атрибутивные свойства объекта меняются, например, изменяется характер покрытия или ширина дороги, то такой объект разделяется на составные части, чтобы с ними однозначно связать различные свойства этого объекта.

Другой важной особенностью векторной модели цифровой карты является то, что она должна обеспечить в процессах пространственного анализа и моделирования определение взаимосвязанности объектов между собой. Например, определить пересекаются дороги или проходят на разных уровнях. В этом случае необходима дополнительная информация о пространственных отношениях линейных объектов, чтобы при решении, скажем, задачи нахождения оптимального маршрута дороги могли быть объединены в более сложный составной объект – дорожную сеть.

При пространственном анализе и моделировании часто возникают вопросы такого характера: «что расположено справа от дороги?», «являются ли полигоны (площадные объекты) соседними?», «расположен ли данный точечный или линейный объект на данном участке территории?» и т.д. Для ответа на подобного рода вопросы векторная модель данных должна содержать не только информацию о местоположении объектов, но и информацию об их территориальной (пространственной) взаимосвязи – топологическую информацию. Отличие информации о местоположении объекта и его топологической информации хорошо иллюстрируется примерами схем, например, Московского метрополитена. Схема метрополитена, на которой показаны только радиальные и кольцевые линии метро, станции и места перехода без учета расстояний и реального местоположения, представляет собой чисто топологическую схему.

В настоящее время существует большое количество видов векторных форматов пространственных данных, имеющих те или иные преимущества по компактности хранения или полноте хранимой информации. Но в целом эти форматы (модели) данных можно разделить на два класса: нетопологические (не поддерживающие некие пространственные связи между объектами) и топологические.

Типичным представителем нетопологического формата является простейшая векторная структура, получившая название «спагетти-модель» [12]. В такой структуре графическое изображение карты переводится в цифровую форму «один в один» (рис. 1.9).

На рис. 1.9 условно изображен метод кодирования полигонов замкнутыми строками списка координат X,Y, представляющих собой последовательность отрезков, аппроксимирующих границы полигонов. В этой модели каждый объект представлен координатами начальной и конечной точек и координатами промежуточных точек, причем у полигональных объектов начальные и конечные точки совпадают (образуют замкнутые границы). Общая граница полигонов оцифровывается отдельно дважды. Поэтому для определения соседства этих полигонов требуются специальные вычисления. Аналогично обстоит дело и с определением положения линейного объекта относительно полигонов. Таким образом, все отношения вычисляются независимо друг от друга, приводят к избыточности хранимых данных и требуют дополнительных ресурсов компьютера.

X_A₁ Y_A₁= X_A₁ Y_A₁

Рис. 1.9. Векторное нетопологическое представление пространственной информации:

A X_A1 Y_A1, X_A2 Y_A2,..., X_A1 Y_A1

B X_B₁Y_B₁, X_B₂ Y_B₂,..., X_B1 Y_B1

C X_C1Y_C1, X_C2 Y_C2,..., X_C1 Y_C1.

Векторные топологические модели (форматы) содержат информацию о топологических отношениях объектов в явном виде. Для понимания сути геоинформационной системы остановимся на этом подробнее.

Векторные топологические форматы

В отличие от графических векторных форматов, форматы (модели) пространственных данных включают в себя топологические отношения (топологию объектов), с помощью которых при анализе данных определяются локализованные точечные, линейные и площадные объекты и пространственные отношения между ними в терминах “расстояния”, “направления”, “взаимоположения” и “связности”. Благодаря топологии автоматически определяется, является ли, например, многоугольник на цифровой карте лишь результатом пересечения улиц или это объект, идентифицируемый как квартал.

Такая геореляционная структура формируется как иерархическая:

При топологическом описании приняты следующие обозначения

Нульмерные объекты: точки - объекты, определяющие геометрическое положение с помощью координат; узлы вершин - топологические соединения, которые могут определять одновременно геометрическое положение с помощью координат.

Одномерные объекты: отрезок линии, вектора, сегмента - прямые между двумя точками; полилиния, ломаная, цепь - направленная последовательность непересекающихся отрезков (сегментов) с узлами на концах.

Двумерные объекты: полигоны, кольца, площадные объекты, контурные объекты - последовательность непересекающихся полилиний с замыканием.

Пример топологического описания полигона через объекты более низкого уровня представлен на рис. 1.10. Если на рис. 1.9 система кодирования требует “двойной оцифровки” всех границ полигонов, то на рис. 1.10 показан способ “одинарного” кодирования. Границы оцифровываются в виде полилиний с выделением координат начальных и конечных точек (узлов). Конечные точки незамкнутых строк координат X, Y кодируются совместно, если они находятся на расстоянии в пределах допуска, непересекающиеся полилинии соединяются в полигоны в виде замкнутых звеньев. Кроме того, графотопологическая модель пространственных данных дополняется левыми и правыми идентификаторами, что предоставляет значительно большие возможности для решения различных топологических задач.

Рис. 1.10. Векторное топологическое представление пространственной информации

Полилинии

а X_a1 Y_a1, X_a2 Y_a2,..., X_ai Y_ai; 1,4; A,Æ

_{................................}

f X_f1 Y_f1, X_f2 Y_f2,..., X_fn Y_fn; 2,3; Æ,C

Узлы Полигоны

1 a,b,c; A,B,Æ A a,b

............... B b,c,e,d

4 a,b,d; A,B,Æ C e,f

Такое представление пространственной информации обозначается как линейно-узловая векторно-топологическая структура. Оно позволяет структурировать информацию по слоям в зависимости от вида объектов (точечные, линейные, полигональные), от атрибутивных характеристик этих объектов.

В виду того, что в векторной (структурной) форме по существу описываются только положение и границы физических объектов, объем машинной памяти для хранения пространственной информации по сравнению с растровыми (позиционными) методами значительно уменьшается. Эффективно решаются также задачи по определению расстояния между объектами, их взаимное положение (“во вне”, “внутри”, “принадлежит”, “расположен слева, справа” и т. п.). Наиболее технологично решаются задачи сетевого анализа. Благодаря этим достоинствам векторное представление занимает доминирующие положение [17].

Цифровая модель карты может быть разбита на несколько самостоятельных подмоделей или так называемых тематических слоев. Тематический слой графически содержит, как правило, однородные объекты, например, шоссейные дороги или реки, или населенные пункты и т.д. При наложении всех тематических слоев получаем результирующую карту. Тематические слои можно также складывать в произвольных сочетаниях, создавая тематические карты различной «нагруженности». Такая операции в ГИС называется наложением или оверлеем.

Графически операция наложения представлена на рис. 1.11.

Рис.1.11. Оверлей тематических слоев.

Такое структуривание пространственной (географической) информации аналогично широко распространённой древовидной файловой структуре. Роль каталогов (папок) играют тематические каты, которые в свою очередь состоят из вложенных папок – тематических слоёв. Тематические слои состоят из файлов – данных об объектах этого тематического слоя. Такая древовидная структура позволяет быстро находить необходимую пространственную информацию и манипулировать объектами и тематическими слоями.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

1 2 3 4 5 6

Формы и системы оплаты труда

Методы исследования

Условия интерференционного максимума и минимума

Понятие «неблагополучная семья», ее основные характеристики. Типология неблагополучных семей

Мгновенный центр скоростей (МЦС) и его определение. Определение скоростей точек тела с помощью МЦС

Личностные качества волонтеров, которые определяют эффективность волонтерской работы

Самый сильный аргумент, почему эволюция человека не могла быть