Понятие о географических информационных системах

Структура и классификация.

Обязательными элементами более или менее полного определения ГИС следует считать указание на “ пространственность”, операционно - функциональные возможности и прикладную ориентацию систем.

Считалось, имея ввиду ГИС профессионально - географической направленности, что пространственность является необходимым условием для квалификации некоторой информационной системы как географической (например, автоматизированные радионавигационные системы, хотя и оперируют пространственно определенными данными, к географическим информационным системам не принадлежат). Основанием для отличия “ географических ” от “ негеографических “ информационных систем не может служить и содержание собираемых данных: идентичные по своему содержанию базы данных могут обслуживать совершенно различные (в том числе чисто географические и явно негеографические) приложения. Наоборот, системы разного целевого назначения вынуждены аккумулировать одинаковые сведения. Например, база данных с цифровым представлением рельефа используется для автоматизированного вычерчивания изогипс на топографической карте (топографическая картография), расчета и картографирования морфометрических показателей (геоморфология и тематическая картография), поиска оптимальных трасс шоссейных дорог или иных коммуникаций (инженерные изыскания и проектирование).

Одной из разновидностей ГИС становятся системы, основанные на материалах дистанционного зондирования, объединяющие функциональные возможности геоинформационных технологий с развитыми функциями обработки дистанционных изображений, так называемые интегральные (интегрированные) ГИС.

Минимальный набор критериев, позволяющих идентифицировать каждую конкретную геоинформационную систему, образует “ систему координат “ трехмерного пространства, осями которого являются: территориальный охват и связанный с ним функционально масштаб (или пространственное разрешение), предметная область информационного моделирования и проблемная ориентация.

При всем многообразии операций, целей, областей информационного моделирования, проблемной ориентации и иных атрибутов, характерных для создаваемых и действующих ГИС, логически и организационно в них можно выделить несколько конструктивных блоков, называемых также модулями или подсистемами, выполняющими более или менее четко определенные функции. Функции ГИС в свою очередь вытекают из четырех типов решаемых ею задач:

Что касается классификации ГИС, то здесь наметилось тоже несколько направлений. Например, классификация по их проблемной ориентации:

Инженерные;

Имущественные (ГИС для учета недвижимости), предназначенные для обработки кадастровых данных;

ГИС для тематического и статистического картографирования, имеющие целью управление природными ресурсами, составление карт переписям и планирование окружающей среды;

Библиографические, содержащие каталогизированную информацию о множестве географических документов;

Географические файлы с данными о функциональных и административных границах;

Системы обработки изображений с Ландсата и др.

Однако быстрая изменчивость и множественность вариантов решаемых проблем требует введения иных классификаций, учитывающих структуру и архитектуру ГИС. Разработана и представлена 3 - х компонентная классификация ГИС по следующим признакам:

1) характеру проблемно - процессорной модели;

2) структуре модели баз данных;

3) особенностям модели интерфейса.

На верхнем уровне классификации все информационные системы подразделены на пространственные и непространственные. ГИС, естественно, относятся к пространственным, делясь на тематические (например социально - экономические) и земельные (кадастровые, лесные, инвентаризационные и др.). Существует разделение по территориальному охвату (общенациональные и региональные ГИС); по целям (многоцелевые, специализированные, в том числе информационно - справочные, инвентаризационные, для нужд планирования, управления); по тематической ориентации (общегеографические, отраслевые, в том числе водных ресурсов, использования земель, лесопользования, туризма, рекреации и др.).

Источники данных и их типы

Среди источников данных, широко используемых в геоинформатике, наиболее часто привлекаются картографические, статистические и аэрокосмические материалы. Помимо указанных материалов гораздо реже используются данные специально проводимых полевых исследований и съемок, а также текстовые источники. Важный признак используемых данных - в какой цифровой или нецифровой (аналоговой) форме получается, хранится и используется тот или иной тип данных, от чего зависят легкость, стоимость и точность ввода этих данных в цифровую среду ГИС.

Использование географических карт как источников исходных данных для формирования тематических структур баз данных удобно и эффективно по ряду причин. Сведения, считанные с карт, обладают следующими достоинствами: имеют четкую территориальную привязку, в них нет пропусков, “белых пятен” в пределах изображаемой территории, они в любой своей форме возможны для записи на машинные носители информации.

Картографические источники отличаются большим разнообразием кроме общегеографических и топографических карт насчитываются десятки и даже сотни типов различных тематических карт.

Следует отметить особую роль серий карт и комплексных атласов, где сведения приводятся в единообразной, систематизированной, взаимосогласованной форме; по проекции, масштабу, степени генерализации, современности, достоверности и другим параметрам. Такие наборы карт особенно удобны для создания тематических баз данных. Прекрасным примером может служить трехмерный Атлас океанов, содержащий подробные сведения о природных условиях, физико - химических параметрах, биологических ресурсах Мирового океана, представленных на сериях карт разной тематики, разновременных и разновысотных (глубинных) срезов.

Материалы аэрофотосъемки используются в основном для топографического картографирования, также широко применяется в геологии, в лесном хозяйстве, при инвентаризации земель. Космические снимки начали поступать с 60 - х годов и к настоящему времени их фонд исчисляется десятками миллионов.

В последние годы в среде ГИС широко используются портативные приемники данных о координатах объектов с глобальной системы навигации (позиционированная) GPS, дающие возможность получать плановые и высотные координаты с точностью от нескольких метров до нескольких миллиметров, что в сочетании с портативными персональными ЭВМ и специализированным программным обеспечением обработки данных с системы GPS позволяет использовать их для полевых съемок в условиях необходимости их сверхоперативного выполнения (например, при ликвидации последствий стихийных бедствий и техногенных катастроф).

Обратившись к статистическим материалам, имеющим цифровую форму, можно сказать, что они удобны для непосредственного использования в ГИС, среди которых особое место занимает государственная статистика. Основное ее предназначение - дать представление об изменениях в народном хозяйстве, составе населения, уровне его жизни, развитии культуры, учете недвижимости, наличии материальных резервов и их использовании, соотношении в развитии различных отраслей хозяйства и др.

Для получения государственной статистики на территории страны обычно используется единая методика ее сбора. В России кроме Госкомстата страны эту работу проводят также некоторые отраслевые министерства, например Министерство путей сообщения о железнодорожном транспорте и т.д. Статистическая отчетность различается по периодичности, она может быть суточной, недельной, полумесячной, квартальной, полугодовой и годовой. Кроме того, отчетность может быть и единовременной.

Для упорядочения всей совокупности данных государственной службой определены показатели по отраслям статистики. В качестве таких групп в нашей стране использовались отрасли статистики:

1) промышленности;

2) природных ресурсов и окружающей среды;

3) технического прогресса;

4) сельского хозяйства и заготовок;

5) капитального строительства;

6) транспорта и связи;

7) торговли;

8) труда и заработной платы;

9) населения, здравоохранения и социального обеспечения;

10) народного образования, науки и культуры и т. д.

Специализированная геоинформационная система ABRIS-Cadastr

Геоинформационные системы являются сегодня важным инструментом сбора и планирования географических объектов. Существующие сегодня в мире ГИС можно достаточно четко разбить на три основных категории:

Мощные полнофункциональные ГИС на основе рабочих станций на UNIX-системах и RISC-процессорах.

ГИС средней мощности (или ГИС с редуцированными возможностями) класса MAPINFO на PC-платформе.

Программы строящиеся по принципу ГИС и имеющие малые потребности в ресурсах ЭВМ.

Последние обычно более узкоспециализированные, ориентированные на конкретный рынок работ. К таким системам относится ABRIS-Cadastr. Эта система ориентирована на обработку данных инвентаризации земель. Благодаря ей можно, введя информацию, оперативно получать все необходимые справочные данные установленной формы.

ГИС ABRIS-Cadastr одна из ГИС семейства ABRIS, разрабатываемых в Московском Университете Геодезии и Картографии с 1993 года.

Данная система служит целям земельного кадастра. Она позволяет вводить картографическую информацию снятую с помощью дигитайзера либо из файлов полученных GPS-приемниками. На основании информации можно вести оперативный учет земель и проводить сравнение учетных данных и результатов измерений, получать документы в виде распечаток (ведомости вычисления площадей, сравнительные ведомости занимаемых земель по учетным данным и по результатам измерений, ведомости вычисленных площадей, экспликация земель, планы различных масштабов и др.). Существует возможность редактирования и изменения как графической, так атрибутивной информации. Это позволяет всегда иметь обновленные данные.

В целом, ABRIS-Cadastr позволяет быстро и удобно автоматизировать работы в области земельного кадастра, хранить данные земельного кадастра в электронном виде.

Контрольные вопросы:

Функции и компоненты геоинформационной системы.

Классификация ГИС.

Разновидности данных для ГИС.

3 Современное состояние процесса автоматизации в цифровой картографии.

Работы по автоматизации в тематической картографии в настоящее время зависят и опираются в первую очередь на технические средства, используемые для этих целей, и знания, формализованные при помощи математики.

В основном автоматизация коснулась процессов, требующих больших вычислительных и временных ресурсов, а также многих черновых работ, которые приходилось выполнять в картографии ранее. Однако, всем этим процессам присуще одно свойство - четкая алгоритмизация.

Именно это не позволяет, и скорее всего не позволит в ближайшие годы, решить многие, наиболее важные проблемы цифровой картографии. В первую очередь это касается автоматического чтения информации, процесса генерализации, некоторых других вопросов. Т.е. всех тех задач, при решении которых мы не можем описать четкую последовательность элементарных шагов, приведших к решению, и используем наши собственные субъективные ощущения. Успех в автоматизации этих задач зависит от прогресса в области распознавания образов и искусственного интеллекта.

Хотя, конечно, постоянно ведутся исследовательские работы по созданию более совершенных алгоритмов и новых технических средств, способных взвалить на себя больший груз проблем, связанный с интеллектуальной деятельностью человека, до решения этих проблем еще далеко.

Средства автоматизации в цифровой картографии условно можно разделить на две группы: аппаратные и программные.

К аппаратным средствам относится все оборудование, используемое на различных этапах технологического цикла создания карт. Это ЭВМ, сканеры, дигитайзеры, плоттеры, принтеры, видеотерминалы и различные специализированные устройства для выполнения некоторых узких задач (цветоделители, фотонаборные автоматы и т.д.).

Однако, существует тенденция - заменять специализированные устройства соответствующим программным обеспечением (ПО). Цифровая картография становится все более "цифровой".

Преимущество аппаратных средств перед программными состоит в том, что они выполняют свои функции иногда намного быстрее, но они дороги, а по мере увеличения мощности ЭВМ разница в скорости исчезает. По-видимому, единственными специализированными устройствами, которые никогда не исчезнут, кроме самой ЭВМ, обеспечивающей функционирование программных средств, будут устройства ввода-вывода, без которых диалог человека с машиной невозможен. Сейчас устройствами, автоматизирующими ввод, являются сканеры, устройства фото- и телеввода, позволяющие в короткое время вводить в ЭВМ изображения в растровой форме: дигитайзеры различных конструкций и автоматические отслеживатели, используемые для ввода исходной графической информации в векторной форме.

Устройства для ввода растровой информации выгодно отличаются от других тем, что позволяют быстро и точно перенести графические образы в ЭВМ и сразу же отказаться в дальнейшем от бумажной технологии. При этом достигается высокая степень автоматизации: современные промышленные сканеры требуют минимального участия человека в процессе работы благодаря автоматической подаче материала, настройке, цифровой фильтрации, сжатию и передаче информации.

При этом важной особенностью такого способа является то, что вводимые данные представляют собой просто описание графического образа карты без указания на смысловое значение каждого элемента изображения. Те объекты, которые мы видим на карте, на изображении в растровом формате нет. Они существуют только в нашем сознании, интерпретирующем группы пикселов, связывая их в какой-то целостный объект. Реально такой связи в растровых данных нет, все пикселы равноценны между собой и отличаются только цветом или яркостью. Поэтому машина не может непосредственно интерпретировать растровое изображение. Вот почему такие данные необходимо для дальнейшей обработки перевести в векторный формат. Но недостаток такого способа то, что преобразованная информация еще никак не обработана в содержательном плане, имеет малое количество семантических атрибутов и требует дальнейшего распознавания и множества операций по обработке.

Напротив, устройства для ввода информации в векторном виде позволяют одновременно с вводом произвести все необходимые операции по идентификации объектов и их оцифровке. Причем, данные в ЭВМ передаются практически в том самом виде, в каком они и будут храниться как ЦК, а поэтому требуют минимальной дальнейшей обработки.

При кажущемся преимуществе этот способ имеет свой недостаток: он требует большого количества человеческого труда, менее поддается автоматизации из-за наличия в нем большего количества электромеханических компонентов. Сравним хотя бы сложность создания программы - автоматического отслеживателя линий и устройства, преследующего ту же цель.

Несмотря на всю громоздкость оборудования для ввода информации в векторном виде, его дороговизну, малую производительность и значительное участие человека в процессе работы, способ ввода информации в растровом виде с последующей автоматической обработкой и преобразованием в векторный формат тоже пока не получил должного распространения из-за сложности создания программ, способных автоматических распознавать и преобразовывать графическую информацию. Поэтому в настоящее время существуют оба способа первичного ввода графической информации в ЭВМ. Хотя, анализируя развитие современной науки и техники, предпочтение следует отдать растровым устройствам ввода изображений. Тем более, что в настоящий момент активно развивается гибридный способ ввода картографической информации в ЭВМ, использующий именно эти устройства. Он предполагает преобразование изображения на физическом носителе в растровую форму с последующей записью цифрового кода на машинный носитель. После этого изображение векторизуется способом, похожим на применяемый при работе с дигитайзером, в ручном, полу- и автоматическом режиме. Изображение контролируется на экране видеотерминала. При этом достигаются преимущества, даваемые обоими вышеописанными методами, и одновременно частично компенсируются их недостатки: уменьшается громоздкость оборудования, его общая стоимость, осуществляется переход на "безбумажную" технологию, увеличивается возможность автоматизации процессов, растет точность и производительность труда.

К устройствам, автоматизирующим вывод информации, относятся графические видеотерминалы, матричные, струйные и лазерные принтеры, графопостроители (плоттеры). Все они используются в различных случаях.

Для быстрого динамического вывода картографической информации без ее дальнейшего сохранения и с высокой изобразительной способностью используются всевозможные типы графических видеотерминалов. Для быстрого получения твердых копий карт в зависимости от требований к качеству, скорости и материалу носителя применяют разные типы принтеров. А для получения высококачественных материалов для долговременного пользования применяют графопостроители.

В качестве ЭВМ, используемых в современной цифровой картографии, существовали попытки использовать все наиболее известные типы ЭВМ и аппаратные платформы. Зачастую в автоматизированных комплексах используются и персональные компьютеры, и рабочие станции, связанные в ЛВС (локальную вычислительную сеть) и имеющие выход на мейнфрейм, осуществляющий централизованное хранение и обработку информации.

Программное обеспечение, управляющее всеми устройствами и выполняющее многочисленные операции по сбору, хранению и обработке картографической информации, постоянно совершенствуется. Автоматизация в цифровой картографии в наибольшей степени зависит от того, какое ПО разработано и используется на данный момент. Учитывая, что в последние годы наметилась тенденция использования в цифровой картографии не специализированного картографического, а стандартного компьютерного оборудования, ясно, что все специальные функции ложатся на программное обеспечение и его роль в автоматизации картографии достигла практически 100 процентов.

Современное ПО позволяет производить предобработку введенного изображения для повышения его качества, автоматизирует процесс перевода его в форму ЦК, управляет сложными базами картографических данных, представляющими из себя огромное количество информации.

Это ПО дает в руки пользователей мощные аналитические возможности для пространственного анализа информации. Существуют прикладные пакеты, позволяющие моделировать различные процессы природной среды (например, рельефообразующие) и использовать данные моделирования в картографировании явлений.

Велико значение программных систем, используемых в производстве карт. Цветоделение, расчет различных проекций и автоматический подбор лучшей для заданного участка местности, выбор оптимальной компоновки листа и оформления - вот далеко не полный список операций, производимых ПО уже в наше время и поднимающих технологию производства на качественно иной уровень.

1. Провести анализ современного состояния процесса автоматизации при создании цифровой топографической основы для автоматизированных информационных систем государственного кадастра недвижимости.

Для рассмотрения остановимся подробнее на технологии фирмы INTERGRAPH, как одной из наиболее передовых фирм в области геоинформатики. Один из ключевых моментов этой технологии - преобразование исходных документов в растровую форму, попросту говоря - сканирование. В процессе работы сканера данные в форме изображения на документе преобразовываются в компьютерный файл, который может быть отредактирован, воспроизведен, передан по сети, отпечатан или архивирован. Сканерный механизм использует узкий пучок света для получения сканированного изображения, которое может представляться в цветном (чаще RGB), полутоновом (серая шкала) и бинарном виде. Но в процесс сканирования нужно также включить все возможные операции, вовлекаемые в перевод изображения на документе в компьютерный формат, пригодный для использования. А это, кроме непосредственно считывания информации сканирующим механизмом, процесс корреляции, квантования, сжатия, преобразования данных, их передачи в компьютер и, наконец, файловые манипуляции для создания соответствующего файла. Некоторые из этих операций выполняются аппаратно схемами, встроенными в сканер. Другие осуществляются чисто программным путем. Баланс между ними определяет стоимость и производительность системы, причем зависимость обратно пропорциональная. Ранние, а также более дешевые модели все операции, кроме, разве что, считывания светового сигнала и яркостной коррекции, проводимой для компенсации неоднородностей при освещении соседних элементов изображения, возлагали на компьютер, поглощая его вычислительные и другие ресурсы. Современные промышленные сканеры производства одного из подразделений Intergraph (ANA Tech), все операции по обработке совершают автономно, а в компьютер передают данные уже в формате записываемого файла. Таким образом, экономится место на диске - от единиц до нескольких тысяч мегабайт (в зависимости от размера документа, изображения на нем и режима сканирования). Уменьшается время на обработку документа, освобождается процессор, что очень важно в многозадачных средах и при работе компьютера в сети.

Все приложения базируются на векторном графическом редакторе MicroStation. Более того, они выполняются в среде MicroStation и написаны на MDL, встроенном языке разработки приложений. MicroStation поддерживает наиболее совершенные сети, объединяя пользователей в DOS, Windows NT, Macintosh, UNIX и VAX. Пользовательский интерфейс удовлетворяет установленному Фондом Открытого Программного обеспечения (OSF) стандарту Motif. Плюс ко всему этот мощнейший в мире редактор может быть соединен такими мощными СУБД, как Informix и Oracle. Все это позволяет с легкостью строить сложные интегрированные системы, собирая, как бы из кубиков, необходимую конфигурацию из продуктов, исполняемых в единой среде. Спектр приложений, предлагаемых фирмой INTERGRAPH, покрывает весь набор задач, с которыми приходится сталкиваться, создавая и используя автоматизированную картографическую систему. Это приложения для ввода картографической информации в ЭВМ, трансформирования, управления и сложного анализа введенных данных, для обработки аэрокосмических изображений и для стереофотограмметрических измерений. Сюда можно включить пакеты для геодезии, а также специализированные приложения, ориентированные на издание карт и моделирование физических процессов природной среды.

Вообще преимуществом этой технологии является то, что все компоненты от необходимого оборудования (сканеры, дигитайзеры, вычислительные системы, др. периферия) до сервисных утилит производятся корпорацией INTERGRAPH, а поэтому не возникает проблем при интеграции этих компонентов друг с другом из-за несовместимости. При этом нет опасности монополии поставщика, так как большое число независимых фирм разрабатывает и предлагает аппаратные и программные продукты, совместимые с этой технологией.

Вместе с тем, он же является и наиболее употребимым в настоящее время. Правда, со времени своего возникновения эта технология претерпела некоторые изменения. В отличие от традиционного способа дигитализации при помощи физического устройства (дигитайзера) появился альтернативный способ, связываемый с некоей программой, позволяющей оцифровывать изображение, наблюдая его на экране. Благодаря чему эту программу часто называют "экранным дигитайзером", а всю схему обозначают термином "heads-up" (с поднятой головой).

По своей сути, не меняя весь смысл метода ручной дигитализации, этот способ добавил множество преимуществ. Перечислим основные из них. Первое - это то, что появилась возможность более точно наводиться на объект, так как появилась возможность увеличить масштаб изображения, т.е. как бы увеличить картинку, приблизить ее. Это кроме непосредственной выгоды дает и то, что теперь уменьшается нагрузка на зрительную систему оператора, т.к. с крупными объектами работать легче. А это уже в свою очередь уменьшает ошибки дигитализации, повышает производительность труда. Вторым преимуществом является возможность визуального контроля за выходной информацией, т.к. оператор может наблюдать след, оставляемый векторной линией, т.е. посмотреть, как точно получаемые вектора описывают исходное растровое изображение, выступающее в качестве подложки, путем одновременного совмещения их на одном экране или в окне.

Другие преимущества нельзя было бы отнести непосредственно к экранной дигитализации, как к методу цифрования, но некоторый анализ показывает, что часто это становится стандартными элементами "экранной" технологии. Речь идет прежде всего о функциональных возможностях программных средств, применяемых при работе.

Технологическая схема фирмы INTERGRAPH предполагает использование для такого вида работ продукт MicroStation I/RAS B. В этом случае создание самого векторного изображения происходит посредством базового графического редактора среды MS, а возможность работы с растром представляет пакет I/RAS B. Он позволяет загружать до 64 индивидуальных растровых файлов в качестве подложки и визуализировать их любым цветом из палитры в 254 цвета, а также отключать вообще.

После того, как необходимые файл или группа файлов загружены, оператор может начинать дигитализацию, пользуясь устройством ввода типа "мышь". Как и при работе с дигитайзером ввод информации осуществляется указанием вершин графических примитивов при непосредственно визуальном распознавании объектов, которые они описывают. Но если в первом случае такими объектами зачастую являются линия (отрезок) и общий случай полилинии (ломаной), то в последнем - существует большое число графических примитивов, ввод которых не возможен при использовании классического дигитайзера. Приведем несколько примеров.

При вводе полилинии можно указать, что угол между ее сегментами является фиксированной величиной и равен 90 градусов, что очень часто требуется при оцифровке антропогенных объектов (контура зданий, кварталов в городах и т.д.). При оцифровке объектов, имеющих смежную границу, вновь изображаемая векторная линия может точно повторить другую, которая уже относится к какому-либо объекту посредством привязки ее вершин к вершинам уже существующей.

Количество примеров, конечно, не ограничивается только этими двумя, потому что базовый графический редактор среды MicroStation является одним из наиболее мощных векторных графических редакторов, применяемых в промышленности сегодня.

Интерактивная дигитализация.

Дальнейшим развитием технологии дигитализации растровых изображений стало появление ПО, позволяющего работать в полуавтоматическом интерактивном режиме. Облегчая векторизацию линейных элементов карт, такие пакеты позволили увеличить скорость растрово-векторного преобразования и избавить человека-оператора от утомительной процедуры ручной дигитализации.

На сегодняшний день такие пакеты являются наиболее часто используемыми, благодаря своей универсальности. Большинство не предлагают аналогичные услуги, отличаясь интерфейсом, заложенными алгоритмами, точностью преобразования, способностью разбираться в сложных ситуациях и скоростью работы.

C его помощью можно, используя технику "heads-up digitizing", интерактивно вводить векторные данные поверх существующего растрового изображения. Для этого достаточно визуально идентифицировать растровый объект на экране и поставить первую точку рядом с ним. I/GEOVEC отслеживает растровую линию, пока она не закончится или он не достигнет точки, требующей дальнейших инструкций оператора.

Пользователь может установить параметры отслеживания для преодоления некоторых трудностей (разрывов в растре, пересечений с др. линиями, развилок, касаний контуров и наложений текста). Отслеженную линию можно подвергнуть фильтрации и сглаживанию для спрямления векторов с малым углом расхождения, удаления избыточных узлов и скругления резких перегибов. Эти операции также доступны, как постпроцесс, запускаемый в пакетном режиме. I/GEOVEC позволяет вводит криволинейные изображения объектов в 4 или 5 раз быстрее и более точно, чем при ручном методе.

Функция REVERS VIDEO позволит отслеживать не сам растр, а фон, считая его как бы изображением. Эта возможность не заменима при обработке дорог, которые изображаются двумя параллельными линиями.

Настроив параметр "величина разрыва в растре" и "угол обзора", можно заставить приложение отслеживать линии, состоящие из точек или штрих-пунктирные линии, что применимо при вводе контуров растительности и разнообразных границ. При встрече пересекающихся линий (развилок) есть возможность установить действие программы по умолчанию - останавливаться, поворачивать налево или направо, следовать прямо, присоединиться к пересекаемой векторной линии, присоединиться и разорвать пересекаемую векторную линию для создания узла.

Довольно уникальной для такого рода ПО является способность I/GEOVEC распознавать текст и одиночные условные знаки. Этот пакет увеличивает эффективность работы, расширяя набор инструментальных средств другими менее часто используемыми, но полезными функциями, ускоряющими процесс преобразования и позволяющими его контролировать.

В настоящее время существует версия только для UNIX(CLIX). В скором времени ожидается выход версии для другой известной ОС - Microsoft Windows NT.

Эффективное использование цифровых данных предполагает наличие программных средств, обеспечивающих функции их хранения, описания, обновления и т.д. В зависимости от типов и форматов их представления, от уровня программных средств ГИС и некоторых характеристик среды и условий их использования могут быть предложены различные варианты организации хранения и доступа к пространственным данным, причем способы организации различаются для позиционной (графической) и семантической их части.

В достаточно простых программных средствах ГИС, отсутствуют специфические средства организации хранения, доступа к данным и манипулирования или эти функции реализуется средствами операционной системы в рамках ее файловой организации.

Большинство же существующих программных средств ГИС используют для этих целей достаточно изощренные и эффективные подходы, основанные на организации данных в виде баз данных (БД), управляемых программными средствами, получившими название систем управления базами данных (СУБД). Под базой данных принято понимать “совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимую от прикладных программ”, а под СУБД - “ комплекс программ и языковых средств, предназначенных для создания, ведения и использования баз данных”.

Современные коммерческие СУБД, в том числе те, что использованы в программном обеспечения ГИС, различаются по типам поддерживаемых моделей данных, среди которых выделяются иерархические, сетевые и реляционные и соответствующие им программные средства СУБД. Особое широкое применение при разработке программного обеспечения ГИС получили СУБД.

СУБД реляционного типа позволяют представить данные о пространственных объектах (точках, линиях и полигонах) и их характеристиках (атрибутах) в виде отношения или таблицы, строки которой - индексированные записи - соответствуют набору значений атрибутов объекта, а колонки (столбцы) обычно устанавливают тип атрибута, его размер и имя атрибута. В число атрибутов не входят геометрические атрибуты, описывающие их геометрию и топологию. Векторные записи координат объектов упорядочиваются и организуются с использованием особых средств. Связь между геометрическим описанием объектов и их семантикой в реляционной таблице устанавливается через уникальные номера - идентификаторы.

Удобство манипулирования данными в БД существенно зависит от языковых средств СУБД. Широкие возможности предоставляются пользователю СУБД, в которых реализован язык обработки запросов SQL, и его расширения, адаптированные к описанию пространственных запросов к БД ГИС и содержащие конструкции, включающие пространственные переменные и условия.

Одним из главных мотивов, определяющих необходимость использования технологии баз данных при создании ГИС в настоящее время, является поддержка современными СУБД сетевых возможностей хранения и использования технологий локальных сетей (LAN) и удаленных сетей в так называемых распределенных БД. Тем самым достигается оптимальное использование вычислительных ресурсов и возможность коллективного доступа пользователей к запрашиваемым БД.

6.2. Анализ данных и моделирование.

Блок анализа данных, являясь одним из трех крупных модулей ГИС (ввода, обработки и вывода), составляет ядро геоинформационных технологий, все остальные операции которых с некоторой точки зрения могут представляться сервисными, обеспечивающими возможность выполнения системой ее основных аналитических и моделирующих функций. Содержание аналитического блока современных программных средств сформировалось в процессе реализации конкретных ГИС, выкристаллизовавшись в форме более или менее устоявшегося набора операций или групп операций, наличие, отсутствие или эффективность (неэффективность) которых в составе данного продукта может служить надежным индикатором его качества.

Существуют различные классификации позволяющие сгруппировать элементарные операции аналитического характера или их последовательности в группы. Обобщая некоторые из них, и опираясь на состав и структуру аналитических модулей, можно выделить следующие их группы:

1.Операции переструктуризации данных.

2.Трансформация проекций и изменение систем координат.

3.Операции вычислительной геометрии.

4.Оверлейные операции (наложение разноименных и разнотипных слоев данных).

5.Общие аналитические, графо-аналитические и моделирующие функции.

6.3.Вывод и визуализация данных.

Результаты обработки данных, основные процедуры которой рассмотрены выше, покидая свою цифровую оболочку, должны трансформироваться в “человеко-читаемый” документ. Программные средства ГИС включают достаточно широкий набор средств генерации выходных данных.

Документы, генерируемые на выходе:

-табличные;

-графические;

-картографические.

К техническим средствам, используемых для генерации документов, принадлежат средства машинной графики, конвертеры данных, позволяющие преобразовывать данные из одних форматов в другие без потерь их геометрических и семантических атрибутов, графопостроители, графические дисплеи с высоким разрешением.

Классификация СУБД в соответствии с используемой моделью данных:

Иерархическая.

Сетевая.

Реляционная.

Объектная.

Гибридная (элементы объектной с реляционной).

В настоящее время самыми распространенными СУБД являются продукты использующие реляционную модель данных. Это связано с простотой понимания и лучшими характеристиками по сравнению с другими. В связи с этим остановимся на рассмотрение только реляционных СУБД (РСУБД).

Настольные СУБД. Для одного пользователя, используется для ведения настольной БД или как клиент для подключения к серверу БД.

Рассмотрим стандартные современные реляционные СУБД по каждому классу продуктов, основные возможности, которые они предоставляют. Произведем оценку их, в соответствии с требованиями предъявляемым системам автоматизации кадастрового учета.

Очень хорошая СУБД. Корпорация Microsoft разработала хороший продукт, который вписывается в общую концепцию компании, выпуская только интегрированные продукты. Эта СУБД интегрирована с Windows NT, дополняя ее. Недостатки: недостаточная масштабируемость, малое количество поддерживаемых программных платформ.

Структура базы данных ORACLE7.

СУБД ORACLE7, в дальнейшем просто ORACLE7, имеет собственную модель реляционной базы данных - это хорошо определенная теоретическая модель работы и управления набором данных(который и составляет базу данных). Такая модель должна определять структуру данных, целостность данных и операции с данными.

Аналогично тому, как предприятие организует склад продукции, ORACLE7 структурирует базу данных логически и физически. Логическая структура базы данных ORACLE7 - это набор файлов операционной системы, в которых на диске хранятся биты и байты информации базы данных.

Когда пользователь создает новую таблицу он сообщает ORACLE7 где физически нужно хранить ее данные Пользователь делает это путем спецификации для новой таблицы табличной области Табличная область - это раздел илилогическая область памяти в базе данных непосредственно соответствующая одному или более физическим файлам данных после определения администратором табличной области в базе данных пользователи могут создавать в ней одну или более таблиц Табличная область - это логический раздел базы данных который отображается в один или несколько физических файлов Таким образом табличные данные в каждой табличной области отображаются в ее файлы данных.

Цепочка таблица - табличная_область - файл данных - это то что обеспечивает для ORACLE7 характеристики реляционной базы данных независимость от данных. После создания таблицы пользователем другие пользователи могут вставлять удалить или обновлять строки в таблице, указывая ее имя в операторе SQL. ORACLE7 берет на себя заботы по отображению запроса SQL в корректные физические данные диска.

Каждая база данных ORACLE7 имеет по крайней мере одну табличную область - область SYSTEM. При создании базы данных администратор задает для нее имена и размеры начальных файлов данных. Эти файлы образуют на диске физическую память для табличной области SYSTEM. ORACLE7 использует табличную область SYSTEM для хранения словаря данных. Словарь данных - набор внутренних системных таблиц, содержащих все виды информации о базе данных. Например: имеются таблицы словаря данных с информацией о таблицах табличных областях и файлах данных СУБД.

ORACLE7 позволяет администраторам управлять доступностью информации базы данных на основе табличных областей Таким образом они могут эффективно переводить приложения в автономное состояние, переводя в автономное состояние соответствующую табличную область (при этом ее таблицы становятся недоступными).

При разумном использовании табличных областей администраторы могут улучшить производительность приложений. Например, если администратор помещает файлы данных табличной области каждого приложения на разные диски сервера базы данных, то приложения не будут мешать друг другу при обращении к диску (не возникает конкуренции за доступ к диску и память на нем).

Рассмотрим некоторые компоненты системы базы данных ORACLE7.

Представление REORDER определяет оператор CREATE VIEW. Этот запрос соответствует только тем строкам в таблице STOCK, у которых текущее наличное количество меньше той точки, когда нужно заказывать новую партию товара.

Одно из основных правил реляционной модели заключается в том, что все данные нужно рассматривать как таблицы. Таким образом, представление обслуживает характеристики таблицы. Также как для таблицы, пользователи могут использовать для представления операторы SQL (но с некоторыми ограничениями). Конечно, представление получает свои данные из базовой таблицы. Когда пользователь запрашивает данные представления, вставляет их, удаляет или обновляет в представлении, ORACLE7 работает с данными таблицы. Но если вы точно не знаете, что это представление, его трудно отличить от таблицы.

Представление может использоваться для улучшения защиты, для вывода дополнительной информации, для сокрытия сложных запросов (конкретное использование рассматривается в специальной литературе).

Обеспечение целостности данных.

Очень важно, чтобы была обеспечена целостность информации базы данных, то есть чтобы данные были, согласно некоему набору правил, допустимыми. Реляционная модель описывает некоторые характерные правила, которые можно ввести для обеспечения в реляционной базе данных целостности данных. Это - ограничение домена, ограничение таблицы и ссылочное ограничение. Правила целостности поясняют следующие понятия.

Целостность домена: каждое значение поля должно быть элементом домена.

Целостность домена гарантирует, что база данных не содержит бессмысленных значений. Она обеспечивает то, что значение в столбце является элементом домена столбца, то есть допустимого множества его значений. Строка не будет включена в таблицу, пока каждое из значений ее столбцов не будет находиться в домене соответствующего столбца.

Задание целостности домена осуществляется с помощью типов данных. Запись данных не может быть включена в таблицу, пока данные в каждом столбце не будут иметь корректный тип.

Все типы данных ORACLE7 позволяют разработчикам описывать тот или иной тип столбца. Можно ввести дальнейшие ограничения домена столбца. Например, тип данных NUMBER позволяет определить точность (общее число значащих цифр) и масштаб (общее число цифр справа или слева от десятичной точки), и тому подобное (более полное описание можно получить в справочном руководстве).

Ссылочная целостность: обеспечение синхронизации связанных таблиц.

Ссылочная целостность или целостность отношения - еще одно элементарное правило целостности реляционной модели. Ссылочная целостность определяет соотношения между различными столбцами и таблицами в реляционной базе данных. Такое название она получила, поскольку значения в одном столбце или наборе столбцов ссылаются на значения другого столбца или набора столбцов, либо должны совпадать с ними.

При описании ссылочной целостности встретятся новые термины. Столбец, от которого зависит другая таблица, называется внешним ключем. При этом другая таблица, называется родительским ключем (это должен быть первичный или уникальный ключ). Внешний ключ находится в дочерней или детальной таблице, а родительский ключ - в основной таблице.

Возможность связывать значения в различных таблицах и поддерживать отношения ссылочной целостности - это очень важная характеристика реляционных баз данных. Благодаря возможности связывания таблиц серверы реляционных СУБД могут очень эффективно хранить данные.

В приведенном выше примере с помощью ограничения целостности FOREIGN KEY задается ограничение ссылочной целостности, определяющего для таблицы внешний ключ. С помощью этого мы соединяем таблицу orders с родительской таблицей customer.

Деловые правила: специальные правила целостности данных.

До сих пор это были стандартные правила целостности данных, встроенные в реляционную модель данных. Однако в базе данных каждой организации определяется собственный уникальный набор деловых правил, не менее важных чем стандартный набор правил целостности данных. Например, администратор, отвечающий за вопросы защиты, может запретить изменение таблицы вне обычного рабочего времени либо получать значение столбца, когда пользователь вставляет или обновляет запись.

Для задания специальных правил ORACLE7 предлагает использовать хранимые процедуры или триггеры. Для полного представления о задании специальных правил надо обратиться к справочным материалам.

Управление доступом к данным в многопользовательской СУБД.

Так как к базе данных должны обращаться много пользователей, то СУБД должна обеспечивать множественный доступ к базе данных. К сожалению, однопользовательские СУБД не подходят для коллективной работы. Рассмотрим проблему взаимного влияния на примере картотеки. Вы хотите использовать ту же информацию с которой в данный момент работает кто-то еще. Если вы хотите увидеть результаты работы другого пользователя, то придется подождать. Если же эти результаты на вашу работу не повлияют, вы можете скопировать данные. Возникает неудобство. Картотека иллюстрирует проблемы параллельного доступа, возникающие при попытке нескольких пользователей одновременно работать с базой данных.

В многопользовательских СУБД говорят о проблеме конкуренции — попытках многих пользователей одновременно выполнять операции с одними и теми же данными. Фактически, задача обеспечения параллельного доступа к данным — одна из наиболее важных и наиболее очевидных задач сервера базы данных. Сервер базы данных должен управлять информацией таким образом, чтобы при сохранении целостности данных пользователи ожидали выполнения работы другими пользователями минимальное время. Если сервер базы не может удовлетворить одну из этих целей, то пользователи сразу заметят последствия. Когда многие транзакции конкурируют за одни и те же данные, то пользователи столкнутся с плохой производительностью или получат неточные результаты.

Это проблемы, но ORACLE7 решает эти проблемы. Рассмотрим как это он делает.

Когда две конкурирующие за одни и те же данные операции вмешиваются в работу друг друга, это может привести к неточным результатам или потере целостности данных. Это называется “ разрушающее взаимное влияние”. Для предотвращения таких ситуаций при одновременном доступе пользователей к данным применяются блокировки. Аналогично тому как “вертушка” в проходной не позволяет проходить через нее одновременно двоим, блокировка данных предотвращает в многопользовательской СУБД разрушающее влияние. Существуют исключающие и разделяемые блокировки.

Заперев ячейку камеры хранения на вокзале, вы получаете на нее исключительное право. Никто не сможет в нее положить, пока вы ее не освободите. Если же вы хотите, чтобы этой ячейкой воспользовался ваш знакомый, то сообщаете шрифт. Аналогично блокирует данные и ORACLE7.

Когда пользователь пытается выполнять операции с данными, с которыми работает кто-то еще, ORACLE7 автоматически их блокирует и предотвращает возможность разрушающего влияния. Если это возможно (то есть не приведет к разрушающему влиянию), всегда использует разделяемую блокировку. Однако, если такая блокировка оставляет возможность разрушающего влияния, устанавливается исключающая блокировка запрашиваемых вашей транзакцией данных. Исключающая блокировка предотвращает возможность блокировать те же данные с помощью блокировки любого типа и за счет устранения параллельного доступа к одним и тем же данным обеспечивает их целостность.

Получение точных данных при высокой степени доступа: запросы, согласованное чтение и поддержка версий.

Предыдущие примеры показывают, как Огасlе7 для одного и того набора данных обрабатывает две различные транзакции обновления. А что происходит в случае запросов, содержащих только операции чтения? Как Огaсlе7 обрабатывает конкурирующие запросы и запросы с операциями обновления, возвращая точные результаты?

В зтих ситуациях Оraсlе7 использует следующий подход. Во-первых, транзакция не требует блокировки строк для любого типа запросов. Это означает, что две транзакции могут давать одновременно в точности один и тот же запрос без какой-либо конкуренции за один набор строк. Отсутствие блокировок чтения означает также, что такой запрос не может блокировать обновления и наоборот.

Используя хранимые в сегментах отката данные, Огасlе7 может создавать для запроса согласованные по чтению копии (наборы результатов) данных. Сегмент отката (или сегмент отмены транзакций) — это область памяти на диске, которую Оraclе7 использует для временного хранения старых значений данных, обновляемых транзакцией удаления или обновления строк. Если пользователь отменяет транзакцию, то Оraclе7 считывает присвоенный транзакции сегмент отката и возвращает измененные ею строки в исходное состояние. Кроме того, Оrасlе7 использует сегмент отката в механизме выделения версий. Если запросу требуются данные, которые в процессе его выполнения изменяются, то Оrасlе7 с помощью данных сегмента отката генерирует согласованный по чтению копию данных (заданный момент времени). Все это происходит автоматически.

При обеспечении параллельного доступа множества пользователей и приложений к одной базе данных при адекватной производительности системы и полной точности разработчики могут не беспокоиться о сложных механизмах блокировки и ведения версий. Однако, если они хотят выжать из производительности приложения все возможное, то Оrасlе7 предусматривает средства управления, переопределяющие применяемые по умолчанию механизмы блокировки.

Неужели кто угодно может войти в базу данных Оrасlе7 и начать использовать данные, читать табличную информацию и модифицировать ее? Конечно, нет! Если бы это было так, то пользователи могли бы видеть данные, которые для них не предназначаются (такие как заработная плата их начальника), а злоумышленники могли бы легко стереть или изменить данные по своему усмотрению (например, повысить зарплату самим себе). Одной из обязанностей сервера базы данных является обеспечение защиты всей информации СУБД. Независимо от того, хотите или нет защитить свои данные от глаз неуполномоченных пользователей или злоумышленников, защита является важной функцией базы данных. Для обеспечения защиты Оrасlе7 использует систему выборочного управления доступом зто означает, что администратор присваивает пропуска для всех зарегистрированных в базе данных пользователей и дает им полномочия на выполнение в базе данных конкретных операций с конкретными данными. Различные методы управления защитой Оraclе7 описываются в следующих разделах.

Предоставление пользователям доступа к базе данных.

Доступ к базе данных Огасlе7 очень напоминает доступ к телефонной банковской системе. Во-первых, вам нужно получить общий доступ к базе данных. Чтобы предоставить кому-либо доступ к базе данных Оraclе7, администратор должен зарегистрировать его и создать в базе данных нового пользователя (определив его имя). Для обеспечения защиты доступа пароль должен соответствовать имени этого нового пользователя. Для подключения к базе данных пользователь должен ввести и имя, и пароль. Нового пользователя создает, например, следующий оператор SQL:

После получения пользователем доступа к базе данных Оraclе7 операции его в этой СУБД ограничивают другие средства контроля доступа.

Полномочия на объекты управляют работой базы данных с конкретным ее объектом. (Объект — это нечто, находящееся внутри базы данных: таблица, представление, роль, процедура, пользователь и т.д.). Например, администратор может управлять тем, кто опрашивает таблицу CUSTOMER. Для этого он предоставляет полномочия SELECT на эту таблицу только конкретным пользователям. Существуют и другие полномочия на объекты, о которых можно получить информацию в руководстве по применению Оracle7.

Управление защитой в большой базе данных клиент/сервер — сложная задача. Множество работающих в системе полномочий и пользователей могут требовать обозначений конкретных полномочий. При отсутствии административного инструментального средства управление защитой может стать настоящим кошмаром. К счастью, Оracle7 предлагает решение, облегчающее управление полномочиями в большой и сложной системе клиент/сервер, — это роли. Роль представляет собой набор соответствующих полномочий, которые администратор может коллективно предоставлять пользователям и другим ролям. С помощью ролей администратор может значительно упростить управление полномочиями.

Простое управление полномочиями — это не единственное преимущество использования ролей. Возможно, более важно то, что разработчики могут применять роли для динамического изменения домена (текущего набора) полномочий пользователей при работе их с различными приложениями. Путем простого разрешения соответствующей роли при запуске приложение может гарантировать, что все его пользователи будут иметь корректный домен полномочий.

Архивация и восстановление данных.

Вероятно, каждому из нас приходилось терять важный файл. Случайности и ошибки неизбежны, поэтому администратору нужно быть готовым к тому, чтобы восстановить данные. Следующие несколько разделов познакомят читателя с различными механизмами защиты, встроенными в сервер базы данных Oracle7

Защита транзакций: журнал транзакций.

В журнале полетов коммерческого авиалайнера записывается все, что происходит во время полета в кабине пилотов. Почти не поддающаяся разрушению маленькая коробочка (“черный ящик”) регистрирует информацию на случай авиакатастрофы. После катастрофы его можно исследовать и выяснить причину. Oracle7 также ведет журнал, где регистрируются происходящее в базе данных изменения. Каждый раз, когда SQL-оператор вносит изменение в базу данных, Oracle7 записывает его в журнал транзакций (который называется также журналом отмены). Если пользователь завершает транзакцию, Oracle7 немедленно записывает данные в журнал, подтверждая, что транзакция и ее изменения стали постоянными.

Oracle7 использует журнал транзакций для восстановления в случае разных сбоев. Например, если во время работы экземпляра базы данных происходит сбой питания, а Oracle7 еще не записал файлы данных (то есть некоторые несохраненные данные), не беспокойтесь. При следующем запуске экземпляра Oracle7 автоматически выполняет восстановление базы данных в то состояние, которое она имела в результате последней завершенной транзакции перед сбоем. Для восстановления потерянных транзакций Oracle7 применяет изменения, зарегистрированные в журнале транзакций.

Структура журнала транзакций.

Журнал транзакций базы данных содержит две или более группы файлов регистрации фиксированного размера или членов группы, которые Oracle7 использует для физического сохранения изменений в базе данных. Физическая структура типичного журнала транзакций базы данных иллюстрируется рис.5 Журнал транзакций может иметь две (или более) группы. После того как транзакции заполняют одну группу, Oracle7 для продолжения регистрации происходящих в базе данных изменений переключается на следующую доступную группу. Тем временем Oracle7 автоматически архивирует (создает резервные копии) заполненные группы транзакций. Причем это делается параллельно, не оказывая влияния на текущий процесс транзакций. Повторное циклическое использование групп транзакций позволяет Oracle7 отвести для журнала транзакций небольшую фиксированную область диска. В результате архивации заполненных групп транзакций создается постоянный автономный журнал последовательных транзакций.

Поскольку механизм восстановления является жизненно важным компонентом Oracle7, сам он также имеет средства защиты. Для защиты от единичного отказа, например, сбоя диска, администратор может задать зеркальное отображение групп журнала (групп регистрации) путем создания группы с несколькими членами, которые физически помещаются на разные диски. Oracle7 регистрирует транзакции в зеркально отображаемых группах, записывая изменения параллельно во все файлы группы. Если диск выходит из строя, один из файлов группы на поврежденном диске становится недоступным. Однако Oracle7 это не останавливает: он продолжает регистрировать изменения в других, неиспорченных, файлах текущей группы регистрации.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: