Основной вопрос – методы и способы обработки правовой информации в машинной обработке.
Весь массив правовой информации необходимо представить в машиночитаемом виде.
Машинное слово – это байт (8 бит).
Методы подготовки информации к машинной обработке:
Формализация, метризация и кодирование.
Формализация – это выявление и уточнение содержания правового явления через рассмотрение и фиксацию его формы и оперирование с нею.
Устойчивыми конструкциями, которыми мы можем записывать информацию – это буквы, знаки, символы и тому подобное.
Второй метод – это метризация. Это описание объекта совокупностью числовых характеристик.
Два способа метризации – подсчёт и измерение.
При подсчёте используют натуральные числа, а при измерении – принятые единицей меры (градусы, радианы, граммы, килограммы…).
Третий способ – это кодирование.
Кодирование – это замена каких-либо данных сокращёнными условными обозначениями.
Способы кодирования: ручное, механизированное и автоматизированное.
Ручной способ очень широко сейчас используется – это в виде карточек и других форм типовых документов. Сейчас осуществляется на основании совместного приказа Генеральной Прокуратуры, МВД, МЧС, Министерства юстиции, ФСБ, Минэкономразвития и ФСКН (госнаркоконтроль) от 29 декабря 2005 года. В качестве приложения в этом приказе очень много форм. Форма №1 – статистическая карточка на выявленное преступление…
Механизированное используется не так часто. Используются координатные сетки и точечное и контурное кодирование.
Автоматизированные способы – это при помощи сканера. В последнее время стали использовать голографические способы снятия объёмной информации.
Мы подготавливаем правовую информацию для того, чтобы обработать, а обработка нам нужна для того, чтобы избавиться от рутинной работы.
Информационно-поисковая система – это совокупность средств для хранения, поиска и выдачи информации по запросу.
Поиск (в самом общем виде) – это процесс извлечения элемента из массива.
Массивы бывают неорганизованные и организованные (организованные ещё делятся на разные классификации, связанные с матрицей и т.д.).
В неорганизованном поиске поиск является случайным. А в организованном массиве поиск детерминированный, то есть предопределённый.
Примером организованного массива является наша библиотека – у нас есть каталоги и алфавитные, и тематические, и по авторам…
По способу поиска информационно-поисковые системы бывают ручные, механизированные и автоматизированные.
Ручные – это человек с его руками (когда мы заходим в библиотеку, берём каталог и начинаем карточки перебирать).
Механизированный – раньше был, когда есть часть и от руки написанное, а есть и элементы механики.
Автоматизированная информационно-поисковая система – это система, реализующая хранение поиска и выдачу информации на базе использования ЭВМ как совокупности языково-алгоритмических и технических средств.
Виды поиска:
1. Путём образа документа. А ещё точнее – создание поискового образа документа. Он представляет собой текст, который на информационно-поисковом языке отражает содержание документа.
Четыре уровня поискового образа документа:
1) Библиографическое описание (первый и самый низший уровень). В него входит: наименование документа; орган, который его принял (или автор, который его издал); место принятия или издания; дата принятия или издания; объём документа.
2) Аннотация. Второй уровень. Аннотация – это краткое описание документа (больше, чем библиографическое описание), объёмом не более пятисот знаков (примерно полстраницы машинописного текста).
3) Реферат (это третий уровень). Это не только описание документа, но и выводы о нём и место в системе других документов. Примерно полторы тысячи знаков, не более.
4) Четвёртый и самый полный уровень – это текст самого документа.
2. Второй способ поиска. При помощи классификаторов. В нашей стране утверждены порядка двух десятков классификаторов, в правоведении используются три.
Для законодательства и нормативных актов используют классификатор правовых актов, одобренный Указом Президента от 15 марта 2000 года. В него включается двадцать одна отрасль российского законодательства (именно отрасли законодательства, а не права). У него трёхуровневая структура. 010.000.000 – конституционный строй. 030.000.000 – гражданское право… 120.000.000 – информация и информатизация (информационное законодательство).
Каждая отрасль законодательства имеет свою структуру, состоит из нескольких разделов, которые разделяются на институты, субинституты, конечная единица – нормы.
Семь разделов отрасли информации и информатизации:
120.010.000 – общие положения. 120.020.000 – управление в сфере информации и информатизации.
120.030.000 – информационные ресурсы (пользование информационными ресурсами), разделяется на восемь институтов: 120.030.010 – общие положения; 120.030.020 – документирование информации и делопроизводство; 120.030.030 – обязательный экземпляр документов; 120.030.040 – архивный фонд и архивы; 120.030.050 – информационные ресурсы по категориям доступа; 120.030.060 – информация о гражданах (персональные данные); 120.030.070 – правовая информация; 120.030.080 – предоставление информации и информационные услуги.
120.040.000 – информация и информационные системы. Разделяется на два института. 120.040.010 – информатизация и 120.040.020 – информационная система, технологии и средства из обеспечения.
120.050.000 – средства массовой информации (СМИ).
120.060.000 – реклама.
120.070.000 – это информационная безопасность, защита информации и прав субъектов в области информационных процессов и информатизации.
Ряд институтов является межотраслевыми. Это относится к управлению в сфере информации и информатизации, сфера СМИ (образование и культура) и информационная безопасность (безопасность и охрана правопорядка).
Для научной литературы используются два классификатора: УДК (универсальный десятичный классификатор) и ББК (библиотечно-библиографический классификатор).
УДК – во всём мире, а ББК – у нас.
В УДК код наш: 34 – право и юридические науки. Число кодов больше всего – 4414. Все право и юридические науки состоят из 18 отраслей науки: 348 – церковное право, 349 – специальные отрасли права…
ББК право и юридические науки – состоит из 13 отраслей права. Но у лектора он уже устарел.
1672 закона (месяца два назад так было), которые действуют в нашей стране сейчас. А всего – почти семь тысяч (но это с учётом тех законов, которые вносят изменения в другие законы).
3. По объектам поиска.
Два вида – фактографические и документальные информационно-поисковые системы.
В фактографических информационно-поисковых системах происходит хранение, поиск и выдача различных сведений (или фактов): о личности (в том числе может быть и изображение личности в графических файлах), о преступлении, о следах, о доказательствах и тому подобное.
Все фактографические АИПС подразделяются на три группы: информационно-справочные, информационно-логические и экспертные системы. Разница между ними заключается в характере решаемых задач.
Информационно-справочная система – простейшая из этих систем. Если есть запрашиваемый элемент – вытаскивает и выдаёт, нет элемента – не выдаёт.
Информационно-логическая система – в ней происходит алгоритмическое решение задач по синтезу новых сведений и выдаёт те сведения, которые в явной форме там нет.
Экспертная система вообще может делать выводы, не связанные с информационной базой. Она получает новые знания – она может судить (то есть совершать логические суждения, делать логические выводы, может самообучаться, разговаривать с пользователем…).
Документальные информационно-поисковые системы – они предназначены для описания документа и выдачи поиска с необходимой информацией.
Фактографические АИПС больше используются для экспертиз, опознаний, расследований преступлений, то документальные АИПС прежде всего – для законодательства (Консультант, Гарант, Референт).
Два вида документальных информационно-поисковых систем:
1) Избирательное распределение информации (избирательный вид). Это значит, что каждый сеанс поиска производится по одному и тому же запросу, который отражает постоянные интересы пользователя.
2) Справочные, которые выполняют функции справочного или рестропективного поиска. Здесь каждый сеанс поиска осуществляется по разовым запросам (так чаще всего и происходит).
Есть искусственный язык общения – информационно-поисковый язык, он предназначен для записи и поиска семантической или смысловой информации. Его цель – описание тем, предметов или формальных характеристик поисковых образов документов, а также выражение содержания информационных запросов.
Базируется на естественном языке (в нашем случае – на русском языке) и как и любой язык, состоит из слов, которые бывают двух видов: ключевое слово и дескриптор.
Ключевое слово – это слово, которое отражает содержание документа (от восьми до пятнадцати ключевых слов достаточно, чтобы полностью описать документ). Раньше ключевые слова выделяли интуитивно, а теперь – есть закон «чем реже встречается символ, тем большую информацию он в себе несёт, а чем чаще встречается – тем меньшую информацию в себе несёт». Учёные составили частотный словарь русского языка, где все буквы и слова по степени убывания частотности (наиболее часто встречаемая буква – «о»).
Ключевое слово – это лексическая единица, которая описывает языковую конструкцию, выбираемую из текста.
Дескриптор – это словарная единица, выраженная словом или словосочетанием и связанная с другими словами логическими (семантическими) связями.
Все эти слова (ключевые и десприторы0 включаются в словарь, который называется тезаурус.
Семь видов связей между словами: синонимы, функциональная связь (предприятие – производство), родовидовая связь (машина – автомобиль, компьютер, теплоход…), часть и целое (факультет и университет или институт), ассоциативная связь (подданство – гражданство; найм – раньше только жилищный; устойчивые типичные словосочетания, к примеру «явка с повинной»).
Этапы развития АИПС по законодательству.
1 этап – 1961 год. Создание прообраза АИПС (Ленинградский государственный университет).
Второй этап – первые рабочие АИПС. 1972 и 1975 годы. 1972 год – это Право I, а 1975 год – Хронология.
Право I было создано во всесоюзном научном институте… В общем, чисто ведомственный характер носило.
Хронология была в Эстонии изобретена и носила более универсальный характер.
Третий этап – это 80-е годы. Распространение АИПС в министерствах и ведомствах. Их было создано порядка пятидесяти. Самой большой из них была АИПС «Законодательство» (была создана в НИИ советского законодательства и Минюста СССР и включало около 32 000 нормативных актов общесоюзного значения, там были только акты общесоюзного значения).
Следующий этап – это 90-е годы. Здесь три особенности АИПС по законодательству.
1) Появление АИПС на ПК. Первая такая АИПС была создана в 1989 году в Верховном Совете СССР. Называлась она «Союз».
2) Произошло разделение АИПС на государственные и коммерческие (что связано с появлением новых форм собственности). Самые первые государственные системы – это «Эталон» Минюста, та же «Союз» Верховного Совета РСФСР и позже – преемника – Верховного Совета РФ; НДЦ (научно-технический центр правовой информации) «Система».
Коммерческие системы. Самые первые из них – «Юсис» (Юридическая справочная информационная система, была создана в МГУ; была создана на факультете вычислительной математики и кибернетике; но система была так себе – капризная, искала долго…). Вторая система – «Гарант», затем появилась и заняла почти 70% рынка «Консультант +», затем в Ленинграде появилось «Кодекс», потом «Ваше право», «Референт» (три года назад получило первое место среди АИПС) и другие.
3) Появились АИПС на базе компакт-диска. Очень удобно, можно его нахаляву взять в университете (подойти к Просвирнину на практических занятиях и взять).
Пятый этап – это появление сетевых АИПС. Об этом давно стали задумываться, так как это достаточно удобно (чтобы по разным министерствам не было разных систем).
Первая попытка на основании Постановления Правительства – в 1985 году стали создавать ОГАСПИ (Общегосударственная автоматизированная система правовой информации). В неё вложили большие деньги, но попытка эта провалилась.
Первая преграда – разные операционные системы (шесть разных и равноправных, а не только детище Билла Гейтса). Вторая – проблема с телекоммуникациями, связь была ужасная.
Вторая попытка была предпринята в 1993 году на основании Указа Президента «О концепции правовой информатизации России». И с этого года начало создаваться и сейчас функционирует РАСИПО (Российская автоматизированная система информационно-правового обеспечения правотворческой, праворелиазиционной деятельности, правового воспитания и обучения). В настоящее время РАСИПО в основном сделано и существует. В ней пять уровней:
1 уровень. Высшие органы государственной власти (Президент, Федеральное Собрание, Правительство).
2 уровень. Центральные органы федеральной исполнительной власти. Министерства и ведомства.
3 уровень. Государственные органы власти субъектов РФ.
4 уровень. Региональные органы власти и органы местного самоуправления.
5 уровень. Отдельные предприятия и организации.
Первые три органа – работа постоянно ведётся, они функционируют, на основе этого в общедоступной сети интернет уже выставлены данные.
Четвёртый уровень – не все из них пока имеют выход в Интернет (есть такие глухие места в нашей стране) и не все активно обновляют.
А пятый уровень заглох. Ибо слишком много их, этих отдельных предприятий и организаций.