Бази даних і бази знань

  • Етапи проектування бази даних
  • Словнико та тексто зорієнтовані лінгвістичні бази даних.
  • Способи організації лінгвістичних баз даних
  • Компютерна копія та компютерна версія словна оригінала
  • Граматика компютерної версії традиційного складника
  • Стратегія проектування баз даних моремно-словотвірного фонду української мови, як словнико-зорієнтованої бази

Лінгвіст який у своїй роботі використовує компютер працює у так званому компютерному середовищі. Змодельовані для компютера мовні обєкти декларативні та процедурні знання про них становлять фактографічне підгрунтя для розвязання певних завдань прикладної лінгвістики. Розрізняють два види таких фактичних основ діяльності лінгвістика компютерника залежно від типу відомостей про модельовані обєкти інформацію про мовні обєкти незалежно від умов їхньої реалізації, ситуацій і особливостей використання їхнього звязку з іншими мовними обєктами прийнято називати даними а сукупність такої інформації базою даних. Відомостіі про можливості і способи застосування мовних обєктів у різних ситуаціях спілкування, у різних продуктах мовної діяльності судження про такі обєкти, їхню оцінку а отже відомості на основі яких можна робити певні висновки про мовні обєкти називають знаннями, а сукупність таких відомостей базою знань, або інтелектуальною базою даних, таким чином база даних відносно бази знань виступає, як вихідний продукт до похідного, оскільки база знань містить інформацію про відношення між даними та їхні ціннісні х-ки, ми отримуємо на екрані компютера мовні обєкти, декларативні та процедурні знння про них становлять фактографічне підгрунтя для розвязання певних завдань прикладної лінгвістики.

 

Проектування бази даних передбачає 2 етапи:

  1. інфологічний – це етап відбору інформації та її структурування, або етап внутрішньої формалізації інформації, етап моделювання змісту інформації.
  2. датологічний – це етап оформлення інформації відповідною мовою представлення, придатної для компютерного опрацювання, або етап зовнішньої формалізації інформації- це етап моделювання її форми, етап перетворення інформації на дані.

Завдання інфологічного етапу проектування бази даних полягає у відборі обєктів опису, типів інформації про їхню будову та функціонування. Це етап вивчення та опису певної предметної галузі, її внутрішньої формалізації. Результатом роботи лінгвіста на цьому етапі є концептуальна інформаційна модель такої предметної галузі.

Завданням датологічного етапу є вироблення способів представлення обєктів та інформації про них у памяті компютера, спеціальних маркерів сигналізаторів для безпомилкого розпізнавання компютером, того чи іншого типу інформації, правил взаємодії типів інформації та одержання з бази даних відомостей у потрібному вигляді, тобто це етап зовнішньої формалізації інформації про моні обєкти. Датологічний етап містить дві стадії організації даних логічну і фізичну.

Логічна –це повязання концептуальної інформаційної моделі одержаної на інфологічному етапі з операціною с-мою певного типа компютера, з тими с-мами керування базами даних, якими він послугується

Фізична – це вибір раціональної структури організації бази даних у памяті компютера, методів роботи з нею виходячи з тих можливостей, які надають технічні показники компютера, його апаратне та програмне забезпечення, стратегія створення показових і надійних лінгвістих баз данихх спрямована на їхнє багаторазове та різноаспектне, використання, тобто оброблення за різними параметрами та типами інформації, про подані в таких базах мовні обєкти.

За способом організації інформації, лінгвістичні бази даних, як і бази даних з інших галузей знання можна поділити на 2 основні типи:

  1. ієрархічні
  2. реляційні

Ієрархічні подають відомості про мовні обєкти за різними відношеннями їхнього відпорядкуваня: родо-видові, частина-ціле.

Реляційні представляють інформацію про той чи інший мовний обєкт, як сукупність його атрибутів, властивослей,х-к, ознак,така інформація в базі даних, обєднана на підставі її належності певному єдиному обєкту, за ознакою відношення, тобто реляції до нього.

Здебільшого лінгвістичні бази даних поєднують обидва способи організації про мовні обєкти, оскільки сама мовна с-ма організована, як за відношеннями підпорядкування одиниць, так і за відношеннями включення або координації.

Залежно від обраних джерел формування баз даних розізняють:

Словнико та тексто зорієнтовані бази. Тип віходного джерела, спосіб представлення, та організація в ньому мовної інформації, визначають не лише структуру інфологічних моделей баз цих двох різновидів, але і спосіб роботи з ними, одержання з них потрібної інформації та вигляд машинних продуктів опрацювання таких лінгвістичних баз. Представлення в памяті компютера тексту традиційного словника залежить від мети його подальшого використання. Якщо користувач не планує конструювати на основі такого тексту нові лінгвістичні обєкти, наприклад словники нових типів, аббо використовувати таку базу даних для інших лінгвістичних досліджень чи практичних потреб, його задовольнить так звана компютерна копія традиційного словника. Таке представлення тексту словника не передбачає будь-якого втручання в його структуру, спосіб виділення типів інформації, або відношень між ними, такі копії можуть бути цілком придатними і для пошукових дослідницьких завдань. Це стосується орфографічних,орфоепічних, словників індексів морфем(словники де немає справа тлумачення). Для пояснювальних словників компютерні копії текстів розрахованих на людське сприйняття мовної інформації є мало придатними для використання. Тексти таких словників для виконання таких пошукових завдань вимагають втручання лінгвіста дослідника до процесу їхнього представлення, і тому у базах даних створюють компютерні версії, які мають свою спеціальну граматику або правила аналізу та синтезу його тексту за типами інформації.

 

Для роботи користувачів як з о-ною базою даних так і з бзами сатилітами створено спеціальний інтерфейс, що є засобом доступу до бази даних і отриманням з них потрібної інформації.

Інтерфейс - це спеціальні с-ми спілкування з базою даних призначені для її поповнення або редагування, а також для одержання з неї інформації потрібної для виконання завдання користувача. Такий засіб звязку між користувачем і базою даних у морфемно-словотвірному фоні становить діалогова с-ма «морфолог», яка дозволяє працювати з базою в інтерактивному режимі. ЇЇ створили лінгвісти-розробники фонду «Клименко та Капріловська» разом з математиками програмістами Буригіним, Перельмутером.

Інтерактивний або онлайновий режим- це режим опрацювання інформації в масштабі реального часу навідміну від так званого пакетного режиму, він уможливлює роботу з інформацією бази з втручанням користувача в процесі її опрацювання, або з можливим візуальним контролем ходу виконання поставленого завдання. Крім того с-ма морфолог дає змогу користувачеві отримати деталізоване структурування бази даних за типами інформаціїї про слово, а також створені спеціальні засоби опрацювання такої інформації дають можливість описаній вище словнико-зорієнтованійй базі даних морфемно-словотвірного фонду української мови створеній в інституті мовознавства ім. Ботебні виконувати такі ф-ції як:

  1. інформаційно-довідкову
  2. навчальну
  3. редакційно-видавничу
  4. власне лінгвістичну, дослідницьку

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: