Основні компоненти технології World Wide Web

     ДО 1989 року гіпертекст представляв нову, багатообіцяючу технологію, що мала відносно велике число реалізацій з одного боку, а з іншої сторони робилися спроби побудувати формальні моделі гіпертекстових систем, що носили скоріше описовий характер і були навіяні успіхом реляційного підходу опису даних. Ідея Т. Бернерс-Ли полягала в тім, щоб застосувати гіпертекстову модель до інформаційних ресурсів, розподіленим у мережі, і зробити це максимально простим способом. Він заклав три наріжних камені системи з чотирьох існуючих нині, розробивши: 

мова гіпертекстової розмітки документів HTML (HyperText Markup Lan-guage); універсальний спосіб адресації ресурсів у мережі URL (Universal Resource Locator); протокол обміну гіпертекстовою інформацією HTTP (HyperText Transfer Protocol). 

Пізніше команда NCSA додала до цим трьох компонентам четвертий: універсальний інтерфейс шлюзів CGI (Common Gateway Interface). Ідея HTМL-приклад надзвичайно вдалого рішення проблеми побудови гіпертекстової системи за допомогою спеціального засобу керування відображенням. На розробку мови гіпертекстової розмітки істотний вплив зробили два фактори: дослідження в області інтерфейсів гіпертекстових систем і бажання забезпечити простий і швидкий спосіб створення гіпертекстової бази даних, розподіленої на мережі. 

       У 1989 році активно обговорювалася проблема інтерфейсу гіпертекстових систем, тобто способів відображення гіпертекстової інформації і навігації в гіпертекстовій мережі. Значення гіпертекстової технології порівнювали зі значенням друкарства. Затверджувалося, що лист папера і комп'ютерні засоби відображення/відтворення серйозно відрізняються друг від друга, і тому форма представлення інформації теж повинна відрізнятися. Найбільш ефективною формою організації гіпертексту були визнані контекстні гіпертекстові посилання, а крім того був визнаний розподіл на посилання, асоційовані з усім документом у цілому й окремих його частинах. 

       Найпростішим способом створення будь-якого документа є його набивання в текстовому редакторі. Досвід створення добре розмічених для наступного відображення документів у CERN був - важко знайти фізика, що не користався би системою Te чи LaTe. Крім того на той час існував стандарт мови размітки-Stаndаrd Generalised Markup Language (SGML). 

Варто також узяти до уваги, що відповідно до своїх пропозицій Бернерс-Ли припускав об'єднати в єдину систему наявні інформаційні ресурси CERN, і першими демонстраційними системами повинні були стати системи для NeXT і VAX/VMS. 

       Звичайно гіпертекстові системи мають спеціальні програмні засоби побудови гіпертекстових зв'язків. Самі гіпертекстові посилання зберігаються в спеціальних чи форматах навіть складають спеціальні файли. Такий підхід гарний для локальної системи, але не для розподіленої на безлічі різних комп'ютерних платформ. У HTML гіпертекстові посилання убудовані в тіло документа і зберігаються як його частину. Часто в системах застосовують спеціальні формати збереження даних для підвищення ефективності доступу. У WWW документ-це звичайні ASCII- файли, які можна підготувати в будь-якому текстовому редакторі. Таким чином, проблема створення гіпертекстової бази даних була вирішена надзвичайно просто.  

       Як базу для розробки мови гіпертекстової розмітки був обраний SGML (Standard Generalised Markup Language). Випливаючи академічним традиціям, Бернерс-Ли описав HTML у термінах SGML (як описують мова програмування в термінах форми Бекуса-Наура). Природно, що в HTML були реалізовані всі розмітки, зв'язані з виділенням параграфів, шрифтів, стилів і т.п., тому що реалізація для NeXT мала на увазі графічний інтерфейс. Важливим компонентом мови став опис убудованих і асоційованих гіпертекстових посилань, убудованої графіки і забезпечення можливості пошуку по ключових словах. 

       З моменту розробки першої версії мови (HTML 1.0) пройшло вже п'ять років. За цей час відбувся досить серйозний розвиток мови. Майже вдвічі збільшилося число елементів розмітки, оформлення документів усе більше наближається до оформлення якісних друкованих видань, розвиваються засоби опису не текстових інформаційних ресурсів і способи взаємодії з прикладним програмним забезпеченням. Удосконалюється механізм розробки типових стилів. Фактично, у даний час HTML розвивається убік створення стандартної мови розробки інтерфейсів як локальних, так і розподілених систем. 

       Другим наріжним каменем WWW стала універсальна форма адресації інформаційних ресурсів. Universal Resource Identification (URI) являє собою досить струнку систему, що враховує досвід адресації й ідентифікації e-mail, Gopher, WAIS, telnet, ftp і т.п. Але реально з усього, що описано в URI, для організації баз даних у WWW потрібно тільки Universal Resource Locator (URL). Без наявності цієї специфікації вся міць HTML виявилася б марною. URL використовується в гіпертекстових посиланнях і забезпечує доступ до розподілених ресурсів мережі. У URL можна адресувати як інші гіпертекстові документи формату HTML, так і ресурси e-mail, telnet, ftp, Gopher, WAIS, наприклад. Різні інтерфейсні програми по різному здійснюють доступ до цих ресурсів. Одні, як наприклад Netscape, самі здатні підтримувати взаємодія по протоколах, відмінним від протоколу HTTP, базового для WWW, інші, як наприклад Chimera, викликають для цієї мети зовнішні програми. Однак, навіть у першому випадку, базовою формою представлення відображуваної інформації є HTML, а посилання на інші ресурси мають форму URL. Слід зазначити, що програми обробки електронної пошти у форматі MIME також мають можливість відображати документи, представлені у форматі HTML. Для цієї мети в MIME зарезервований тип “text/html”. 

       Третім у нашому списку коштує протокол обміну даними в World Wide Web -HyperText Transfer Protocol. Даний протокол призначений для обміну гіпертекстовими документами і враховує специфіку такого обміну. Так у процесі взаємодії, клієнт може одержати нову адресу ресурсу на мережі (relocation), запросити убудовану графіку, прийняти і передати параметри і т. п. Керування в HTTP реалізовано у виді ASCII-команд. Реально розроблювач гіпертекстової бази даних зіштовхується з елементами протоколу тільки при використанні зовнішніх розрахункових чи програм при доступі до зовнішнім відносно WWW інформаційним ресурсам, наприклад базам даних. 

       Остання складова технології WWW - це вже плід роботи групи NCSA -- специфікація Common Gateway Interface. CGI була спеціально розроблена для розширення можливостей WWW за рахунок підключення всілякого зовнішнього програмного забезпечення. Такий підхід логічно продовжував принцип публічності і простоти розробки і нарощування можливостей WWW. Якщо команда CERN запропонувала простий і швидкий спосіб розробки баз даних, то NCSA розвила цей принцип на розробку програмних засобів. Треба помітити, що в загальнодоступній бібліотеці CERN були модулі, що дозволяють програмістам підключати свої програми до сервера HTTP, але це вимагало використання цієї бібліотеки. Запропонований і описаний у CGI спосіб підключення не  вимагав додаткових бібліотек і буквально приголомшував своєю простотою. Сервер взаємодіяв із програмами через стандартні потоки введення/висновку, що спрощує програмування до межі. При реалізації CGI надзвичайно важливе місце зайняли методи доступу, описані в HTTP. І хоча реально використовуються тільки два з них (GET і POST), досвід розвитку HTML показує, що співтовариство WWW чекає розвитку і CGI у міру ускладнення задач, у яких буде використовуватися WWW-технологія.

 

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: