Побудова лексичного аналізатора засобами скінченного автомату

Міністерство освіти і науки, молоді та спорту України

 

Національний університет “Львівська політехніка”

 

 

Кафедра ЕОМ

 

 

Розробка системних програмних модулів та компонент систем програмування

Методичні вказівки
до курсової роботи з курсу “Системне програмування ”

 для студентів базового напряму 6.050102 - “Комп’ютерна інженерія”

 

Затверджено
на засіданні кафедри
”Електронні обчислювальні машини”
Протокол № 1 від 23.08.2011 року

 

Львів – 2011


Розробка системних програмних модулів та компонент систем програмування: Методичні вказівки до курсової роботи з курсу “ Системне програмування ” для студентів базового напряму 6.050102 - “Комп’ютерна інженерія” / Укладачі: Мархивка В.С., Олексів М.В., Мороз І.В. – Львів: Національний університет “Львівська політехніка”, 2011, 41 с.

 

Укладачі                                                              Мархивка В.С., ст. викл.

                                                                        Олексів М. В., асистент

Мороз І.В., ст. викл.

                                                                                 

 






Рецензенти                                                             

 

Відповідальний за випуск:              Мельник А. О., професор, завідувач кафедри

 

                                              

 

 



Розробка системних програмних модулів та компонент систем програмування

МЕТА КУРСОВОЇ РОБОТИ

Метою виконання курсової роботи є закріплення теоретичних знань та практичних навичок системного програмування, набутих при вивченні дисципліни “Системне програмування”. В ході виконання курсової роботи студенти повинні навчитися самостійно працювати з літературою, розробляти типові елементи системних програм, програмуючи роботу з таблицями, словниками, інформаційними базами, виконуючи лексичний та синтаксичний аналіз, а також семантичну обробку, здійснювати їх програмну реалізацію та відлагодження на сучасних обчислювальних системах.

СТРУКТУРА ТА ОБСЯГ КУРСОВОЇ РОБОТИ

Обсяг курсової роботи повинен становити не менше 20 сторінок друкованого тексту (без врахування додатків).

Рекомендується такий склад пояснювальної записки до курсової роботи:

Титульна сторінка

Анотація

Зміст

Завдання на курсову роботу

Вступ

1. Огляд методів та способів проектування трансляторів

2. Формальний опис вхідної мови програмування

2.1. Деталізований опис вхідної мови в термінах розширеної нотації Бекуса-Наура

2.2. Термінальні символи та ключові слова

3. Розробка транслятора вхідної мови програмування

3.1. Вибір технології програмування

3.2. Проектування таблиць транслятора

3.3. Розробка лексичного аналізатора

3.4. Розробка синтаксичного та семантичного аналізатора

3.5. Розробка генератора коду

4. Опис програми (в тому числі граф-схем)

5. Опис інтерфейсу та інструкція користувачеві

6. Відлагодження та тестування програми

6.1. Виявлення лексичних помилок

6.2. Виявлення синтаксичних помилок

6.3. Виявлення семантичних помилок

6.4. Загальна перевірка коректності роботи транслятора

Висновки

Список літератури

Додатки

А. Лістинг програми

Б. Граф-схеми алгоритмів

В. Результати тестування

Обов’язковими додатками має бути документований текст програми та графічна частина, оформлені у відповідності до стандартів та ЄСКД.

Завдання на курсову роботу (1 стор.). У завданні вказується тема роботи та перелік конкретних вхідних даних. Завдання на курсову роботу видається студентові керівником курсової роботи індивідуально.

Анотація (1 стор.) В анотації викладаються короткі відомості про курсову роботу.

Зміст (1 стор.). У змісті вказуються номери та назви основних розділів курсової роботи та номери сторінок, де вони починаються. Вступ, висновки по роботі, список літератури та додаток не нумеруються.

Вступ (1 стор.). У вступі здійснюють опис проблеми у загальному вигляді, визначають її актуальність, формулюють мету курсової роботи.

Теоретична частина. Огляд методів та способів проектування трансляторів Цей розділ виконується із використанням літературних джерел і повинен містити опис методів та способів вирішення задачі. Необхідно здійснити порівняння описаних методів та способів.

Формальний опис вхідної мови програмування. Вцьому розділі описується тип граматики вхідної мови програмування згідно завдання. При цьому визначається алфавіт мови та набір зарезервованих слів. Рекомендується опис вхідної мови подавати в термінах розширеної нотації Бекуса-Наура або за допомогою синтаксичних діаграм.

Розробка транслятора вхідної мови програмування. В цьому розділі:

- здійснюється вибір технології програмування;

- розробляється структура постійних таблиць для зберігання алфавіту мови, зарезервованих слів, знаків операцій, роздільників тощо та здійснюється вибір для постійних таблиць алгоритму пошуку елементів у впорядкованих таблицях;

- розробляється структура перемінних таблиць для зберігання ідентифікаторів і констант та алгоритми пошуку/вставки лексем і їх атрибутів;

- проектується лексичний аналізатор на основі детермінованих кінцевих автоматів;

- проектується синтаксичний аналізатор на основі дерева граматичного розбору;

- проектується генератор асемблерного коду

Опис програми. Програма повинна бути написана та реалізована на мові програмування C/C++. Текст програми повинен бути документований і написаний згідно вимог структурного програмування. Кожний програмний модуль на початку повинний містити інформацію про тему курсової роботи, прізвище автора та дату створення. Крім того, кожна підпрограма мусить буди також документованою

Опис програми проводиться в такій послідовності: спершу описується граф-схема алгоритму, а пізніше програмна реалізація.

Опис інтерфейсу та інструкція користувачеві В інструкції користувачеві приводять детальну послідовність дій по запуску програми на виконання та описують всі можливі режими керування роботою програми. Для ілюстрації режимів роботи програми бажано навести зображення екранних форм, вікон, меню, блоків діалогу, форм документів і т.п.

Відлагодження та тестування програми. В цьому розділі описуються вибрані технології відлагодження та тестування програми на комп’ютері.

Технологія відлагодження програми - це послідовність дій та засоби виявлення, аналізу та виправлення помилок програми. Описуються використані засоби автоматизованого відлагодження та оптимізації програми (автономні та вбудовані відлагоджувальники, профайлери). Проводиться аналіз помилок, допущених в ході програмування задачі, спосіб їх виявлення та усунення.

Для підтвердження працездатності програмного продукту розробляється система тестів та приводяться результати тестування з їх аналізом.

Висновки (1 стор.) У висновках перераховуються основні результати курсової роботи, вказуються її позитивні сторони та недоліки, даються рекомендації по практичному застосуванню розроблених алгоритмів та програм.

ВИМОГИ ДО ОФОРМЛЕННЯ

Курсова робота є індивідуальною роботою кожного студента і оформляється окремо кожним студентом згідно із виданим завданням.

Курсова робота оформляється на аркушах формату A4, які заповнюються з однієї сторони. Текст повинен бути надрукований на принтері. Використання різних чорнил не дозволяється. Заголовки розділів можуть бути виділені великими літерами або підкресленням. Текст повинен бути набраний без помилок українською мовою.

Текст на сторінці повинен бути розміщений рівномірно з дотриманням відступів: зліва, згори та знизу - 20 мм, зправа - 10 мм. При комп’ютерному наборі необхідно вибрати шрифт Times New Roman Cyr, розмір шрифта - 14, міжрядковий інтервал - 1.5. Сторінки курсової роботи повинні бути пронумеровані. Титульна сторінка вважається першою і не нумерується. Номери сторінок вказуються у правому верхньому куті.

Кожен розділ повинен мати свій номер, який записується перед його назвою. Після номера розділу ставиться крапка, наприклад: 1.Формулювання задачі. Вступ, висновки, список літератури та додаток не нумеруються. Кожен розділ необхідно розпочинати з нової сторінки. Розділ може складатися з підрозділів. Номер підрозділу записується через крапку після номера розділу, наприклад: 4.2. Призначення програми.

Формули, на які здійснюється посилання, а також всі таблиці та рисунки повинні мати номер. Нумерація може бути наскрізною або прив'язаною до номера розділу.

Номер формули записується після неї у круглих дужках. Номер та назва таблиці вказуються над нею після слова "Таблиця". Номер та назва рисунка вказуються під ним після скорочення "Рис.".

Рисунки та рамки таблиць повинні бути виконані олівцем або чорнилом вибраного кольору. Дозволяється комп'ютерне виконання графічної частини курсової роботи. Графічні схеми алгоритмів виконуються згідно вимог міжнародного стандарту ISO 5807-85 "Обробка інформації. Символи і умовні позначення блок-схем даних, програм та систем, схем програмних мереж і системних ресурсів".

Роздруки текстів програм приводяться у додатку. Кожен окремий документ додатку повинен мати свій номер та назву, які записуються після слова "Додаток", наприклад: Додаток 1. Текст програми на мові С++.

Список літератури виконується згідно вимог стандартів. Література може бути розміщена за алфавітом або в порядку посилання на неї. У списку можна наводити тільки ту літературу, яка була використана при виконанні курсової роботи і на яку є посилання у тесті пояснювальної записки. Посилання здіснюється вказанням номера джерела у квадратних дужках. Список літератури повинен містити не менше 5 джерел.

Пояснювальна записка повинна бути сформована згідно змісту і надійно зшита з лівої довшої сторони листів формату A4. Для зручності зберігання палітурка курсової роботи повинна бути жорсткою (виконана із листа ватману чи картону).

ЗАХИСТ РОБОТИ

Готова курсова робота представляється керівнику для перевірки. При необхідності вона може бути повернута студенту для доопрацювання. До захисту приймається робота, оформлена згідно приведених вище вимог, разом з дискетою. На дискеті розміщуються текстові файли програм, тестових даних та текст пояснювальної записки до курсової роботи. Дискета повинна бути підписана з вказанням номера групи та прізвища студента. Назви файлів повинні бути виконані латинськими літерами та цифрами.

В процесі захисту роботи студент демонструє роботу транслятора на комп'ютері і дає пояснення та відповіді на поставлені питання членами комісії. Захист роботи здійснюється студентом тільки один раз. При незадовільній оцінці студенту видається нове завдання на курсову роботу за дозволом завідувача кафедри та декана.

Теоретичні відомості

       Виконання курсової роботи полягає в розробці транслятора з вхідної мови програмування, яка задана варіантом, на мову асемблер. Здійснюючи трансляцію, транслятор типово послідовно виконує такі фази роботи: лексичний аналіз, синтаксичний аналіз, генерація коду. Розглянемо детальніше кожну з фаз.

Лексичний аналіз

Лексичний аналіз – це перша фаза роботи компілятора чи транслятора довільної мови програмування. Він полягає у перетворенні послідовності символів тексту вхідної програми в послідовність токенів (токен - об'єкт, що утворюється із лексеми в процесі лексичного аналізу). В процесі роботи він вирішує задачі: побудова таблиці ідентифікаторів; побудова таблиці лексем шляхом ідентифікації токенів в тексті вхідної програми; видалення пробілів і коментарів оскiльки вони не мають нiякого впливу на виконання програми, отже ж й на синтаксичний розбір та генерацію коду; передача таблиці ідентифікаторів і таблиці лексем на вхід синтаксичному аналізатору (рис.1).

Рис.1.1. Взаємодія лексичного і синтаксичного аналізаторів

 

Таблиця ідентифікаторів містить перелік ідентифікаторів, наприклад, назв змінних, функцій. Таблиця лексем містить ідентифіковані токени тексту вхідної програми у форматі внутрішнього представлення. Цей формат може включати таку інформацію:

· позиція лексеми в тексті вхідної програми (рядок і стовпець);

· тип токена;

· лексему;

· значення (для чисел, рядкових констант);

· адресу ідентифікатора в таблиці ідентифікаторів.

Таблиці лексем і ідентифікаторів можуть бути суміщеними. Приклад таблиці лексем зображено в табл. 1.1.

Крім побудови таблиць лексем і ідентифікаторів лексичний аналізатор генерує вихідний файл з лексичними помилками з зазначенням адреси літералів, які викликали лексичну помилку. Лексичною помилкою є зустріч невідомої лексеми. При виникненні лексичної помилки можливі кілька варіантів реакції на неї:

· «режим паніки» - записати повідомлення про помилку у файл і припинити лексичний розбір;

· видалення зайвих символів;

· вставка пропущених символів;

· заміна невірного символу вірним;

· перестановка двох сусідніх символів місцями.

Лексичний аналізатор не обов’язково обробляє всю програму до початку всіх інших фаз. Якщо лексичний аналіз не виділяється як окрема фаза компіляції, а є частиною синтаксичного аналізу, то лексична обробка тексту програми виконується по мірі необхідності по запиту синтаксичного аналізатора.

Таблиця 1.1. Таблиця лексем

Рядок Токен Лексема Значення Адреса в таблиці ідентифікаторів
5 Vartype Int 0 0
5 Variable Var 0 1
6 Vartype Char* 0 0
6 Variable Var 0 2
7 Variable Var 0 1
7 Assign << 0 0
7 Num Num 25 0
8 Condition If 0 0
8 Variable Var 0 1
8 Relation eq 0 0
8 Num Num 25 0
9 Variable Var 0 2
9 Assign << 0 0
9 Literal Literal “Hello, World”  

Зауваження: в колонках «токен» і «лексема» таблиці.1.1 під літеральним позначенням в дійсності стоїть унікальний цифровий ідентифікатор (який може бути заданий за допомогою типу enum мови С), який однозначно ідентифікує токени і лексеми. Наявність літерального позначення лексем і токенів допускається в цілях відлагодження, але є необов’язковою.

 

Побудова лексичного аналізатора засобами скінченного автомату


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: