Людина та Компьютеp, Детальна інформація
Людина та Компьютеp
Національний університет “Києво-Могилянська Академія”
Реферат
на тему:
“Дослідники автоматичного перекладу В.Інгве, Д.М.Йейтс, М.Мастерман, Є. фон Глазерсфельд: їх праці та внесок в розвиток автоматичного перекладу”
Виконала
студентка ДКТ-5
Фіялка Світлана
Київ-1999
Зміст:
TOC \t "zag1;1" Обчислювальні машини і переклад. В.Інгве PAGEREF _Toc467148765 \h 3
Модель синтаксичної структури російської фрази та алгоритм синтезу англійської при автоматичному перекладі. Д.М.Йєйтс. PAGEREF _Toc467148766 \h 7
“Мультістор” – система кореляційного аналізу для англійської мови. Е. фон Глаузерсфельд PAGEREF _Toc467148767 \h 12
Полуавтоматичний переклад з англійської на французьку мови: система “Людина – машинний тезаурус”. М.Мастерман PAGEREF _Toc467148768 \h 17
Обчислювальні машини і переклад. В.Інгве
Німецікий дослідник автоматичного перекладу Віктор Інгве вважав, що для подолання труднощів при перекладі треба ретельно вивчати морфологію та синтаксис відповідних мов, а також розробляти повний перелік елементарних одиниць кожної мови.
Опис мови повинен бути статичним, а програма для обчислювальної машини – динамічною. Тому В.Інгве пропонував, щоб дані про мовні факти вводилися в машину у вигляді переліків або таблиць – окремо від програми, що орієнтована на обробку цих даних. Такий розподіл є вдалим тому, що вже існують створені лінгвістами описи різних мов.
В своїй роботі по генерації англійських речень, він використовував традиційні методи опису мови. Зокрема для описів синтаксису була застосована модель безпосередньо складових (речення послідовно ділиться на все менші частини: спочатку виділяється група підмета та присудка, кожна з яких, в свою чергу, складається з двох або більше частин; ділення продовжується поки не дійдемо до слів або морфем).
В даній роботі опис мови подається в чотирьох таблицях і орієнтований на породження англійських фраз за допомогою універсальної обчислювальної машини. Машина породжує фразу, рухаючись від вузла до вузла. На кожному кроці є робочий вузол, який визначає наступний крок. Якщо робочий вузол зображений у вигляді кола, то це означає наявність декількох рівноправних альтернатив, і машина робить вибір за допомогою таблиці випадкових чисел. Якщо робочий вузол зображений у вигляді ромба, то наступний крок визначається однозначно. Якщо робочий вузол поданий у вигляді квадрату, то за наступний робочий вузол вибирається вузол, що розташований зліва під ним, а той, що справа – запам’ятовується. Якщо робочий вузол – трикутник, то принцип дії той же, що і з квадратом, але вузол, що запам’ятовується, використовується в більш пізніх перетвореннях. Кожне слово в прямокутнику – це слово фрази; після розміщення цього слова у тексті вибирається новий робочий вузол.
Багато фраз, які породжуються цією програмою безглузді, оскільки дана програма породжує тільки граматично, а не семантично правильні фрази. Проте вона є зручним засобом для перевірки точності лінгвістичного опису мови. Якщо деякі породжені фрази – граматично невірні, таблиці можна змінювати та виправляти. Якби ця програма була пристосована для перекладу, то вибір слів залежав би від перекладного тексту.
За допомогою цієї програми можна отримувати фрази будь-якої довжини. Це можливо тому, що вибір вузла може здійснюватися рекурсивно.
Починаючи породжувати яку-небудь двучленну конструкцію, програма повинна запам’ятовувати один вузол, для того щоб після породження першого члена конструкції, породити також і друкий. При цьому можуть бути отримані фрази великої довжини, і виникають значні вимоги до оперативної пам’яті комп’ютера.
Існують дві структури породження запам’ятованих вузлів. При регресивній структурі машина іде вниз по дереву, розгортаючи вузли, наприклад 1, 2, 3, 4 і запам’ятовуючи певну кількість вузлів; потім вона повинна повернутися, щоб розгорнути запам’ятовані вузли. Глибина регресивної структури дорівнює кількості запам’ятованих вузлів. При прогресивній структурі машина іде вниз по дереву, не повертаючись назад і записуючи на кожному кроці в оперативну пам’ять лише один вузол. Машина обробляє вузол на основній гілці дерева, потім приймається за запам’ятований вузол, а потім знову повертається до основної гілки. Отже, зростання глибини регресивної структури призводить до необхідності використання більшого об’єму пам’яті, тоді як прогресивна структура може мати довільний розмір і не вимагати при цьому збільшення об’єму пам’яті.
Існує два рішення щодо подолання проблеми нестачі оперативної пам’яті. Перше – оснастити програму відповідним сигналізатором, який буде повідомляти про заповнення оперативної пам’яті. В цей час повинен бути обмежений вибір наступного вузла таким чином, щоб вузли, які треба запам’ятовувати, не з’являлися до тих пір, поки не звільниться пам’ять. Інша можливість – зробити граматику таким чином, щоб вона могла породжувати прогресивні структури довільного розміру, а регресивні структури – певної довжини. Проте такі обмеження незручні, оскільки можуть дуже ускладнити граматику.
Для визначення правильного рішення були ще раз ретельно розглянуті конструкції англійської мови, і був зроблений висновок, що багато властивостей мови спрямовані на те, щоб обмежити глибину фраз приблизно до 7. З цього В.Інгве висунув гіпотезу, що всі мови мають морфологічні та синтаксичні механізми, що служать для обмеження глибини синтаксичних конструкцій. Крім того, психологами встановлено, що об’єм оперативної пам’яті людини також дорівнює 7 одиниць. Людина не може запам’ятати відразу, а потім відтворити більше 7 випадкових цифр або слів.
Одним з способів обмеження глибини конструкцій в англійській мові є бінарний поділ речення. Наприклад, речення поділяється на групу підмета і групу присудка, а вже група присудка на дієслово та, наприклад, додаток. Якщо поділити речення відразу на три частини, то потрібно запам’ятовувати не один, а два вузли. Взагалі лінгвісти відмічають, що мова надає перевагу бінарним конструкціям.
Іншим способом обмеження глибини конструкцій, що більш властивий аглютинативним мовам, є аффіксація, за допомогою якої можна поєднати різні елементи в одне довге слово.
Разом з засобами обмеження глибини конструкцій англійська мова має механізми, що дозволяють зберігати виразність, не дивлячись на жорстке обмеження глибини. Таким механізмом є, наприклад, перестановка членів речення. Крім того для надання виразності, речення будуються так, щоб складну структуру перенести на кінець, де вона буде потребувати запам’ятовування на один вузол менше. Це пояснює, чому означальні підрядні речення ідуть за своїми іменниками.
Приклад породження фрази.
START -> 103 (Simple sentense)
Реферат
на тему:
“Дослідники автоматичного перекладу В.Інгве, Д.М.Йейтс, М.Мастерман, Є. фон Глазерсфельд: їх праці та внесок в розвиток автоматичного перекладу”
Виконала
студентка ДКТ-5
Фіялка Світлана
Київ-1999
Зміст:
TOC \t "zag1;1" Обчислювальні машини і переклад. В.Інгве PAGEREF _Toc467148765 \h 3
Модель синтаксичної структури російської фрази та алгоритм синтезу англійської при автоматичному перекладі. Д.М.Йєйтс. PAGEREF _Toc467148766 \h 7
“Мультістор” – система кореляційного аналізу для англійської мови. Е. фон Глаузерсфельд PAGEREF _Toc467148767 \h 12
Полуавтоматичний переклад з англійської на французьку мови: система “Людина – машинний тезаурус”. М.Мастерман PAGEREF _Toc467148768 \h 17
Обчислювальні машини і переклад. В.Інгве
Німецікий дослідник автоматичного перекладу Віктор Інгве вважав, що для подолання труднощів при перекладі треба ретельно вивчати морфологію та синтаксис відповідних мов, а також розробляти повний перелік елементарних одиниць кожної мови.
Опис мови повинен бути статичним, а програма для обчислювальної машини – динамічною. Тому В.Інгве пропонував, щоб дані про мовні факти вводилися в машину у вигляді переліків або таблиць – окремо від програми, що орієнтована на обробку цих даних. Такий розподіл є вдалим тому, що вже існують створені лінгвістами описи різних мов.
В своїй роботі по генерації англійських речень, він використовував традиційні методи опису мови. Зокрема для описів синтаксису була застосована модель безпосередньо складових (речення послідовно ділиться на все менші частини: спочатку виділяється група підмета та присудка, кожна з яких, в свою чергу, складається з двох або більше частин; ділення продовжується поки не дійдемо до слів або морфем).
В даній роботі опис мови подається в чотирьох таблицях і орієнтований на породження англійських фраз за допомогою універсальної обчислювальної машини. Машина породжує фразу, рухаючись від вузла до вузла. На кожному кроці є робочий вузол, який визначає наступний крок. Якщо робочий вузол зображений у вигляді кола, то це означає наявність декількох рівноправних альтернатив, і машина робить вибір за допомогою таблиці випадкових чисел. Якщо робочий вузол зображений у вигляді ромба, то наступний крок визначається однозначно. Якщо робочий вузол поданий у вигляді квадрату, то за наступний робочий вузол вибирається вузол, що розташований зліва під ним, а той, що справа – запам’ятовується. Якщо робочий вузол – трикутник, то принцип дії той же, що і з квадратом, але вузол, що запам’ятовується, використовується в більш пізніх перетвореннях. Кожне слово в прямокутнику – це слово фрази; після розміщення цього слова у тексті вибирається новий робочий вузол.
Багато фраз, які породжуються цією програмою безглузді, оскільки дана програма породжує тільки граматично, а не семантично правильні фрази. Проте вона є зручним засобом для перевірки точності лінгвістичного опису мови. Якщо деякі породжені фрази – граматично невірні, таблиці можна змінювати та виправляти. Якби ця програма була пристосована для перекладу, то вибір слів залежав би від перекладного тексту.
За допомогою цієї програми можна отримувати фрази будь-якої довжини. Це можливо тому, що вибір вузла може здійснюватися рекурсивно.
Починаючи породжувати яку-небудь двучленну конструкцію, програма повинна запам’ятовувати один вузол, для того щоб після породження першого члена конструкції, породити також і друкий. При цьому можуть бути отримані фрази великої довжини, і виникають значні вимоги до оперативної пам’яті комп’ютера.
Існують дві структури породження запам’ятованих вузлів. При регресивній структурі машина іде вниз по дереву, розгортаючи вузли, наприклад 1, 2, 3, 4 і запам’ятовуючи певну кількість вузлів; потім вона повинна повернутися, щоб розгорнути запам’ятовані вузли. Глибина регресивної структури дорівнює кількості запам’ятованих вузлів. При прогресивній структурі машина іде вниз по дереву, не повертаючись назад і записуючи на кожному кроці в оперативну пам’ять лише один вузол. Машина обробляє вузол на основній гілці дерева, потім приймається за запам’ятований вузол, а потім знову повертається до основної гілки. Отже, зростання глибини регресивної структури призводить до необхідності використання більшого об’єму пам’яті, тоді як прогресивна структура може мати довільний розмір і не вимагати при цьому збільшення об’єму пам’яті.
Існує два рішення щодо подолання проблеми нестачі оперативної пам’яті. Перше – оснастити програму відповідним сигналізатором, який буде повідомляти про заповнення оперативної пам’яті. В цей час повинен бути обмежений вибір наступного вузла таким чином, щоб вузли, які треба запам’ятовувати, не з’являлися до тих пір, поки не звільниться пам’ять. Інша можливість – зробити граматику таким чином, щоб вона могла породжувати прогресивні структури довільного розміру, а регресивні структури – певної довжини. Проте такі обмеження незручні, оскільки можуть дуже ускладнити граматику.
Для визначення правильного рішення були ще раз ретельно розглянуті конструкції англійської мови, і був зроблений висновок, що багато властивостей мови спрямовані на те, щоб обмежити глибину фраз приблизно до 7. З цього В.Інгве висунув гіпотезу, що всі мови мають морфологічні та синтаксичні механізми, що служать для обмеження глибини синтаксичних конструкцій. Крім того, психологами встановлено, що об’єм оперативної пам’яті людини також дорівнює 7 одиниць. Людина не може запам’ятати відразу, а потім відтворити більше 7 випадкових цифр або слів.
Одним з способів обмеження глибини конструкцій в англійській мові є бінарний поділ речення. Наприклад, речення поділяється на групу підмета і групу присудка, а вже група присудка на дієслово та, наприклад, додаток. Якщо поділити речення відразу на три частини, то потрібно запам’ятовувати не один, а два вузли. Взагалі лінгвісти відмічають, що мова надає перевагу бінарним конструкціям.
Іншим способом обмеження глибини конструкцій, що більш властивий аглютинативним мовам, є аффіксація, за допомогою якої можна поєднати різні елементи в одне довге слово.
Разом з засобами обмеження глибини конструкцій англійська мова має механізми, що дозволяють зберігати виразність, не дивлячись на жорстке обмеження глибини. Таким механізмом є, наприклад, перестановка членів речення. Крім того для надання виразності, речення будуються так, щоб складну структуру перенести на кінець, де вона буде потребувати запам’ятовування на один вузол менше. Це пояснює, чому означальні підрядні речення ідуть за своїми іменниками.
Приклад породження фрази.
START -> 103 (Simple sentense)
The online video editor trusted by teams to make professional video in
minutes
© Referats, Inc · All rights reserved 2021