09/25/12 17:21
(http://www.klassa.bg/)
(http://www.klassa.bg/)
Българският език застрашен от изчезване в дигиталната ера
Българският език е застрашен от отмиране в дигиталната епоха.Това показва изследване на водещи европейски експерти в сферата на езиковите технологии, съобщиха от Българската академия на науките (БАН).
Изследването е проведено от Европейската мрежа за върхови постижения META-NET, в която членуват 60 изследователски центъра от 34 страни, сред които е и Институтът за български език „Проф. Любомир Андрейчин".
Изследването на водещи европейски експерти в сферата на езиковите технологии показва, че повечето европейски езици са заплашени от дигитална смърт. Според проучването шансът на много от европейските езици да оцелеят в дигиталната епоха не е голям.
Изследователите са направили оценка на състоянието на езиковите технологии за 30 от близо 80-те езика, които се говорят в Европа. Експертите са достигнали до извода, че езиковите технологии за 21 от 30-те изследвани езика или „са недоразвити", или са „слабо развити".
Проучването е проведено от над 200 експерти и е обобщено в Бели книги за различните езици (30 на брой), които са публикувани от META-NET (печатни издания и онлайн) и включват обзор и оценка на състоянието на наличните езикови технологии за всеки език в четири различни категории: автоматичен превод, обработка и синтез на реч, анализ на текст и общо състояние на езиковите ресурси.
В поне една от тези категории 21 от 30-те езика (т. е. 70%) получават най-ниската оценка (т. е. за тях липсват езикови технологии или съществуващите технологии са недоразвити).
За българският език категорията със слаба оценка е автоматичният превод.
Няколко езика, сред които исландски, латвийски, литовски и малтийски, получават най-ниска оценка и в четирите категории. Състоянието на наличните езикови ресурси и технологии не е оценено като „отлично" за нито един език. Ресурсите за английски получават висока оценка, след това се нареждат холандски, френски, немски, италиански и испански език, които са оценени като „средно развити".
Технологиите и ресурсите за езици като баски, български, каталански, гръцки, унгарски и полски са категоризирани като „фрагментарно развити", което означава, че са сред езиците с висок риск от отмиране в дигиталната епоха.
Това означава, че в момента българският език (получил средна оценка в категориите обработка на реч, анализ на текст и общо състояние на езиковите ресурси) не е застрашен, но ситуацията би могла да се промени значително с навлизането на ново поколение технологии, използващи наистина ефективно естествените езици.
Прочети цялата новина
Публикувана на 09/25/12 17:21 http://www.klassa.bg/News/Read/article/212276_%D0%91%D1%8A%D0%BB%D0%B3%D0%B0%D1%80%D1%81%D0%BA%D0%B8%D1%8F%D1%82+%D0%B5%D0%B7%D0%B8%D0%BA+%D0%B7%D0%B0%D1%81%D1%82%D1%80%D0%B0%D1%88%D0%B5%D0%BD+%D0%BE%D1%82+%D0%B8%D0%B7%D1%87%D0%B5%D0%B7%D0%B2%D0%B0%D0%BD%
Свързани новини:
- И Видин обявява грипна епидемия
- Без безплатни бързи тестове за грип
- Приложение на „Майкрософт” ще ни предупреждава за сайтове с фалшиви новини
- Опозиционерът Хуан Гуайдо се обяви за временен президент на Венецуела
- Жената, нападнала медик в Горна Оряховица, е с повдигнато обвинение
- Руската ВТБ: Заложници сме на нарастващ конфликт между Тръмп и Конгреса
- Ивелин Попов се настани в хотела на "Ростов" в Доха, ще подписва
- Алберт Попов спечели втория слалом за ФИС
- Паредес се отдалечава от ПСЖ
- Прекратиха търсенето на самолета със Сала поне за днес
- Погба носи тузарски костюм със своите инициали
- Зафиров: Цената на Неделев е висока
- Емери: Арсенал работи по трансфера на Суарес
- Зафиров: Неделев отхвърли ЦСКА и Лудогорец, търсим нападател и ляв бранител
Виж всички новини от 2012/09/25