пятница, 24 июля 2015 г.

Universal Networking Language

Универсальная сетевая речь

UNL can be seen as a kind of mark-up language which represents not the formatting but the core information of a text. As such it can be embedded in the eXtensible Mark-up Language (XML), and as HTML/XML annotations already can be realized differently in the context of different applications, machines, displays, etc., so UNL expressions can have different realizations in different human languages.

The principle of the UNL presentational system is its concept orientation anchored in three basic mechanisms:

  • Labeled links (binary relations);
  • Universal words (UWs);
  • Attributes.

http://www.unl.ru/introduction.html

https://uk.wikipedia.org/wiki/%D0%A3%D0%BD%D1%96%D0%B2%D0%B5%D1%80%D1%81%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0_%D0%BC%D0%B5%D1%80%D0%B5%D0%B6%D0%B5%D0%B2%D0%B0_%D0%BC%D0%BE%D0%B2%D0%B0

Материал из Википедии - свободной энциклопедии.

На этой странице показываются непроверенные измененияТекущая версия

Универсальная сетевая речь ( англ. Universal Networking Language , сокращенно UNL) - искусственный язык, который может быть языком-посредником в системахмашинного перевода , или языком представления знаний в программах обработки информации . Она создана в Институте перспективных исследований Университета Организации Объединенных Наций , Токио, и разрабатывалась в Фонда UNDL , Женева, Швейцария, а также большим сообществом исследователей во всем мире (так называемой UNL-сообществу).

Содержание

[ скрыть

История [ ред. ред. код ]

Программа UNL началась в 1996 году по инициативе Института перспективных исследований Университета Организации Объединенных Наций , Токио, Япония. В январе 2001 года, Университет Организации Объединенных Наций создал отдельную организацию, фонд UNDL , ответственное за развитие и управление программой UNL. Фонд - некоммерческая международная организация, независимая от Университета ООН, хотя и имеет особые связи с ООН. Она унаследовала от ИПД УООН мандат на реализацию программы UNL. Ее штаб-квартира находится в Женеве, Швейцария.

С самого начала сообщество факультетов университетов со всех частей света участвовала в разработке UNL. Эта UNL-сообщество, всемирная сеть исследователей и разработчиков, в которую вовлечено около 200 специалистов в области информатики и лингвистики, работает над созданием лингвистических ресурсов и развитием веб-структуры системы UNL. UNL-центр предоставляет технологическую поддержку и координирует осуществление программы.

Программа уже перешла важные вехи. Общая архитектура UNL-системы была выполнена набором базового программного обеспечения и инструментов, необходимых для его функционирования, и постоянно испытывается и совершенствуется. За последние годы накоплено большое количество языковых ресурсов на разных языках и на языке UNL. Кроме того, уже действует техническая инфраструктура для расширения этих ресурсов, способствуя тем самым участии многих других языков в системе UNL. Все большее число научных работ и научных диссертаций по UNL публикуются ежегодно.

Самым заметным достижением является признание договором о патентной кооперации (РСТ) [1] инновационного характера и промышленной применимости UNL, полученное в мае 2002 года в рамках Всемирной организации интеллектуальной собственности (WIPO). Получение патента языке UNL абсолютно новым достижением в рамках Организации Объединенных Наций.

Применение и цели [ ред. ред. код ]

UNL является усилиям для достижения простой основы для представления краеугольных аспектов информации и смысла в машинно и мовнонезалежний форме.Как независимый от языка формализм, UNL направлена ​​на кодирование, хранение, распространение и получение информации независимо от языка оригинала, в котором она была выражена. В этом смысле, UNL стремится предоставить инструменты для преодоления языкового барьера на систематической основе.

На первый взгляд, UNL, кажется многоязычной системой машинного перевода, разновидностью ИНТЕРЛИНГВА, на которую исходные тексты переводятся к переводу на необходимые языки. Ее действительно можно использовать для этих целей, и очень эффективно. Однако ее реальная сила заключается в представлении знаний, и ее главным назначением является быть инфраструктурой для обработки знания, которое уже существует, или может существовать в том или ином языке.

Тем не менее важно отметить, что на данном этапе было бы глупо заявлять о возможности представления "полного" значение любого слова, предложения или текста на любом языке. Нюансы и интерпретации делают "полное" значение, независимо от содержания, который мы вкладываем в него, слишком переменным и субъективным для любого систематического толкования. UNL избегает ловушек, пытаясь представить "полный смысл" высказываний или текстов, ориентируясь на "ядро" или "консенсус" содержания, которое чаще всего связано с ними. В этом смысле, большая часть тонкостей поэзии, метафор, образного языка, намеков и другой сложной, косвенной коммуникативного поведения находится вне текущей областью и целями УНЛ. В свою очередь, UNL направлена ​​на прямую коммуникативное поведение и буквальный смысл, как материальную, конкретную основу для большинства коммуникаций людей в практических, повседневных условиях.

Структура [ ред. ред. код ]

В подходе UNL, информация в естественном языке представляется, предложение за предложением, гиперграфах , составленным из набора направленных бинарных связей(отношений) между узлами или гипервузламы (универсальными словам, или просто UW). К UW можно применять атрибуты, уточняющие информационный контекст.

Например, английское предложение "The sky was blue ?!" может быть представлено в UNL следующим образом:

UNLGraph.svg

В приведенном выше примере, "sky (icl> природа)" и "blue (icl> цвет)", которые представляют собой отдельные концепции, являются универсальными словами (UW);"Aoj" (= атрибут объекта) - это направленное бинарное семантическое отношение, связывающее два UW; и "def", "interrogative", "past", "exclamation" и "entry" являются атрибутами, которые изменяют UW.

Универсальные слова являются универсальными понятиями, которые выражаются любыми естественными языками. Они состоят из "заголовке" (корень UW) и "список ограничений" (суффикс UW в скобках). Последний используется для устранения неоднозначности общей концепции, которую передает первый. UW организованы в онтологическую структуру (так называемую "Систему UW"), где высшие понятия используются для устранения неоднозначности низших через отношение "icl" (= является видом), "iof" (= является примером) и "фас" (= равно).

Отношение должны представлять семантические связи между словами в любой существующей языке. Они могут быть онтологическими (например, "icl" и "iof", упомянутые выше), логическими (например, "и" и "или") и тематическими (например, "agt" = агент, "ins" = инструмент, "tim "= время", "plc" = место, и т.д.). В наше время[ Когда? ] есть 46 отношений, и они определяют синтаксис UNL.

Атрибуты представляют информацию, которая не может быть выражена через UW и отношения. Как правило, они предоставляют информацию о времени (". @ Past", "future" и т.д.), определенность ("def", "indef" и т.д.), модальность ("can", "must" и т.п.) , f ("topic", "focus" и т.д.), и так далее.

В программе UNL процесс представления предложений естественного языка в графах UNL называется инконвертуванням, и процесс создания предложений естественного языка из графов UNL называется деконвертуванням. Первое, включая в себя анализ естественного языка и ее понимание, предполагается осуществлять в полуавтоматическом режиме (т.е. на автоматизированной основе с участием человека); последнее, как ожидается, будет полностью автоматическим.

UNL-сообщество [ ред. ред. код ]

Ссылка [ ред. ред. код ]

  1. Вверх↑ Договор о патентной кооперации на сайте WIPO

Внешние ссылки [ ред. ред. код ]

Wiki letter w.svg

На эту статью не ссылаются другие статьи Википедии.

Пожалуйста, воспользуйтесь подсказкой и установите ссылки в соответствии с принятыми рекомендациями .

Категории :

Мемы&медиавирусы

Loading...