вторник, 27 января 2015 г.

Neurocognitive Networks

 

Количество связей между нейронами в человеческом мозгу пока ещё несравнимо больше, чем связей между индивидами в обществе, да и сами эти связи ещё недостаточно надёжны и оперативны. Тем не менее процесс установления таких связей растает по экспоненте и обусловлено это, в первую очередь, бурным и вес ускоряющимся развитием Сети.

Юрий Хохлачев. Метамеметика. 


Технологическая сингулярность как следствие развития нанотехнологий рассматривается в отчете 2007 года Комиссии по экономической политике Конгресса США. По некоторым мнениям, придерживающихся возможности сингулярности, она должна наступить около 2030 года. Если проэкстраполировать закон Мура, окажется, что примерно в то же время вычислительная мощность компьютеров сравнится с головным мозгом человека. Сторонники теории технологической сингулярности считают, что если возникнет принципиально отличный от человеческого разум (постчеловек), дальнейшую судьбу цивилизации невозможно предсказать, опираясь на человеческую логику.

В проект Long Bet Project входит пари стоимостью 20 000 $ между Митчем Капуром (Mitch Kapor — пессимист) и Рэймондом Курцвейлом (оптимист). Смысл пари: пройдет ли компьютер тест Тьюринга к 2029 году? Определены также некоторые условия пари. Суть теста в том, что если что-то выглядит как рыба, пахнет как рыба и имеет рыбий вкус, то это скорее всего рыба и есть.

По сообщению Университета Рединга (англ.)русск., в тестировании 6 июня 2014 года, организованном Школой системной инженерии[9] при университете и компаний RoboLaw под руководством профессора Кевина Уорика, полноценный тест Тьюринга впервые в истории был пройден с помощью программы «Eugene Goostman»[10][11], разработанной в Санкт-Петербурге выходцем из России Владимиром Веселовым и выходцем из Украины Евгением Демченко[12].

Всего в тестировании участвовали пять суперкомпьютеров. Испытание представляло собой серию пятиминутных письменных диалогов. Тест Тьюринга считался пройденным, если компьютеру удалось бы вводить собеседника (человека) в заблуждение на протяжении хотя бы 30 % суммарного времени. Программа Eugene c результатом 33 % и стала тем устройством, которое искусственным путём воссоздало человеческий интеллект — в данном случае, тринадцатилетнего подростка из Одессы, который «претендует на то, что знает всё на свете, но в силу своего возраста не знает ничего». Это вторая победа программы, однако в 2012 году на конкурсе в честь юбилея Алана Тьюринга (см. выше) она не добрала 0,8 % для полного прохождения теста.

Википедия


 

Cognitive Architectures For Conceptual Structures
John F. Sowa VivoMind Research, LLC

Figure 2 introduces conceptual graphs as “a universal, languageindependent
deep structure” that relates perception to language. “When a person sees a cat sitting on a
mat, perception maps the image into a conceptual graph. A person who is bilingual in French and
English may say, in speaking French, Je vois un chat assis sur une natte. In describing the same
perception in English, the person may say I see a cat sitting on a mat. The same conceptual graph,
which originates in a perceptual process, may be mapped to either language.” (Sowa 1984:38)

 

image


Figure 3 overlays the base drawing of Figure 2 with a network of connections for the word fork as
proposed by Lamb (2010). The node labeled C represents the concept of a fork. It occurs in the parietal
lobe, which is closely linked to the primary projection areas for all the sensory modalities. For the
image of a fork, C is connected to node V, which has links to percepts for the parts and features of a
fork in the visual cortex (occipital lobe). For the tactile sensation of a fork, C links to node T in the
sensory area for input from the hand. For the motor schemata for manipulating a fork, C links to node
M in the motor area for the hand. For the phonology for recognizing the word fork, C links to node PR
in Wernicke’s area. Finally, PR is linked to node PA for the sound /fork/ in the primary auditory cortex
and to node PP in Broca’s area for producing the sound.

image

The original version of VAE used algorithms related to those for chemical graphs. More recent
variations have led to a family of algorithms that encode a graph in a Cognitive Signature™ that
preserves both the structure and the ontology. The encoding time is polynomial in the size of a graph.
With a semantic distance measure based on both the structure of the graphs and an ontology of their
labels, locality-sensitive hashing can retrieve a set of similar graphs in log(N) time, where N is the total
number of graphs in the knowledge base. With this speed, VAE can find analogies in a knowledge base
of any size without requiring a search engine as a preliminary filter. For examples of applications, see
the slides by Sowa and Majumdar (2009).
The distributed processing among heterogeneous agents supports Peirce’s cycle of pragmatism, as
illustrated in Figure 6. That cycle relates perception to action by repeated steps of induction, abduction,
reasoning, and testing. Each step can be performed by an application of analogy or by a wide variety of
specialized algorithms.

image

The cycle of pragmatism shows how the VivoMind architecture brings order out of a potential chaos
(or Pandemonium). The labels on the arrows suggest the open-ended variety of heterogeneous
algorithms, each performed by one or more agents. During the cycle, the details of the internalprocessing by any agent is irrelevant to other agents. It could be neat, scruffy, statistical, or biologically
inspired. The only requirement is the conventions on the interface to the FMF. An agent that uses a
different interface could be enclosed in a wrapper. The overall system is fail soft: a failing agent that
doesn’t respond to messages is automatically replaced by another agent that can answer the same
messages, but perhaps in a very different way. Agents that consistently produce more useful results are
rewarded with more time and space resources. Agents that are useless for one application might be
rewarded in another application for which their talents are appropriate.
The society of agents can have subsocieties that traverse the cycle of pragmatism at different speeds.
Societies devoted to low-level perception and action may traverse each cycle in milliseconds. Societies
for reasoning and planning may take seconds or minutes. A society for complex research might take
hours, days, or even years.

http://www.jfsowa.com/pubs/ca4cs.pdf


Столкнувшись в ходе машинного перевода с мемом-неологизмом, нельзя его перевести, не обратившись к “грязным” сетевым данным. Из которых можно попробовать выявить типовые коннотации и сделать наиболее вероятное предположение о том, как именно его можно интерпретировать в данном контексте, сформулировать новое правило для программы перевода или обновить уже созданное. Отслеживаемой метрикой эффективности работы которой будет оцениваемая экспертами-носителями языка лингвистическая погрешность, на базе которой можно построить обратную связь.

Вполне аналогичный подход вполне применим и к переводу самых, казалось бы, обычных слов. Значение которых (а значит - и оптимальный перевод) также меняется в зависимости от времени, места и контекста письменного и устного употребления. Чтобы это слово в новостях могло значить именно сегодня утром, в контексте начинающегося дня (синхрония вместо диахронии)? И т.д.

Препятствием к отслеживанию таких тонкостей является необходимость быстро получать, (распознавать), очищать и анализировать огромные массивы грязных сетевых данных в режиме реального времени. С чем пока явно успешнее справляется человеческий мозг. Вполне примечательно, что и он также построен по сетевому принципу. А жанры текстов в корпусах безнадежно пахнут электронными лампами и протухшим оптимизмом 60-х. Корпуса – это сегодня очередной чемодан без ручки, который жалко бросить.

Анализ интернет-мемов представляется многим сомнительной подростковой забавою. Хотя на самом деле – это лишь текущий способ ограничения данных для анализа до того объема, который можно технически обеспечить прямо сегодня. Наработанный лингвистами небезынтересный гуманитарный фольклор об языке можно проверять на фактах - по мере того, как появится очередной, доступный для использования новый инструмент, позволяющий это сделать. В частности, суперкомпьютеры, красиво стоящие в МГУ, таким инструментом назвать пока не получится.

Сетевой поиск повторяющихся изображений, в принципе, дает поводы задуматься об возможности начать анализировать доязыковые феномены.

Сетевая лингвистика может быть реализована только через получение полезных, доказуемых результатов. Метафорически толкуя слова героя фильма “манибол”, сетевая лингвистика – это не очередная по списку теория про язык, а непрерывный процесс, в ходе которого интересен лишь процент “занятия базы”.

Нынешняя же лингвистика преимущественно выстроена по гуманитарному принципу – принципу признанных авторитетов, определяемых методом наибольшего количества цитат и ссылок из диссертаций. Попытки обсуждать с ними одну лишь теорию, заведомо приведут к бесконечной дискуссии ни о чем конкретном, а также ситуации типа генетика vs. академик Лысенко (который начинает и всегда выигрывает). В нынешней лингвистике слишком много предположений, очень мало доказательств и почти нет результатов. Лингвистика в чисто гуманитарном ее понимании – это всего лишь научный мем, успешно вовлекающий в общение:) Тем не менее, именно она способна постепенно вывести компьютерные науки об языке из мрака бессмысленных расчетов. Которые отнюдь не всегда являются наиболее быстрым и компактным способом результативного анализа.

Технократы с равной убедительностью могут изложить тему, что они лучше всех смогу управлять чем угодно – хоть культурой, хоть физкультурой. Однако и от них одних толку в лингвистике пока что маловато.

Поставленные в равные конкурентные позиции, технократы и гуманитарии столкнулись с одной и той же проблемой – деньги сегодня платят лишь за то, от чего есть результат. Грызня между собой к нему не ведет. Значит, нужны и важны не столько подходы, сколько способы увязать их между собой. Гуманитраные дисциплины, в высоком их понимании, возникли не на пустом месте – есть сферы, где такой способ мыслить на порядки превосходит по эффективности всевозможную запутанную, но примитивную по своей сути арифметику, скачущую на своих компьютерах в даль неведомую как всадник без головы.

Мемы&медиавирусы

Loading...