среда, 16 декабря 2015 г.

Вместо мемов США за 2015 опубликованы мемы той же страны за 2010 год.







https://www.google.com/trends/topcharts#vm=cat&geo=US&date=2015&cid

Короче, кто быстрее отрос обратно, тот там и мем, видимо. Отсталая страна...

воскресенье, 13 декабря 2015 г.

суббота, 12 декабря 2015 г.

ядерная лингвистика

ЯДЕРНАЯ ФИЗИКА И ЛИНГВИСТИКА

alexander shenderov

06.05.2013 16:11:00

Американский лингвист Моррис Сводеш проследил взаимосвязь между ядерной физикой и лингвистикой. Казалось бы, что может быть общего у этих дисциплин? По мнению Сводеша, процесс языковой эволюции имеет фазы, схожие с процессом радиоактивного распада. При неизменной скорости языковой эволюции слова со временем изменяются, что напоминает полураспад радиоактивного элемента. Для проверки своей догадки Сводеш создал список значений 100 слов, изменение которых возможно проследить. В список вошли наиболее употребляемые существительные и глаголы, характеризующие прикладные понятия, такие как названия животных, повседневных действий, частей тела и т.д.http://wtsrussia.ru/blog/yadernaya-fizika-i-lingvistika/

вторник, 8 декабря 2015 г.

Multilayer Network of Language

Multilayer Network of Language: a Unified
Framework for Structural Analysis of Linguistic
Subsystems
Domagoj Margan, AnaMeˇstroviґc, SandaMartinˇciґc-Ipˇsiґc
Department of Informatics,
5 University of Rijeka,
1 RadmileMatejˇciґc 2, 51000 Rijeka, Croatia

http://arxiv.org/pdf/1507.08539.pdf
image

Если мы ищем наиболее частые сочетания слов, то мы рассматриваем только один слой – словесный как бы. Под ним находятся скрытые при таком подходе слои – слоги и буквы. Subword layers. Фишка в том, что частота корреляций между слогами как-то там влияет на частоту корреляций между словами.

На уровне здравого смысла –  если последний слог одного слова сочетается с первым слогом другого так, что не выговоришь, то и слова такие вместе, друг за другом будут встречаться реже. Хотя по смыслу вроде слова подходят.

Банально, но правильно.

И вывод:

These findings reveal a variety of new and thrilling questions which will open
new paths for future research in network linguistics. Хотя, конечно, вот это уже навряд ли.

воскресенье, 29 ноября 2015 г.

лингвистические паспорта. и не только

ФСБ хочет разработать лингвистические паспорта для регионов России

21.02.2015

  

МОСКВА, 21 фев — РИА Новости. Федеральная служба безопасности (ФСБ) России объявила тендер по разработке лингвистических паспортов для регионов РФ, Украины и Прибалтики (шифр "Дары"), начальная (максимальная) цена госконтракта составляет 14 миллионов рублей, соответствующая заявка от имени войсковой части 68240 размещена на портале госзакупок.

Исследование функционирования русского языка должно пройти среди мужчин от 20 до 60 лет, проживающих в 24 российских городах (в том числе в Волгограде, Владивостоке, Грозном, Екатеринбурге, Краснодаре, Магадане, Новосибирске, Уфе).

В обследуемых зонах требуется собрать и проанализировать звукозаписи для определения фонетических статусов обследованных городов (паспортизация городов). При этом необходимо разработать лингвистические паспорта изученных мест и реестры особенностей русской речи иностранцев. Собранный материал должен быть включен в имеющийся у заказчика автоматизированный атлас современного русского языка, отмечается в материалах.

"Результаты (работы) дадут возможность совершенствовать практические навыки экспертов при выявлении и описании различных фонетических явлений, расширить методическую и информационную базу фонографических идентификационных и диагностических исследований, а также повысить качество, объективность и надежность результатов экспертной работы", — говорится в документе.

Заявки на участие в тендере принимаются до 19 марта, подведение итогов конкурса назначено на 7 апреля. Ориентировочный срок выполнения работ — до 30 сентября 2017 года.

РИА Новости http://ria.ru/society/20150221/1048996653.html#ixzz3ekj1mKMl


1 октября в России начнется микроперепись населения

30 сентября 2015

 


Опрос населения будет осуществляться специально подготовленными переписчиками, которые будут обходить жилые помещения, проводить опрос и заполнять электронные опросные листы на планшетных компьютерах. При этом переписчики должны будут предъявить специально выданное Росстатом удостоверение переписчика и свой паспорт.

Респонденты помимо традиционных вопросов о поле, возрасте, состоянии в браке, уровне образования, составе домохозяйства, экономической активности, национальной принадлежности, миграции, гражданстве и владении языками ответят на вопросы о репродуктивных планах населения и условиях, при которых эти планы могут быть реализованы, оценке состояния здоровья, пользовании языками, истории приобретения российского гражданства. Кроме того, программой микропереписи предусмотрен вопрос о видах источников средств к существованию (при этом информация о размере дохода и его легальности не собирается)

Напомним, микроперепись проводится с целью получения актуальной информации о современном состоянии населения страны, о социально-экономических, демографических, этно-лингвистических характеристиках населения России. Эта информация необходима для обоснованного принятия решений при разработке социальной и демографической политики. Ранее микроперепись в России проводилась в 1985 и 1994 годах.

ГАРАНТ.РУ: http://www.garant.ru/news/654070/#ixzz3smSD5awJ


ну и что-то подсказывает, что у переписчиков на этот раз внезапно окажутся диктофоны

и не только

хотя казалось бы зачем они им

image

image

суббота, 28 ноября 2015 г.

Дираковские билинейные формы

Дираковские билинейные формы[править | править вики-текст]

Имеется пять различных (нейтральных) дираковских билинейных форм без производных:

где \sigma^{\mu\nu}=\frac{i}{2} \left[\gamma^{\mu},\gamma^{\nu}\right]_{-} и \gamma^{5}=\gamma_{5}=\frac{i}{4!}\epsilon_{\mu\nu\rho\lambda}\gamma^{\mu}\gamma^{\nu}\gamma^{\rho}\gamma^{\lambda}=i\gamma^{0}\gamma^{1}\gamma^{2}\gamma^{3} .

Ква́нтовая суперпози́ция (когерентная суперпозиция) — это суперпозиция состояний, которые не могут быть реализованы одновременно с классической точки зрения, это суперпозиция альтернативных (взаимоисключающих) состояний. Принцип существования суперпозиций состояний обычно называется в контексте квантовой механики просто принципом суперпозиции.

воскресенье, 8 ноября 2015 г.

про начинающих теологов и юных натуралистов

Материализм можно рассматривать как разновидность верования в то, что органы чувств способны снабдить нас ощущениями, в точности соответствующими тому, что существует объективным образом, независимым от наблюдателя. На ранних стадиях научного познания это отождествление ему не мешало, поэтому на данный, весьма тонкий момент попросту не обращали внимания. Иными словами, непознаваемое может лежать не только за рамками теоретической модели, но и за рамками физического эксперимента.

Построение супервентных моделей снижает степень загадочности внутреннего устройства субъекта, которого в квантовой механике принято обозначать термином “наблюдатель”. Верить в них на полном серьезе или же нет – это вопрос отдельный, к самим моделям не относящийся.

Эволюционные модели вполне могут находить свое подтверждение в рамках конечных по времени экспериментов. Можно ли экстраполировать их на те случаи, когда есть “математические” сомнения по поводу того, хватит ли времени на описанный ими эволюционный процесс – это опять же вопрос веры, а не науки.

Натурализм – это поспешная, а потому ошибочная экстраполяция и не более того. Уверенность в том, что любой исследователь должен непременно совершить подобного рода натуралистическую ошибку экстраполяции – это тоже разновидность поспешного, личного верования исследователя около-теологического толка, собственно с религией никак не соотносящегося.

В науке всегда остается достаточное место для религии. И в религии остается достаточно место для науки. Такой как та же теология в интерпретации ВАКа.

суббота, 7 ноября 2015 г.

воскресенье, 25 октября 2015 г.

храбрый русский

В интернете набирает популярность видеофрагмент гонки Формулы-1 в Сочи, когда один из представителей обслуживающего персонала перед носом болида убрал обломок разбившейся машины. Комментируя этот эпизод, гонщик Себастьян Феттель назвал смельчака very brave russian. Это выражение моментально превратилось в мем, заняв почетное место в прессе и хештегах социальных сетей.http://www.dni.ru/society/2015/10/12/317432.html

 

Фото: youtube.com

https://www.google.ru/trends/explore#q=brave%20russian%2C%20%D0%BA%D1%82%D1%83%D0%BB%D1%85%D1%83&cmpt=q&tz=Etc%2FGMT-3

Dennett

Деннетовская когнитивная модель сознания. (Источник: Figure 9.1, р.155 в Daniel С. Dennett, Brainstorms: Philosophical Essays on Mind and Psychology, The MIT Press. Copyright © 1987 by Bradford Books, Publishers. С разрешения The MIT Press)

воскресенье, 18 октября 2015 г.

Долговременная синаптическая пластичность

 

Впервые идея о связи между получением опыта и изменением синаптической силы была высказана на рубеже XIX и ХХ вв. нобелевским лауреатом Сантьяго Рамон-и-Кахалем.

 

Экспериментальное изучение долговременной синаптической пластичности базируется на постулате Хэбба, сформулированном в 1949 году: «Если аксон клетки А расположен достаточно близко к клетке Б, чтобы возбуждать её, и постоянно участвует в её активации, то в одной или обеих клетках происходят такие метаболические изменения или процессы роста, что эффективность А как одной из клеток, активирующих Б, повышается»[5]. В современной формулировке постулат Хэбба понимается так, что изменение эффективности передачи сигнала в синапсе управляется корреляцией силы, необходимой для активации пре- и постсинаптического нейрона[6

Первые экспериментальные результаты, подтверждающие постулат Хэбба, были получены в начале 1970-х годов[7]: многократная активация возбуждающих синапсов гиппокампа кролика вызвала увеличение силы синапса, продолжавшееся несколько часов или даже дней. Это явление получило название «долговременная потенциация» (long-term potentiation, LTP).

 

Позже были открыты другие явления, связанные с синаптической пластичностью, — долговременное ослабление (long-term depression, LTD), гомеостатическая пластичность, метапластичность.

 

Гомеостатическая пластичность, например, представляет собой изменение силы всех синапсов конкретной клетки в ответ на длительные изменения активности, в частности, увеличение силы синапсов в ответ на уменьшение активности сигналов.

 

Этот вид пластичности связан с гораздо большими временами, чем LTP и LTD, и может быть важен при развитии нейрональных путей. Термин «метапластичность» относится к эффектам, связанным с изменением возможности синапса проявлять пластичность[1].

 

В отличие от кратковременной пластичности, долговременная пластичность связана с экспрессией генов и синтезом новых белков. Наиболее изученными формами долговременной пластичности по-прежнему остаются LTP и LTD в области гиппокампа СА1, которые управляются N-метил-D-аспартатными (NMDA) рецепторами. Лишь в последние годы были получены доказательства в пользу существования долговременной потенциации ГАМКА-опосредованной синаптической передачи (LTPGABA), происходящей по гетеросинаптическому механизму, но и этот процесс требует активации NMDA-рецепторов в глутаматных синапсах[8].

пятница, 16 октября 2015 г.

про куматоиды запрограмированные

 

«Куматоид – это особый термин, специально изобретенный автором концепции для выражения
специфики социальных процессов. Суть предложенного (сугубо «доморощенного») термина в том, что зако-
номерности волновых процессов определяются не материалом, а особенностями самой «волны». Материал лишь
реализует прохождение волны, хотя в некоторых рамках сам материал не дает возможности такой реализации
(волна, скажем, не может возникать и распространяться там, где водоем пересох). Однако в принципе не матери-
ал порождает свое движение, а движение волны заставляет «колебаться» те или иные частицы». [1]

http://rozova.net/wp-content/uploads/2015/09/Alt2.pdf

 

Альтернативная теория куматоидов Ю.С. Хохлачев

 


 

суббота, 3 октября 2015 г.

СУБСТАНЦИОНАЛЬНОЕ ВРЕМЯ ОТКРЫТЫХ СИСТЕМ* А.П. Левич

Поскольку речь идёт о моделировании самих исходных понятий – вре-
мени и пространства, мы не вправе изначально использовать привычные фи-
зические понятия: энергию, массу, импульс, действие

Zitterbewegung

 

Zitterbewegung (нем. Zitterbewegung — «дрожащее движение») — быстрое осциллирующее движение элементарной частицы, подчиняющейся уравнению Дирака (в частности, электрона).


суббота, 26 сентября 2015 г.

местами, но понятно

С. А. Жаботинская доктор филологических наук, профессор, Вице-президент Украинской ассоциации когнитивной лингвистики и поэтики (УАКЛиП) Март 2015

image

 

Как показывает рис. 1, языковой знак,

пятница, 25 сентября 2015 г.

Супервентность Чалмерс Дэвид | Сознающий ум. В поисках фундаментальной теории |

Широко распространено представление, что большинство фундаментальных фактов относительно нашего мира — это физические факты и что все остальные факты зависят от них. Философское понятие супервентности создает унифицированные рамки, в которых могут обсуждаться эти отношения зависимости.

среда, 23 сентября 2015 г.

SVM

Компьютеры обошли людей в вербальном тесте IQ

https://nplus1.ru/news/2015/06/15/iqlearning

Иллюстрация одной из идей генеративной лингвистики по различению двух «is».Кадр: Is The Man Who Is Tall Happy/Partizan

воскресенье, 13 сентября 2015 г.

Actor-Network Theory, ANT пример успешного импорта «семиотической метафоры» в социологическое описание.

Социологическое обозрение Том 5. № 1. 2006
 
Виктор Вахштайн
 
 
Джон Ло: социология между семиотикой и топологией
 

Топология,  с  ее
стремлением  дать  строгое (но  не  количественное)  описание  трансформирующихся  форм
становится  притягательным  теоретическим  ресурсом  для  осмысления  опыта  подвижного,
изменчивого («текучего», в понятиях «социальной топологии») мира.

суббота, 12 сентября 2015 г.

Дэвид Чалмерс-про осведомленность

Если признать необходимость осведомленности, то любой кандидат на роль базового закона будет иметь такой вид: «Осведомленность плюс нечто порождает сознание». И остается, таким образом, спросить: что же это за дополнительное нечто, — или тут вообще не нужно ничего дополнительного?


СПЕЦИФИКА ОРГАНИЗАЦИИ АССОЦИАТИВНО-СЕМАНТИЧЕСКИХ СЕТЕЙ В СОЗНАНИИ ВТОРИЧНОЙ ЯЗЫКОВОЙ ЛИЧНОСТИ

Осинцева-Раевская Е.А.
СПЕЦИФИКА ОРГАНИЗАЦИИ АССОЦИАТИВНО-СЕМАНТИЧЕСКИХ
СЕТЕЙ В СОЗНАНИИ ВТОРИЧНОЙ ЯЗЫКОВОЙ ЛИЧНОСТИ 
(МЕТОДЫ ПСИХОЛИНГВИСТИЧЕСКОГО ЭКСПЕРИМЕНТА)

 

Проблема организации ментального пространства человека является одной
из  самых  дискуссионных  в  современной  науке. Когнитивная  парадигма XXI
столетия,  в  рамках  которой  ведутся  исследования  по  прояснению  данного
вопроса, представляет собой междисциплинарный феномен, что соответствует
общепризнанной точке зрения о невозможности изучения языка, мышления и
сознания с позиции какой-либо одной науки [8; 10; 29].


пятница, 11 сентября 2015 г.

интернет лингвистика

В последние несколько лет ряд исследователей использует термин «интернет-лингвистика» ([Горошко 2007], [Компанцева 2007], [Сидорова 2006]). Речь может идти об интегральном направлении [Горошко 2012], которое соединяет подходы и методологию различных лингвистических дисциплин: социолингвистики, психолингвистики, ортологии и др., используя методы лингвистических и коммуникативных исследований (дискурс-анализ, контент-анализ, нарративный анализ, статистический анализ, модели исследования межкультурной коммуникации, масс-медиа и др.) ([Расплетин 2002], [Филатова 2004], [Herring 1999, 2004b]) и постепенно формируя при этом свой инструментарий [Markham, Baym 2009]. Исследовательским объектом интернет-лингвистики является коммуникативное взаимодействие в сети Интернет, а «предметом становятся лингвистически релевантные особенности интернет-коммуникации на различных языковых уровнях: морфологическом, лексическом, синтаксическом, текстовом (на уровне текста или совокупности текстов), коммуникативном (уровне коммуникативной стратегии) и т.д.» [Горошко 2012: 36].http://www.rae.ru/monographs/218-6797


воскресенье, 6 сентября 2015 г.

суббота, 5 сентября 2015 г.

Цифровая физика

 

Цифровая физика, в физике и космологии, — совокупность теоретических взглядов, проистекающих из допущения, что Вселенная по сути является информацией и, следовательно, является вычислимой. Из данных предположений следует то, что Вселенная может пониматься как результат работы некоторойкомпьютерной программы или как некий вид цифрового вычислительного устройства (или, по крайней мере, устройства, математически изоморфного такому устройству).

Цифровая физика основана на одной или нескольких нижеследующих гипотезах (перечисленных в порядке возрастания степени смелости предположений). Вселенная, или реальность:

  • по сути информационна (хотя не каждая информационная онтология должна быть вычислима);
  • по сути вычислима;
  • может быть описана и/или смоделирована в цифровой форме;
  • по сути является цифровой;
  • имеет свойства вычислительной системы;
  • её поведение может быть результатом работы этой системы.

 

Критика[

Критики цифровой физики, включая физиков, работающих в области квантовой механики, возражают против неё по ряду причин.

Непрерывности физических симметрий[править | править вики-текст]

Одно из возражений заключается в том, что существующие ныне модели цифровой физики несовместимы с существованием некоторых непрерывных признаков физических симметрий, например симметрии вращения, трансляции пространства, симметрии Лоренца и электрослабой симметрии, которые являются центральными для текущей физической теории.

Защитники цифровой физики заявляют, что такие непрерывные симметрии — всего лишь удобные (и весьма хорошие) приближения дискретной реальности. Например, рассуждения, приводящие к системам природных единиц и выводу о том, что планковская длина является минимальной значимой единицей длины, предлагают, что на некотором уровне пространство само по себе квантовано[27].

ИНФОРМАЦИОННЫЕ ПОТОКИ И СЛОЖНЫЕ СЕТИ (Д.В. ЛАНДЭ)

БОЛЬШАКОВА Елена Игоревна
КЛЫШИНСКИЙ Эдуард Станиславович
ЛАНДЭ Дмитрий Владимирович
НОСКОВ Алексей Анатольевич
ПЕСКОВА Ольга Вадимовна
ЯГУНОВА Елена Викторовна
 
 
 
Автоматическая обработка текстов на естественном языке 
и компьютерная лингвистика

 

 

Теория  информации,  которая  ранее  находила  свое  основное
применение  в  области    передачи  данных,  становится  полезной  и  для  анализа 
текстовых массивов, динамически порождаемых в сетях. 

 

Ландэ Д.В. Моделирование динамики информационных потоков // Фундаментальные исследования. – 2012. – № 6 –3 – С. 652-654
URL:
Предусматривается, что новостные сообщения обладают свойством старения, т.е.
теряют свою актуальность со временем. Все информационное пространство можно с
достаточной  мерой  условности  разделить  на  две  составляющие  –  стабильную  и
динамическую,  которые  имеют  очень  разные  характеристики  своего  развития.  В
частности,  процесс  старения  информации  в  известной  модели  Бартона-Кеблера
описывается уравнением, которое состоит  из двух компонент:

 

image


где  m(t)   –  часть  полезной  информации  в  общем  потоке  через  время  T,    первое
вычитаемое    соответствует  стабильным  ресурсам,  а  второе  –  динамическим,
новостным. Это уравнение также в полной мере соответствует объемам информации,
которые  формируются  в  информационном  пространстве  по  определенными
тематиками,  которые  время  от  времени  возникают  и  исчезают.  Стабильная
составляющая  информационного  пространства  содержит  информацию
«долгосрочного»  плана,  в  то  время,  как  динамическая  составляющая  содержит
ресурсы, которые постоянно обновляются. Некоторая часть последней составляющей
впоследствии  вливается  в  стабильную,  однако  большая  часть  «исчезает»  из
информационного  пространства  или  попадает  в  сегмент  так  называемой  его
«скрытой» части, не доступной пользователям с помощью обычных информационно-
поисковых систем (ИПС).

 

Под  тематическим  информационным  потоком  будем  понимать
последовательность  сообщений,  соответствующих  определенной  тематике.

Информационный  поток,  измеряемый  количеством  сообщений,  является
величиной относительно стабильной. Изменяются во времени лишь объемы массивов
сообщений, соответствующие той или иной тематике, той или иной информационной

системе.  Другими  словами,  рост  количества  публикаций  по  одной  теме  при
ограниченной  способности  их  генерации  (что  вполне  соответствует
действительности) сопровождается уменьшением публикаций на другие темы, так что
для каждого промежутка времени T  имеем:

 

image

где  ni (t)  – количество публикаций в единицу времени по теме  i , а  M  – общее
количество  всех  возможных  тем.  То  есть  для  локальных  временных  промежутков
можно наблюдать так называемый «тематический баланс».

Основной  интерес  в  такой  формулировке  представляет  изучение  динамики
отдельного тематического потока, который описывается плотностью ni (t) .

 

Теоретически  можно  допустить,  что  множества  публикаций,  ассоциируемых  с
определенным  набором  тематик,  пересекаются,  то  есть  существуют  публикации,
которые могут быть отнесены одновременно к нескольким различным тематикам. В
реальности  такая  политематичность  действительно  наблюдается,  она  является
эффектом, который необходимо учитывать, но  в первом приближении будем считать,
что его вклад не искажает общей картины.

 

Каждая  тематика  также  имеет  ряд  характерных  свойств,  которые  допускают
некоторую  классификацию,  например,  на  основе  особенностей  ее  образования  и
воспроизведения во времени:
−  публикации  на  «разовую»  тему,  временная  зависимость  количества  которых
резко растет, выходит на насыщение, а затем убывает и далее асимптотически
стремиться к нулю;
−  публикации  по  темам,  которые  периодически  появляются  в  общем
информационном потоке, а затем через некоторое время практически исчезают
из него;
−  публикации  по  теме,  временная  зависимость  количества  которых  колеблется
вокруг некоторого значения и никогда не исчезает полностью

 

Таким  образом  сообщения  могут  подразделяться  на  аналогичные  категории,
причем каждая из них имеет собственную специфику развития во времени.
Еще  сложнее  выглядит  синхронное  изменение  количества  сообщений  из
нескольких тематических информационных потоков. Их поведение четко напоминает
процессы  взаимодействия  популяций  в  биоценозе.  Так,  например,  в  ряде  случаев
увеличение  числа  публикаций  по  одной  теме  сопровождается  сокращением  числа
публикаций  по  другим  темам. Общая  динамика  в  этом  случае может  описываться
системой уравнений, каждое из которых относится к отдельному монотематическому
потоку. Подчеркнем, что общие политематические потоки являются стационарными
по  количеству  публикаций,  динамика же  в  основном  определяется  «конкурентной
борьбой» отдельных тематик.

 

Вместе  с  тем  в  практическом  плане  часто  оказывается  полностью
удовлетворительным упрощеное понимание информационного потока как некоторой
зависимой от времени величины n(t) , которая описывается уравнением:

 

image

 

В  мноргочисленной  литературе  описаны  много  разновидностей  систем
«конкурентной борьбы» для разных модификаций модели в  зависимости от целого

ряда предположений о реальных условиях протекания процессов. В самом простом
виде такие уравнения могут иметь следующий вид:

 

image

 

Приведенная  система  уравнений  описывает  перераспределение  публикаций
между  тематиками,  образующими  фиксированный  набор.  Но  в  реальной  жизни
тематики  (сюжеты)  появляются  и  со  временем  исчезают,  потому  необходимо
ввести  в  эти  уравнения  соответствующие  коррективы.  Это  можно  сделать  по-
разному, например, определив коэффициенты  pi  и  rij   зависящими от времени так,
чтобы  каждый  сюжет имел  собственный максимум  активности на определенном
промежутке времени.

 

Анализ  динамики  тематических  информационных  потоков,  которые
генерируются  в  веб-пространстве  становится  сегодня  одним  из  наиболее
информативных методов исследования   актуальности тех или других тематических
направлений  [5].  Эта  динамика  обусловлена  факторами,  много  из  которых  не
поддаются  точному  анализу.  Однако  общий  характер  временной  зависимости
количества  тематических  публикаций  в  Интернете  все  же  допускает  построение
математических моделей.

 

Традиционными  считаются  два  класса  моделей  информационных  потоков:
линейные и экспоненциальные. Оба класса имеют существенную ограниченность –
монотонный  характер  временной  зависимости.  То  есть  они  мало  пригодны  для
изучения  реальной  динамики  сетевых  информационных  потоков  в  течение
длительных интервалов времени.

 

В  некоторых  случаях  динамика  тематических  информационных  потоков,
выражаемых  количеством  публикаций  за  определенный  период,  их
интенсивностью, обусловленной, например, изменением активности тематики  (ее
повышением или старением),  происходит линейно, то есть количество сообщений
в момент времени t  можно, соответственно, представить формулой:
y(t) = y(t0)+v(t −t0), 
где  t0   –  стартовое  время  отсчета,  y(t)   –  количество  сообщений  к  моменту
времени  t ,  v  –  средняя  скорость  увеличения  (уменьшения)  интенсивности
тематического информационного потока.

 

Важные  характеристики  информационного  потока  могут  быть  количественно
оценены флуктуацией  этого потока – изменением  среднеквадратичного отклонения
σ(t) , вычисляемого по формуле:

 

image

 

Если эта величина изменяется пропорционально квадратному корню  от времени,
то  процесс  изменения  количества  публикаций  по  избранной  теме  можно  считать
процессом  с  независимыми  приращениями.  При  этом  связями  с  предыдущими
тематическими публикациями можно пренебречь. 
В  случае,  когда  среднеквадратичное  отклонение  пропроционально  некоторой
степени  от  времени:  σ(t)∝tµ (1/2≤µ≤1),  чем  большее  значение  µ ,  тем  выше
корреляция  между  текущими  и  предыдущими  сообщениями  в  информационном
потоке.

 

В некоторых случаях процесс изменения актуальности тематики (увеличения или
уменьшения  количества  тематических  сообщений  в  информационном  потоке  в
единицу  времени)  аппроксимируется  экспоненциальной  зависимостью,  которая
выражается формулой:
y(t) = y(t0)exp[λ(t −t0)],  
где  λ   –  среднее  относительное  изменение  интенсивности  тематического
информационного потока.
В реальности актуальность тематики является дискретной величиной,  измеряемой
в  моменты  времени  t0,...,tn ,  которая  лишь  аппроксимируется  приведенной  выше
зависимостью. В рамках данной модели справедливо:
y(ti )/y(ti−1) = y(t0)exp[λ(ti −t0)]=
= y(t0)exp[λ(ti −ti−1+ti−1−t0)]= y(ti−1)exp[λ(ti −ti−1)].
Откуда:
image

 

image

В этом случае также, если σ(t)  изменяется пропорционально корню квадратному
от  времени,  то  можно  говорить  о  процессе  с  независимыми  приращениями  –
корреляция  между  отдельными  сообщениями  несущественна.  В  случае  наличия
значительной зависимости сообщений наблюдается соотношение:  σ(t)∝tµ ,   причем
значение  µ   превышает  1/2,  но ограниченно 1.

 

Значениеµ ,  которое  превышает  1/2,  свидетельствует  о  наличие  долгосрочной
памяти  в  информационном  потоке.  Такой  класс  процессов  получил  название
автомодельных,  для  которых  предусматривается  корреляция  между  количеством
сообщений, публикуемых в разные моменты времени.

 

Логистическая модель
В  отличие  от  модели  Бартона-Кеблера  в  реальной  динамике  информационных
потоков  имеют  место  процессы  как  роста,  так  и  спада  количества  документов.
Поэтому для построения реалистичной картины, безусловно, необходимо применять
более гибкие модели.

 

В первую  очередь,  стоит  сказать,  что  документы  в информационном потоке  во
многих отношениях напоминают популяции живых организмов. Они в определенном
смысле  «рождаются»,  «умирают»  и  дают  «потомство»  (документы,  содержащиет
информацию,  ранее  появившуюся  в  других  документах).  В  современной  научной
литературе  понятие  популяции  часто  используется  в  широком  смысле,  и  потому
полностью обосновано введение его и при моделировании информационных потоков.

 

 

Логистическую модель можно рассматривать как обобщение экспоненциальной
модели Мальтуса, предусматривающей пропорциональность скорости роста функции
y(t)  в каждый момент времени ее значению:
image
где k  – некоторый коэффициент

Наиболее  простым  обобщением  закона  Мальтуса,  позволяющим  уйти  от
неограниченного  роста  решения,  является  замена  постоянного  коэффициента  k 
некоторой функцией времени  k(t). Естественно, эта функция должна быть выбрана
таким образом, чтобы  выполнялись условия:
−  решение уравнения имело бы приемлемое поведение;
−  структура  функции  имела  бы  определенный  смысл  с  точки  зрения
исследуемого явления.

 

Главная  идея  логистической  модели  заключается  в  том,  что  для  ограничения
скорости  роста  на  функцию  y(t)   накладывается  дополнительное  условие,  в
соответствии с которым ее значением не должно превышать некоторую величину [6].
Для этого выберем k(t) такого вида:
k(t) =k ⋅[N−ry(t)],   
где  N  – предельное значение, которое функция  y(t)  не может превысить,  
коэффициент, который описывает негативные для данной тенденции процессы,  k  –
коэффициент  пропорциональности.

 

image

Модель, основанная на приведенном выше уравнении, называется логистической.
Несмотря  на  мнимую  простоту,  подобное  обобщение  закона  Мальтуса  никоим
образом  не  является  примитивным.  Напротив,  оно  позволяет  явно  включить  в
описание  динамики  популяций  исключительно  важную  обратную  связь.
Логистическое  уравнение, можно  считать феноменологическим:  исследователям  не
обязательно знать, как действуют конкретные механизмы, которые по мере роста  y(t) 
снижают скорость ее изменения.

 

Приведенное  выше  логистическое  уравнение  имеет  два  равновесных  решения:
y(t)=0 и  y(t)=N . С формальной точки зрения первое из них неустойчиво, однако на
практике  это  не  совсем  так.  Дело  в  том,  что  реальные  объемы  информационных
потоков выражаются дискретными числами, и если в какой-то момент  y(t)  принимает
значение, меньшее единицы, то в дальнейшем расти оно уже не сможет.  Поэтому в
реальности решение  y(t) =0 также можно считать равновесным.

 

Второе  же  решение  y(t)=N   является  равновесным  в  любом  смысле.
Действительно,  при  y(t)>N     включаются  механизмы  спада  зависимости,  а  при
y(t)<N ,  соответственно, роста.

 

Рассмотрим,  как  логистическая  модель  может  применяться  во  время  анализа
информационных  потоков,  а  именно  определение  минимального  начального
количества  c сообщений (которое можно, например, выделить для начала некоторой
информационной  операции).   Пусть    x   –    объем  тематического  информационного
потока.    На  динамику  этой  величины  осуществляется  влияние  других  тематик,
уменьшающих ее распространение, которое описывается  таким образом:  x& = x−x2 −c.  
Вычисления показывают, что поведение системы резко изменяется при некотором
критическом значении c.

 

Очевидно,  что  при  наличии  благоприятных  внешних  условий  (при  некоторой
плотности  ресурса)  объем  информационного  потока  растет  свободно,  что
способствует  логистическому  росту.  В  этом  случае  даже  более  сложные  модели
должны давать результаты, подобные приведенным. С другой стороны это означает,
что  основные  параметры  для  конкретизации  общей  модели  могут  определяться  в
результате анализа  упрощенной логистической модели. 

 

Следовательно,  логистическая  модель  успешно  описывает  достижение
тематическим информационным потоком некоторого равновесного состояния.

 

image

 

image

 

Подчеркнем,  что  содержательно  величина  p   определяет  нормируемую
вероятность появления публикации в единицу времени независимо от актуальности
темы.  Этот  фактор  отображает  фоновые  механизмы  генерации  информации
(типичным  примером  может  быть  механическая  перепечатка  материалов  из
престижных  информационных  источников).  Величина  же  D    характеризует
непосредственное  влияние  актуальности  данной  темы. Параметр  q    характеризует
уменьшение скорости роста количества публикаций и  является величиной,  обратной
к асимптотическому значению зависимости u(t)  при D=0.

image

Приведеные  выше  нелинейные  дифференциальные  уравнения  являются
вариантами записи уравнения Бернулли:
= 2 + ,
y' ay by
которое линеаризуется стандартной заменой   z =1/ y:
z '+bz+a=0.

 

image

 

Таким  образом,  модель  описывает  зависимость,  которая  имеет  S–подобную
(логистическую) форму, представленную на рис. 6.1.

image

Заметим,  что  решение  не  зависит  от  значения  n0 ,  что  свидетельствует  о
несущественности начальных условий для информационной динамики. Каким бы не
было  начальное  количество  публикаций,  насыщение  будет  определяться
исключительно  параметрами,  которые  характеризуют  фоновую  скорость  роста
количества  публикаций,  количественную  меру  актуальности  и  негативные  для
процесса факторы.

 

image

Представим теперь выражение для  u(t)  следующем виде:

 

image

 

image

image

 

Как и ожидалось, величина  vs  также не зависит ни от начального условия, ни от
условия  «сшивки»  с  функцией  u(t)   на  границе  областей.  Как  видно,    полученная
зависимость  имеет  область  насыщения  us   при  t ≤λ   и  асимптотикуvs ,  которая
описывает постепенное уменьшение числа публикаций до фонового уровня. То есть
она,  по  крайней  мере,  на  качественном  уровне,  согласовывается  с  общими
соображениями  о  характере  информационной  динамики,  полученными  на  основе
опытных  данных. Кроме того, на локальных участках она неплохо аппроксимируется
линейной и экспоненциальной моделями.

 

В  случае  информационных  потоков,  которые  ассоциируются  с  конкретными
темами,  необходимо  описывать  динамику  каждого  из  таких  потоков  отдельно,
принимая  во  внимание  то,  что  рост  одного  из  них  автоматически  приводит  к
уменьшению других и наоборот. Поэтому  ограничение на количество сообщений по
всем тематикам распространяется и на совокупность всех монотематических потоков. 
   224     
В  случае  изучения  общего  информационного  потока  наблюдается  явление
«перетекания»   публикаций из одних, теряющих актуальность тематик,  в другие. 
Общая динамика должна описываться системой уравнений, каждое из которых
относится  к  отдельному  монотематическому  потоку.  Подчеркнем,  что  общие
политематические  потоки  являются  стационарными  по  количеству  публикаций,
динамика же в основном определяется «конкурентной борьбой» отдельных тематик.
Приведенную  выше  систему  уравнений    «конкурентной  борьбы»  в  рамках
обобщенной логистической модели можно представить в таком виде:

image

В этих соотношениях коэффициенты  pi  и  Di  имеют тот же смысл, что и ранее, а
λ   являются  точками,  в  которых  соответствующие  Di   достигают  максимальных
i
значений.

Мемы&медиавирусы

Loading...