Полная версия страницы  English  

За распространением идеи в интернете теперь можно проследить

Vladimir Matveev, 24.10.2010 08:57
Ученые-компьютерщики из Принстона разработали новый способ отслеживания происхождения и распространения идей и технологий. Это поможет оценить глобальное влияние научных статей, рассказов, новостей и других источников информации.

Новый метод основан на компьютерных алгоритмах, анализирующих морфемы языка на протяжении периода времени в группе документов - будь то научные статьи по квантовой физике или блоги о политике - и определяющих, какие документы были наиболее влиятельными.

"Благодаря компьютерам и интернету мы теперь в состоянии управлять потоками информации. Например, сегодня можно легко узнать, кто придумал термин "кварк" или найти старые новости о том, где случился первый антивоенный протест 1960-х, - объясняет доцент компьютерных наук в Принстонском университете Дэвид Блей (David Blei). - Мы хотим разобраться, как идеи и информация распространяются в человеческом обществе".

Дэвид Блей надеется, что новая методика поиска может использоваться историками, политологами и другими учеными для исследования процесса возникновения и распространения идей.

Хотя поисковые системы, такие как Google и Bing, помогают людям найти среди океана информации интернета нужные факты, их работа основана на сложном комплексе критериев вроде количества ссылок и трафика посетителей. Подобная схема не в полной мере отражает влияние того или иного документа. В научных изданиях влияние документа оценивается традиционным способом – по количеству цитат в других работах. Однако для других "сборников" материалов, таких как газеты, патентные претензии, сообщения в блогах, нет таких средств измерения влияния.

Вместо того чтобы сосредоточиться на цитатах, ученые разработали специальную статистическую модель. Она позволяет компьютерам анализировать текст документов для оценки изменений самого языка с течением времени. "Влиятельные" идеи создают новые понятия и термины, которые изменяют слова, фразы и суть более поздних работ. Например, слово "лазер" отражается во множестве последующих статей и материалов в самых различных источниках. Соответственно, первая статья, которая ввела в оборот это слово, имела исключительное влияние.

Модель американских ученых может служить альтернативным методом измерения воздействия информации, размещенной на веб-сайтах, в юридических, исторических документах и т.п. В перспективе она даже способна предсказывать "великие идеи" еще до того, как они станут общеизвестными и признанными.

Источник: http://rnd.cnews.ru/math/news/line/index_s...10/10/21/413123
Guest, 24.10.2010 10:14
Отключи куки на своём компе и фиг они чего узнают а будут только полны рассуждений и догадок.
Bio-Nom, 24.10.2010 11:36
Если новая идея или явление будут иметь какой-то новый идентификатор, тогда можно будет отследить появление новых лексем, откуда они возникли, пути и скорость распространения.
А если все это будет описываться с помощью уже устоявшихся терминов, то тут без ИИ или специалиста в определенной области не обойтись, только он сможет отсеять шелуху.
Statin, 24.10.2010 12:30
Ну как же теперь бедные американцы будут получать нобелевские премии!? smile.gif
Это — лёгкая версия форума. Чтобы попасть на полную, щелкните здесь.
Invision Power Board © 2001-2012 Invision Power Services, Inc.