Постоянное стремление к максимальному количеству публикаций наряду со слабо выраженным чувством этического сознания приводят вновь и вновь к плагиату в научной литературе. Эррами и Гарнер (Errami and Garner) в своём исследовании плагиата обнаружили дважды поданные в печать статьи и неизменённые повторы текстов более, чем в 1 % публикаций по медицинской тематике последних лет. И эта тенденция растёт. В качестве позорного столба была создана база данных Дежа Вю (Deja vu), в которую заносятся подобные статьи ( и их авторы)
В действительности, при изобилии биомедицинских публикаций поиск дубликатов сопряжён со значительными техническими трудностями. Но даже при этом, такой контроль оправдывает себя из этических и научных соображений. Многоразово поданные публикации приводят к умалению вклада отдельных учёных в науку с одной стороны, и к неправильному представлению роли самой работы — с другой. Кроме того, они являются совершенно излишлим балластом для издателей и рецензентов научных журналов.
Функциональной системой распознавания текстов является eTBLAST. Она была создана Эррами и Гарнером.
Изначально eTBLAST предназначалась для оперативного получения данных о существующих публикациях по заданной теме и была удобным фильтром для поиска нужных статей. В то время, как алгоритм PubMed фильтрует статьи по ключевым словам, авторам и т.д., eTBLAST — по существенным совпадениям в тексте. На деле eTBLAST работает примерно так: фрагмент текста (примерно соответствующий размеру тезисов) вводится в поле для поиска. Затем eTBLAST сравнивает его с существующими биомедицинскими публикациями. В программе используются те же алгоритмы, что и в знаменитой поисковой системы BLAST для сравнения сиквенсов. Совпадения, превышающие определенную пороговую величину, представляются в графе результатов вместе с ссылками на найденные статьи (как и в системе BLAST поиск занимает некоторое время).
Наряду с основной функцией в меню eTBLAST есть также раздел ARGH, сожержащий список сокращений биологических терминов.
P.S. Извиняюсь за корявый перевод


