Чешские программисты сделали уникальное открытие

Найди в Сети своего двойника!

dvojce

Специалисты в области информатики из Университета им. Масарика в Брно разработали уникальный метод поиска в мультимедийных данных MUFIN. В отличие от современных интернет-поисковиков, которые работают лишь с текстовым описанием картинок, музыки или видео, новая технология из Брно основана на сравнении их содержания – так объяснил способ работы один из главных разработчиков проекта Павел Зезула. Данный метод первым в Чехии получил престижную премию IBM Shared University Research.

Над разработкой новой системы группа молодых университетских ученых под руководством Зезулы работает с 2004 года. К ключевому моменту своих исследований они подошли в течение последних двух лет, когда началась совместная работа с фирмой IBM, которая предоставила им возможность работать в одном из восьми научных центров IBM в Израиле в Хайфе.

Как уникальный метод работает? В отличии от других поисковиков, которые работают, главным образом, с текстовым описанием, коментариями или конкретной уже используемой в Сети фотографией, MUFIN способен идентифицировать содержание фотографии – как рисунка, посредством ее свойств. Текстовые поисковики – не удивят сегодня никого, поисковик способный найти двойника Джоконды, это что-то из разряда фантастики, но не для чехов… «Из рисунка мы извлекаем некоторые данные – цветовой спектр, текстуру или размещение различных форм. На основании этих анализируемых данных, программа будет сравнивать их с данными других рисунков, тем самым, подбирая наиболее похожие», - говорит Павел Зезула. Кроме поиска в интернете, новую технологию можно использовать и в биологии для поиска похожих данных ДНК, отпечатков пальцев или опознания лиц, а также при разработке географических карт.

Поиск по содержанию, по словам Павла Зезеулы, имеет большое будущее. «По словам экспертов, только за последний год на свете было создано более 100 миллиардов фотографий. И хотя большая часть будет стерта, почти невозможно каждой фотографии, размешенной в Сети, дать название или ключевое описание. В результате чего поиск, основанные на текстовой форме, не имеет возможности с этими фотографиями работать, все равно верим что у данного проекта большое бущушее», - добавил он. Частью премии IBM Shared стали также восемь современных серверов, благодаря которым ознакомительная версия программы может быть предоставлена широкой публике - http://mufin.fi.muni.cz/imgsearch/. Благодара этому, каждый пользователь, задав в систему свою фотографии, может попробовать найти своего двойника.

Программа может сравнить содержание различных документов, содержащих более 50 миллионов рисунков в базе данных одного из крупнейших веб-центров с фотографиями – Flickr, менее чем за полсекунды! Программу можно также использовать для «чистки» компьютера (она идеально находит лишние копии документов). «В течение месяца мы намерены расширить базу наших данных до 100 миллионов, в ближайшем будущем даже до миллиарда фотографий. В фазе развития находится также программа для сравнивания видео и звуковых программ для поиска различного плагиата», - сообщил Павел Зезула.

В.Степанова