Thursday, July 30, 2009




Лавина новостей и комментариев об объединении усилий Yahoo и MicroSoft совсем заслонила куда, на мой взгляд, более интересную новость поискового мира начала лета.

Практически все существующие поисковики занимаются контекстным поиском в текстовых файлах либо поиском среди мета-данных прочих объектов. Поиск в графических и звуковых файлах файлах до сих пор был практически невозможен..

Тем интереснее бета-версия графического поиска канадской компании TinEye. Похоже им удалось решить первую часть этой математически крайне сложной задачи - сравнение двух графических файлов. На сегодня (30.07.2009) они осуществляют поиск среди примерно 1.1 миллиарда проиндексированных ими изображений.

Интересно - может ли та же методика быть применена для поиска среди звуковых файлов?

1 comment:

  1. Со звуком, насколько я знаю, все сложнее и проще одновременно. Что касается музыки, то тут работа идет давно - есть сервис, который позволяет найти песню по мелодии, есть проект Music Genome, на котором построена pandora. Но если говорить о звуке вообще, то там все упирается либо в распознавание - если мы говорим о речи, либо в поиск внутри определенного (и достаточно узкого) предметного домена, как например акустические сигнатуры кораблей.
    TinEye, в принципе, огромного прорыва не сделали, т.к. они всего лишь придумали алгоритм рассчета сигнатуры изображения устойчивой к преобразованиям этого изображения, таким как изменение размера, кроп, масштабирование. Т.е. TinEye на позволит найти, к примеру, фотографию и рисунок одного и того же объекта.

    ReplyDelete