Search engines vs. Find engines

Сегодня я написала пост в SE la vie, затрагивающий тему индексации веба альтернативными поисковиками. Чуть-чуть хочу поразмышлять на эту тему именно в этом блоге.

Почему тема больная? Ну прежде всего потому, что альтернативные поисковики - понятие еще пока не то чтобы не существующее, но какое-то.. неоформленное, что ли.. Особенно учитывая то, что даже просто понятие “Поисковая система” не имеет четкого определения. Есть много мнений. И вроде как все правильные. Но применительно к этому разговору хочу выделить мнение о том, что поисковая система - это сервис, который имеет своего поискового робота, индексирующего данные в Вебе и, соответственно, индекс, то есть базу данных. Я не возьмусь говорить, правильно это или не правильно. Потому что у медали, как известно, две стороны. Вернемся к альтернативам.

Я уже писала не так давно свое мнение на этот счет в “Альтернативах для чайников“:

…говорить о том, что у поисковой системы всенепременнейше должен быть собственный алгоритм - я не буду. А значит, не буду говорить и о том, что поисковая система - лишь тот сервис, у которого есть собственный поисковый кроулер. Если ПС заимствует индекс у стороннего сервиса и ей и так прекрасно живется, то паук ей зачем?..

Я до сих пор придерживаюсь этой точки зрения. При всем разнообразии альтернативных поисковиков, можно найти не один, которому собственный индекс совершенно не нужен, не говоря уж о просто мета-поисковых системах.

Тем не менее и утверждение, что ПС - это индекс и паук - вполне справедливо. Ну, во-первых, это принцип наиболее привычных и крупнейших поисковиков - индексировать все и вся на своем пути. Но если это вертикальный поиск по недвижимости, то с какой стати ему вообще нужно индексировать все то, что недвижимости совершенно не касается? И если у вас сайт не по недвижимости, то вроде как совершенно неудивительно, что робот этого поисковика к вам не заходил и не зайдет никогда. Поэтому говорить наверняка о том, что у того-то поисковика нет собственного индекса или паука - не стоит так сразу. Может он есть. Просто тихий.. незаметный такой. А то сразу обзываться - не поисковая система, не поисковая система..

Во-вторых, многие альтернативы все же стремятся построить именно свой индекс. Другой вопрос - как! Если это поиск по блогам - то совершенно естественно предположить, что индексируются не веб-страницы, а только лишь rss фиды - и самому поисковику и блогу от этого гораздо легче. Или мета-поисковик может иметь своего паука, котрый бродит по базам данных, а не по веб-страницам. Кстати, что интересно, многие альтернативные поисковики используют открытых пауков - то есть не собственные. И это их совершено не парит.

Далее. Сервисы, которые действительно полность используют чужую (лицензированную) базу и в кроулере не нуждаются - поисковые это системы или нет?

…Я бы сказала, что это промежуточная стадия - еще не поисковая система в смысле своей начинки, хотя для пользователя этот сервис является именно поисковой системой…

Ну например. Хочу я купить телевизор. Я могу пойти в обычный магазин техники. А могу заглянуть в его же представительство в интернете. По ассортименту товаров они будут абсолютно одинаковыми. Просто один реальный, другой виртуальный. Только в виртуальном удобнее, быстрее и, скорее всего, дешевле. А то, что там нету продавцов в привычном понимании этого слова - в костюмчиках и с улыбочкой - так что, это не магазин теперь? Магазин, только называется он - интернет-магазин. Разница в названии небольшая, а объясняет многое.

Я не считаю, что сервисы, не имеющие собственный индекс - ущербные. Просто тут такая мелочь выходит на первый план, как название. Поисковые системы - те, которые ищут. Вполне понятно желание некоторых людей впихивать в определение строчку про собственый индекс и поисковый паук.

В противовес Search Engine вполне можно поставить Find Engine - находящую систему. Это та система, которая скорее находит результаты в уже имеющейся базе в соответствии со своими моральными и религиозными принципами. Ну то есть как ее построят - так и будет находить и предоставлять эти результаты. Find engine - это сервис, который использует чужой индекс и лишь перерабатывает данные, полученные поисковыми системами (то есть теми, которые самостоятельно нашли их), представляя результаты по собственному алгоритму.

Как я уже говорила, find engine - это, скорее, промежуточная стадия. Все таки большинство поисковиков стремятся составить свой индекс. Тогда уж они точно не будут пустышками)) Quintura, например, активно занимается составлением своего индекса и вроде как его уже даже тестирует. Пожелаю удачи в бою. Кстати, себя они величают discovery engine. Но в некоторых случаях find engine вполне прекрасно чувствует себя в этой роли - находящего поисковика, так он себя позиционирует и совершенно при этом счастлив. Пример посвежее - tafiti.

Само собой, ничего особенно полезного сам факт другого названия человечеству не даст. Просто так удобнее будет анализировать стартапы. Плюс, возможно, это хоть как-то сможет уменьшить негатив в сторону альтернативных поисковиков по части того, что вовсе они не поисковые системы. Ну да, не поисковые. Но находящие. Плюс, возможно, это будет некоторый стимул для этих стартапов ;) Здесь можно почитать, что говорят руководители нескольких альтернативных поисковиков на тему индексации.

If you enjoyed this post, please consider to leave a comment or subscribe to the feed and get future articles delivered to your feed reader.


Комментарии

Привет!
Как развивается погодный стартап?

А мы запустили новый сервис - виджет для блогов - HATE-LiST (лист ненавсти)

ps. кстати отлично пишите, сорри, не всегда есть время комментировать, но не пропускаю ни одного поста.

привет! впервые на блоге твоем, поздароваться хотел )

Вы утверждаете, что find engines не ущербные? Хм… вы можете привести find engines, которые имеют нормальный доступ к базам крупных поисковиков, а не тупо парсят их выдачу?

Откомментировать

(Важно)

(Важно)