Описание языков запросов различных поисковых машин

Умение искать информацию с помощью поисковых машин очень важно для создания и последующей раскрутки блога.

Благодаря поисковым машинам можно своевременно собирать информацию, появляющуюся в Интернете по теме, которой посвящен блог. Это, в свою очередь, дает возможность своевременно прокомментировать ситуацию и разместить на своем блоге готовый материал, предложив его вниманию читателей. Важно, что язык запросов поисковой машины работает не только при поиске во всем Интернете, но и при поиске по блогам и форумам, что значительно расширяет возможности блоггера. Несмотря на то, что принципы языка современных поисковых машин действительно одинаковы, синтаксис запросов у них различен. Некоторые операторы языка запросов универсальны, но большинство – нет.

Рассмотрим языки запросов трех основных поисковых машин, работающих с русскоязычными текстами, более подробно.

Поиск в Яндексе

Лучшая, на наш взгляд, работа по изучению операторов поисковой машины Яндекс, выполнена специалистом из Санкт-Петербурга Денисом Фурсовым. На его блоге в статье «Хозяйке на заметку. Поиск через Яндекс для специалистов»[19] постоянно публикуются результаты исследований, отслеживаются, оцениваются и обсуждаются изменения в работе операторов поисковой машины Яндекс (рис. 22).

Рис. 22. Внешний вид страницы «Хозяйке на заметку. Поиск через Яндекс для специалистов»

Ниже речь пойдет о том, как с помощью специальных фильтров, основанных на булевой алгебре, создавать запросы, максимально соответствующие потребностям специалиста, который ищет информацию в Интернете. При изучении этого вопроса не следует забывать, что компьютер очень исполнителен, но лишен способности думать, поэтому следует составлять запрос исходя из того, что он будет обработан буквально, а не с учетом того, что же на самом деле имел в виду пользователь, создавая обращение к поисковой машине. Лучше всех эту мысль проиллюстрировал летом 2005 года Алексей Амилющенко, главный аналитик отдела маркетинга Яндекса, на таком примере.

? Вот еще одна история с семинаров, но ее приходится рассказывать не очень часто. Иногда случается, что заходит разговор о том, что хорошо бы поисковым системам учитывать не только слова, которые есть в индексируемых документах, но и смысл написанного. В ответ говорю, что знаю фразу, про которую и человек-то не скажет, о чем это. Вот она: «Эти типы стали есть в прокатном цехе». И что тут написано? Я вижу минимум три смысла. Не подглядывайте в ответ сразу (он ниже). Попробуйте сначала самостоятельно… Обычно, когда зал видит это предложение, сначала становится тихо (видно, что думают), потом начинаются смешки (до кого-то дошло). Потом хихикают уже все. Но к делу, что же здесь все-таки написано?
1. Скучный такой вариант: «Эти типы стали (варианты металлопроката) есть (имеются в наличии) в прокатном цехе».
2. Более творческий, с элементами мизантропии: «Эти типы (неприятные автору личности) стали (начали) есть (принимать пищу) в прокатном цехе».
3. Несколько надуманный, конечно, и тем не менее: «Эти типы стали (варианты металлопроката) есть (надлежит принимать в пищу) в прокатном цехе».
Вот видите, даже протеиновые мозги не справляются, а вы хотите, чтобы силиконовые умели[20].

Текст запроса мы будем помещать в квадратные скобки для того, чтобы визуально его выделить. Если уважаемый читатель решит ввести приведенные ниже запросы в поисковую строку поисковой машины, чтобы проверить их работоспособность на практике, то эти квадратные скобки вводить не надо.

Итак, перейдем непосредственно к операторам запросов Яндекса.

Логическое «И». Яндекс поддерживает три разных оператора, относящихся к логическому «И», что делает его самым гибким из всех поисковиков, работающих с русским языком. Столь развитая, практически уникальная, система операторов поисковых запросов дает возможность предельно точно настроить запрос и сформировать такой фильтр для данных в Интернете, который максимально качественно выбирает нужную информацию и отсекает ненужную.

Пробел. Слова, разделенные пробелом, должны быть недалеко друг от друга.

Специалисты поясняют, что термин «недалеко» фиксированной величиной не является и меняется в зависимости от того, с какими словами оператор «пробел» в каждом конкретном случае используется.

Если слова часто употребляемые, то «недалеко» – значит на расстоянии нескольких слов друг от друга. Если слова редко встречаются в обиходе, то даже их нахождение в разных концах документа будет восприниматься как «недалеко».

При этом, несмотря на то, что логическое «И» в общем виде булевой алгебры подразумевает присутствие всех упомянутых слов, Яндекс тем не менее действительно выдает сначала те документы, в которых есть все ключевые слова, упомянутые в запросе. Но после этого он дает и те, в которых содержатся не все ключевые слова.

На наш взгляд, сказанного об операторе «пробел» достаточно, для того чтобы решать основные проблемы, связанные с поиском в Интернете. Но на самом деле решение вопроса о том, что такое «не очень далеко» и «очень далеко», с точки зрения Яндекса, вопрос не простой, и для полного его понимания мы вновь рекомендуем держать в поле зрения статью Дениса Фурсова.

Мы еще неоднократно обратимся к этому замечательному руководству.

–
ПРИМЕР
Запрос: [маркетинг менеджмент]
Результат поиска: страниц – 7 174 687, сайтов – не менее 2070, в каталоге – 57.
В выдаче: менеджмент и маркетинг в бизнесе.
–

Амперсанд (&). Слова, разделенные амперсандом, находятся в одном предложении.

Внимание! Амперсанд должен быть отделен пробелами с двух сторон от любых других слов.

–
ПРИМЕР
Запрос: [маркетинг & менеджмент]
Результат поиска: страниц – 2 628 927, сайтов – не менее 1670, в каталоге – 53.
В выдаче: Маркетинг Менеджмент: Главная 2006 «Маркетинг Менеджмент».
–

Двойной амперсанд (&&). Слова, разделенные двойным амперсандом, находятся в любом месте одного и того же документа.

ВНИМАНИЕ! Между амперсандами не должно быть пробелов, но сам оператор должен быть отделен пробелами с двух сторон от любых других слов.

–
ПРИМЕР
Запрос: [маркетинг && менеджмент]
Результат поиска: страниц – 9 665 609, сайтов – не менее 1948, в каталоге – 57.
–

В выдаче будут присутствовать, например, учебные планы вузов, в которых слова «маркетинг» и «менеджмент» находятся в разных частях текста, в том числе на разных страницах опубликованного в Интернете многостраничного плана занятий.

Чтобы наглядно это увидеть, мы рекомендуем читателям нажать в результатах выдачи гиперссылку «Сохраненная копия», которая есть под каждым результатом поиска. В этом случае слова, которые есть в запросе, будут подсвечены в тексте и сократится время на их поиск.

Логическое «НЕ». Логическое «НЕ» представлено двумя операторами. Прежде чем рассказать о них, отвечу на вопрос, который часто возникает у людей, впервые приступивших к изучению операторов поиска. Они говорят: «Зачем нужно логическое “НЕ”? Можно ведь просто его не вводить, и тогда оно нам не понадобится!» Ответ таков: «Если мы сами решаем, что нам вводить, а что нет, то это утверждение справедливо. Но проблема в том, что обычно в выдаче принудительно оказывается “мусор”, и часто нет другого способа избавиться от него, кроме как убрать эти слова при помощи логического “НЕ”. Так, например, если вас интересует конек крыши, то по слову “конек” в выдаче будут и роликовые, и фигурные коньки, и даже Конек-Горбунок. Для них-то логическое “НЕ” и придумано». Итак, перейдем к двум оператором логического «НЕ» в Яндексе.

1. Тильда (~).

Знак тильды – это верхняя левая клавиша на буквенно-цифровой клавиатуре. Символ вводится на английском регистре с нажатой клавишей Shift. Как и амперсанд, тильда должна быть отделена с обеих сторон пробелами. Часто допускают ошибку, «приклеивая» тильду к следующему за ней слову. Иногда отсутствие пробела между тильдой и последующим словом не влияет на результат, но бывает и наоборот, поэтому лучше внимательно проследить за пробелами вокруг знака тильды. Тильда означает, по аналогии с диаметрально противоположным символом – амперсандом, что слова не должно быть в предложении.

–
ПРИМЕР
Запрос: [маркетинг ~ менеджмент]
Результат поиска: страниц – 29 907 227, сайтов – не менее 5347, в каталоге – 281.
В выдаче: форум Маркетинг и реклама – Маркетинг и…
Новости маркетинга и рекламы, история рекламы и маркетинга.
Управление маркетингом и продажами, организация маркетинговой деятельности: отдел продаж, отдел рекламы и отдел маркетинга – работа отдела маркетинга…
–

2. Двойная тильда (~~).

По аналогии с двойным амперсандом двойная тильда пишется слитно внутри самого этого оператора, но отделяется от остальных слов пробелами с обеих сторон.

Двойная тильда означает, что слова, которое за ней расположено, не должно быть в документе совсем.

–
ПРИМЕР
Запрос: [маркетинг ~~ менеджмент]
Результат поиска: страниц – 21 936 571, сайтов – не менее 4720, в каталоге – 276.
В выдаче: Промо.Текарт – продвижение сайтов, интернет-маркетинг и реклама в Интернете…
Департамент Промо.Текарт является подразделением маркетинговой группы «Текарт», оказывающим услуги комплексного интернет-маркетинга: маркетинговый… комплексный подход к услуге интернет-маркетинга, охватывающий все возможности для продвижения интернет-представительств компаний в сети Интернет.
–

Обратите внимание: в результатах выдачи слова «маркетинг» и «маркетинга» выделены как релевантные, тогда как слово «маркетинговый» – нет. Это происходит потому, что «маркетинг» – существительное, «маркетинга» – его словоформа, тогда как «маркетинговый» – совсем другое слово иной части речи, а отнюдь не словоформа «маркетинга». Подобное явление надо учитывать, если вы рассчитываете на способность Яндекса самостоятельно перебирать словоформы. Игнорирование этого факта нередко приводит к искажению результатов выдачи и также является частой ошибкой начинающих специалистов по поиску в Интернете.

На самом деле в Яндексе есть еще один оператор логического «НЕ», который обозначается знаком минус. По мнению Дениса Фурсова, с которым автор полностью согласен, знак «минус» – не всегда корректно работающая двойная тильда, поэтому пользоваться им смысла нет. Мы не знаем наверняка, но предполагаем, что знак «минус» в качестве логического «НЕ» – способ унифицировать Яндекс с другими поисковыми машинами, поскольку в большинстве машин именно знаком «минус» логическое «НЕ» и обозначают. Мы не пользуемся оператором «минус» при поиске в Яндексе.

Логическое «ИЛИ» (оператор | ). Логическое «ИЛИ» представлено оператором, имеющим вид вертикальной черты: | На клавиатуре этот оператор находится обычно выше (реже он расположен ниже) клавиши Enter и вводится в английском регистре, при нажатой клавише Shift.

В подавляющем большинстве случаев оператор | и слова, с которыми он используется, заключается в скобки, так как часто в запросе есть больше двух слов, к которым этот оператор относится.

–
ПРИМЕР
Запрос, который должен показать, что нас интересует документ, в котором в одном предложении содержатся слова «маркетинг» и «менеджмент», но при этом нигде в документе не должно быть слов «курс», «работа», «конференция», «теория», «книга», «семинар», «бизнес», «прибыль», «клиент», может выглядеть так: [маркетинг & менеджмент ~~ (курс | работа | конференция | теория | книга | семинар | бизнес | прибыль | клиент)].
Результат поиска: страниц – 302 567, сайтов – не менее 2177, в каталоге – 19.
В выдаче: Журналы маркетинг, менеджмент, финансы, управление персоналом. Издательский дом…
Наша периодика – журналы по менеджменту, маркетингу, логистике и финансам.
Или: МАРКЕТИНГ-МЕНЕДЖМЕНТ: Национальная экономическая энциклопедия.
МАРКЕТИНГ-МЕНЕДЖМЕНТ: экономическая энциклопедия охватывает десятки тысяч экономических терминов, также обеспечен поиск по отдельным или всем словарям.
–

ВНИМАНИЕ! Скобки, как в арифметике при вынесении за скобку общего множителя, позволяют распространить оператор «двойная тильда» на все слова, расположенные внутри нее.

Кстати, для удобства восприятия этот запрос лучше записать так, чтобы заодно сгруппировать с помощью скобок и слова «маркетинг» и «менеджмент». Смысловой нагрузки это не несет, поэтому и на выдачу не влияет, но снижает вероятность, что вы сами запутаетесь в своем запросе, если он будет достаточно длинным. Поэтому мы бы советовали написать запрос вот так: [(маркетинг & менеджмент) ~~ (курс | работа | конференция | теория | книга | семинар | бизнес | прибыль | клиент)].

Яндекс учитывает морфологию. Это означает, что по запросу «блог» он выдаст результаты, содержащие слова «блогу», «блогом» и т. п., которые выделит как релевантные запросу.

–
ПРИМЕР
Запрос 1: [Блог]
Результат поиска: страниц – 38 733 590, сайтов – не менее 1901, в каталоге – 93.
В выдаче: Блог – Википедия.
Отличия блога от традиционного дневника обусловливаются средой, т. е. его «сетевостью»: блоги обычно публичны или хотя бы доступны определенному…
…первые обычно предполагают сторонних читателей, которые могут вступить в публичную полемику с автором (в отзывах к блог-записи или своих блогах)…
Запрос 2: [Блогом]
Результат поиска: тот же.
–

Можно отключить поддержание морфологии: если слова с изменяющимися окончаниями «замусоривают» результаты, то можно принудительно заставить Яндекс искать только слова в нужной словоформе. Это бывает полезно, например, при совпадении названия компании с общеупотребительными словами. Скажем, маловероятно, чтобы фирма «Река» упоминалась в публикациях со словами «реке» или «реку».

Восклицательный знак. Этот оператор используют для того, чтобы принудительно искать в Яндексе только нужную словоформу. Он пишется слитно со словом, которое стоит за ним, как если бы восклицательный знак был первой буквой нужного слова.

–
ПРИМЕР
Запрос 1: [!Река]
Результат поиска: страниц – 1 321 155, сайтов – не менее 2547, в каталоге – 4.
В выдаче: Екатеринбург Турфирма Река Желаний, туры, путевки, горящие туры из Екатеринбурга.
Турфирма Река Желаний 2004–2007 Екатеринбург.
Запрос 2 (без восклицательного знака): Река.
Результат поиска: страниц – 23 423 159, сайтов – не менее 19 368, в каталоге – 5.
В выдаче: Речные круизы на теплоходах по рекам России и Украины. Путешествия и отдых … Москва-реке.
Цены и Расписание круизов по рекам России и Украины.
–

Видно, что количество страниц и сайтов в случае запроса с оператором восклицательный знак уменьшается почти в восемь раз за счет исключения словоформ слова «река», таких как «реки», «рекой», «рекам» и пр.

Заглавные и строчные буквы. Яндекс периодически меняет некоторые нюансы в этом вопросе, но при этом старается придерживаться главного правила: слова, написанные с маленькой буквы, будут выдаваться и с маленькой, и с заглавной, а те, что написаны с заглавной буквы, – только с заглавной. Изменения, которые периодически происходят в подходах Яндекса к этому вопросу, обычно касаются попыток исправить наиболее распространенные ошибки пользователей. Ознакомиться с текущим состоянием дел можно как на странице помощи Яндекса, так и в уже упоминавшейся статье Дениса Фурсова. Однако для эффективной работы достаточно просто следовать приведенному в этом разделе правилу.

Если же слово написано целиком заглавными буквами, Яндекс будет рассматривать его как написанное строчными. То есть если слово «РИТЕЙЛЕР» даст такие же результаты, как «ритейлер».

–
ПРИМЕР
Запрос 1: [Мой Персональный Блог]
Результат поиска: страниц – 492, сайтов – не менее 59.
В выдаче (первое сообщение на шестой странице): Day.Az Forum > Netty-2007
Мой блог участвует в номинации «Персональные страницы».
Запрос 2: [мой персональный блог]
Результат поиска: страниц – 1372, сайтов – не менее 167.
В выдаче (первое сообщение на шестой странице): Форум по WordPress/
www.lehis.com.ua – блог lehis, повседневные заметки
www.lehis.com.ua – мой персональный блог.
–

К шестой странице результатов по запросу мы обратились для того, чтобы наглядно показать разницу, поскольку первые страницы по двум этим запросам оказались одинаковыми.

Оператор «плюс» (+). Этот оператор используется для того, чтобы слова были обязательно включены в документы, присутствующие в выдаче.

Покажем работу этого оператора наглядно. Для этого сделаем запрос со словами, которые редко оказываются в одном документе, и разделим их пробелом.

А затем сделаем точно такой же запрос, но поставим знак «плюс» перед каждым словом, запретив таким образом Яндексу выдавать документы, в которых набор слов неполный.

–
ПРИМЕР
Запрос 1: [литейщик провизор стоматолог маркшейдер] Результат поиска: страниц – 63, сайтов – не менее 43. Запрос 2: [+ литейщик + провизор + стоматолог + маркшейдер]
Результат поиска: страниц – 15, сайтов – не менее 10.
В выдаче: Lindex-стандарт, ДСТУ, ГОСТ, ДБН, ДНАОП, СНиП,СН,СанПиН, МИ и другие…
…1237.1 20801 – Главный кулинар 1237.1 20807 – Главный маркшейдер
1237.1 20810 – Главный мелиоратор 1237.1 20813 – Главный…
Врач-эндокринолог 2222.1 23667 – Научный сотрудник (стоматология)
2222.2 20459 – Врач-стоматолог 2222.2 20462 – Врач-стоматолог…
Служба занятости по НСО, РАБОТА В НОВОСИБИРСКЕ, ТРУДОУСТРОЙСТВО
Литейщик санитарно-строительных изделий на стенде (134046)
Провизор (258501)
ОБЩЕСОЮЗНЫЙ КЛАССИФИКАТОР. ПРОФЕССИИ РАБОЧИХ, ДОЛЖНОСТИ СЛУЖАЩИХ И ТАРИФНЫЕ…
8 Лесник 00 13378 7Лесоруб 2 – 4 39 13380 4 Летчик-наблюдатель 13382 3 Листобойщик 2 – 5 07 13384 2 Литейщик…
…2 Врач-стоматолог 2 20462 4Врач-стоматолог-ортодонт 2 20465 8Врач-стоматолог-протезист 2 20468 1Врач-стоматолог-хирург 2…
–

Оператор «плюс» бывает незаменим также в тех случаях, когда есть необходимость обязательно включить в выдачу стоп-слова.

Очень хорошо это описано в уже упоминавшейся выше работе Дениса Фурсова.

? Если какие-то слова должны быть в результатах, поставьте перед ними +. Запрос «коллапс овощебаза майя астрофизик жжот» предлагает только «нестрогие соответствия» – страницы, на которых отсутствуют некоторые (на усмотрение Яндекса) из заданных слов. Если вы хотите, чтобы слово «майя» обязательно присутствовало на найденных страницах, то запрос должен быть «коллапс овощебаза + майя астрофизикжжот».
Яндекс учитывает стоп-слова (предлоги, местоимения, частицы и пр.) только в запросах из трех и менее слов. Если стоп-слово должно быть в результате, поставьте перед ним +. +не покупай телефоны samsung позволит найти негативные отзывы о продукции этой фирмы (сравните с простым – не покупай телефоны samsung). Если хотите обязательно исключить стоп-слово, используйте «~»: иду шагаю москве ~ +по. Не забудьте при этом ставить перед стоп-словом +, иначе наткнетесь на глюк: иду шагаю москве ~ по21.

–
ПРИМЕР
Запрос 1: [+не покупай (samsung | lg)]
Результат поиска: страниц – 9193, сайтов – не менее 2000.
В выдаче: Куплю не рабочие мобильники LG – Интернет-аукцион AUCTION.ua
Куплю поломанные телефоны марки LG на запчасти!
Запрос 2: [не покупай (samsung | lg)]
Результат поиска: страниц – 3 262 203, сайтов – не менее 899.
В выдаче: Dreamphones.ru – купить мобильный телефон твоей мечты Nokia, Samsung…
Dreamphones.ru – купить мобильный телефон твоей мечты всего за 20 долларов!
–

Яндекс периодически меняет нюансы своего отношения к алгоритму включения слов в выдачу, при неизменном общем подходе, а обычный пользователь вряд ли имеет возможность проверить, как Яндекс отреагировал на запрос в каждом конкретном случае. Поэтому мы рекомендуем воспользоваться советом Дениса и ставить знак «плюс» перед стоп-словами, да и вообще перед теми словами, которые вы считаете совершенно необходимыми в выдаче.

Слова находятся на определенном расстоянии. Этот оператор очень часто используется на практике, так как он позволяет достаточно четко ограничить поиск. Он выглядит как /n, где n, по определению самого Яндекса, – «максимально допустимое расстояние между двумя любыми словами запроса».

Денис Фурсов определяет этот оператор как «расстояние между словами»[21].

Мы предлагаем следующим образом запомнить значение цифры в операторе: эта цифра (n) показывает, каким по счету будет второе слово после первого.

Например, если в запросе написано: [редкий /1 блог], то в выдаче будет «редкий блог». Потому что слово «блог» будет первым после слова «редкий».

Если в запросе написано: [редкий /2 блог], то в выдаче может появиться «редкая птица блог», потому что слово «блог» может быть вторым после слова «редкий», а первым может быть любое другое слово.

Мы надеемся, что это понятно, поэтому расскажем еще о двух нюансах оператора расстояния между словами.

На самом деле, по запросу [редкий /2 блог] документы, содержащие «редкий блог», также будут выданы, потому что меньшее значение расстояния возможно, а большее – нет. Мало того, не только «редкий блог», но и «блог редкий» попадут в выдачу. Расстояние между словами распространяется на оба слова.

Легко проверить, что это эквивалентно запросу: [редкий /1 блог ~ (блог /+1 редкий)].

Количество документов в выдаче совпадает, и в первых рядах в момент составления запроса был: Fashion – Мода стиль и красота.

И строчки Зъявински, и иллюстрации Брауна пользователи мгновенно растащили по всему миру – редкий блог пропустил Future Fetish.

Мы не будем загружать читателя дальнейшими подробностями работы оператора «расстояние между словами», так как сказанного вполне достаточно, а изучение всех нюансов поискового движка Яндекса не является нашей основной задачей.

Оператор «двойные кавычки» (аналогичные тем, что применяются в прямой речи). Используют в случае, когда необходим поиск точной фразы. Это бывает важно, когда необходимо найти чью-либо цитату, либо рекламный слоган компании, либо сайты, содержащие одинаковые фрагменты текста.

В выдаче при поиске цитаты будут документы, содержащие все ее слова, в той же словоформе и последовательности, что и в самой цитате.

Если вас интересует только цитата, без каких-либо других слов в запросе, то вы можете просто ввести ее в кавычках – и получите результат. Однако если кроме цитаты вы хотите включить в запрос какие-то другие слова, в кавычки не заключенные, то спрогнозировать результат в Яндексе вряд ли возможно. Дело в том, что Яндекс время от времени меняет алгоритм работы оператора «кавычки».

Периодически допускается сохранение порядка слов, но меняются их словоформы. В другое время Яндекс может, например, словоформы сохранять неизменными, но исключать стоп-слова и т. д. Чтобы не проводить постоянных экспериментов, мы считаем наиболее правильным прислушаться к совету Дениса Фурсова.

? Официальная документация сообщает, что «порядок слов можно указать с помощью запроса в кавычках». Это не так: кавычки также задают и форму слов. То есть запросом “красными шапочками” вы «красную шапочку» не найдете. Отношение Яндекса к словам в кавычках неоднократно менялось: когда-то требовалось совпадение формы, потом учитывался только порядок слов, затем форма учитывалась, если в запросе было только словосочетание в кавычках и больше ничего. Думаю, это еще далеко не конец. В общем случае, если вам важен порядок слов и не важна их форма, используйте оператор расстояния /+1 – его действие на протяжении лет не менялось. Так, умная хороший мальчики – 0 результатов, а умная /+1 хороший /+1 мальчики ищет все формы этих слов и находит множество страниц со словосочетанием умный хороший мальчик[22].

Числоформы (этот термин введен Денисом Фурсовым).

Для того чтобы при запросе какого-либо нужного номера (например, номера приказа или номера телефона) в выдаче вам не попадались посторонние ИНН, маркировки радиоламп и микросхем, а также прочие лишние результаты, рекомендуется перед номером, который вы ищете, поставить восклицательный знак или взять этот номер в кавычки.

Сами номера надо написать во всех возможных вариантах, разделив их оператором «ИЛИ» и объединив в круглую скобку.

Запросы [(тел | телефон) (!123-45-67 | !1234567)] и [(тел | телефон) ( 123-45-67” | 1234567”)] дадут одинаковые результаты. В выдаче: Телефонные анекдоты, смешные разговоры по телефону.

У меня такая запись на автоответчике (допустим ваш номер телефона 123-45-67): «Вы позвонили по телефону 123-45-67».

Поиск на определенном сайте. Оператор имеет вид url=www.url.ru/cat*. Хотим обратить внимание читателя на то, что на сайте Яндекса этот оператор имеет вид url=www.URL.ru/cat/* с косой чертой в конце. Наш опыт показывает, что эта косая черта часто ухудшает результаты выдачи, поэтому мы рекомендуем записывать оператор без нее – url=www.URL.ru/cat*. Обратите внимание на «звездочку» в конце адреса. Это символ маски, который означает, что нас устраивает любая страница сайта, адрес которой начинается так, как написано слева от «звездочки».

Чтобы воспользоваться оператором, позволяющим проводить поиск на определенном сайте, лучше скопировать его целиком из таблицы на сайте Яндекса в разделе «Язык запросов», а затем заменить в нем адрес на нужный пользователю, нежели вводить вручную. Так можно свести к минимуму риск орфографической ошибки.

Операторы поиска на определенном сайте можно сгруппировать так, чтобы поиск проводился на группе сайтов. Денис Фурсов приводит пример поиска слова «работа» на сайтах www.ko.by и www.superjob.ru, который дает в общей сложности почти 800 страниц.

–
ПРИМЕР
Запрос: [работа && (URL =”www.ko.by*” | URL =”www.superjob.ru*”)]
Результат поиска: страниц – 39 299, сайтов – не менее 2, в каталоге – 2.
В выдаче: Кадровое агентство Коллекция Открытий … кадры, работа в Минске, работа в…
В/о, опыт работы от двух лет, ответственность за организацию работ на строительном участке, контроль качества, объема, сроков выполнения работ…
В/о или средне-специальное (желательно ПГС). Опыт работы от года, организация работ на строительном участке, контроль качества, объема, сроков…
www.ko.by/vacancy.php?typework=all 163 КБ и Работа должна доставлять удовольствие! Социологические опросы «Работа ради работы – это извращение»;
«Другое дело – получать удовлетворение от хорошо выполненной работы»; «…если работа начала доставлять удовольствие, значит, пора разводиться».
www.superjob.ru/research/articles/478/ 66 КБ
–

Оператор ссылки(link). Он показывает, какие внешние сайты содержат ссылку на сайт, указанный в запросе. Это один из самых важных для конкурентной разведки операторов, поскольку позволяет найти друзей или союзников конкурента, часто ведет на личные странички бывших или действующих сотрудников компаний, может привести к размещенным сотрудниками объявлениям о поиске работы или, например, выявить аффилированные структуры.

Записывается оператор следующим образом:

link=”www.url.ru/cat/*”

Как и в предыдущем случае, мы рекомендуем убирать последнюю косую черту, после которой указан символ «звездочка». Если надо найти ключевое слово в ссылающихся страницах, то оператор link сочетается с обычными ключевыми словами, отделяясь от них двойным амперсандом.

Например, зададим поиск слова «креатив» в сайтах, ссылающихся на сайт издательства «Вершина» www.vershinabooks.ru

–
ПРИМЕР
Запрос: [креатив && link=”www.vershinabooks.ru*”] Результат поиска: страниц – 48, сайтов – не менее 10. В выдаче: Издательство деловой литературы «Вершина».
Зарегистрироваться
Креатив как бизнес и бизнес как креатив.
www.vershinabooks.ru/books/book435.html · 14 КБ
–

ВНИМАНИЕ! Оператор link показывает ссылки на сайт так, как он указан в тексте ссылки. В настоящее время стало стандартом де-факто, что сайты одинаково открываются, как при вводе адреса с «www», так и без «www». Запрос, приведенный выше (с «www») покажет только те ссылки, где «www» присутствует в тексте ссылки и не покажет те ссылки, где его в тексте ссылки нет. Поэтому имеет смысл делать также запрос: [креатив && link=”vershinabooks.ru*”]. Результат поиска: страниц – 1211, сайтов – не менее 74.

При этом можно еще раз проиллюстрировать влияние знака «плюс» на результат выдачи в Яндексе.

–
ПРИМЕР
Запрос: [+креатив && link=”vershinabooks.ru*”]
Результат поиска: страниц – 31, сайтов – не менее 9.
–

Остальные страницы, показанные в предыдущем запросе, ссылались на сайт издательства «Вершина», но слова «креатив» не содержали.

Оператор поиска в заголовке страницы. Для тех, кто не занимается сайтами профессионально, напомним, что заголовок страницы – это то, что написано на синем (для Windows XP) поле в самом верху экрана, как бы уже за пределами страницы, на ее рамке. А с точки зрения разметки HTML, эта часть сайта заключена внутри тега «TITLE».

Яндекс справедливо считает, что если ключевое слово содержится в самом заголовке страницы, значит, эта страница точно имеет непосредственное отношение к запросу.

Каким образом выглядит синтаксис оператора, покажем на примере поиска слова «разведка» на страницах, содержащих в заголовке словосочетание «ИПК УГТУ».

–
ПРИМЕР
Запрос: [+разведка && $title (маркетинг)]
Результат поиска: страниц – 10 800, сайтов – не менее 1136.
В выдаче: Книга «Конкурентная разведка: маркетинг…
Презентация книги «Конкурентная разведка: маркетинг рисков и возможностей» на «Галерее продаж» в Москве 2 декабря 2005 года. Читатель узнает, где и как взять информацию, какие технические средства использовать, куда «влить» свою службу разведки и как обнаружить разведку…
ci-razvedka.narod.ru/Kniga.html 9 КБ
–

Остальные операторы языка запросов Яндекса представляют меньший практический интерес, хотя и значительно разнообразят возможности поиска. Ознакомиться с ними можно на странице помощи в Яндексе[23], пройдя по ссылкам «Помощь – Как искать – Язык запросов».

Поиск в Гугле

Гугл становится все более популярным. За ним стоит колоссальный финансовый ресурс, которым грамотно распоряжаются. Так, по словам инженера по программному обеспечению Гугла Мэта Катса, уже в 2002 году каждые 28 дней эта поисковая система индексировала 3 миллиарда веб-документов, в том числе более 3 миллионов новых страниц каждый день.

Гугл в чем-то проигрывает Яндексу, а в чем-то выигрывает у него. Поскольку об операторах Яндекса читатель уже знает, то для удобства при рассказе об операторах Гугла будем в ряде случаев проводить их сравнение.

Основы поиска. Чтобы ввести запрос, напечатайте ключевые слова и нажмите Enter либо щелкните кнопку «Поиск в Google».

Гугл использует интеллектуальную технику анализа текстов, которая позволяет искать важные и вместе с тем релевантные страницы по вашему запросу. Для этого он анализирует не только ту страницу, которая соответствует запросу, но и те, что на нее ссылаются, чтобы определить ценность этой страницы для целей вашего запроса. Кроме того, Гугл предпочитает страницы, на которых ключевые слова, введенные вами, расположены недалеко друг от друга.

Показ ключевых слов в результатах. Первый способ увидеть ключевые слова заключается в том, что каждый раз в списке найденных страниц Гугл показывает отрывок из текста на странице, выделяя в этом отрывке ключевые слова. Тем самым облегчается обнаружение ключевых слов в тексте. Второй способ – загрузить страницу по ссылке «Сохранено в кэше». Недостаток этого способа (конкурентная разведка нередко это рассматривает как преимущество) – в том, что вы видите не ту страницу, которая есть сегодня, а ту, которая сохранена в базе Гугла. Изначально эта опция была придумана для того, чтобы сохранить возможность просмотра страницы даже в тех случаях, когда сервер, на котором эта страница расположена, недоступен.

Третий способ – традиционный для просмотра текста в браузере – использовать сочетание клавиш CTRL+F. Появится окно «Найти», в которое вводятся искомые слова. Раскладка клавиатуры, установленная в этот момент на компьютере, значения не имеет.

Логическое «И». В отличие от Яндекса, в Гугле всего одно логическое «И», оно наиболее близко к оператору Яндекса && в сочетании с оператором «плюс», поставленным перед каждым словом запроса. Это логическое «И» позволяет выдавать документы, которые принудительно содержат ключевые слова в любом месте текста. По умолчанию при написании слов запроса через пробел Гугл ищет документы, содержащие все слова запроса.

–
ПРИМЕР
Запрос: [литейщик провизор стоматолог маркшейдер]
Результат поиска: 1–10 из примерно 37 для литейщик провизор стоматолог маркшейдер.
В выдаче: Общероссийский классификатор занятий ОК 010-93 (ОКЗ) (утв…
Примеры профессий, входящих в данную базовую группу: Фармацевт Провизор Базовая… Вальцовщик гидроизоляционных материа лов Литейщик облицовочных плиток… www.magister.msk.ru/library/economic/work/ok010.txt – 952k -
Поиск вакансии
…ВРАЧ-РЕНТГЕНОЛОГ, ВРАЧ-СТОМАТОЛОГ, ВРАЧ-СТОМАТОЛОГ-ХИРУРГ, ВРАЧ-ТЕРАПЕВТ… НА МАШИНАХ ДЛЯ ЛИТЬЯ ПОД ДАВЛЕН, ЛИТЕЙЩИК САНИТАРНО-СТРОИТЕЛЬНЫХ ИЗДЕЛИЙ…
d37.chtts.ru/vac/edrd.asp – 63k
–

Интересно, что Гугл может показать и те страницы, на кoтopыx нет ключевых слов, но эти слова содержатся в ссылках на показанную страницу. В таком случае при просмотре страницы с помощью ссылки «Сохранено в кэше» будет видна надпись: «Эти слова присутствуют только в ссылках на эту страницу».

Логическое «ИЛИ». Пишется с помощью оператора OR, либо, как и в Яндексе, с помощью символа вертикальной черты | Обратите внимание, что оператор OR должен быть написан заглавными буквами и отделен пробелами с обеих сторон от слов, расположенных перед ним и после него.

Важно знать, что, в отличие от Яндекса, Гугл не поддерживает такой оператор, как скобки.

–
ПРИМЕР
Запрос: [литейщик OR провизор OR стоматолог OR маркшейдер], либо [литейщик | провизор | стоматолог | маркшейдер]
Результат поиска: 1–10 примерно из 2 330 000 для литейщик | провизор | стоматолог | маркшейдер либо
1–10 примерно из 2 330 000 для литейщик OR провизор OR стоматолог OR маркшейдер.
–

Заглавные буквы или прописные? Гугл, в отличие от Яндекса, не чувствителен к регистру. Все буквы воспринимаются как прописные, вне зависимости от того, как их вводили в поисковую строку. Запросы [Эйфелева Башня], [Эйфелева башня] и [эйфелева башня] дадут одинаковые результаты.

–
ПРИМЕР (результат на момент написания книги)
Результат поиска: 1–10 примерно из 511 000 для Эйфелева Башня.
Результат поиска: 1–10 примерно из 511 000 для эйфелева башня.
–

Стоп-слова. В хэлпах (так часто называют раздел «Помощь» в онлайновых сервисах) написано, что Гугл, подобно большинству поисковых машин, игнорирует стоп-слова. Кроме того, хэлпы говорят о том, что, как и многие другие поисковые машины, Гугл имеет механизм принудительного включения стоп-слов в результаты поиска. К стоп-словам относятся большинство артиклей английского языка, а также союзов и предлогов русского языка. В реальности ситуация, похоже, изменилась.

–
ПРИМЕР
Запрос 1: [в]
Результат поиска: 1–10 примерно из 619 000 000 для в.
Запрос 2: [the]
Результат поиска: 1–10 из примерно 5 620 000 000 для the.
–

Оператор «плюс» (+). Тем не менее бывают ситуации, когда надо принудительно включить в текст какое-либо слово, которое может иметь варианты написания. В хэлпе Гугла приводится пример с запросом «Star Wars Episode I», где римская единица представляет собой латинскую букву I (Ай).

–
ПРИМЕР
Запрос 1: [Star Wars Episode I]
Результат поиска: 1–10 примерно из 3 150 000 для Star Wars Episode I.
В том числе в выдаче появятся слова «Episode II», «Episode IV» и т. п.
Запрос 2: [Star Wars Episode +I]
Результат поиска: 1–10 примерно из 2 810 000 для Star Wars Episode +I.
–

И в него войдут только тексты, содержащие слово «Episode I».

Морфология слов. Гугл официально подтвердил, что поддерживает морфологию русского языка. Правда, делает он это не так, как многие другие поисковые машины. С одной стороны, алгоритм поддержки русского языка Гуглом дает возможность видеть не только словоформы, но и другие части речи, а с другой стороны, не все словоформы редких слов поддерживаются на практике. О плюсах этого алгоритма сотрудник Гугла Александр Грушецкий на официальном блоге заявил следующее.

? Сейчас… мы умеем обращаться с морфологией и знаем другие особенности русского. Поэтому когда это нужно, мы ищем не только слова из вашего запроса, но и их различные формы. Реализовать морфологию было довольно просто, но традиционные подходы имеют множество недостатков. Мы же выбираем алгоритмы, которые в первую очередь улучшают качество результатов реальных пользовательских запросов и избавляют вас как от необходимости набирать различные варианты одного запроса, так и от просмотра множества не интересующих вас страниц. Мы постоянно изменяем и совершенствуем наши алгоритмы и пополняем арсенал трюков по обработке слов. Например, традиционная реализация русской морфологии не поддерживает множество других полезных преобразований слов. Теперь же, например, для запроса как лечить ожог будут также найдены страницы, содержащие лечение ожогов, для звон колокола – колокольный звон, для футбол английский чемпионат – чемпионат Англии по футболу, а для русификация ICQ – русификатор ICQ.
Также чрезмерное увлечение морфологией чаще вредит, чем помогает. Поэтому мы стараемся использовать словоформы там и тогда, где это действительно нужно, и делать это как можно аккуратнее. Например, «готов к войне» не имеет отношения к запросу «война с готами», ответом на вопрос кто такие таты будет явно не тату, а для запроса мыть кошку больше подойдет мытье кошек, чем моя кошка. Кстати, вы всегда можете полностью отключить использование форм слова, поставив оператор «+» перед словом или взяв его в кавычки. Например, для запроса звон + колокола или звон «колокола», будет найдено только точное вхождение слова колокола, а вот колокольный звон найден не будет.
Но на самом деле вам не нужно знать все эти тонкости. Вам просто нужно искать, как вы обычно это делаете, а мы найдем то, что вам нужно.

Ограничение возможностей работы Гугла со словоформами редких слов видно на примере словосочетания «глоклая куздра»[24].

–
ПРИМЕР
Запрос 1: [глоклая куздра]
Результат поиска: 1–10 примерно из 50 для глоклая куздра.
Запрос 2: [глоклую куздру]
Результат поиска: 1–3 из 3 для глоклую куздру.
Запрос 3: [глоклой куздре]
Результат поиска: 1–6 из 6 для глоклой куздре.
–

Просто для сравнения приведем результат Яндекса. По всем трем запросам о глоклой куздре Яндекс давал на момент написания книги одинаковый результат.

Результат поиска: страниц – 52, сайтов – не менее 22.

Мы рекомендуем в ответственных случаях вводить важные слова в разных словоформах вручную, чтобы избежать ошибок.

Ниже будут показаны случаи, когда даже по общеупотребительным словам Гугл словоформы обрабатывает не вполне корректно.

–
ПРИМЕР
Запрос 1: [журавль]
Результат поиска: 1–10 примерно из 656 000 для журавль.
В выдаче: ЖУРАВЛЬ СЕРЫЙ
ЖУРАВЛЬ СЕРЫЙ (Grus grus) это как раз тот самый журавль, чьи звонкие крики мы сльшим высоко в небе весной и осенью. Это крупная птица ростом около 125 см и… www.floranimal.ru/pages/animal/zh/1325.html – 22k.
Запрос 2: [журавль -журавль]
Результат: 1–10 из примерно 322 000 для журавль –журавль.
В выдаче: Гамзатов, Расул.
ЖУРАВЛИ Мне кажется порою, что солдаты, С кровавых не пришедшие полей… Сегодня, предвечернею порою, Я вижу, как в тумане журавли Летят своим… www.litera.ru/stixiya/authors/gamzatov/mne-kazhetsya-poroyu.html – 6k.
–

Улучшение запроса во время поиска. По мере того как вы проводите поиск, в найденных текстах обнаруживаются слова, которые вы упустили из виду, создавая запрос. В ряде случаев результаты станут точнее, если по этим словам проводить поиск дополнительно, составляя отдельные запросы. Подчеркнем особо – это должны быть именно отдельные запросы. Если же добавлять эти слова к уже имеющемуся запросу, то можно иногда излишне сузить диапазон результатов – ведь Гугл будет пытаться выдать документ, в котором содержатся все слова запроса.

Исключение слов из запроса. Логическое «НЕ». Как известно, при составлении запроса часто встречается информационный мусор. Чтобы его удалить, стандартно используются операторы исключения – логическое «НЕ». В Гугле такой оператор представлен знаком «минус» – идентичным оператору Яндекса «двойная тильда» (~~). Используя этот оператор, можно исключать из результатов поиска те страницы, которые содержат в тексте определенные слова.

–
ПРИМЕР
Запрос 1: [Журавль колодец]
Результат поиска:1–10 из примерно 91 200 для Журавль колодец.
Запрос 2: [ Журавль колодец -птица ]
Результат поиска: 1–10 из примерно 40 400 для Журавль колодец-птица. Запрос 3: [Журавль колодец -птица]
Результат 1–10 из примерно 508 000 для Журавль -колодец -птица.
–

Кстати, в этом запросе также проявилось, на наш взгляд, несовершенство поддержки морфологии русского языка Гуглом. Так, в момент написания книги в выдаче присутствовал текст, содержащий слово «птицы»: СЕМЕЙСТВО ЖУРАВЛИ.

–
ПРИМЕР
Семейство ЖУРАВЛИ (Gruidae). К семейству журавлиных относятся крупные длинноногие птицы с длинной шеей и прямым копьевидным клювом…
www.floranimal.ru/families/4295.html – 16k.
Запрос 3: [Журавль -колодец -птица -птицы]
Результат поиска: 1–10 примерно из 450 000 для Журавль -колодец -птица -птицы.
И в результатах по этому запросу документа со словом «птицы», приведенного выше, не оказалось.
Запрос 4: [Журавль -колодец -птица -птицы -журавли]
Результат поиска: 1–10 примерно из 432 000 для Журавль -колодец -птица -птицы -журавли.
–

Поиск точной фразы. Точная фраза на практике, как мы уже говорили, требуется либо при поиске текста определенного произведения, либо при поиске определенных продуктов или компаний, в которых название или часть описания представляет собой стабильно повторяющееся словосочетание.

Чтобы справиться с поиском точной фразы при помощи Гугла, требуется заключить запрос в двойные кавычки.

–
ПРИМЕР
Забавным, но показательным примером может быть задание из учебника русского языка для седьмого класса под редакцией Н. М. Шанского. На странице 45 приведено задание разделить текст на абзацы. Фрагмент взят из произведения М. Шолохова (название не указано):
«За Доном в лесу прижилась тихая, ласковая осень. С шелестом падали с тополей сухие листья. Кусты шиповника стояли, будто объятые пламенем, и красные ягоды в редкой листве их пылали, как огненные язычки».
–

Введем этот текст в кавычках в Гугл.

–
ПРИМЕР
Результат поиска: 1–3 из 3 для «За Доном в лесу прижилась тихая, ласковая осень. С шелестом падали с тополей сухие листья. Кусты шиповника стояли, будто объятые пламенем, и красные ягоды в редкой листве их пылали, как огненные язычки». Как выяснилось, это отрывок из «Тихого Дона» (книги четвертой). А забавность примера в том, что у Шолохова этот текст оказался вообще не разбитым на абзацы.
–

Гугл воспринимает как знаки, связывающие слова в единую фразу, не только кавычки, но и дефис, слэш (косую черту), точку, знак равенства, апостроф.

Результат поиска: 1–10 из примерно 124 000 для мать-и-мачеха.

Результат поиска: 1–10 из примерно 124 000 для мать-и-мачеха.

Во всех вышеприведенных случаях первым в выдаче стоит текст, фрагмент которого приведен ниже: «Мать-и-мачеха(Tussilago farfara) – одно из самых раноцветущих растений: зацветает в … Как лекарственное растение мать-и-мачеха применяется, прежде всего…»

При этом все три слова – «мать», «и», «мачеха» – рассматриваются как отдельные, но стоящие рядом и в этой последовательности.

Интересно, что по запросу [мать-и-мачеха] оказалось на 100 документов больше, чем по остальным, но если взять это слово в кавычки, то результат уравнивается.

–
ПРИМЕР
Запрос: [“мать-и-мачеха”]
Результат поиска: 1–10 примерно из 27 300 для “мать-и-мачеха”.
Чтобы прояснить этот казус, введем запрос такого вида: [мать-и-мачеха – “мать-и-мачеха”].
Результат поиска: 1–10 из примерно 35 для “мать-и-мачеха”. В выдаче: Санкт-Петербургская Федерация Настольного ФутболаМатьимачеха. Королев Петр Трушков Кирилл. 2. Экспромт. Гриневич Василий… Мать-имачеха – игроки получают по 60 рейтинговых очков; Экспромт – игроки… www.kickerclub.spb.ru/tournaments/2005-09-03.html 17k
–

Количество слов в строке поиска. Во многих источниках встречается информация, что поисковая строка Гугла вмещает 10 слов или что Гугл проводит поиск только по 10 словам.

На момент написания книги Гугл учитывал в запросе 32 слова, а все последующие слова игнорировал. Это хорошо видно, если ввести запрос, содержащий числительные подряд. Например, числа с 1 до 35. В результатах как релевантные отображаются только первые 32 слова запроса: [+1 +2 +3 +4 +5 +6 +7 +8 +9 +10 +11 +12 +13 +14 +15 +16 +17 +18 +19 +20 +21 +22 +23 +24 +25 +26 +27 +28 +29 +30 +31 +32 +33 +34 +35].

Результат поиска: 1–10 из примерно 381 000 000 для +1 +2 +3 +4 +5 +6 +7 +8 +9 +10 +11 +12 +13 +14 +15 +16 +17 +18 +19 +20 +21 +22 +23 +24 +25 +26 +27 +28 +29 +30 +31 +32 +33 +34 +35. В выдаче: Тематический рубрикатор.

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52… www.amr.ru/topics/index.php?PAGEN_2=8 – 72k -.

В кэше подчеркнуты только 32 слова, и в тексте они также присутствуют.

Стемминг (а также wildcard). Стемминг – возможность усечения слова до его корня. После этого усечения производится поиск релевантных вариантов слов, производных от него. Другими словами, стемминг позволяет искать все однокоренные слова. Техника поиска по маске (wildcard) представляет собой написание базового слова (или его части), после которых идет символ маски – «звездочка» (*), заменяющая собой любое возможное продолжение слова. Таким образом, если поисковая машина поддерживает поиск по маске, то ищутся все слова, которые одинаково начинаются. Эта техника особенно удобна, когда вам неизвестно точное написание конкретного слова либо когда вы хотите включить все возможные варианты слова в свой поиск.

Например, когда по запросу [тарт*] получают как «тарталетку», так и «тартар». Так вот, Гугл эти технологии не поддерживает (как и Яндекс). Зато он поддерживает вариант, когда вместо целого слова вводится звездочка.

Например, по запросу [красная * площадь] будет выдано: «Красная, Манежная площади», с подчеркиванием всех этих слов. В какой-то степени это похоже на поиск с расстоянием между словами, применяемый в Яндексе.

По запросу [красная * * площадь] будет выдано: «Рамблер-Фото > fanphoto > Красная и Манежная площади, Коломенское; Красная и Манежная площади; Воробьевы горы Кошки Цветы Зоопарк 2007 Еще метро Метро Поклонная гора Зоопарк 2006 ВДНХ Царицыно… foto.rambler.ru/users/fanphoto/11/ – 35k –».

По запросу [красная *** площадь] будет выдано: «Афиша: Новосибирск / Места / Магазины / Обувь Любым, Гагаринская, Заельцовская, Красный проспект, Маршала Покрышкина, Площадь Гарина-Михайловского, Площадь Ленина, Площадь Маркса, Речной вокзал… novosibirsk.afisha.ru/places/catalogue/?id=969066 – 31k».

Дополнительные операторы.

1. Оператор cache: – поисковая машина хранит версию текста, которая проиндексирована поисковым пауком, в специальном хранилище в формате, называемом кэшем. Кэшированную версию страницы можно извлечь, если оригинальная недоступна (например, не работает сервер, на котором она хранится). Кэшированная страница показывается в том виде, в котором она хранится в базе данных поисковой машины, и при показе пользователю сопровождается надписью наверху о том, что это страница из кэша. Там же содержится информация о времени создания кэшированной версии. На странице из кэша ключевые слова запроса для удобства пользователя подсвечены, причем каждое из них своим цветом.

Например: «Это сохраненная в кэше Google копия страницы http://ci-razvedka.com/, записанная 20 май 2007 20:10:24 GMT».

Сохраненные в кэше Гугла страницы показываются в том виде, в каком они находились в момент добавления в нашу базу. Можно создать запрос, который сразу будет выдавать кэшированную версию страницы с определенным адресом. Например, запрос [cache:www.ci-razvedka.ru] будет сразу выдавать версию страницы www.ci-razvedka.ru из кэша, а не проверять ее нынешнее состояние.

ВНИМАНИЕ! Пробела между оператором cashe: и URL’ом запрашиваемой страницы быть не должно.

Если вы хотите, чтобы ключевые слова на кэшированной версии страницы были подчеркнуты, их надо через пробел указать после оператора cashe: и адреса страницы. Например: [cache:www.ci-razvedka.ru книга]

2. Оператор info: позволяет увидеть информацию, которая известна Гуглу о данной странице. Например, запрос [info:www.ru-ci.ru] дает следующий результат: Ющук Евгений Леонидович. Конкурентная разведка и Информационная…

Публикации по теме негативных пиар-технологий. Сайт Невидимый Интернет. Материалы по теме информационной войны, размещаемые на этом сайте… ru-ci.ru/». Гугл может показать следующую информацию об этом адресе:

> сохраненную в Google версию www.ru-ci.ru;
> страницы, похожие на www.ru-ci.ru;
> страницы, ссылающиеся на www.ru-ci.ru;
> страницы на сайте www.ru-ci.ru;
> страницы, упоминающие ссылку www.ru-ci.ru.

Важно, что запрос без «www», например, [info:ru-ci.ru], даст другие результаты – прежде всего потому, что в тексте полученных по такому запросу ссылок, которые ведут на этот сайт, адрес прописан без «www».

ВНИМАНИЕ! Пробела между оператором info: и URL’ом запрашиваемой страницы быть не должно.

3. Оператор site: ограничивает поиск конкретным доменом. То есть если сделать запрос [маркетинг разведка site:ci-razvedka.ru], то результаты будут получены со страниц, содержащих слова «маркетинг» и «разведка» именно в домене «ci-razvedka.ru», а не в других частях Интернета.

Результат поиска: 1–10 из приблизительно 81 из домена ci-razvedka.ru для маркетинг разведка.

Если сделать запрос [scip site:ru] то будут получены документы, содержащие слово «scip» и расположенные в доменной зоне «.ru».

ВНИМАНИЕ! пробела между оператором site: и URL ’ом запрашиваемой страницы быть не должно.

4. Оператор link: позволяет увидеть все страницы, ссылающиеся на страницу, по которой сделан запрос. Например, по запросу [link: www.livejournal.com/community/kubok/45852.html] будут получены известные Гуглу ссылки на статью о поиске через Яндекс, написанную liveuser.

ВНИМАНИЕ! Пробела между оператором link: и URL’ом запрашиваемой страницы быть не должно.

5. Оператор allintitle: (переводится как «все – в заголовке»). Если начать запрос с этого оператора, то Гугл выдаст тексты, в которых все слова запроса содержатся в заголовках (внутри тега Title в HTML). Например, запрос [allintitle: википедия яндекс] даст результаты, где слова «википедия» и «яндекс» содержится внутри тега Title на просмотренных поисковой машиной страницах.

Результат поиска (на момент написания книги): 1–5 из 5 для allintitle: википедия яндекс.

6. Оператор intitle: показывает страницы, в заголовке кoтopыx содержится только то слово, которое стоит непосредственно после оператора intitle: Все остальные слова запроса могут быть в любом месте текста. Если поставить оператор intitle: перед каждым словом запроса, это будет эквивалентно использованию оператора allintitle:

–
ПРИМЕР
Запрос: [intitle:википедия яндекс]
Результат поиска (на момент написания книги): 1–10 из примерно 21 300 для intitle:википедия яндекс.
–

ВНИМАНИЕ! Пробела между оператором intitle: и последующим словом быть не должно.

7. Оператор allinur: – если запрос начинается с оператора allinurl:, то поиск ограничен теми документами, в которых все слова запроса содержатся только в адресе страницы, т. е. в URL.

–
ПРИМЕР
Запрос: [allinurl: narod razvedka]
Результат поиска: 1–10 примерно из 79 для allinurl : narod razvedka
–

ВНИМАНИЕ! Оператор allinurl: работает только со словами, но не со служебными фрагментами URL. Такие специальные символы, как слэш или точка, не окажут положительного влияния на результат. Зато они окажут отрицательное влияние, так как могут быть восприняты Гуглом как попытка ввести в запрос точную фразу. Например, запрос [allinurl: narod.razvedka], равно как и [allinurl : narod/razvedka] результата не дал вообще.

8. Оператор inurl : – слово, которое расположено непосредственно слитно с оператором inurl :, будет найдено только в адресе страницы Интернета, а остальные слова – в любом месте такой страницы. Например, для того, чтобы найти слово «разведка» на сайтах, содержащих в адресе сочетание букв «tc», можно сделать такой запрос: [inurl :tc razvedka]. Результат поиска (на момент написания книги): 1–1 из 1 для inurl :tc razvedka. Кроме того, Гугл выдал текст: «Otryady-5Razvedka okazalas’ neskol’ko utomitel’noi (obratno shli V lavirovku). Poetomu kpirsu my podoshli sovershenno izmuchennye: no ne stol’ko samoi razvedkoi… www-lat.rusf.ru/tc/tc08/08otr5.htm». Если оператор inurl: поставить перед каждым словом запроса, это будет эквивалентно использованию оператора allinurl :

ВНИМАНИЕ! Пробела между оператором inurl: и последующим словом быть не должно. Оператор inurl : работает только со словами, но не со служебными фрагментами URL Такие специальные символы как слэш или точка, не окажут положительного влияния на результат. Более того, они могут быть восприняты Гуглом как попытка ввести в запрос точную фразу. Например, запрос [inurl :tc/razvedka], равно как и [inurl :tc.razvedka] результата не дал вообще. Результат мог бы быть, если бы в адресе какой-то страницы содержалась точная фраза «tc/razvedka» или «tc.razvedka». В этом можно убедиться.

–
ПРИМЕР
Запрос 1: [inurl:kubok]
Результат поиска: 1 – 10 из примерно 50 400 для inurl :kubok. И этот
результат начинается с текста: «Кубок по поиску. Recent Entries. Recent
Entries; Archive · Friends · User Info · Открытый Кубок России по поиску
в Интернете… community.livejournal.com/kubok – 39k – ».
Запрос 2: [inurl:kubok/45852]
Результат поиска: 1–1 из 1 для inurl:kubok/45852.
–

И этот результат начинается с текста: «kubok: Хозяйке на заметку. Поиск через Яндекс для специалистов. Хозяйке на заметку. Поиск через Яндекс для специалистов. Последнее обновление – 18 апреля 2007 г. С тех пор многое могло измениться… www.livejournal.com/community/kubok/45852.html – 124k -».

9. Оператор related: описывает страницы, которые «похожи» на какую-то конкретную страницу.

–
ПРИМЕР
Запрос: [related:it2b.ru]
Результат поиска: 1–10 приблизительно из 30 подобных it2b.ru.
–

Мы не считаем, что все страницы действительно подобны странице сайта it2b.ru с точки зрения человека, а не робота. Большинство страниц в результатах по запросу действительно посвящены тематике безопасности бизнеса или конкурентной разведки.

ВНИМАНИЕ! Пробела между оператором related: и последующим словом быть не должно.

10. Оператор define: выполняет роль своего рода толкового словаря, позволяющего быстро получить определение того слова, которое введено после оператора.

–
ПРИМЕР
Запрос: [define: разведка]
Результат поиска: разведка – определения в Интернете: совокупность мер для сбора данных о действительном или возможном противнике. www.examen.ru/db/Examine/catdoc_id/50EFFB02B0ADF8B2C3256A3A003D797D/rootid/9327995FB7A6D40FC3256A02002CE0D5/defacto.html
–

Интересной особенностью оператора define: является его способность искать определения фразам. В качестве фразы он понимает все слова, написанные после оператора, в том числе и написанные без кавычек, просто через пробел.

–
ПРИМЕР
Запрос: [define: большой взрыв]
Результат поиска: большой взрыв – определения в Интернете: Большой Взрыв – взрывной процесс в котором, по данным современной науки, наша Вселенная родилась из так называемой космологической сингулярности (ru.wikipedia.org/wiki/Большой_Взрыв).
–

Правда, иногда define: может и повеселить либо дать материал для проведения КВН с вопросами, на которые мало кто ответит. В принципе он в состоянии составить конкуренцию анекдотам, с его помощью хорошо начать вести каталог «приколов» на блоге. Это может привлечь туда людей, любящих посмеяться. Например, по запросу [define:ложка] получите такой результат: «ложка – определения в Интернете: блесна, основанная на подражании раненой рыбке (http://fisherman.com.ua/files/fishsay.php)». А по запросу [define:осел] результат будет следующим: «Похожие фразы: буриданов осел. Осел – определения в Интернете: строгий, собранный в кучу, материал (astro.rin.ru/htmls/nostradamus/astro1826-5.html)». А вот, что вы получите по запросу [define:карлсон] : «Похожие фразы: честер карлсон карлсон, честер. Карлсон – определения в Интернете: вентилятор для процессора (netlander.org/culture/humor/dictionary)».

Если сделать запрос [define:ламер], то Гугл даст множество вариантов: «Похожие фразы: ламер вонючий; ламер – определения в Интернете:

> ламер (от англ. lamer) — жаргонное или сленговое прозвище человека, полностью некомпетентентного в той или иной области, но твердо уверенного в обратном (ru.wikipedia.org/wiki/);
> ламер: юзер, регулярно наступающий на грабли, но по-прежнему уверенный что граблей не существует (humour.sysadminday.com.ru/read.phtml);
> человек, который плохо разбирается в компьютерах, начинающий пользователь (pc-terms.com.ru/ru3.html);
> человек, который думает, что все знает; при этом ламеры очень ярко пытаются это продемонстрировать, принося тем самым
некоторые неудобства окружающим – смотрите эпиграф к слову Dial-up… (zcom.skyfamily.ru/st21.htm);
> начинающий юзер, лажбек (www.streetlife.ru/dic/);
> «чайник», мнящий себя крутым (compuhumour.narod.ru/scien ce/ jargon.html);
> неумелый игрок (www.csfight.net/slovar.php);
> полный идиот, не желающий ничему учиться, тупица. Не путать с начинающим пользователем, «чайником». Легко узнать по частому использованию сленга (27194.pbnet.ru/base/view/news/1097887076/9252/full);
> начинающий нетлэндер (netlander.org/culture/humor/dictionary); чайник, возомнивший себя хакером, кул зизопом или еще бог знает кем (www.ekzotika.com/pub22);
> законченный кретин, убежденный чайник (novo.kuban.ru/ dictionary.htm); презрительное – человек, который делает вид, что что-то понимает в каком-либо предмете (обычно в компьютерах/программах), на самом деле ничего не понимая (kag.sc.ru/teoria/slovar_virtualnogo_pilota.html)».

ВНИМАНИЕ! Наличие или отсутствие пробела между оператором define: и последующим словом на результате не сказывается.

11. Поиск синонимов. В хэлпе Гугла сказано, что если вы хотите найти тексты, содержащие не только ваши ключевые слова, но и их синонимы, то можно воспользоваться оператором «~».

Нам не удалось найти подтверждения этому утверждению. Так, мы сравнили два запроса и не нашли разницы.

–
ПРИМЕР
Запрос 1: [~опережающий ~разведка]
Результат поиска: 1-10 примерно из 43 600 для ~опережающий ~разведка.
Запрос 2: [опережающий разведка]
Результат поиска: 1-10 примерно из 43 600 для опережающий разведка.
–

12. Поиск числовых значений – для тех, кому приходится работать с цифрами, Гугл дал возможность искать диапазоны между числами. Для того чтобы найти все страницы, содержащие числа в неком диапазоне от… до, надо между этими крайними значениями поставить две точки.

–
ПРИМЕР
Запрос 1: [численность населения 1913…1917]
Результат поиска: Народная энциклопедия городов и регионов России. Города. Санкт… Подчиненные поселки городского типа, численность населения на 1.01.2000… Вскоре после начала Первой мировой войны актом от 18 (31) августа 1914 г… rfdata.al.ru/auto/city/18/667.HTM (с выделенным числом «1914»);
а также:
Известия Уральского государственного университета № 9 (1998… За 192 года своего существования с 1723 по 1915 гг. численность населения города увеличилась в 28 раз, достигнув 112 тыс. чел. Следует отметить, что город… proceedings.usu.ru/…/0009(03_05-1998)&xsln=showArticle. xslt&id=a14&doc=../content.jsp (с выделенным числом «1915»).
–

Подобный пример приведен в хэлпе Гугла на примере цены DVD: [DVD player $50..$100].

13. Кнопка «Мне повезет» (в английском варианте I’m Feeling Lucky) расположена на главной странице Гугла. На наш взгляд, это замечательная идея. По этой кнопке Гугл выдает наиболее релевантный с его точки зрения, результат. Обычно это помогает при быстром поиске какой-то фактической информации, когда не требуется подробного изучения вопроса. После нажатия кнопки «Мне повезет» вы попадаете непосредственно на сайт, который Гугл предлагает в качестве искомого. Например, запрос по кнопке «Мне повезет» [издательство вершина] открывает непосредственно сайт издательства «Вершина»: www.vershinabooks.ru

Поиск в Рамблере

Операторы Рамблера в данном разделе будут рассматриваться в сравнении с операторами Яндекса и Гугла, и на тех из них, что имеют аналоги в двух других поисковых машинах, мы не станем останавливаться слишком подробно. Основные подробности данного раздела касаются именно отличий Рамблера от Яндекса и Гугла.

Еще год назад мы говорили, что Рамблер, на наш взгляд, является третьей по значимости поисковой машиной для работы с русскоязычными текстами. Причем это третье место находилось на очень значительном расстоянии от первых двух. Мы отмечали, что нечасто обращаемся к Рамблеру, поскольку, в зависимости от задачи, обычно начинаем поиск с Яндекса, а затем идем в Гугл, или наоборот – начинаем с Гугла, а затем уточняем результат в Яндексе. На тот момент в большинстве случаев этого было достаточно при работе с каким-то фактическим материалом, когда требовалась не полнота ответа, а правильность.

Сегодня ситуация изменилась. Рамблер, по нашему мнению, ощутимо улучшил свою работу как поисковая машина, а также ввел очень интересный инструмент: стал показывать документы, проиндексированные недавно, т. е. в течение последних нескольких часов. Чтобы воспользоваться этой функцией, надо после получения страницы с результатами поиска по запросу нажать на гиперссылку с данными о найденных страницах, расположенную под поисковой строкой. Она выглядит как число после слова «новых». Вот пример по запросу Спелеолог (число «23» – это гиперссылка, перейдя по которой можно увидеть недавно проиндексированные документы): «Вы искали: Ющук Евгений Леонидович, найдено сайтов: 158, документов: 4436, новых: 23».

Важной особенностью Рамблера является то, что он показывает дату последнего обновления страницы результатов. Например, так: «Обновлено: 26.05.2007 11:25 мск».

Один из ведущих специалистов по автоматизированному поиску информации для целей конкурентной разведки в Интернете Андрей Масалович вообще считает, что наличие перечня последних найденных документов и информации о времени обновления базы – серьезное преимущество, благодаря которому многие специалисты все чаще выбирают Рамблер в качестве поисковика, с которого надо начинать работу по поиску в Интернете (сайт Андрея Масаловича www.tora-centre.ru/).

Кроме того, все, кому приходится заниматься поиском в Интернете профессионально, сходятся во мнении, что только использование нескольких поисковых машин может дать результат, претендующий на полноту ответа на вопрос – одна поисковая машина справиться с подобной задачей не способна. Связано такое положение вещей с тем, что, во-первых, поисковые роботы физически не успевают угнаться за стремительно растущим Интернетом, а во-вторых, с тем, что у разных поисковых машин разные алгоритмы обработки собранной информации, а значит, и разные результаты этой обработки. Наш опыт подтверждает правильность таких выводов.

В результате нет и не может быть полного совпадения результатов поиска в разных поисковых машинах, особенно когда речь идет о редком запросе.

–
ПРИМЕР
Поиск во всех трех системах точной фразы (фрагмента песни) «Дым, дым в твоих глазах» дал на момент написания статьи такие результаты.
Запрос: [“дым, дым в твоих глазах”]
Результат поиска.
Яндекс: страниц – 0.
Гугл: не найдено ни одного документа, соответствующего запросу “дым, дым в твоих глазах”.
Рамблер: Вы искали: “дым, дым в твоих глазах”, найдено сайтов: 1, документов: 1.
Результат этого поиска можно увидеть здесь: www.ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Dym_Dym_v_Glazakh.html
–

Это не значит, что Рамблер лучше всех. Это значит, что нельзя заранее знать, в какой поисковой системе и что именно удастся найти. В этом смысле показателен пример с поиском фразы, также фрагмента редкой песни: «Аэропорт аэропорт ночное зарево огней».

–
ПРИМЕР
Запрос: [“аэропорт аэропорт ночное зарево огней”]
Результат.
Яндекс: страниц – 133, сайтов – не менее 4 http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Yandex.html
Гугл: 1 – 6 из примерно 32 для “аэропорт аэропорт ночное зарево огней”.
http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Google.html
Рамблер: не найдено ни одного документа, полностью соответствующего запросу “аэропорт аэропорт ночное зарево огней”. http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Rambler.html
–

Итак, перейдем к рассмотрению работы с Рамблером. Основой для этого раздела послужили раздел «Помощь» Рамблера (www.rambler.ru/doc/help.shtml) и форма расширенного поиска (www.rambler.ru/cgi-bin/advanced.cgi?set=www).

Ресурсы, которые Рамблер индексирует. По утверждению самого Рамблера, он индексирует сайты, размещенные в следующих доменах первого уровня:

> Российская Федерация: .ru, .su;
> Украина: .ua;
> Белоруссия: .by
> Казахстан: .kz;
> Киргизия: .kg;
> Узбекистан: .uz;
> Грузия: .ge.

Сайты, находящиеся в других доменах, Рамблер, как он сам утверждает, игнорирует.

Для тех, кто хочет, чтобы сайт, расположенный в другой доменной зоне, был проиндексирован Рамблером, этот поисковик оставляет небольшую надежду на успех.

? Если Ваш сайт находится вне названных доменов (например, в зонах .com, .org, .net), но существенная часть сайта содержит русскоязычные материалы или, по Вашему мнению, он может представлять интерес для русскоязычной аудитории Рамблера, Вы можете отослать письмо на адрес search.support@rambler-co.ru с просьбой включить Ваш сайт в число сканируемых, либо заполнить форму обратной связи. Наши сотрудники рассмотрят эту просьбу и примут решение о целесообразности такого включения[25].

Кроме того, Рамблер утверждает, что умеет извлекать гиперссылки из объектов Macromedia Flash, но не индексирует непосредственно сами тексты flash-объектов. Для таких технически продвинутых сайтов специалисты Рамблера советуют создавать HTML-копию.

Поддержка морфологии слов. Рамблер поддерживает морфологию слов по умолчанию. Отключение поддержки морфологии предусмотрено, но требует использования специального оператора – слово должно быть взято в кавычки. Мы сейчас не будем останавливаться на всех особенностях использования кавычек, а поговорим о них ниже. Наш эксперимент подтвердил, что Рамблер морфологию слов действительно поддерживает.

Скобки. Как и Яндекс, Рамблер позволяет использовать скобки для группировки слов и применения ко всем словам, расположенным в скобках, одного оператора, который пишется перед скобкой. Этим он ничем не отличается от Яндекса, поэтому подробнее мы применение скобок рассматривать не будем.

Транслитерация. Люди довольно часто делают опечатки при вводе текста и вместо русских букв печатают их английских «близнецов». Например, часто так происходит с буквой «с». Рамблер говорит, что старается исправлять такие опечатки, но не гарантирует результата. Эксперимент показал, что Рамблер действительно справляется с опечатками транслитерации, если их количество в слове невелико. Приведу часть результатов.

–
ПРИМЕР
Запрос 1 (все буквы русские): [“глОКлАя кУздРА”]
Результат поиска.
Вы искали: “глОКлАя кУздРА”, найдено сайтов: 9, документов: 37.
Запрос 2 (заглавные буквы – латинские): [“глOKлAя кYздPA”]
Результат поиска.
Не найдено ни одного документа, полностью соответствующего запросу
“”глOKлAя кYздPA””.
Запрос 3 (заглавные буквы – латинские): [“глOклая куздPа”]
Результат поиска.
Вы искали: “глOклая куздPа”, найдено сайтов: 9, документов: 37.
–

Чтобы не загружать читателя лишними примерами, скажем лишь, что при трех опечатках правильный поиск еще проводился, но после появления четвертой неправильно написанной буквы результат поиска стал нулевым. Рамблер в этом случае просто порекомендовал пользователям внимательнее относиться к вводу текста.

Регистр букв. Как правило, Рамблер не учитывает регистр, причем распространяет это правило не только на слова запроса, но и на операторы.

Действительно, запросы «глоклая куздра» и «ГлоКЛаЯ КУздРа» дали одинаковые результаты.

–
ПРИМЕР
Запрос 1: [“глоклая куздра”]
Результат поиска.
Вы искали: “глоклая куздра”, найдено сайтов: 12, документов: 44.
Запрос 2: [“ГлоКЛаЯ КУздРа”]
Результат поиска.
Вы искали: “ГлоКЛаЯ КУздРа”, найдено сайтов: 12, документов: 44.
–

Однако Рамблер сообщает, что он делает исключение из этого правила, если в запросе два и более слова подряд написаны с заглавной буквы. По его утверждению, он старается искать эти слова также с заглавной буквы. Таким образом, Рамблер пытается помочь тем, кто ищет имена собственные или географические названия.

В нашем эксперименте это не подтвердилось. Результаты за про са – как с заглавной, так и с прописной буквы – оказались одинаковыми, и в выдаче присутствовали как релевантные слова, написанные в обоих регистрах.

Стоп-слова и оператор «кавычки». Подобно Яндексу, Рамблер при обработке запроса может проигнорировать стоп-слова. Он утверждает, что для принудительного включения стоп-слова (или какого-то другого) в выдачу, нужное слово надо заключить в кавычки.

Эксперимент расставил акценты иначе. Стоп-слова с кавычками и без кавычек попадают в выдачу одинаково, при условии, что кроме них в запросе есть еще не более одного слова. Если, помимо стоп-слова, в запросе присутствуют хотя бы два слова, то стоп-слово игнорируется – как с кавычками, так и без кавычек. Но его все-таки можно принудительно включить в запрос, если, подобно Гуглу и Яндексу, поставить перед словом знак «плюс».

–
ПРИМЕР
Поговорим с пингвином, найдено сайтов: 1044, документов: 49 453, новых: 19.
Поговорим “с” пингвином, найдено сайтов: 1044, документов: 49 453, новых: 19.
Поговорим +с пингвином, найдено сайтов: 471, документов: 2772, новых: 1.
–

Как мы уже говорили, кавычки могут выступать аналогично оператору «восклицательный знак» в Яндексе. Слово, указанное в запросе в кавычках, будет в результатах поиска только в той словоформе, в которой оно написано.

–
ПРИМЕР
Воспользуемся словом, написанным с ошибкой (в этом примере союз «с» написан слитно со словом «большим», чтобы количество документов в выдаче было невелико и было проще оценивать результат):
• с большим уважением отношусь, найдено сайтов 87, документов: 313.
• с большим уважением «отношусь», найдено сайтов 31, документов: 99.
–

В разделе «Помощь» Рамблера приведена еще одна особенность использования кавычек. Процитируем этот фрагмент раздела «Помощь».

? Другой пример – использование кавычек с ужесточающим поиск оператором + (подробнее о нем можно прочесть в главе операторы).
При поиске «что? где? когда?» можно найти «что? где? когда?» и «что где когда». Для ужесточения критерия поиска можно добавить к запросу + +«что? где? когда?». В таком случае в результате будут найдены только страницы с “что? где? когда?”, другое написание будет недопустимо[26].

Логическое «И». Как и в Яндексе и Гугле, роль логического «И» в Рамблере по умолчанию выполняет пробел. Рамблер ввел еще три варианта написания этого оператора, что позволяет влиять на расстояние между словами, им объединенными. Подобно Яндексу, Рамблер достаточно вольно обращается со словами, которые соединены пробелом – он старается дать результаты, где присутствуют все слова запроса, но может затем выдать также те, где на одно-два слова меньше. Если нужное слово ввести в кавычках, оно будет присутствовать обязательно, но лишь в той словоформе, в которой его ввели в запрос.

–
ПРИМЕР
Запрос 1: [кошки собаки верблюды зебры носороги]
Результат поиска.
Вы искали: кошки собаки верблюды зебры носороги, найдено сайтов: 60, документов: 219.
Запрос 2: [“кошки” “собаки” “верблюды” “зебры” “носороги”] Результат.
Вы искали: “кошки” “собаки” “верблюды”… найдено сайтов: 9, документов: 40
–

Во втором случае все без исключения слова запроса принудительно включены в выдачу за счет кавычек, к тому же только в задан ной словоформе, поэтому документов в выдаче значительно меньше.

Существуют модификации логического «И» в Рамблере, которые позволяют управлять расстоянием между словами. Вот цитата из «Помощи» Рамблера: «Оператор && (логическое И). Два запроса, соединенные оператором &&, образуют сложный запрос, которому удовлетворяют только те документы, которые одновременно удовлетворяют обоим этим запросам. Иными словами, по запросу собака && кошка найдутся только те документы, которые содержат и слово «собака», и слово «кошка».

Между тем мы все понимаем, слово «собака» и слово «кошка» на найденной странице могут находиться в самых разнообразных местах – как рядом, в одном предложении, так и в разных предложениях, и даже разных статьях. Для того чтобы дать понять поисковой машине, что слова должны находиться близко друг к другу, вы можете использовать модифицированное И – &. Для управления им служат регулирующие операторы > и < Чтобы расстояние между словами в результате поиска было меньше заданного по умолчанию, можно использовать конструкцию &< или &<<. Чем больше регулирующих операторов, тем сильнее вы уменьшаете расстояние. Чтобы увеличить исходное расстояние, нужно применить обратный оператор: &> или &>>.

Оператор && не имеет степеней регулировки и является оператором И, при котором в запрос попадают даже самые далеко отстоящие друг от друга слова. Например, сравните результат поиска запросов остап почувствовал, что его понесло & 12 стульев и остап почувствовал, что его понесло && 12 стульев. В первом случае будут преобладать документы с указанной цитатой из произведения «Двенадцать стульев», а во втором – поисковая машина найдет текст самого произведения или его большой фрагмент…

Если оператор явно не указан, поисковая машина сама расставляет операторы так, как считает нужным. Так, запрос регистрация доменов будет истолкован как регистрация && доменов. На странице Расширенного поиска оператор по умолчанию можно заменить на || (Искать слова запроса: хотя бы одно).

Запрос из нескольких слов, перемежающихся операторами, будет истолкован в соответствии с их приоритетом. Оператор NOT имеет самый высокий приоритет, следующий по приоритету оператор && (И), поэтому запрос из нескольких слов при обработке сначала группируется по операторам NOT, && (И) и лишь потом по операторам || (ИЛИ). Изменить порядок группировки можно использованием скобок.

Существует модификация оператора И – оператор &&&. Он применяется для расширения границ поиска. В этом случае поиск будет производится не в пределах одного документа, а в пределах одного сайта.

Оператор «плюс» (+). Этот оператор означает, что слово обязательно должно быть найдено, либо, как уже говорилось, усиливает значение оператора «кавычки», требуя буквального написания фраз, содержащихся в кавычках, т. е. включая знаки препинания.

Логическое «ИЛИ». Написание этого оператора приспособлено как для любителей Яндекса, так и для тех. Кто предпочитает работать с Гуглом.

Как и в Яндексе, логическое «ИЛИ» может быть представлено вертикальной чертой – |.

Для тех, кто привык к старому написанию логического «ИЛИ», принятому раньше в Гугле, Рамблер предоставляет возможность пользоваться также оператором OR.

Приоритета нет ни у одного из этих двух вариантов написания оператора.

Рамблер выделяет также вариант логического «ИЛИ» в виде двойной вертикальной черты – ||. Нам не удалось найти принципиальных отличий этого написания оператора от других его вариантов.

–
ПРИМЕР
Вы искали: шестисотпятидесятиметровый OR глоклая, найдено сайтов: 14, документов: 50.
Вы искали: шестисотпятидесятиметровый | глоклая, найдено сайтов: 14, документов: 50. шестисотпятидесятиметровый || глок лая, найдено сайтов: 14, документов: 50.
–

Логическое «НЕ».

Логическое «НЕ» в Рамблере похоже на таковое в Гугле и распространяется только на весь документ в целом.

Сузить запрос, подобно Яндексу, до предложения, в Рамблере нельзя. Записывается логическое «НЕ» как NOT.

–
ПРИМЕР
Запрос 1: [журавль]
Результат.
Вы искали: журавль, найдено сайтов: 60 715, документов: 647 027, новых: 902.
Запрос 2: [журавль NOT колодец]
Результат.
Вы искали: журавль NOT колодец, найдено сайтов: 60 119, документов: 640 943, новых: 866.
Запрос 3: [журавль NOT (колодец | птица)]
Результат.
Вы искали: журавль NOT (колодец | птица), найдено сайтов: 33 059, документов: 390 789.
Запрос 4: [журавль NOT (колодец | птица | “журавль”)]
Результат.
Вы искали: журавль NOT (колодец | птица | “журавль”), найдено сайтов: 33 985, документов: 300 610, новых 489.
Запрос 5: [журавль NOT (колодец | птица | “журавль” | “журавлей”)]
Результат.
Вы искали: журавль NOT (колодец | птица | “журавль” | “журавлей”), найдено сайтов: 30 660, документов: 248 095, новых: 379.
–

Стемминг, а также вилдкард (wildcard).

Рамблер НЕ поддерживает ни стемминг, ни вилдкард.

Поиск с заданным расстоянием. Рамблер не очень качественно поддерживает поиск с расстоянием, несмотря на то что «Помощь» в Рамблере утверждает обратное.

Рамблер говорит о том, что в документе он производит поиск на расстоянии не более 40 слов друг от друга. Это, конечно, не поиск с расстоянием, а скорее ограничение расстояния, но по крайней мере прямо заявленное ограничение.

Однако при этом Рамблер утверждает, что уменьшить это расстояние в 40 слов можно. Запрос, при котором слова должны находиться рядом, в «Помощи» Рамблера выглядит так: [2, красная армия].

Интересно, что при проверке этого утверждения мы обнаружили, что Рамблер, похоже, является рекордсменом по числу сайтов, которые можно открыть в результатах запроса. Так, в случае с запросом про «красную армию» он показал более двух с половиной тысяч сайтов и был согласен показывать их и дальше, но мы прекратили этот эксперимент, результат которого можно увидеть по адресу: www.ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Three_Thousands_Sites.html

Еще нам показался необычным (и неудобным) способ перехода к следующей группе сайтов в результатах выдачи. Так, если в Яндексе можно уйти, например, на 20-ю страницу выдачи, после чего внизу страницы с результатами последней доступной для просмотра в группе страниц станет 30-й, то в Рамблере, для того чтобы эта 30-я страница стала видна, требуется сначала выбрать переход к следующей группе сайтов вверху страницы, под строкой с запросом, и только после этого можно выбрать последнюю страницу следующей группы сайтов и перейти на нее. Зачем переход организован в два приема – непонятно.

Однако вернемся к непосредственным результатам запроса [2, красная армия].

Согласно информации в хэлпе, Рамблер должен рассматривать цифру «2» как служебную информацию, говорящую о расстоянии между словами, и выдавать результаты, где слова «красная» и «армия» находятся рядом. Наше внимание привлекло то, что цифра «2», которая в запросе должна была играть роль элемента оператора, в выдаче обозначалась как релевантное запросу слово.

Чтобы не пролистывать результаты по «красной армии» до 47-тысячного сайта, мы попробовали испытать поиск с расстоянием, как он описан в разделе «Помощь», на другом запросе и не получил положительного результата. Для того чтобы провести такую работу, мы взяли за основу фразу из песни: «Майскими короткими ночами, отгремев, закончились бои».

–
ПРИМЕР
Запрос: [2,”майскими” “ночами” +отгремев]
Результат поиска.
Вы искали: 2,”майскими” “ночами” +отгремев, найдено сайтов: 48, документов: 293.
–

В выдачу попали документы, не содержащие слова запроса непосредственно рядом друг с другом, более того, цифра «2» опять оказалась рассмотрена в качестве части запроса: «Фотографии, рекомендованные автором Roman Mezenin :: Галерея :: Клуб Foto.ru… Портрет Комм. 6 / Рек. 2 Майскими короткими ночами / отгремев, закончились бои – 05.06.2005 – 26 Kb – http://www.club.foto.ru/gallery/photos/recommended… – Восстановить текст – Найти похожие – Рубрика: Фото. Морской интернет-клуб. Майскими короткими ночами, Отгремев, закончились бои. Где же вы теперь, друзья – однополчане, Боевые спутники мои? Страницы: 1 2 3 4 5 6 7. 18.10.2005 – 10 Kb – http://randewy.ru/pes/stol2.html – Восстановить текст – Найти похожие».

Остальные операторы Рамблера вынесены в «Форму расширенного поиска», расположенную по адресу: www.rambler.ru/cgi-bin/advanced.cgi?set=www

Поиск в заголовках страниц (<title>). Этот оператор, существующий в Яндексе и Гугле как самостоятельный, в Рамблере тоже есть, но в «Помощи» Рамблера он не указан, и найти его нам удалось только в «Форме расширенного поиска». Ссылка на форму расширенного поиска находится непосредственно справа от поисковой строки Рамблера.

Поиск ссылающихся страниц (link). Этот оператор также встретился нам только в «Форме расширенного поиска». Работоспособность его проверена – работает.

Язык документа. Принудительное назначение конкретного языка документа возможно в «Форме расширенного поиска». При этом Рамблер предлагает выбрать один из трех языков: русский, украинский и английский.

По умолчанию в поле выбора языка отмечен вариант «любой».

Формат документа. Выбор форматов, как и языков, по современным меркам не впечатляет. Предлагается HTML, Word (.doc) и Adobe Acrobat (.pdf).

Дата документа. Рамблер, подобно Яндексу, предлагает интересную возможность выбора даты в «Форме расширенного поиска», но если Яндекс, кроме конкретного диапазона с датами, предлагает выбрать, например, «последние 2 недели» или «последний год», то Рамблер позволяет провести выборку только в конкретном временном диапазоне.

Поиск на определенном сайте. Представлен строкой в «Форме расширенного поиска» с названием: «Искать документы только на следующих сайтах».

Таким образом, на наш взгляд, Рамблер представляет определенный интерес для поиска страниц, когда требуется полнота выборки, но чаще его роль – быть резервным местом для поиска информации, не найденной в Гугле или Яндексе.

Сам Рамблер, похоже, с этим смирился и не стремится менять ситуацию, о чем косвенно свидетельствует довольно бедный набор возможностей настройки запроса.

Однако порой он может быть весьма полезен, что доказано практикой.

Примечания:

Калмыков А. А., Калмыкова Л. А. Интернет-журналистика. – М.: ЮНИТИ, 2005. – С. 115.

Оглавление