Интернет-маркетинг review

Главная 

 
 

Поисковые сервера

13.12.2004


Источник: searchers.narod.ru

Сегодня мы с вами поговорим о поисковых серверах — мощных автоматизированных средствах для поиска информации в сети Интернет. Статья поможет немного разобраться в их принципах работы, устройстве, выбрать из ряда, казалось бы, одинаковых поисковых машин наиболее подходящую для вашей задачи. Кроме того, далеко не каждый знаком с формами корректного запроса нужной информации — тогда как знание их упрощает поиск, одновременно увеличивая его эффективность. Обзор будет посвящен поисковикам Рунета. Западные работают на схожих принципах; если вы усвоите те, что приведены ниже, да плюс немного водите дружбу с английским языком — сориентироваться во всяких Yahoo, Altavista'x и Lycos'ax не составит проблемы. 

Из отечественных поисковых машин имеет смысл поговорить о наиболее крупных и часто используемых. К ним относятся следующие: Rambler (www.ramblеr.ru) — является одной из самых популярных систем поиска в России. Знаменит своей системой тематических рейтингов 'ТОР 100', куда попадают наиболее популярные сайты различной направленности. Обладает приятным и интуитивно мощным интерфейсом. 

Япdех (www.yandex.ru) — несомненно, один из самых крупных поисковых серверов. Быстро занял свое почетное место в лидерах благодаря мощному языку запросов. Имеет встроенную систему морфологического анализа. 

Aport (www.aport.ru) — оправдывает свое название, буквально впиваясь в поиск необходимого в бесконечный поток страниц. Гибкий язык запроса, возможность англо-русского перевода. Предлагает краткую аннотацию к ссылкам. 

List.ru (www.list.ru) — поисковый сервер, обладающий обширной базой данных по литературе и искусству, науке и технике. Имеет выход но списки почтовых рассылок. Работать удобно и приятно. Помимо HTTP-серверов поиска, существуют базы данных, направленные на поиск среди их FTP-собратьев. FTP-сервероы предназначены для хранения и передачи файлов. В отличие от вышеперечисленных поисковиков (Rambler, Япаех etc.), которые осуществляют выборку по содержимому HTML-страниц, поисковые FTP-сервера ведут поиск по именам файлов и каталогов. Крупнейшими и наиболее известными FTP-поисковикоми являются FTP-Search (www.filesearch.ru) и Files.ru (www.files.ru). Они оба располагают весьма неплохой подборкой файлов (точнее, информации об их местонахождении, собранной с громадного количества серверов). Через определенные промежутки времени базы данных обновляются (в частности, на FTP- Search обновление происходит, каждые пять дней). Устаревшая, ненужная информация удаляется, давая дорогу новой и интересной. 

Принцип действия поисковых серверов довольно-таки прост. Это, грубо говоря, выборка базы данных конкретного поисковика. То есть при каждом запросе робот осуществляет сравнение введенных вами данных в строке поиска с данными, расположенными на сервере, при этом разграничивая степень значимости по количеству совпадений. Так, документы, содержащие точный вариант фразы-запроса, обязательно будут выведены в первых рядах. Задаваться может как отдельное слово, так и целые словосочетания. Кроме этого, существует разбиение на тематические каталоги, например, 'Игры', 'Книги' и т.д. Это увеличивает скорость поиска, позволяя не задерживаться на мусоре. 

Теперь мне бы хотелось рассказать вам о формах запроса поисковых серверов. Формы запроса не только помогают повысить скорость поиска, но и упрощают его. Хотя язык запросов и является базовым для всех серверов, все же каждый из 'всезнаек' пытается внести небольшую изюминку и тем самым привлечь к себе пользователей. Поэтому мы рассмотрим каждый сервер в отдельности. 

Rambler 

Запрос может состоять из одного или нескольких слов. Язык запроса может быть русский либо английский. Слова следует разделять пробелом. Например, 'Ri?a TNT', 'Вирту* РеАЛьность'. Второй пример показывает, что различия в регистрах нет. Тоесть нет никакой разницы, большими либо маленькими буквами, или и теми и другими, набран запрос. 

Сортировка найденных документов может быть изменена (по умолчанию документы сортируются по соответствию запросу). Для этого на странице расширенного запроса (чтобы попасть туда, нужно щелкнуть по соответствующей ссылке в правом верхнем углу экрана) выбираем пункт 'Сортировать по..'. Есть и ограничение поиска документов по времени их создания. Для этой несложной операции выбираем пункт 'От даты х до даты у' на странице детального запроса. Чтобы поисковый сервер искал только документы с минимальным расстоянием между словоми, выбираем режим 'Ограничить расстояние между словами' в детальном запросе. Также можно ограничить поиск частичным поиском конкретного документа (название документа, его заголовок, URL и т.п.). Это можно сделать через меню детального запроса 'Искать в...'. Если вы не знаете слово целиком, то можете использовать символы '*' — для произвольной части запроса или '?' — для произвольной буквы за проса: 'Ri?a TNT', 'Вирту* РеАЛьность". Используя режим запроса 'Расширение запроса: все однокоренные' либо символ '@' перед словом, вы найдете все однокоренные варианты слова: '@игровой'. 

Для увеличения сектора поиска используются логические связки 'And' (и) или 'Or' (или), которым эквивалентны символы '&' и '|' соответственно. 'Увеличение сектора поиска' при использовании "Or" происходит потому, что сервер выдает документы, содержащие хотя бы одно из запрашиваемых слов; тогда как при отсутствии оператора 'или' ищутся только документы со всеми введенными словами. Если использовать оператор 'и", то соединенные им слова в ответах на запрос будут находиться в пределах одного предложения. 

Части запроса могут быть соединены скобками. Возможно многократное вложение скобок с использованием логических операторов: (Виртуал* and Реа?ьность) ог Кибер*. Таким образом достигается большая широта, либо, наоборот, селективность запроса. 

Яndех

Работая с 'Яндексом', надо учитывать некоторые его особенности. Например, он совершенно справедливо проводит различие между строчными и прописными буквами — начиная слово с большой буквы, вы автоматически исключаете из поля поиска все такие же слова, написанные с маленькой. С заглавной буквы стоит писать только имена собственные. Зато, если слово написано с маленькой, почти карликовой, буквы, то будут найдены его эквиваленты и с маленькой, и с большой. Полезно использовать синонимы. Кроме того, что употребление синонимов развивает вашу языковую подготовку, оно может серьезно расширить сектор поиска. Также стоит по возможности конкретизировать свой запрос, и, томясь желанием купить монитор с инваровой трубкой, не писать в качестве запроса слово 'мониторы'. При этом, если вы не желаете посвятить всю оставшуюся жизнь изучению обзоров/научных статей об инваровых трубках, включите в запрос конструкцию '+ продажа'. Знак плюса перед словом делает обязательным поиск документов именно с этим словом (само собой, плюс прочие слова запроса; но слово 'продажа' будет в каждом найденном документе). Если же, напротив, поставить минус, то 'Яндекс' ни за что не выдаст вам местоположение документов с помеченным минусом словом. Чтобы избавить сервер от поиска всех разновидностей ключевого слова, достаточно поставить перед ним восклицательный знак. По коду '(!крокодилов' пред вашими очами предстанут только тексты с этим словом во множественном числе и родитель ном падеже, прочие ('крокодила', 'крокодилу') останутся за бортом. Зато при отсутствии '!' слова будут находиться во всех грамматических формах, возможно, даже в таких, которых вы никогда раньше не видели. В 'расширенном поиске' 'Яндекса' существенных отличий от выше-по-тексту-стоящего коллеги нет. 

Синтаксис языка запросов несколько более сложен, чем у 'Рамблера'. Используются те же команды (&, |, ()), но есть и некоторые добавления. Если между ключевыми словами поставить тильду ('~'), то для сервера будет условием, означающим, что эти слова не должны встречаться в одном предложении. Оператор '/(п m)' имеет значение 'расстояние в словах', где 'п' — минимальное расстояние, a 'm' — максимальное. Возьмем для примера цитату из 'Арии': '...Где свинец слепой отчаянно правит бал'. Между словами 'свинец' и "бал' расстояние в три слова. Значит, чтобы найти именно эту цитату, необходим запрос формы 'свинец /+3 бал'. Плюс перед числом *п в данном случае означает, что второе слово запроса должно стоять после первого (т.е. впереди по тексту). Если плюс убрать, то поиск будет производиться в обе стороны. Спросите, куда я подевал оператор 'т'? Очень просто — если вы желаете, чтобы слово 'бал" искалось, допустим, в интервале от пяти слов до 'свинца' и до семи после, то используйте следующую форму: 'свинец /-5 7 бал'. Надо усвоить простую вещь: 'п' и 'm' — это два одинаковых оператора, несмотря на то, что для их обозначения используются разные буквы; это просто для ясности — с таким же успехом я мог начать свое объяснение, отталкиваясь от формы '/(п п)'. 

По аналогии, синтаксис '&&/(п т)' имеет значение "расстояние в предложениях' По запросу 'свинец &&/2 бал" слово 'бал' будут искать на расстоянии в два предло жения вперед по тексту от 'свинца'. Если вам необходимо объявить поиск сразу по нескольким смежным тематикам, используйте скобки. Скажем, конструкция J типа '(обучение, школа) /+1 (гитара, клавишные)' заставит 'Яндекс' откопать производные от фраз 'обучение гитара', 'обучение клавишные', 'школа гитара", "школа клавишные'. 

В правилах поиска по 'Яндексу' есть еще некоторые тонкости, но их мы касаться не будем — чересчур уж они специализированы и редко используются. При желании вы можете сами дополнительно now- покопаться в разделе 'Помощь' но сервере. 

Aport

У этого сервера (моего фаворита, между прочим) есть свои особенности (хотя к нему применимы и некоторые из описанных выше правил — например, функционируют логические операторы). Поддержка символьного языка,поиск по определенному серверу (мы указываем в запросе URL и слово, которое необходимо найти, на пример 'url-www.listopad.ru клен'; в таком случае будут отыскиваться все документы на сайте www.listopad.ru, содержащие слово "клен'). Можно и ужесточить поиск, ограничивая его каким-либо каталогом сайта — 'www.listopad.ru/der/ клен". 

Хотелось бы упомянуть и так называемый поиск по полям, используемый во многих серверах поиска, в частности, и на 'Апорте*. Под этим выражением' подразу мевается поиск по тексту, привязанному к определенным тегом в HTML-коде. 

title= (t=, заг=, з=) — указанное после равенства слово или конструкция в круглых скобках должно искаться в заголовках до кументов (перед круглыми скобками знак равенства можно опускать). По запросу "заг-(время или место)" будут найдены до кументы, содержащие в заголовке слово "время" или слово 'место', или оба слова одновременно. 

keywords= (kw=, клсл=, кл=) — указанное после равенства слово или конструкция в круглых скобках должно искаться в поле МЕТА KEYWORDS документов (перед круглыми скобками знак равенства можно опускать). По запросу 'kw (бойцовский и клуб)' будут найдены документы, для которых автор в ключевых словах указал оба слова: 'бойцовский" и 'клуб". 

alt= (а=, рис=, р=) — указанное после равенства слово или конструкция в круглых скобках должно искаться в полях ALT (комментарии к картинкам в HTML-коде). По запросу "рис(Билл Гейтс)" будут найдены документы, в которых есть картинка с комментарием, содержащим как минимум два слова: 'Билл" и "Гейтс". 

link= (L=, ссылка=, сс=) — указанное после равенства имя сервера должно искаться в ссылках, имеющихся в HTML-документах. Данный поиск ведется только по ссылкам, где явно указано имя сервера (путь к конкретному файлу игнорируется). По запросу 'link=www.аgama.com" будут найдены документы, в которых есть ссылки на документы с сервера www.agama.com. В том числе будут найдены и локальные ссылки в пределах самой "Агамы", но только тогда, когда в ссылке указано полное имя сервера. 

anchor= — указанное после равенства слово или конструкция в круглых скобках должно искаться в тексте ссылок. По запросу 'апсhог=(ненавижу Интернет)" будут найдены документы, в тексте ссылок на которые встречаются оба слово: "ненавижу' и "Интернет'. 

description= — указанное после равенства слово или конструкция в круглых скобках должно искаться в тексте описаний сайтов и в поле МЕТА DESCRIPTION документов. По запросу 'description=(Школы ка ратэ")" будут найдены корневые документы сайтов, в тексте описаний которых встречается указанное словосочетание, а также документы, в которых оно находится в поле МЕТА DESCRIPTION. 

text= (х=, текст=, т=) - указанные после равенства слово или конструкция в круглых скобках должны искаться только в обычном тексте. По умолчанию слова запроса ищутся как в тексте, так и во всех указанных выше полях. Чтобы искать только по тексту, выдаваемому в основное окно броуэера, следует использовать данный оператор. По запросу 'текст=(оглавление или содержание)" будут найдены документы, в которых любое из указанных слов встречается в пределах основного текста документа. 

дата= (дата=, date=, date:) — ограничение поиска по дате. Сделав запрос вида 'дата=12/07/99-23/08/99 пожар', вы получите все документы, относящиеся к за данному временному интервалу и содержащие слово "пожар", Если убрать вторую дату, появятся только документы с "пожа ром", созданные 12 июля 1999 года. 

List.ru

Весьма неплохой поисковик, оправдывающий свое название — 'Список". На главной странице находятся ссылки на самые популярные проекты List.ru. Ниже расположена поисковая форма. Список ссылок на основные категории каталога занимает центральную часть. Информация в красных скобках, расположенная около ! найденных ссылок, информирует нас о понсещении данных ресурсов определенным количеством пользователей. Значок Rus или Eng означает язык, на котором написана страница на сайте. Язык запроса идентичен Яndex; более того, с этого сервера возможен поиск также и по "Яндексу". 

Итак, мы рассмотрели основные принципы и методы работы с поисковыми серверами. Какой из них вы выберете — решать, в конечном итоге, вам. Моя цель состояла лишь в том, чтобы дать некоторое количество информации — практической и к размышлению — по этой теме, показать ту простую вещь, что знание эффективных путей поиска может сильно упростить доступ к нужной информации.

© 2004-2005 Живая :) рассылка

All Rights Reserved

Счетчик Mail.RU

Счетчик Rambler TOP100