01 марта 2004
Обновлено 17.05.2023

Иголки в стоге сена. Иголка первая: как правильно задать вопрос

Иголки в стоге сена. Иголка первая: как правильно задать вопрос - изображение обложка

Я спросил у “Яндекса”: “Где моя любимая?” “Что пристал ты к серверу?” — отвечал админ. Интернет-фольклор

Поиск в интернете очень напоминает работу старателя на золотом прииске: чтобы добыть несколько крупинок золота, приходится часами просеивать и промывать килограммы пустой породы.

Иголки в стоге сена. Иголка первая: как правильно задать вопрос - фото 1

- Последние запросы на “Яндексе”
Но проблема заключается не только в обилии самой различной информации в Сети. Зачастую отрицательный результат при поиске является следствием неэффективной работы с поисковым сервером. И тут мы приходим к старому, но по-прежнему справедливому утверждению: “в правильном вопросе уже содержится половина ответа”. Этой статьей мы открываем цикл публикаций о поиске информации в интернете. А начнем с азов — с умения задавать правильные вопросы. Анатомия ищеек Лично убедиться в том, что огромное число новоиспеченных интернет-пользователей просто не умеет искать нужную информацию, можно очень простым способом — зайдя на страничку последних запросов на " Яндексе ": www.yandex.ru/last20.html?. Среди банальной глупости вроде “как достать сетевой пароль” , “где в Windows хранится пароль к папке” и " ломатель паролей" порой можно встретить настоящие “запросы-шедевры”, например такие: " Енциклапедия для дябло", “ищу мошенника по-имени Андрей”, “схема транваи в москве”, “препарат повышающий интеллект”, “как преобразовать из jpg в doc”, “скачать программку какуюнибудь”, “Полезна ли манструбация?”, “резак видеофайлов”, “Где скачать интернетмагазин”, “иван-да-марья полевой цветок очень нужна картинка помогите”, “как лечат стрептоккок”, “бесплатно очень быстро скачать мал. размеров ужастик”. Как говорится, и смех, и грех. Существует три причины, которые приводят к появлению таких запросов: 1. Общая умственная отсталость. 2. Обыкновенная лень и нежелание ознакомиться со страничкой помощи на поисковике. 3. Непонимание механизма работы поискового сервера. Разумеется, “умственная отсталость” — это причина отдельная, и ее мы рассматривать не будем. А вот устранить последствия лени и незнания вполне можно. Для начала рассмотрим вкратце принципы, по которым работает любой поисковый сервер. Многие ошибочно полагают, что поисковик ищет информацию в интернете в реальном времени, сканируя интернет-странички сразу после получения запроса. На самом деле все обстоит строго наоборот.

Иголки в стоге сена. Иголка первая: как правильно задать вопрос - фото 2

**_

Иголки в стоге сена. Иголка первая: как правильно задать вопрос - фото 3

_**

Иголки в стоге сена. Иголка первая: как правильно задать вопрос - фото 4

- Разница в способах индексирования дает разные результаты при поиске. По одному и тому же запросу “Игромания” “Яндекс” находит 67473 страницы, Google - 12300 страниц, “Апорт” - всего 4121
Поисковый сервер — это кластер (или, другими словами, локальная сеть) из мощных компьютеров с толстым интернет-каналом и просто чудовищным дисковым объемом памяти — вплоть до десятков терабайт. Основное время кластер тратит на сканирование интернет-страниц при помощи специальных поисковых ботов — их называют краулерами ( crawlers ) или спайдерами ( spiders ). Спайдеры ежедневно методично перебирают IP-адреса, при помощи DNS-серверов выбирая из них те, которые соответствуют адресам HTML-страниц. После нахождения рабочего IP-адреса с HTML-страницей спайдер анализирует ее текстовое содержимое. Этот процесс называется индексированием и заключается в следующем: все найденные на странице слова заносятся в базу данных поискового сервера и связываются с адресом той странички, на которой они были обнаружены. Если спайдер обнаружит на странице ссылку на другую страницу, то после обработки он перейдет на эту страницу и также проиндексирует ее. На самом деле спайдер сохраняет в базе данных гораздо больше информации, но нас интересует не подробное описание его работы, а основные принципы

Иголки в стоге сена. Иголка первая: как правильно задать вопрос - фото 5

- Точный запрос “Катя Синичкина” дает всего 5 ссылок. Негусто, зато в тему
. Вот простейший пример: спайдер нашел на страничке с адресом **_www.igromania.ru _**слово “Игромания” и занес его в упорядоченную по алфавиту базу данных, связав найденное слово с адресом. Если кто-то теперь введет в строке поиска “Игромания”, произойдет следующее: специальная программа просканирует базу данных кластера поисковых серверов, найдет в базе слово “Игромания” и покажет пользователю ссылку на соответствующую страницу. Разумеется, на самом деле ссылок будет гораздо больше одной, так как “Игромания” упоминается далеко не на одной странице. Если в строке поиска введено несколько слов, задача немного усложняется, но принцип остается прежним. Предположим, что в строке поиска пользователь ввел два слова. Что произойдет? Сначала поисковик найдет в своей базе данных первое слово и связанную с ним ссылку, а затем сделает выборку из базы данных, которая будет состоять из всех слов, найденных по этой ссылке. Если в выборке (списке слов) будет найдено и второе слово из строки поиска, значит, эта ссылка будет выдана пользователю в качестве результата поиска. Из описанного механизма работы можно сделать следующие выводы: 1. Поисковый сервер всегда ищет данные в своей локальной базе данных, созданной при помощи спайдеров, а не в Сети. 2. Некоторые результаты, выданные поисковиком, могут быть устаревшими (страница была удалена или изменена после ее индексирования спайдером). 3. Новые страницы попадают в базу данных поисковика не мгновенно, а в течение нескольких суток. Это легко проверить, создав на бесплатном сервере страничку с экзотическим выражением (например, “шестьсотпятидесятитрехмерное пространство”) и попробовав отыскать это выражение на любом поисковике. 4. Можно значительно повысить результативность поиска, если изучить специальные операторы, которые модифицируют стандартный алгоритм поиска в базе данных поискового сервера.

Иголки в стоге сена. Иголка первая: как правильно задать вопрос - фото 6
Иголки в стоге сена. Иголка первая: как правильно задать вопрос - фото 7

- Диаметрально противоположные запросы. В первом случае мы ищем информацию о “Демиургах”, исключая обзоры игры, во втором - именно обзоры
Видовое разнообразие Перед тем как перейти к описанию синтаксиса запросов на популярных поисковых серверах, стоит уделить немного внимания классификации поисковиков. Все они работают по одинаковым принципам, описанным выше, но некоторые различия в скорости и способах индексирования между ними существуют. Другими словами, некоторые поисковики быстрее других дополняют и обновляют свою базу данных, а некоторые — лучше упорядочивают сохраняемую информацию, это дает положительный результат при поиске. Различия в способах индексирования непосредственно влияют на синтаксис запросов — то есть на те правила, по которым составляются запросы к серверу. Существует две основных группы поисковиков: сервера с фиксированным языком запроса и без него. Правила работы с первыми можно найти в таблице. А для работы со вторыми (к ним, к примеру, относятся www.hotbot.com и www.search.com ) существует всего одно правило — чем больше слов в запросе, тем точнее результат. Помимо обычных серверов, существуют мета-поисковики ( www.360.ru , www.metabot.ru , **_www.searchmeta.ru _**и другие), которые сами ничего не индексируют и не ищут, а переадресуют ваш запрос сразу нескольким популярным поисковым серверам, а затем сваливают полученные результаты в одну кучу. Мета-поисковиками лучше не пользоваться — к хорошим результатам это приводит крайне редко. Простая аналогия: гораздо эффективнее влезть на яблоню и сорвать именно то яблоко, которое вам нужно, а не трясти бедное дерево (скорее всего, вас просто завалит яблоками по самые уши).

Иголки в стоге сена. Иголка первая: как правильно задать вопрос - фото 8

- Поиск по заголовкам документов удобен для отсеивания лишних страниц, на которых искомая информация лишь упоминается, но не дается в развернутом виде
Поиск задан А теперь перейдем непосредственно к поиску. Первый принцип, которым стоит руководствоваться при использовании поисковиков, был сформулирован Козьмой Прутковым задолго до возникновения компьютеров — “не умножай сущностей сверх необходимого”. Применительно к поиску в интернете это означает следующее: существительные желательно вводить в строку поиска в единственном числе в именительном падеже, глаголы — в неопределенной форме (инфинитиве). Дело в том, что поисковики по умолчанию находят не только точную словоформу, заданную в запросе, но и родственные словоформы. Например, по запросу компьютерный мышь подключать будут среди прочего найдены и страницы, содержащие слова подключение компьютерной мы ши. Также не стоит без лишней необходимости усложнять запрос дополнительными словами. К примеру, запрос winamp скачать вне всякого сомнения даст лучший набор результативных ссылок, чем winamp на русском для Windows XP хочу скачать быстро бесплатно (скорее всего, последний пример запроса вообще не даст никакого результата). **

Иголки в стоге сена. Иголка первая: как правильно задать вопрос - фото 9

**
- Поиск страниц с упоминанием о “Демиургах” и со ссылкой “Купить” дал всего 2 результата. Зато первый же из них - это действительно страничка, с которой можно попасть на страницу покупки
Также стоит освоить простейшие операторы для расширения или ограничения результатов поиска. Большинство серверов при наличии нескольких слов в запросе по умолчанию ищут страницы не только с точной фразой, заданной в строке запроса, а хотя бы с одним из заданных слов. Возможно, лучший результат даст поиск с заданием точной фразы. Так, поиск по запросу Катя Синичкина может привести на страничку Васи Синичкина или на сайт с рассказами про синичек (страшно подумать, куда еще он может привести), а поиск по запросу “Катя Синичкина” (с кавычками) даст ссылки только на документы с точной фразой Катя Синичкина. Помимо задания точных фраз, очень полезно использовать два простых оператора для поиска — ИЛИ и НЕТ , а также скобки для определения очередности выполнения операторов. Оператор ИЛИ (обычно записывается как OR или | ) предназначен для расширения результатов; например, запрос почта Игромании (Геймер OR Катя) выдаст ссылки на странички, содержащие слова “почта”, “Игромания”, а также хотя бы одно из слов — “Геймер” или “Катя”. Оператор НЕТ (записывается как NOT или ! ) имеет прямо противоположное назначение и служит для ограничения результатов поиска. Пример: запрос Геймер NOT киберспорт даст в качестве результатов ссылки на странички со словом “Геймер”, но только в том случае, если на этих страничках отсутствует слово “киберспорт” (таким образом мы отфильтровываем ненужные нам страницы о профессиональных геймерах). *** В одном из ближайших номеров “Игромании” мы подробно рассмотрим синтаксис запросов двух самых популярных поисковых серверов — " Яндекса " и Google , научимся искать картинки и другие файлы, а также изучим некоторые трюки, которые позволяют получить наиболее точные результаты. Синтаксис запросов Поисковая служба Запрос
Тип поиска Пример строки запроса Результат поиска (страницы, содержащие:)
Апорт (www.aport.ru) &nbsp1.; Словосочетание Нивал Демиурги И слово “Нивал”, и слово “Демиурги” или хотя бы одно из них
&nbsp2.; Ограничение поиска Демиурги NOT обзор Слово “Демиурги”, но без слова “обзор”
&nbsp3.; Расширение поиска Демиурги OR Аллоды Любое из слов - “Демиурги” или “Аллоды”
&nbsp4.; Поиск всех форм неологизмов и экзотических слов Нивал* “Нивал”, “Нивала”, “Ниваловцы” и т.д.
&nbsp5.; Поиск в заголовках &nbsptitle;=Проклятые земли Словосочетание или отдельно слова “Проклятые” и “земли” в заголовках документов
&nbsp6.; Поиск по заданному адресу &nbspurl;=www.nival.ru Демиурги “Демиурги” только сайте www.nival.ru
&nbsp7.; Список всех документов по адресу &nbspurl;=www.nival.ru Все страницы на сайте www.nival.ru
&nbsp8.; Поиск ссылок &nbspanchor;=обзор Гиперссылку, содержащую слово “обзор”
Рамблер (www.rambler.ru) &nbsp1.; Словосочетание Нивал Демиурги И слово “Нивал”, и слово “Демиурги” или хотя бы одно из них
&nbsp2.; Ограничение поиска Демиурги NOT обзор Слово “Демиурги”, но без слова “обзор”
&nbsp3.; Расширение поиска Демиурги OR Аллоды Любое из слов - “Демиурги” или “Аллоды”
&nbsp4.; Различные словоформы #Игромания “Игромания”, “Игромании”, “Игроманию” и т.д.
&nbsp5.; Точное выражение “Катя Синичкина” Точную фразу “Катя Синичкина”
Яндекс (www.yandex.ru) &nbsp1.; Словосочетание Нивал Демиурги И слово “Нивал”, и слово “Демиурги” или хотя бы одно из них в одном и том же предложении
&nbsp2.; Ограничение поиска Демиурги ~ обзор Слово “Демиурги”, но без слова “обзор”
&nbsp3.; Расширение поиска Демиурги | Аллоды Любое из слов - “Демиурги” или “Аллоды”
&nbsp4.; Слова в одном тексте Нивал && Аллоды И слово “Нивал”, и слово “Демиурги” или хотя бы одно из них в одном тексте (не обязательно в одном предложении)
&nbsp5.; Точное выражение “Катя Синичкина” Точную фразу “Катя Синичкина”
&nbsp6.; Уточнение поиска Нивал +Аллоды -Проклятые Слово “Нивал”, а также обязательно содержащие слово “Аллоды”, но не содержащие “Проклятые”
&nbsp7.; Поиск в заголовках $title “Проклятые земли” Точную фразу “Проклятые земли” в заголовках документов
&nbsp8.; Поиск по заданному адресу Демиурги #url=“www.nival.ru” “Демиурги” только сайте www.nival.ru
&nbsp9.; Поиск ссылок $anchor обзор Гиперссылку, содержащую слово “обзор”
Лупа (www.lupa.ru) &nbsp1.; Словосочетание Нивал Демиурги И слово “Нивал”, и слово “Демиурги”
&nbsp2.; Ограничение поиска Демиурги --обзор Слово “Демиурги”, но без слова “обзор”
Черепаха (www.turtle.ru) &nbsp1.; Словосочетание Нивал Демиурги И слово “Нивал”, и слово “Демиурги” или хотя бы одно из них
&nbsp2.; Ограничение поиска Демиурги ! Обзор Слово “Демиурги”, но без слова “обзор”
&nbsp3.; Расширение поиска Демиурги | Аллоды Любое из слов - “Демиурги” или “Аллоды”
&nbsp4.; Точное выражение “Катя Синичкина” Точную фразу “Катя Синичкина”
&nbsp5.; Поиск в заголовках {header} Проклятые земли Словосочетание или отдельно слова “Проклятые” и “земли” в заголовках документов
Google (www.google.com) &nbsp1.; Словосочетание &nbspNival; Etherlords И слово “Nival”, и слово “Etherlords” или хотя бы одно из них
&nbsp2.; Ограничение поиска &nbspEtherlords; -review Слово “Etherlords”, но без слова “review”
&nbsp3.; Расширение поиска &nbspDoom; (Carmack OR Romero) Слово “Doom” и любое из слов “Carmack” или “Romero”
&nbsp4.; Точное выражение “Quake III: Arena” Точную фразу “Quake III: Arena”
&nbsp5.; Поиск в заголовках &nbspintitle;:Quake &nbspC;лово “Quake” в заголовках документов
&nbsp6.; Поиск по заданному адресу &nbspQuake; site:www.idsoftware.com “Quake” только на сайте “www.idsoftware.com”
&nbsp7.; Поиск похожих страниц &nbsprelated;:www.gamespy.com Информацию, похожую на содержание заглавной страницы сайта GameSpy
Altavista (www.altavista.com) &nbsp1.; Словосочетание &nbspNival; Etherlords И слово “Nival”, и слово “Etherlords” или хотя бы одно из них
&nbsp2.; Ограничение поиска &nbspEtherlords; -review Слово “Etherlords”, но без слова “review”
&nbsp3.; Расширение поиска &nbspDoom; (Carmack | Romero) Слово “Doom” и любое из слов “Carmack” или “Romero”
&nbsp4.; Поиск всех форм неологизмов и экзотических слов &nbspquake;* “quake”, “quaker”, “quaking”, “quake-god” и т.д.
&nbsp5.; Точное выражение “Quake III: Arena” Точную фразу “Quake III: Arena”
&nbsp6.; Поиск в заголовках &nbsptitle;:Quake &nbspC;лово “Quake” в заголовках документов
&nbsp7.; Поиск по заданному адресу &nbspQuake; host:www.idsoftware.com “Quake” только на сайте “www.idsoftware.com”
&nbsp8.; Поиск похожих страниц &nbsplike;:www.gamespy.com Информацию, похожую на содержание заглавной страницы сайта GameSpy
&nbsp9.; Поиск ссылок &nbspanchor;:“Click here” Гиперссылку, содержащую “Click here”
Lycos (www.lycos.com), Yahoo (www.yahoo.com) &nbsp1.; Словосочетание &nbspNival; Etherlords И слово “Nival”, и слово “Etherlords” или хотя бы одно из них
&nbsp2.; Ограничение поиска &nbspEtherlords; -review Слово “Etherlords”, но без слова “review”
&nbsp3.; Расширение поиска &nbspDoom; (Carmack OR Romero) Слово “Doom” и любое из слов “Carmack” или “Romero”
&nbsp4.; Точное выражение “Quake III: Arena” Точную фразу “Quake III: Arena”

Комментарии
Чтобы оставить комментарий, Войдите или Зарегистрируйтесь