Какие бывают поисковые системы и как они работают?

Какие бывают поисковые системы и как они работают?

Интернет необходим многим пользователям для того, чтобы получать ответы на запросы (вопросы), которые они вводят.

p, blockquote 1,0,0,0,0 -->

Если бы не было поисковых систем, пользователям пришлось бы самостоятельно искать нужные сайты, запоминать их, записывать. Во многих случаях найти «вручную» что-то подходящее было бы весьма сложно, а часто и просто невозможно.

p, blockquote 2,0,0,0,0 -->

За нас всю эту рутинную работу по поиску, хранению и сортировке информации на сайтах делают поисковики.

p, blockquote 3,0,0,0,0 -->

p, blockquote 4,0,0,0,0 -->

p, blockquote 5,0,0,0,0 -->

Начнем с известных поисковиков Рунета.

p, blockquote 6,0,0,0,0 -->

Поисковые системы в Интернете на русском

1) Начнем с отечественной поисковой системы. Яндекс работает не только в России, но также работает в Белоруссии и Казахстане, в Украине, в Турции. Также есть Яндекс на английском языке.

p, blockquote 7,0,0,0,0 -->

2) Поисковик Google пришел к нам из Америки, имеет русскоязычную локализацию:

p, blockquote 9,0,0,0,0 -->

3)Отечественный поисковик Майл ру, который одновременно представляет социальную сеть ВКонтакте, Одноклассники, также Мой мир, известные Ответы Mail.ru и другие проекты.

p, blockquote 11,0,0,0,0 -->

4) Интеллектуальная поисковая система

p, blockquote 13,0,1,0,0 -->

Nigma (Нигма) http://www.nigma.ru/

p, blockquote 14,0,0,0,0 -->

С 19 сентября 2017 года «интеллектуалка» nigma не работает. Она перестала для её создателей представлять финансовый интерес, они переключились на другой поисковик под названием CocCoc.

p, blockquote 15,0,0,0,0 -->

5) Известная компания Ростелеком создала поисковую систему Спутник.

p, blockquote 16,0,0,0,0 -->

Есть поисковик Спутник, разработанный специально для детей, про который я писала ТУТ.

p, blockquote 18,0,0,0,0 -->

6) Рамблер был одним из первых отечественных поисковиков:

p, blockquote 19,0,0,0,0 -->

В мире есть другие известные поисковики:

  • Bing,
  • Yahoo!, ,
  • Baidu,
  • Ecosia,

подробнее о них ЗДЕСЬ.

p, blockquote 22,0,0,0,0 -->

Попробуем разобраться, как же работает поисковая система, а именно, как происходит индексация сайтов, анализ результатов индексации и формирование поисковой выдачи. Принципы работы поисковых систем примерно одинаковые: поиск информации в Интернете, ее хранение и сортировка для выдачи в ответ на запросы пользователей. А вот алгоритмы, по которым работают поисковики, могут сильно отличаться. Эти алгоритмы держатся в тайне и запрещено ее разглашение.

p, blockquote 23,0,0,0,0 -->

Введя один и тот же запрос в поисковые строки разных поисковиков, можно получить разные ответы. Причина в том, что все поисковики используют собственные алгоритмы.

p, blockquote 24,0,0,0,0 -->

Цель поисковиков

В первую очередь нужно знать о том, что поисковики – это коммерческие организации. Их цель – получение прибыли. Прибыль можно получать с контекстной рекламы, других видов рекламы, с продвижения нужных сайтов на верхние строчки выдачи. В общем, способов много.

p, blockquote 25,0,0,0,0 -->

Прибыль поисковика зависит от того, какой размер аудитории у него, то есть, сколько человек пользуется данной поисковой системой. Чем больше аудитория, тем большему числу людей будет показываться реклама. Соответственно, стоить эта реклама будет больше. Увеличить аудиторию поисковики могут за счет собственной рекламы, а также привлекая пользователей за счет улучшения качества своих сервисов, алгоритма и удобства поиска.

p, blockquote 26,1,0,0,0 -->

Самое главное и сложное здесь – это разработка полноценного функционирующего алгоритма поиска, который бы предоставлял релевантные результаты на большинство пользовательских запросов.

p, blockquote 27,0,0,0,0 -->

Работа поисковика и действия вебмастеров

Каждый поисковик обладает своим собственным алгоритмом, который должен учитывать огромное количество разных факторов при анализе информации и составлении выдачи в ответ на запрос пользователя:

  • возраст того или иного сайта,
  • характеристики домена сайта,
  • качество контента на сайте и его виды,
  • особенности навигации и структуры сайта,
  • юзабилити (удобство для пользователей),
  • поведенческие факторы (поисковик может определить, нашел ли пользователь то, что он искал на сайте или пользователь вернулся снова в поисковик и там опять ищет ответ на тот же запрос)
  • и т.д.

Все это нужно именно для того, чтобы выдача по запросу пользователя была максимально релевантной, удовлетворяющей запросы пользователя. При этом алгоритмы поисковиков постоянно меняются, дорабатываются. Как говорится, нет предела совершенству.

p, blockquote 29,0,0,0,0 -->

С другой стороны, вебмастера и оптимизаторы постоянно изобретают новые способы продвижения своих сайтов, которые далеко не всегда являются честными. Задача разработчиков алгоритма поисковых машин – вносить в него изменения, которые бы не позволяли «плохим» сайтам нечестных оптимизаторов оказываться в ТОПе.

p, blockquote 30,0,0,0,0 -->

Как работает поисковая система?

Теперь о том, как происходит непосредственная работа поисковой системы. Она состоит как минимум из трех этапов:

  • сканирование,
  • индексирование,
  • ранжирование.

Число сайтов в интернете достигает просто астрономической величины. И каждый сайт – это информация, информационный контент, который создается для читателей (живых людей).

p, blockquote 32,0,0,0,0 -->

Сканирование

Это блуждание поисковика по Интернету для сбора новой информации, для анализа ссылок и поиска нового контента, который можно использовать для выдачи пользователю в ответ на его запросы. Для сканирования у поисковиков есть специальные роботы, которых называют поисковыми роботами или пауками.

p, blockquote 33,0,0,0,0 -->

Поисковые роботы – это программы, которые в автоматическом режиме посещают сайты и собирают с них информацию. Сканирование может быть первичным (робот заходит на новый сайт в первый раз). После первичного сбора информации с сайта и занесения его в базу данных поисковика, робот начинает с определенной регулярностью заходить на его страницы. Если произошли какие-то изменения (добавился новый контент, удалился старый), то все эти изменения будут поисковиком зафиксированы.

p, blockquote 34,0,0,0,0 -->

Главная задача поискового паука – найти новую информацию и отдать ее поисковику на следующий этап обработки, то есть, на индексирование.

p, blockquote 35,0,0,0,0 -->

Индексирование

Поисковик может искать информацию лишь среди тех сайтов, которые уже занесены в его базу данных (проиндексированы им). Если сканирование – это процесс поиска и сбора информации, которая имеется на том или ином сайте, то индексация – процесс занесения этой информации в базу данных поисковика. На этом этапе поисковик автоматически принимает решение, стоит ли заносить ту или иную информацию в свою базу данных и куда ее заносить, в какой раздел базы данных. Например, Google индексирует практически всю информацию, найденную его роботами в Интернете, а Яндекс более привередлив и индексирует далеко не все.

p, blockquote 36,0,0,0,0 -->

Для новых сайтов этап индексирования может быть долгим, поэтому посетителей из поисковых систем новые сайты могут ждать долго. А новая информация, которая появляется на старых, раскрученных сайтах, может индексироваться почти мгновенно и практически сразу попадать в «индекс», то есть, в базу данных поисковиков.

p, blockquote 37,0,0,0,0 -->

Ранжирование

Ранжирование — это выстраивание информации, которая была ранее проиндексирована и занесена в базу того или иного поисковика, по рангу, то есть, какую информацию поисковик будет показывать своим пользователям в первую очередь, а какую информацию помещать «рангом» ниже. Ранжирование можно отнести к этапу обслуживания поисковиком своего клиента – пользователя.

p, blockquote 38,0,0,0,0 -->

На серверах поисковой системы происходит обработка полученной информации и формирование выдачи по огромному спектру всевозможных запросов. Здесь уже вступают в работу алгоритмы поисковика. Все занесенные в базу сайты классифицируются по тематикам, тематики делятся на группы запросов. По каждой из групп запросов может составляться предварительная выдача, которая впоследствии будет корректироваться.

p, blockquote 39,0,0,1,0 --> Рис. 1 Упреждающий поиск – выдаются подсказки при вводе первых букв в строку поиска

Предварительная выдача называется еще «упреждающим поиском» — это когда пользователь только начинает вводить свой запрос, а ему уже предлагаются различные варианты ответов.

p, blockquote 40,0,0,0,0 -->

В каждой поисковой системе есть модераторы – люди, отвечающие за оценку сайтов и результаты выдачи по определенным группам запросов. Модераторы нужны для того, что контролировать работу поисковика, а также замещать алгоритм там, где он работает недостаточно хорошо (корректировать его работу). Модераторы могут вручную менять позиции тех или иных сайтов, если видят, что алгоритм поисковика в каких-то случаях сработал некорректно.

📎📎📎📎📎📎📎📎📎📎