Статьи » Заработок в Интернете » Как устроены поисковые системы.
Как устроены поисковые системы.
Поисковая система – комплекс программ, обеспечивающий поиск информации в интернете. Составные части поисковых машин могут различаться набором функциональных программ, но основные принципы их работы сходны. Поиск и скачивание веб-страниц осуществляет поисковый робот, обычно состоящий из программы, разыскивающей новые адреса (Crawler, странствующий паук) и программы, скачивающей содержимое найденных страниц в виде HTML-текста (Spider, паук).
В поисковую систему обычно загружается некоторый список адресов веб-страниц, с которых начинает своё путешествие Crawler. Впоследствии этот список пополняется в результате регистрации новых сайтов. Дальнейший маршрут паука проходит по адресам и этих сайтов и по ссылкам внутри страниц.
Поисковый робот передаёт эстафету индексному роботу (Indexer, индексатор), задача которого – создание и пополнение индекса(database ,база данных или индекс поисковой системы). Индексный робот удаляет из выкачанных страниц всю нетекстовую информацию, нумерует их, выбирает все слова из всех выкачанных текстов и располагает их в алфавитном порядке вместе с номерами страниц и разной служебной информацией о каждой странице.
Полученная информация и есть индекс, которым оперирует поисковая система. Индекс используется системой для поиска страниц по заданным ключевым словам. Использование полученных поисковым и индексным роботами данных осуществляется через систему обработки запросов и выдачи результатов.
Система обработки запросов и выдачи результатов (search engine results engine) принимает запрос пользователя, формирует запрос к базе данных, получает оттуда результат и передает его пользователю. Страницы ранжируются системой с помощью особых алгоритмов с учётом релевантности. Система выдачи вычисляет рейтинг страниц, и потому при оптимизации представляет наибольший интерес. Интерфейс между пользователем и поисковиком обеспечивает Web server. Обычно на сервере присутствует html-страница с полем ввода для задания термина. Выдаёт результат Веб-сервер также в виде html-страницы.
Об авторе
Автор статьи: Broi Вид работ: рерайтинг Стоимость работ: по договорённости (или, укажите цены). Предпочитаемые тематики: любые (или укажите тематики).
Для заказа статей можно обращаться по контактным данным: e-mail: irinso@inbox.ru ICQ: Телефон: Skype: Ссылка на профиль Textsale:
Ссылка на эту страницу: (поставьте на своём сайте/блоге, чтобы повысить свою статью в поисковых системах)
Автор: Broi
Просмотров: 3592
Слов: 262
Рейтинг: Нет оценки
Читайте также на нашем сайте:
|