Топ-10 поисковых систем мира и россии
Содержание:
- DuckDuckGo
- DuckDuckGo — свободный поиск
- Комментарий «Ростелекома»
- Российские поисковые системы
- Используйте кавычки, чтобы найти конкретную фразу
- Обзор поисковых систем Интернета
- Что это?
- Мэйл ру
- Что такое поисковая система
- Поиск Mail.ru
- Yandex
- Рынок поисковых систем
- Топ сайтов в России по рейтингу Alexa.com.
- Предвзятость поисковых систем
- Принцип работы
- Вычислительно-поисковая система
- Основная поисковая система в мире: Google
- Международные поисковые системы
- § 4.2. Поиск информации в Интернете
DuckDuckGo
Разговор об альтернативных поисковых системах стоит начать с поисковика DuckDuckGo. Это достаточно известная и распространенная система с открытым исходным кодом. Серверы DuckDuckGo находятся в Соединенных Штатах Америки. Результаты поиска довольно обширные, так как система использует не только собственные алгоритмы, но и результаты некоторых других источников, например, «Википедии», поисковика «Бинг» и Yahoo!
Поисковик DuckDuckGo обеспечивает максимальную безопасность личной информации пользователя, приватность и конфиденциальность. Система не собирает никаких данных о пользователях, не хранит историю и максимально ограничивает использование файлов cookie.
Отличие DuckDuckGo в том, что эта система не персонализирует поисковую выдачу, как это делают другие системы. В «Гугле» или «Яндексе», например, пользователь видит только ту информацию, которая согласуется с его предпочтениями. А вот DuckDuckGo формирует реальную картину и позволяет избавиться от навязчивой конкретной рекламы. Поисковый сервис легко ищет информацию на иностранных языках, тогда как «Яндекс» и «Гугл» по умолчанию отдают предпочтение русскоязычным источникам, даже если запрос введен на английском, немецком или другом языке.
В системе можно настроить интерфейс: изменять можно цветовое оформление, шрифты, ссылки и другие параметры всего в несколько кликов.
Пока еще этой поисковой системе далеко до гиганта «Гугла», но утёнок развивается, так что вполне возможно, что в будущем DuckDuckGo займет одну из лидирующих позиций. Команда создала отличный продукт, который обеспечивает анонимный, быстрый и функциональный поиск, заслуживающий внимания пользователя.
DuckDuckGo — свободный поиск
Поисковая система DuckDuckGo одна из первых заявила, что не собирает, не хранит и не распространяет данные о пользователе, а также информацию о его активности. Эта система одна из первых отказалась от анализа пользовательских запросов (или «Пузыря фильтров»). Поиск DuckDuckGo предоставляет пользователю только лучшие результаты, находя информацию не только в своей базе, но и анализируя еще более 400 других авторитетных ресурсов, вроде Википедии, Яндекса, Yahoo! и подобных.
Их девизом является фраза «Конфиденциальность, простота». Само название пришло в голову одному из разработчиков. Оно было позаимствовано из популярной детской игры США «Duck, duck, goose» (Утка, утка, гусь). Над разработкой и совершенствованием системы работают около 40 сотрудников. Расположилась компания в Паоли, Пенсильвания.
Комментарий «Ростелекома»
После публикации материала CNews получил ответ пресс-службы «Ростелекома». Приводим его полностью.
«ООО «Спутник» продолжает полноценно работать как дочерняя компания «Ростелекома». Несколько лет назад было объявлено об изменении стратегии «Спутника» — он переориентировался на разработку ПО и решений для сегментов B2B и B2G в области поиска и обработки информации. На сегодня в портфеле компании такие решения как корпоративные браузер и поисковая система, система поддержки медицинских решений, лаборатория интеллектуального анализа данных, web-аналитика и другие. Решения компании «Спутник» используются в ФНС России, Почте России, ГИБДД РФ, ФИПС, Роспатенте, Правительстве Москвы и в областных администрациях 85 регионов России, Министерстве здравоохранения Республики Алтай, ФГУП Информационно-аналитический центр поддержки ГАС «Правосудие» и других организациях».
- Короткая ссылка
- Распечатать
Российские поисковые системы
С развитием интернета в России возник вопрос о создании поисковика под кириллический сегмент интернета, не только Россия но и другие страны СНГ (Белоруссия и Украина)
Google плохо понимал русский язык, и в самом начале русский интернет, как и весь мир. использовал каталоги сайтов (Мейл ру и Рамблер Портал), все изменилось с появлением Яндекса, который теперь занимает лидирующие позиции.
Поисковая система Yandex
Яндекс — компания, основанная в 1997 году. Она известна своим набором сервисов, которые охватывают поисковые системы, AI и аналитику.
Благодаря инновациям в искусственном интеллекте и технологиях чтения данных, поисковик Яндекс может легко работать с российской терминологией при поиске на зарубежных ресурсах, благодаря чему в отдельных нишах обгоняет по эффективности Google.
В настоящее время Яндекс — крупнейшая технологическая компания в России, владеющая более 50% доли рынка поисковых систем в стране. Яндекс является четвертым по популярности сайтом в России.
Портал Rambler
Rambler начала работу в октябре 1996 года, на начальном этапе в ней содержалось всего 100 тысяч проиндексированных сайтов. Rambler был не первой отечественной поисковой системой, но ставшей одной из самых популярных.
Вторая версия поисковика начала разрабатываться летом 2000 года, в ней представили функции, которые уже были доступны в конкурирующих системах. Учитывалась морфология, улучшился поиск по каталогам
Важной фишкой поисковика был каталог Rambler’s Top100, куда попадали сто самых популярных сайтов Рунета
Удачная архитектура продукта позволяла Rambler иметь количество серверов в два раза меньше, чем у Яндекса и в три раза меньше, чем у Aport.
Используйте кавычки, чтобы найти конкретную фразу
Вероятно, одна из вещей номер один, которую вы можете сделать, чтобы сэкономить время при веб-поиске, – заключение поисковой фразы в кавычки.
Когда вы используете кавычки вокруг фразы, вы предлагаете поисковой системе возвращать только те страницы, которые содержат указанный поисковый запрос в том виде, как вы его ввели. Этот совет работает почти в каждой поисковой системе и очень успешен в поиске сфокусированных результатов.
Если вы ищете точную фразу, поместите её в кавычки. В противном случае вы получите огромного количеством бесполезных результатов.
Например, если вы ищете «кошки с длинной шерстью», ваш поиск вернёт результаты с этими словами, расположенными рядом друг с другом и в том порядке, в котором вы их хотели, а не разбросанными по странице сайта.
Если вы используете поисковую фразу без кавычек, некоторые из возвращенных результатов поиска будут содержать не все три слова, или слова могут быть в разных порядках и совсем не находиться рядом друг с другом. Таким образом, страница, которая говорит о длинноволосой блондинке, которая ненавидит кошек, может оказаться в результатах.
Обзор поисковых систем Интернета
Выше мы сделали небольшое описание поисковых систем. А здесь, хотелось бы Вам рассказать о них немного подробно. Когда их создали, и какие у них плюсы и минусы:
- Google. Эта поисковая система была создана в США в 1998 году. Её создали программисты Сергей Брин и Ларри Пейдж. Сейчас она включает в себя более 25 миллиардов веб-сайтов и её используют 200 миллионов пользователей из разных стран мира. Плюсы этой поисковой системы в том, что можно найти качественную информацию быстрее, чем не качественную. Минусы – нагрузка на компьютер, так как частое обновление Гугла нагружает оперативную память компьютера.
- ЯНДЕКС. Её создали в 1997 году. Создатели этой поисковой системы – Аркадий Волож и Илья Сегалович. Занимает второе место по популярности в России. Плюсов у этой системы много и из них – использование электронной почты, кошелька Яндекс деньги, и быстрый доступ к любой информации. Компания установила фильтры поиска, но это не спасает пользователей посещать сомнительные сайты в Интернете. Это один главный минус и недостаток этого поисковика.
- YAHOO. Поисковик является более старым из всех поисковых систем, которые мы рассматриваем. Его создание принято считать в 1995 году, предпринимателями Джерри Янгом и Дэвидом Филом. Он является достаточно крупным Интернет порталом и у него есть только один минус – не устанавливается на компьютер, а используется через браузер.
- MAIL.RU. Эту поисковую систему организовали в 1998 году. Её авторы и создатели – Евгений Голанд и Владимир Шутов. Этот портал принадлежит крупной компании – Мейл Ру Групп. Так же включает в себя популярные проекты: Одноклассники, Вконтакте, Мой мир. Пользоваться этим поисковиком удобно. Но минусы в том, что электронная почта от Мейл не имеет хорошей защиты от взлома и нередко браузеры заражаются вирусной рекламой от этой системы.
- BING. Она была создана в 2009 году. Эта поисковая система работает, как на компьютерах, так и на Смартфонах. В большинстве случаев, ей выгодно пользоваться на телефонах, это считается её главным преимуществом.
Менее популярные поисковые системы
- DUCKDUCK.GO. Наличие поисковика на компьютере, позволит Вам использовать его в полной мере и вместе с этим сохранить свои конфиденциальные данные. Её создал предприниматель Гэбриель Вайнберг в 2006 году. Эта система не сохраняет во время поиска кэш и историю браузера.
- СПУТНИК. Как было уже сказано выше, это поисковая система пока ещё не всеми используется. Её создали в 2014 году, и создателем считают компанию Ростелеком. Эту поисковую систему, планирует использовать государство.
- РАМБЛЕР. Самый известный в Рунете поисковый портал. Создатель портала Дмитрий Крюков – 1996 год. Он существовал до 2011 года, и сейчас по-прежнему работает в полной мере, как поисковая система.
- BAIDU. Данную китайскую поисковую систему основали в 2000 году, предприниматели – Робин Ли и Эрик Сю. Этим поисковиком пользуется только китайское население. К нему очень негативное отношение во многих странах из-за рекламного вируса и нет возможности перевода языка.
- TUT BY. Данная поисковая система была создана в Белоруссии в 2000 году. Его основал журналист Сергей Дмитриев. Посещаемость поисковика уже превышает более 2 000 000 пользователей в этой стране.
Известные поисковики за рубежом
- AOL (Американская поисковая система). Была разработана в США в 90-е годы. У неё довольно слабая популярность среди пользователей. Работают с поисковиком, в основном, жители Америки.
- ASK.COM. Создание поисковой системы принято считать в 1995 году. Чтобы пользоваться этой системой, достаточно лишь внести в поисковую строку какой-либо вопрос, и она выдаст результаты. Её поиск распределяет результаты по порядку, и всегда можно найти необходимую информацию и качественную.
- ECITE. Данная поисковая машина, особо ничем от других не отличается. Сайт был запущен в 1994 году и в данный момент принадлежит компании IAC Search Media. Этот сервис может предлагать пользователям различную информацию в виде обмена быстрыми сообщениями, отправка писем по электронной почте, и имеет полную настройку домашней страницы в браузере.
- Wolfram Alpha. Он был запущен в Интернет – 15 мая 2009 года. Имеет огромную базу знаний, и мощные вычислительные алгоритмы для нахождения этой информации в поиске.
Итак, эти поисковые системы на сегодняшний день самые лучшие. Думаю, Вы сможете выбрать для себя подходящий вариант. Часто приходиться использовать несколько поисковиков для эффективного поиска нужной информации.
Что это?
Поисковая система — это сервис интернета, которая нацелен на поиск необходимой информации по всей сети. В этом процессе участвует непосредственно сам пользователь и его ключевой запрос. Чтобы найти нужную информацию, нужно открыть веб-обозреватель и в поисковой строке сформулировать запрос. Алгоритмы с каждым годом обновляются, поэтому для корректного поиска не нужно писать много слов и предложений. Достаточно выбрать наиболее подходящие определения.
Сейчас уже трудно представить, как было бы непросто без российский поисковых систем. Мы бы не могли найти интересный фильм, автора книги или любимую песню. Не говоря уже о том, как было бы сложно работать и учиться.
Мэйл ру
Стремительно сдающий позиции поисковик, держащийся на плаву исключительно благодаря старомодной части интернета, использующей социальную сеть «одноклассники» и общение на «мой мир». Трудно сказать почему, но мэйл ру не вызывает симпатий пользователей. Может быть, из-за старомодного интерфейса, или из-за слишком навязчивой рекламной компании, заставлявшей устанавливать виджеты поисковика, серьезно замедлявшие работу компьютера.
В результате, все, что связано с данной поисковой системой вычищается и удаляется пользователями просто по привычке. Компания неспешно дрейфует в сторону браузерных игр и мморг стратегий. Кроме поисковика, мэйл ру принадлежит видеосервис «ру туб» с некогда амбициозными планами захвата русскоязычного сектора видеопоиска. Не слишком успешное финансовое управление и устаревшая техническая база привели первый русский поисковик с собственной почтовой системой на грань, когда многие еще помнят эту систему, но мало кто пользуется.
Что такое поисковая система
Поисковая система (или «поисковик») – это специальная компьютерная система, которая разработана и предназначена для поиска необходимой информации, соответственно поисковым запросам пользователей.
Ключевой параметр работы поисковых систем – запрос. Именно в соответсвии с поисковыми запросами поисковики мира выдают пользователям нужную информацию посредством генерации поисковой выдачи.
Чтобы точно отвечать на как можно большее количество запросов пользователей, поисковые боты (например, «Googlebot») выполняют 3 обязательных этапа.
- Сканируют страницы. Следят, какие новые страницы / сайты появляются, и как обновляются старые.
- Индексируют страницы. Распознают содержание страницы и добавляют их в свою огромную базу данных.
- Ранжируют страницы. В зависимости от запроса пользователя, поисковая система генерирует выдачу, произведя отбор лучших результатов из своей базы по определенному алгоритму.
Полезный материал: Как работает Google Поиск
Если вы создали сайт, и хотите, чтобы ваша аудитория вас нашла и выбрала среди конкурентов, вам нужно выполнить ряд правил. В разных поисковых системах они могут отличатся в деталях, но основные принципы работы похожие.
Как вывести сайт в ТОП Google?
Запустите бесплатный аудит сайта и узнайте, какие страницы вы закрыли от Google и какие технические ошибки отдаляют вас от ТОПа
Поиск Mail.ru
У русскоязычных пользователей сети очень популярна почта mail.ru. Но не очень многие используют одноименный поисковик. Сам по себе он обычный и ничем не примечательный, поэтому против таких конкурентов , как вышеупомянутые яндекс и гугл, ему пока не выстоять. Хотя я сомневаюсь, что он будет пытаться покорять вершины поисковых систем. Ему вполне достаточно, что у него самая популярная почта России. Но всё же свои 5 процентов от общего числа запросов он имеет.
Кроме того сайт содержит огромное количество приложений, интересных игр, а также имеет собственную социальную сеть. Разработаны приложения позволяющие производить поиск по голосу.
Yandex
Яндекс – одна из наиболее популярных поисковых систем в России. Обычно пользователи называют Яндекс российским аналогом Google, поскольку у него похожий интерфейс и дополнительные сервисы. Этот сервис известен хорошо продуманным логическим алгоритмом, который распределяет результаты с некоторыми дополнительными функциями. Сейчас, известно, что Яндекс лучше понимает смысл текста. Молодой сайт, который продвигается в СНГ, может достигнуть ТОПа в Яндексе значительно быстрее, чем в поисковой выдаче Google. Но только в том случае, если упор сделан на качество контента и удобство сайта, а не на ссылки.
Рынок поисковых систем
Google — самая популярная поисковая система в мире с долей на рынке 68,69 %. Bing занимает вторую позицию, его доля 12,26 %.
Самые популярные поисковые системы в мире:
Поисковая система | Доля рынка в июле 2014 | Доля рынка в октябре 2014 | Доля рынка в сентябре 2017 |
---|---|---|---|
68,69 % | 58,01 % | 69,24 % | |
Bing | 17,17 % | 29,06 % | 12,26 % |
Baidu | 6,22 % | 8,01 % | 6,48 % |
Yahoo! | 6,74 % | 4,01 % | 5,19 % |
AOL | 0,13 % | 0,21 % | 1,11 % |
Excite | 0,22 % | 0,00 % | 0,00 % |
Ask | 0,13 % | 0,10 % | 0,24 % |
Азия
В восточноазиатских странах и в России Google — не самая популярная поисковая система. В Китае, например, более популярна .
В Южной Корее поисковым порталом собственной разработки Naver пользуется около 70 % жителейYahoo! Japan и Yahoo! Taiwan — самые популярные системы для поиска в Японии и Тайване соответственно.
Россия и русскоязычные поисковые системы
Яндексом пользуются 53,3 % пользователей в России (Google — 42,9 %).
Согласно данным LiveInternet в декабре 2017 года об охвате русскоязычных поисковых запросов:
- Всеязычные:
- (42,9 %)
- Bing (0,3 %)
- Yahoo! (0,0 %) и принадлежащие этой компании поисковые машины: , AltaVista,
-
Англоязычные
AskJeeves (механизм Teoma)
и международные:
-
Русскоязычные — большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском, татарском и других. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что, в основном, индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык, или другими способами ограничивают своих роботов русскоязычными сайтами.
- Яндекс (53,3 %)
- Mail.ru (3,5 %)
- Рамблер (0,2 %)
Некоторые из поисковых систем используют внешние алгоритмы поиска.
Количественные данные поисковой системы Google
Число пользователей Интернета и поисковых систем и требований пользователей к этим системам постоянно растёт. Для увеличений скорости поиска нужной информации крупные поисковые системы содержат большое количество серверов. Сервера обычно группируют в серверные центры (дата-центры). У популярных поисковых систем серверные центры разбросаны по всему миру.
В октябре 2012 года Google запустила проект «Где живёт Интернет», где пользователям предоставляется возможность познакомиться с центрами обработки данных этой компании.
О работе дата-центров поисковой системе Google известно следующее:
- Суммарная мощность всех дата-центров Google, по состоянию на 2011 год, оценивалась в 220 МВт.
- Когда в 2008 году Google планировала открыть в Орегоне новый комплекс, состоящий из трёх зданий общей площадью 6,5 млн м², в журнале Harper’s Magazine подсчитали, что такой большой комплекс потребляет свыше 100 МВт электроэнергии, что сравнимо с потреблением энергии города с населением 300 000 человек.
- Ориентировочное число серверов Google в 2012 году — 1 000 000.
- Расходы Google на дата-центры составили в 2006 году — $1,9 млрд, а в 2007 году — $2,4 млрд.
Размер всемирной паутины, проиндексированной Google на декабрь 2014 года, составляет примерно 4,36 миллиарда страниц.
Топ сайтов в России по рейтингу Alexa.com.
Как думаете, какой рейтинг у Яндекс и Гугл в России по мнению Alexa? Томить не буду, вся информация находится на картинке ниже:
Сводная таблица с рейтингом. Как и во всех предыдущих случаях, в России преобладает Google.
Согласно рейтингу Alexa.com, в 2020 году с большим отрывом лидирует Google. Фактически, разрыв между Гугл и Яндексом намного больше указанного в списке, ведь Alexa отдельно индексирует домены Google.ru и Google.com, занявшие 8 и 1 места в рунете.
Список довольно большой, поэтому я поделюсь ссылкой на статистику Alexa онлайн, а также перечислю наиболее важные параметры.
Для начала я составлю список топ-10 сайтов в России по рейтингу Alexa за 2020 год:
- Google.com — 1 место;
- Vk.com — 2 место;
- YouTube.com — 3 место;
- Yandex.ru — 4 место;
- Mail.ru — 5 место;
- Ok.ru — 6 место;
- Avito.ru — 7 место;
- Google.ru — 8 место;
- Wikipedia.org — 9 место;
- Aliexpress.com — 10 место.
Чтобы сравнение было полным, данные о Google.com и Google.ru (так как это единая часть поисковой системы Гугл) я солью в единый массив данных. Так как никакие другие порталы Yandex в топ-10 и топ-20 не попали, его статистика остаётся без изменений. Теперь можно проанализировать рейтинг поисковых систем Яндекс и Гугл в России по мнению Alexa.com в 2020 году.
Google:
- Ежедневное время на сайте: 15 минут 63 секунды;
- Ежедневные просмотры: 19,8 страниц в день;
- % трафика из поисковых систем: 4,6%;
- Общее количество ссылающихся сайтов: 2 247 492.
Яндекс:
- Ежедневное время на сайте: 4 минуты 22 секунды;
- Ежедневные просмотры: 2,80 страниц в день;
- % трафика из поисковых систем: 3%;
- Общее количество ссылающихся сайтов: 200 365.
Замечу, что это без попытки суммировать данные из YouTube, тогда общая оценка Google была бы ещё выше! Но это уже не самое честное сравнение, так как я хочу оценить только поисковые системы.
По ежедневному времени на сайте на 1 пользователя Гугл популярней Яндекса в 3,70 раз, по ежедневным просмотрам — в 7 раз, по переходам из поисковых систем — в 1,5 раза. Ещё больше разница по количеству ссылающихся сайтов: по этому параметру Google превышает Yandex более чем в 11 раз!
Вердикт: в 2020 году в России Google — не только самая популярная поисковая система, но и самый популярный ресурс.
Предвзятость поисковых систем
Несмотря на то, что поисковые системы запрограммированы, чтобы оценивать веб-сайты на основе некоторой комбинации их популярности и релевантности, в реальности экспериментальные исследования указывают на то, что различные политические, экономические и социальные факторы оказывают влияние на поисковую выдачу.
Такая предвзятость может быть прямым результатом экономических и коммерческих процессов: компании, которые рекламируются в поисковой системе, могут стать более популярными в результатах обычного поиска в ней. Удаление результатов поиска, не соответствующих местным законам, является примером влияния политических процессов. Например, Google не будет отображать некоторые неонацистские веб-сайты во Франции и Германии, где отрицание Холокоста незаконно.
Предвзятость может также быть следствием социальных процессов, поскольку алгоритмы поисковых систем часто разрабатываются, чтобы исключить неформатные точки зрения в пользу более «популярных» результатов. Алгоритмы индексации главных поисковых систем отдают приоритет американским сайтам.
Поисковая бомба — один из примеров попытки управления результатами поиска по политическим, социальным или коммерческим причинам.
Принцип работы
Весь принцип работы поисковой системы можно разделить на три этапа: сканирование, индексация и ранжирование.
Рассмотрим все три процесса более подробно на примере Яндекса.
Сканирование
Это процесс сбора в базу данных всех имеющихся в глобальной сети веб-страниц.
Сканирование осуществляется поисковыми роботами, которые называются краулерами. Они обходят все сайты в Интернете и загружают в свои сервера их копии, а точнее копии страниц этих сайтов. Боты можно классифицировать по назначению: одна группа роботов индексирует картинки, другая — видео, третья — текстовый материал и так далее.
Робот загружает копии страниц в свою базу, чтобы позже быстро совершать по ним поиск нужной информации. Но это уже следующий этап.
Индексирование
Индексирование — это процесс, благодаря которому сайт появляется в поисковой выдаче.
Когда пользователь вводит интересующую его фразу в Яндекс, поисковик сначала подвергает ее детальному лингвистическому анализу. Этот процесс состоит из следующих этапов:
- Определение языка: Яндекс распознает язык не только по наличию букв того или иного алфавита, но и по характерному сочетанию символов. Именно поэтому поисковик может верно определить слово даже тогда, когда вы напишете его, не поменяв раскладку клавиатуры.
- Определение морфологии: поисковик дополняет введенное пользователем слово различными морфологическими формами и синонимами. Например, если вы введете в Яндекс слово «клавиатура», то он ищет не только это конкретное слово, но и другие его формы: «клавиатуры», «клавиатур», «клавиатурой». Это делается для расширения зоны поиска.
- Исключение омонимии: анализируя частоту и сочетаемость слов, Яндекс исключает омонимы — слова с одинаковыми написанием и звучанием, но с разными значениями. Это позволяет дать пользователю наиболее точную информацию. Введите в Яндекс фразу «купить лук», и в результатах вы увидите как репчатый лук, так и стрелковое оружие. А теперь попробуйте сначала ввести «купить лук семена», а потом «купить лук для стрельбы». В первом случае вы увидите в выдаче только репчатый лук, а во втором случае — только стрелковое оружие. Таким образом, Яндекс, проанализировав сочетаемость слов «семена — лук» и «стрельба — лук», выдал нам точный ответ.
- Расширение запроса: на этом этапе Яндекс ищет синонимы к введенному пользователем слову, находит однокоренные слова, аббревиатуры и написание названий брендов/компаний на других языках. Например, введите в Яндекс слово «торрент», и в результатах вы увидите «uTorrent». Или попробуйте ввести аббревиатуру «ПК», а в результатах будет словосочетание «персональный компьютер».
Ранжирование
Когда поисковик найдет в своем индексе все страницы, в которых содержится нужная пользователю информация, список все равно оказывается внушительным.
Давать результат в таком виде пользователю нельзя. Поэтому полученный список ссылок проходит через последний этап, который называется ранжированием.
Ранжирование — это сортировка ссылок на страницы веб-сайтов в порядке убывания их полезности.
То есть, когда вы вводите в Яндекс фразу «как ухаживать за комнатными розами», поисковик выдаст вам сотни ссылок на страницы, в которых содержится инструкция по уходу.
Однако ссылки на страницы с наиболее точным ответом на ваш вопрос размещаются на первых строчках выдачи, а все остальные — ниже. Такой процесс сортировки веб-страниц и называется ранжированием.
Вычислительно-поисковая система
Как известно, поисковая система Google умеет проводить несложные вычисления, конвертировать из одних единиц в другие и делать некоторые другие полезные вещи, не связанные непосредственно с поиском. Однако если вам нужны ответы на действительно сложные вопросы в области математики, физики, медицины, статистики, истории, лингвистики и других областей науки, то вам не обойтись без «вычислительно-поисковой системы» WolframAlpha, способной предложить пользователю чуть ли не энциклопедические ответы на самые необычные вопросы.
Фактически это даже не совсем поисковая система, а огромная база данных, часть которой преобразована в вычислительные алгоритмы, что и позволяет получать готовые сведения о том, сколько граммов протеина содержится в десятке конфеток M&M’s, какова ожидаемая средняя продолжительность жизни в США, Швеции и Японии в текущем году или как решается алгебраическое уравнение.
Вместо того чтобы долго описывать функциональность WolframAlpha, предлагаем зайти на страницу примеров, где содержатся рассортированные по областям знания образцы того, на вопросы какого рода может дать ответ эта система и как будут выглядеть результаты выдачи.
К сожалению, WolframAlpha работает только с английским языком, и для её использования потребуется его довольно уверенное знание. Кроме того, не стоит слепо доверять тем результатам, которые рассчитывает система по вашим запросам, поскольку малейшая ошибка в базе данных приводит к полной недостоверности выдачи, и такое периодически случается (достаточно поискать в Сети).
Основная поисковая система в мире: Google
Доля мирового рынка поисковых систем 91,38%
Трудно представить себе невероятные размеры Google. Эта поисковая система настолько популярна, что во много раз больше, чем все другие поисковые системы мира вместе взятые.
В частности, Google в настоящее время занимает колоссальный 91,38 процента от мировой доли рынка поиска.
Поисковая система была создана в 1996 году Сергеем Брином и Ларри Пейджем, но вот самое интересное: в 1999 году два партнёра хотели продать Google интернет-компании Excite всего за 750 000 долларов. Excite отклонили это предложение…
Сегодня состояние Google и его материнской компании Alphabet составляет более 750 миллиардов долларов.
В результате, Пейдж, генеральный директор Alphabet, занимает восьмое место в списке самых богатых людей в мире с чистым капиталом в 53,5 миллиарда долларов, а Брин, президент Alphabet, занимает девятое место в списке самых богатых людей с чистым капиталом в 52,1 миллиарда долларов.
В наши дни Google – это больше, чем поисковая система.
Компания разработала множество других программных решений, таких как Google Drive. Она владеет YouTube, разработала линейку смартфонов и ноутбуков и даже создала беспилотные автомобили.
Google также поддерживает другие поисковые системы, включая Ask , которая является шестой по величине поисковой системой в мире.
Гигант поискового рынка постоянно обновляет свою страницу результатов поиска, чтобы предоставить ряд полезных форматов контента, таких как Featured Snippets Google.
Международные поисковые системы
Самые известные международные поисковики
-
Китайский поисковик Байду
Сайт является четвертым в мире по посещаемости. 92% его аудитории составляют граждане Китая. - Поисковик Ask
-
Французский поисковик Qwant.
Вышел в свет в 2013 году как альтернатива Гуглу. -
Metasearch Search Engine — Search.com.
Этим поисковиком можно воспользоваться, если ничего не нашли в Гугле -
AlltheWeb. Поисковик, созданный в Норвегии.
Назван «открытием 1999 года». В результатах поиска американские сайты не доминируют.
Ищет также картинки, видео и аудио. Спецпоиск по научным сайтам. - LYCOS
- Live Search. Также от Микрософт.
§ 4.2. Поиск информации в Интернете
Содержание урока
4.2. Поиск информации в Интернете
4.2. Поиск информации в Интернете
Сеть Интернет растет очень быстрыми темпами, поэтому найти нужную информацию становится все сложнее. Для поиска информации используются специальные поисковые системы, которые содержат постоянно обновляемую информацию о местонахождении Web-страниц и файлов на серверах Интернета.
Поисковые системы содержат тематически сгруппированную информацию об информационных ресурсах Всемирной паутины в базах данных. Специальные программы-роботы периодически «обходят» Web-серверы Интернета, читают все встречающиеся документы, выделяют в них ключевые слова и заносят в базу данных Интернет-адреса документов.
Большинство поисковых систем разрешают автору Web-сайта самому внести информацию в базу данных, заполнив регистрационную анкету. В процессе заполнения анкеты разработчик сайта вносит адрес сайта, его название, краткое описание содержания сайта, а также ключевые слова, по которым легче всего будет найти сайт.
Поиск по ключевым словам. Поиск документа в базе данных поисковой системы осуществляется с помощью введения запросов в поле поиска.
Запрос должен содержать одно или несколько ключевых слов, которые являются главными для этого документа. Например, для поиска самих систем поиска в Интернете можно в поле поиска ввести ключевые слова «российская система поиска информации Интернет».
Через некоторое время после отправки запроса поисковая система вернет список ссылок на документы, в которых были найдены указанные ключевые слова. Для просмотра такого документа в браузере достаточно активизировать указывающую на него ссылку.
Если ключевые слова были выбраны неудачно, то список ссылок на документы может быть слишком большим (содержать десятки и даже сотни тысяч ссылок). Для того чтобы уменьшить список, можно в поле поиска ввести дополнительные ключевые слова или воспользоваться каталогом поисковой системы.
Одной из наиболее полных и мощных поисковых систем является (www.google.ru), в базе данных которой хранятся более 300 миллиардов Web-страниц, и каждый месяц программы-роботы заносят в нее 5 миллионов новых страниц (рис. 4.9). В российской части Интернета обширные базы данных, содержащие по 400 миллионов документов, имеют поисковые системы Яндекс (www.yandex.ru), Mail (www.mail.ru) и Rambler (www.rambler.ru).
Поиск в иерархической системе каталогов. В базе данных поисковой системы Web-сайты группируются в иерархические тематические каталоги, которые являются аналогами тематического каталога в библиотеке.
Тематические разделы верхнего уровня, например «Интернет», «Компьютеры», «Наука и образование» и т. д., содержат вложенные каталоги. Например, каталог «Интернет» может содержать подкаталоги «Поиск», «Сервис» и др.
Рис. 4.9. Поиск по ключевым словам в системе Google
Поиск информации в каталоге сводится к выбору определенного каталога, после чего пользователю будет представлен список ссылок на наиболее посещаемые и содержательные Web-сайты. Каждая ссылка обычно аннотирована, т. е. содержит короткий комментарий к содержанию документа.
Наиболее полный многоуровневый иерархический тематический каталог русскоязычных Интернет-ресурсов имеет поисковая система Апорт (www.aport.ru) (рис. 4.10). Каталог содержит подробную аннотацию содержания Web-сайтов и указание на их географическое положение.
Поиск файлов. Для поиска файлов на серверах файловых архивов существуют специализированные поисковые системы, в том числе российская файловая поисковая система FileSearch (www. filesearch.ru). Для поиска файла необходимо имя файла ввести в поле поиска, и поисковая система выдаст ссылки на серверы файловых архивов, на которых хранится файл с заданным именем.
Рис. 4.10. Тематические каталоги поисковой системы Апорт
Cкачать материалы урока