Вернуться на главную страницу Algo.ru  
 

Новый Яndex

 

 

     

3 июня 1999
–> вернуться на COMPTEK

Ну кто же не знает поисковой системыЯndex?! За полтора года работы она заслужила уважение всего русскоязычного Интернета. На сегодня, Яndex индексирует 32 835 серверов и 7 237 683 уникальных документов. Роботы Яndex собирают документы, забираясь в самые укромные уголки российского Интернета. Однако Сеть растет взрывообразно. Только за последние полгода количество русскоязычных ресурсов увеличилось в пять раз. И старый Яndex уже с трудом справлялся со своими задачами. Пришло время более совершенных систем.

Компания CompTek, поддерживающая Яndex, объявляет о его решительном обновлении. Новя система начала работать 30 мая и доступна все по прежнему адресу — www.yandex.ru

Новому Яndex была поставлена задача собрать максимум информации о каждом найденном документе, включая названия и подписи к картинкам, ключевые слова, описания, java-апплеты, ссылки и другие элементы. С помощью индексирования ссылок новый Яndex.Ru может организовать поиск по определенному серверу; найти того, кто сослался на конкретный ресурс и даже исключить из поиска нелюбимые серверы.

В числе прочего, новый Яndex умеет бороться со спамом. Спам, в данном случае, — это заголовки и ключевые слова, снабженные большим количеством самых популярных запросов, большие массивы текста, «замаскированные» на странице цветом фона или набранные очень мелким шрифтом, а также другие уловки на которые идут хозяева с целью не очень честным способом привлечь пользователя. Многие попадались и попадаются на такую хитрую приманку, используя чересчур «доверчивые» системы поиска. Новый Яndex отслеживает такие ненормальные изменения на страницах и снижает место документа на странице результатов.

Среднее время сканирования всего российского Интернета роботом нового Яndex составляет всего неделю. А если пользователь вносит свою страницу в Яndex самостоятельно, то она появится в базе уже через 10 минут. База данных нового Яndex занимает 60 Гб. Теперь практически весь русскоязычный Интернет оказывается прояндексированным. При этом индекс базы занимает 20 Гб, храня все элементы страницы и расстояния слов друг от друга. Компактность индекса ценят владельцы версии Яndex для сайта (Яndex.Site), которым скоро будут доступны все описанные новые возможности.

Новые возможности Яndex:

  • Кто на меня сослался

    Вы хотите узнать, кто поставил ссылки на ваши страницы? Яndex выдаст список таких документов. Эта возможность доступна на странице расширенного поиска.

  • Поиск слов в ссылках

    Новый спецпоиск позволит найти документы, где есть ссылки на ваш сайт. Кроме того, вы можете конкретно указать какие слова должны быть в таких ссылках.

  • Искать только на моем сайте

    Раз Яndex умеет искать на определенных сайтах, то он может ограничить поиск одним единственным сайтом. А значит, вы можете искать на Яndex только по своему сайту. Или по любому другому.

  • Сортировка выдачи по серверам

    Яndex выдаст только заголовки документов и адреса сайтов. Документы с одного и того же сайта будут собраны вместе, под заголовком сайта. Документы могут быть отсортированы еще и по датам.

  • Исключение URL из поиска

    Вас утомили бесполезные ссылки, ведущие на один и тот же сайт, и сортировка по серверам не помогла? В таком случае вы теперь имеете возможность исключить такой сайт из поиска.

  • Поиск картинок

    Чтобы найти интересующее изображение, задайте поиск в подписях к картинкам или укажите, как должно начинаться название файла.

  • Поиск на языке

    Яndex различает язык проиндексированных им документов. Например, вы можете поискать описание Visual C++ только на русском языке.

  • Поиск в аннотациях

    Поиск среди ключевых слов и описаний.

    Все перечисленные способы поиска доступны со страницы расширенного поиска.


  • –> вернуться на канал COMPTEK