|
3 июня 1999 Ну кто же не знает поисковой системыЯndex?! За полтора года работы она заслужила уважение всего русскоязычного Интернета. На сегодня, Яndex индексирует 32 835 серверов и 7 237 683 уникальных документов. Роботы Яndex собирают документы, забираясь в самые укромные уголки российского Интернета. Однако Сеть растет взрывообразно. Только за последние полгода количество русскоязычных ресурсов увеличилось в пять раз. И старый Яndex уже с трудом справлялся со своими задачами. Пришло время более совершенных систем. Компания CompTek, поддерживающая Яndex, объявляет о его решительном обновлении. Новя система начала работать 30 мая и доступна все по прежнему адресу — www.yandex.ru Новому Яndex была поставлена задача собрать максимум информации о каждом найденном документе, включая названия и подписи к картинкам, ключевые слова, описания, java-апплеты, ссылки и другие элементы. С помощью индексирования ссылок новый Яndex.Ru может организовать поиск по определенному серверу; найти того, кто сослался на конкретный ресурс и даже исключить из поиска нелюбимые серверы. В числе прочего, новый Яndex умеет бороться со спамом. Спам, в данном случае, — это заголовки и ключевые слова, снабженные большим количеством самых популярных запросов, большие массивы текста, «замаскированные» на странице цветом фона или набранные очень мелким шрифтом, а также другие уловки на которые идут хозяева с целью не очень честным способом привлечь пользователя. Многие попадались и попадаются на такую хитрую приманку, используя чересчур «доверчивые» системы поиска. Новый Яndex отслеживает такие ненормальные изменения на страницах и снижает место документа на странице результатов. Среднее время сканирования всего российского Интернета роботом нового Яndex составляет всего неделю. А если пользователь вносит свою страницу в Яndex самостоятельно, то она появится в базе уже через 10 минут. База данных нового Яndex занимает 60 Гб. Теперь практически весь русскоязычный Интернет оказывается прояндексированным. При этом индекс базы занимает 20 Гб, храня все элементы страницы и расстояния слов друг от друга. Компактность индекса ценят владельцы версии Яndex для сайта (Яndex.Site), которым скоро будут доступны все описанные новые возможности. Новые возможности Яndex: Вы хотите узнать, кто поставил ссылки на ваши страницы? Яndex выдаст список таких документов. Эта возможность доступна на странице расширенного поиска. Новый спецпоиск позволит найти документы, где есть ссылки на ваш сайт. Кроме того, вы можете конкретно указать какие слова должны быть в таких ссылках. Раз Яndex умеет искать на определенных сайтах, то он может ограничить поиск одним единственным сайтом. А значит, вы можете искать на Яndex только по своему сайту. Или по любому другому. Яndex выдаст только заголовки документов и адреса сайтов. Документы с одного и того же сайта будут собраны вместе, под заголовком сайта. Документы могут быть отсортированы еще и по датам. Вас утомили бесполезные ссылки, ведущие на один и тот же сайт, и сортировка по серверам не помогла? В таком случае вы теперь имеете возможность исключить такой сайт из поиска. Чтобы найти интересующее изображение, задайте поиск в подписях к картинкам или укажите, как должно начинаться название файла. Яndex различает язык проиндексированных им документов. Например, вы можете поискать описание Visual C++ только на русском языке. Поиск среди ключевых слов и описаний. Все перечисленные способы поиска доступны со страницы расширенного поиска. |