Поисковые системы и каталоги. Логотип Iskati.Com

Апорт (Aport).
Отечественные поисковые системы в интернете

  Поисковые системы и каталоги. Разделитель ГЛАВНАЯ   Поисковые системы и каталоги. Разделитель СТАТЬИ   Поисковые системы и каталоги. Разделитель НОВОСТИ   Поисковые системы и каталоги. Разделитель ПОИСК   Поисковые системы и каталоги. Разделитель О ПРОЕКТЕ   Поисковые системы и каталоги. Разделитель КОНТАКТ   Поисковые системы и каталоги. Разделитель КАРТА САЙТА

СТАТЬИ ПРО БИЗНЕС В ИНТЕРНЕТЕ

Как измерить ущерб от спама, а также - более важно! - преодолеть антиспамовские фильтры

Можно ли сформировать коммерчески эффективный трафик целевой аудитории за ... один день?

Электронный бизнес жив, но акценты меняются

Cделано в Индии - разглядывая офшорный кусок софтверного проекта

hi-tech экспорт из континетального Китая

Индия VS. Китай: гонки в Интернет и не только

Годовщина IPO компании Google:

Google и YouTube: Интернет-пузырь version 2

Рейтинг ”электронной готовности” стран

Хотите продать сайт?





Для сотрудничества по размещению на нашем сайте вашых рекламных материалов, вы можете связаться с нами одним из способов указанных в разделе "Контакты". Кроме того вы можете написать нам и в случае заинтересованности в тематическом обмене с нами ссылками или статьями, или любой другой формы взаимного обмена информацией.


Мы заинтересованы также в размещении рекламы на паритетной основе между нашим проектом и проектами-партнёрами, как на специально отведённой для этого странице так и на центральной странице нашего ресурса.
Апорт (Aport). Отечественные поисковые системы. Информация

Апорт (Aport)

www.aport.ru

Поисковая система Апорт является одной из популярных поисковых машин российского Интернета. Апорт позволяет пользователям осуществлять полнотекстовый поиск документов c учетом морфологии русского языка в запросах. Поисковая система построена на основании новейших достижений в области информационного поиска и использует уникальные алгоритмы сортировки найденных результатов. Техническая база и программное обеспечение Апорта постоянно совершенствуются, что ведет к наращиванию объема поисковой базы и обеспечению высокой частоты индексации русскоязычных ресурсов Интернета. Разнообразные специализированные поиски (Знакомства, Товары, Новости, Рефераты, MP3 и др.) дают пользователям дополнительные возможности находить различную информацию в Сети. В поисковую машину интегрирован один из крупнейших в Рунете каталогов интернет-ресурсов "Апорт-каталог".

Как устроена поисковая машина

1. САЙТЫ

Многие поисковые системы сегодня, так или иначе, оперируют понятием сайта, но подразумевают под этим просто адрес сервера типа www.server.com. В этом случае адрес сайта определяется из адреса страницы простым отрезанием хвоста: из http://www.server.com/users/~vasya получается сайт www.server.com. Для больших серверов, где размещены сайты множества фирм или людей, это неудачное решение. Апорт берет в качестве сайта сервер только в самом крайнем случае. Как правило, для определения того, какая группа страниц является логическим целым (сайтом), Апорт использует информацию из базы данных своего каталога, информация о сайтах в котором вводится человеком, а потому гораздо точнее, чем то, что дает любой автоматический алгоритм (специальные алгоритмы тоже используются, но только, если сайт не зарегистрирован в каталоге).

2. ДОКУМЕНТЫ



Увеличить


Апорт дает весьма информативное представление найденных при поиске страниц. В блоке каждого сайта Апорт приводит информацию об одной из наиболее релевантных найденных на сайте страниц (7): адрес, заголовок, дата и цитата из документа (8). Важно, что цитаты выбираются из полного текста документа и содержат слова запроса.

Также имеется ссылка на реконструкцию полного текста документа (9). Она нужна, если документ недоступен на самом сайте (упал сервер, документ уже удалили и т.п.)

Если нужно получить информацию о всех остальных страницах, которые Апорт нашел на сайте, то можно воспользоваться ссылкой (12), которая замыкает блок результатов. По этой ссылке выдается дополнительное окно, в котором отображаются результаты поиска только по данному сайту. Они состоят из блоков данных по отдельным страницам.

3. СОРТИРОВКА

Общие принципы

Задача ранжирования результатов поиска является определяющей с точки зрения качества работы поисковой системы. Разработка хорошей функции ранжирования весьма непростая задача, в частности, из-за большой неоднородности ранжируемых документов и из-за попыток сознательного искажения результатов поиска с помощью поискового спама. Мощным средством повышения качества ранжирования является учет гипертекстовой структуры Интернета: ссылочное ранжирование и индекс цитируемости позволяют (хотя и не всегда) отличить качественный контент от сходного по содержанию “мусора”, а также (что особенно важно для владельцев сайтов) оригинальные материалы от их копий. Однако и здесь приходится иметь дело с теми же проблемами: неоднородностью ссылочной структуры и ее сознательным искажением спамерами.

Ещё одним важным средством повышения релевантности является использование информации из каталога Апорта, которая обладает высокой степенью достоверности, так как составлена или проверена профессионально подготовленными редакторами.

Принципиальным моментом в ранжировании результатов поиска в Апорте является стремление к учёту максимального количества критериев ранжирования в их взаимосвязи. В частности, заметное преимущество получают документы, имеющие высокий вес сразу по нескольким независимым критериям (например, по частотности слов запроса в тексте и ссылочному ранжированию).

Ранжирование производится исключительно автоматическими методами, мы не осуществляем специальной корректировки результатов поиска для каких-либо запросов или сайтов.

Критерии ранжирования

Апорт применяет следующие критерии при ранжировании документов:

частота и взаимное расположение слов запроса в тексте документа;
размер документа;
присутствие и взаимное расположение слов запроса в выделенном (размером шрифта или html-тегами < b >, < strong >, < h1 >...< h6 >) тексте;
присутствие и расположение слов запроса в заголовке документа;
присутствие и расположение слов запроса в мета-тегах "keywords" и "description";
присутствие и расположение слов запроса в ссылках на ранжируемый документ и авторитетность этих ссылок;
присутствие и взаимное расположение слов запроса в названии и описании сайта в каталоге Апорта (учитывается при вычислении веса главной страницы сайта);
взвешенный индекс цитирования документа;
количество страниц сайта, имеющих высокую релевантность запросу.
Результирующий вес документа рассчитывается по специальному алгоритму, различным образом учитывающему сочетания разных критериев.

Частотные характеристики

Учитывается как абсолютная, так и относительная частота слова в тексте документа.

И для той и для другой величины существуют пороговые значения, после достижения которых дальнейшее увеличение частоты не влияет на вес документа. Для небольших документов, размер которых (в словах) меньше заданной константы, относительная частота рассчитывается не от их фактического размера, а от этой константы.

В заголовке, мета-тегах, а также в названии и описании сайта из каталога частота слов не учитывается.

Ссылочное ранжирование

Алгоритмы ссылочного ранжирования в Апорте учитывают не более одной ссылки с каждого домена второго уровня для отдельного запроса (то есть, для разных запросов могут учитываться разные ссылки).

Вес каждой ссылки зависит (помимо ее текста) от взвешенного индекса цитирования ссылающейся страницы.

Взвешенный индекс цитирования

Алгоритм вычисления взвешенного индекса цитируемости является модификацией классического алгоритма PageRank. В качестве одной из наиболее существенных особенностей следует отметить, что учитывается не более одной ссылки на документ с каждого домена второго уровня.

Индексом цитирования сайта считается взвешенный индекс цитирования страницы, самый высокий среди всех страниц сайта (в большинстве случаев это бывает взвешенный индекс цитирования главной страницы сайта).

Мета-теги "keywords" и description"

Ключевые слова (meta keywords) учитываются Апортом даже в случае их отсутствия в тексте документа. Индексируется не более 16 ключевых слов для каждого документа. Мета-тег description также учитывается при ранжировании, однако, в большинстве случаев, имеет очень небольшой вес.

Источник информации www.aport.ru

Статьи
    
Новости

Поисковые системы и каталоги. Информация  Вы можете также добавить в нашу систему вашу статью и при этом разместить в статье обратную ссылку на ваш сайт. Добавить статью по теме бизнес в интернете и поисковые системамы можно здесь.

Поисковые системы и каталоги. Информация  Вы можете добавить также вашу новость на наш сайт. И разместить в тексте новости обратную ссылку на ваш ресурс. Добавить новую новость по теме связанной с поисковыми системами и бизнесом в интернете можно здесь.

Ваша статья или новость не должна просто содержать набор ключевых слов или быть короткой рекламой вашего ресурса или вашего интернет-бизнеса. Статья или новость должны быть хотя-бы в некоторой степени информативными по теме "Поисковые системы и бизнес в интернете" и быть, в какой-то мере, интересной и полезной для наших пользователей. Вся информация проходит предварительную модерацию и лишь модератор решает что опубликовать, а что нет.