Svoboda | Graniru | BBC Russia | Golosameriki | Facebook

Для установки нажмите кнопочку Установить расширение. И это всё.

Исходный код расширения WIKI 2 регулярно проверяется специалистами Mozilla Foundation, Google и Apple. Вы также можете это сделать в любой момент.

4,5
Келли Слэйтон
Мои поздравления с отличным проектом... что за великолепная идея!
Александр Григорьевский
Я использую WIKI 2 каждый день
и почти забыл как выглядит оригинальная Википедия.
Статистика
На русском, статей
Улучшено за 24 ч.
Добавлено за 24 ч.
Что мы делаем. Каждая страница проходит через несколько сотен совершенствующих техник. Совершенно та же Википедия. Только лучше.
.
Лео
Ньютон
Яркие
Мягкие

Из Википедии — свободной энциклопедии

Apache Nutch — модульный фреймворк для построения поисковых систем, написанный на языке Java и основанный на технологиях Lucene, Solr, Tika, Hadoop и Gora, адаптированных для специфики поиска в интернете (например, поддерживается crawler, база ссылочной связи, парсинг HTML и других форматов). Архитектура Nutch позволяет разработчикам создавать плагины для обработки нового медиаконтента, получение данных через нестандартные каналы для формирования типовых запросов или организации поискового кластера.

Система предоставляет средства для построения высокомасштабных систем индексации, отвлеченных от типа хранилища, что позволяет использовать такие хранилища для больших объемов данных, как Apache Accumulo, Apache Avro, Apache Cassandra, Apache HBase и HDFS, так и SQL-базы и размещение в памяти NoSQL БД.

Энциклопедичный YouTube

  • 1/5
    Просмотров:
    5 902
    57 039
    455
    1 840
    38 340
  • Crawling with Apache Nutch
  • Web Crawling vs. Web Scraping: The battle for data extraction dominance!
  • Edanz Journal Selector: A Prototype based on Solr/Nutch/Hadoop
  • Основные конструкции фильтров для разделения суспензий
  • Принцип Работы Фильтр-Пресса | Envites

Субтитры

Использование

На базе Nutch 2.0, запущенного поверх 34-узлового Hadoop-кластера, построен поисковый сервис компании Kalooga, в индексе которого находится более миллиарда страниц[2].

На основе Nutch построены поисковые системы:

  • Creative Commons Search — запущен в 2004 году, имплементация Nutch заменена в 2006[3][4][5]
  • DiscoverEd — прототип поиска по открытым образовательных ресурсам, разрабатывается Creative Commons
  • Krugle
  • MozDex
  • Wikia Search — запущен в 2008 году, закрыт в 2009[6][7]
  • search2.net

Примечания

  1. Apache Nutch 1.19 (src-tar, src-zip, bin-tar and bin-zip) — 2022.
  2. Релиз поискового движка Apache Nutch 2.0. Дата обращения: 9 января 2017. Архивировано 14 июля 2012 года.
  3. Our Updated Search. Creative Commons (3 сентября 2004). Дата обращения: 9 января 2017. Архивировано 7 сентября 2011 года.
  4. Creative Commons Unique Search Tool Now Integrated into Firefox 1.0. Creative Commons (22 ноября 2004). Архивировано из оригинала 22 июля 2013 года.
  5. New CC search UI. Creative Commons (2 августа 2006). Дата обращения: 9 января 2017. Архивировано 7 ноября 2011 года.
  6. Where can I get the source code for Wikia Search? Дата обращения: 9 января 2017. Архивировано из оригинала 4 ноября 2011 года.
  7. Update on Wikia – doing more of what’s working. Дата обращения: 9 января 2017. Архивировано 3 мая 2009 года.

Ссылки

Эта страница в последний раз была отредактирована 3 апреля 2024 в 04:53.
Как только страница обновилась в Википедии она обновляется в Вики 2.
Обычно почти сразу, изредка в течении часа.
Основа этой страницы находится в Википедии. Текст доступен по лицензии CC BY-SA 3.0 Unported License. Нетекстовые медиаданные доступны под собственными лицензиями. Wikipedia® — зарегистрированный товарный знак организации Wikimedia Foundation, Inc. WIKI 2 является независимой компанией и не аффилирована с Фондом Викимедиа (Wikimedia Foundation).