четверг, 14 января 2010 г.

Solr - полнотекстовый поиск от Apache (на основе Lucene)

solr


Apache Solr — это расширяемая поисковая платформа от Apache. Система основана на библиотеке Apache Lucene и разработана на Java. Особенности ее в том, что она представляет из себя не просто техническое решение для поиска а именно платформу, поведение которой можно легко расширять/менять/настраивать под любые нужды — от обычного полнотекстового поиска на сайте до распределенной системы хранения/получения/аналитики текстовых и других данных с мощным языком запросов.



Основные особенности



  • Расширенные возможности полнотекстового поиска
  • Оптимизирован под Web системы с большой нагрузкой
  • Стандартные интерфейсы протокола — XML, JSON, HTTP
  • Web панель администрирования (интерфейс для тестовых запросов, статус сервера и компонент, отладка и оптимизация анализатора…)
  • JMX статистика
  • Масштабирование — репликация и шардинг в составе платформы
  • Огромная гибкость благодаря мощной системе конфигурации
  • Расширяемость благодаря поддержке плагинов
  • Индексация в реальном времени
  • Текстовый анализ (разнообразные текстовые фильтры)
  • Кеширование
  • Мощный язык запросов (фильтры, сортировки, работа с датой/временем, функциональные запросы и многое другое)
  • Готовые клиенты для множества языков разработки (в том числе PHP)
  • Приблизительный поиск (неточные совпадения) и проверка запросов на ошибки (подсказки вариантов)

Lucene


Платформа Solr основана на библиотеке полнотекстового поиска Apache Lucene. Библиотека предоставляет большой и гибкий набор функционала для реализации полнотекстового поиска. Поскольку Lucene является библиотекой, то Вам самим необходимо заботиться о всем, что не входит в ее функционал (установка, администрирование, протокол обмена данными с приложением, приложение индексирования, масштабирование и т.п.). Solr представляет как раз тот продукт, который нужен в этом случае, обеспечивая разработчиков отличным набором всех необходимых инструментов.


Следует обратить внимание на то, что Solr предоставляет готовые решения для масштабирования будующего приложения. Ко всему прочему, будучи разработанным на Java он не привносит дополнительных языковых оверхедов в фукнцианальность Lucene (таких, например, как невероятно медленный Zend_Search_Lucene).


Полезные ссылки




Google Bookmarks Digg I.ua Ru-marks Ruspace Zakladok.net Reddit delicious Technorati Yahoo My Web News2.ru БобрДобр.ru Memori.ru rucity.com



No related posts.

Комментариев нет:

Отправить комментарий