суббота, октября 23, 2004

Сравнительный анализ программ для локального поиска.

После объявления поисковика Google Desktop стало интересным сравнить его с другими подобными. Провёл изучение трёх систем.

1. Google Desktop - http://desktop.google.com
2. LookOut - http://www.lookoutsoft.com/Lookout (куплена нынче Microsoft)
3. Indexing Service - системный поисковик.

Первые два обещают поиск в почте (второй - только в Outlook) и в любых, практически, файлах на диске.
Третий про почту как-то ничего не обещает, что странно.
Все три для быстрого поиска строят индексы.

Google Desktop строил индекс 4 дня, совсем незаметно для производительности. В настройках указаны все возможные источники информации. Получился индекс размером ок.550 Мб. Проиндексировано 81 678 документов (почта - 31 993, Web history - 10 606, файлы - 39 079). Не проиндексировались текстовые файлы, однако при их изменениях (создание, редактирование) они попадают в индекс. Похоже на глюк беты.
Обновление индекса происходит быстро (сразу при появлении "окна" в процессорном ресурсе), как по файлам, так и по почте.
Скорость поиска - "световая" (показывает какие-то цифры типа 0,28 сек, отрисовка страницы в браузере присходит дольше).
Памяти хозяйство (5 процессов) съедает ок. 20 Мб (пополам оперативка и своп).
Для поиска используется форма в браузере (вполне привычная по "большому" Гуглю).

LookOut строит индекс быстро, часа полтора. Сколько проиндексировал документов, не говорит, в процессе наблюдения можно узнать количество обработанных папок - ок. 12 000 (сюда входят папки Outlook и папки файловой системы). Индекс получился размером ок. 210 Мб. Не проиндексировались файлы на диске, ни текстовые, ни офисные (по крайней мере, поиск по словам этих файлов не даёт). Почта проиндексировалась вся, недостатков при поиске в почтовых документах не обнаружено.
Обновление индекса регулируется параметрами (от 10 минут до нескольких месяцев), однако дождаться явления не удалось, запустилось только кнопкой на форме с полной переиндексацией.
Скорость поиска также большая, результаты выдаются практически мгновенно.
Памяти в составе Outlook съело около 100 Мб (оперативной и виртуальной).
Для поиска используется Win-форма (форма как форма, ничего плохого).

Indexing Service на настоящий момент строит индекс третий день, рассказывает о 75000 проиндексированных документах, индекс имеет размер 340 Мб. Можно полагать, что окончательный размер будет меньше, чем у Google Desktop. Что там индексируется, так и не понятно. Пробный поиск даёт совершенно чумовые результаты - выдаются документы, запрошенных слов не содержащие. Запрос выполняется сравнительно быстро (только, что толку-то?) Примеры запросов из хелпа проясняют мало что.
Памяти использует 20-22 Мб (примерно пополам).
Для поиска есть форма в mmc (довольно убогая), результаты запроса выводятся там же. В хелпе помянута возможность запросов через веб-формы.

Промежуточные итоги.
1. LookOut - выкинуть. Пущай MS повозится года два (ну уж, и прикупили чудо).
2. Google Desktop - пускай живёт и развивается. Будет основным инструментом.
3. Indexing Service - пускай закончит постройку своего индекса, в Гугле поискать, как этой фигнёй пользоваться, потом решить, как с ней быть.

Комментариев нет: