среда, 28 сентября 2011 г.

ПиМ: Просмотр, обработка и хранение информации в Avalanche PE #osint #razvedka

   После обзора возможностей по сбору информации в Avalanche Personal Edition рассмотрим просмотр, обработку и хранение собранной информации.

   Основной "фишкой программы" вендор подает т.н. "умные папки" (smart folders), что на самом деле является применением к ранее скачанной (модулем Spider) информации регулярных выражений и логических операторов (к слову, как минимум тот же Yahoo! Pipes делает это и для RSS-лент и для HTML-страниц бесплатно, впрочем).
  Впрочем, я бы назвал основной "фишкой" скорее не сами "умные папки" как технологию (второе название - рубрики), а возможность выборки из когда-то скачанной информации все новых и новых понятий с помощью перерубрикации (создания новых рубрик и отдельного пункта "Перерубрицировать" в меню). Таким образом, программа становится не просто набором роботов да среднего удобства (по сравнению с новыми веб-приложениями) просмотрщиком  новой информации, а базой знаний, чем-то похожей на Evernote\Lycorize, но заточенной под самостоятельное получение информации из Сети. Если говорить в терминах американской школы сбора и анализа информации, то Avalanche дает возможность проводить не только intelligence collection process, но и intelligence analysis process так как ранее собранное никуда не исчезает и имеется крайне удобный интерфейс доступа именно к собранной когда-то информации.
   Перед тем, как попасть из приложения Spider в приложение Avalanche материалы проверяются на идентичность (в буквальном смысле, т.е. различие в один знак уже делает материалы разными для программы). Более продвинутые корпоративные сестры из семейства Avalanche используют нейронную сеть, определяющую меру похожести документов на основе анализа частотного спектра значимых слов, тем самым убирая все дубли а не только те, что идентичны до последнего знака.
   В приложении Avalanche же существует три режима отображения ранее собранных материалов (Источники, Рубрики и Закладки) и три вида отображения (Коды, Просмотр (HTML\RSS etc) и Текст):
Рис. 1. Режим Рубрики, вид Коды

Рис. 2. Режим Рубрики, вид Просмотр

Рис. 3. Режим Рубрики, вид Текст


Рис. 4. Режим Источники

   Удобства добавляют встроенные дополнительные контейнеры для типовых сущностей (компаний, источников, персон, материалов), а именно: 

Рис. 5 Паспорт информационного материала

Рис. 6 Характеристика источника

Рис. 7 Карточка компании

Рис. 8 Напечатанная карточка компании

Рис. 9 Карточка персоны
Рис. 10 Распечатанная карточка персоны
   Менее интересно реализованы календарь событий (всего 2 поля - время и событие, но с возможностью печати) и т.н. эмоциональные папки (новости в при просмотре получают дополнительное поле, которое может содержать одно из 3-ех значений - позитивная новость, негативная и смешанная).
   Нельзя не упомянуть возможность формирования простых отчетов:
Рис. 11. Сформированный и наполненный отчет (так много места на странице по умолчанию)
и экспорт новостей в формат XML.
   Материалы хранятся в виде HTML-файлов а так же в виде RSS-ленты новостей. Есть возможность поменять СУБД (через интерфейс ODBC), например, на Oracle (в техническом руководстве есть подробная инструкция как подключить Oracle) и обещан экспорт БД (в которой хранятся все настройки, паспорта, карточки и т.п., но не сами новости!) в Excel\OpenOffice (на практике в MS Office 2010 не работает - следуя инструкции в официальной технической документации).
Удобство
   В целом работать более удобно чем с Spider'ом, но много смотреть в инструкцию все же придется. Не очень понятен подход разработчика - то он обещает (техподдержка оказалась достаточно оперативная и честная, что редкость в наши дни - на заданный вопрос про наличие службы QA мне ответили что проблема решается, а ведь могли бы и соврать, впрочем, комментарии разработчика к обзору будут завтра\послезавтра) совершенствовать продукт для удобства, то продукт и не должен быть удобным, т.к. он (продукт) дескать, только для профи.

   Стабильность и скорость работы были на более высоком уровне чем в Spider'е, жаловаться практически не на что (насчитал аж 1 глюк, но списываю его на несовершенное владение продуктом).

Комментариев нет:

Отправить комментарий