Награда Elastic Cause Awards

среди компаний, использующих Elastic Stack

Этот проект был включен в список на первую в этом году награду Elastic Cause Awards, которая признает организации, использующие Elastic Stack в своих професиональных целях для достижения успеха.

Национальный центр по сохранению растений (CNCFlora) является официальным подразделением Министерства окружающей среды Бразилии, которое находится в Ботаническом саду Рио-де-Жанейро. Он предназначен для реализации оценки риска бразильской флоры и координации усилий по сохранению.

О проекте

и его важности

В настоящее время Бразилия перечисляет 46 113 видов флоры, но даже с непрерывными и целенаправленными усилиями CNCFlora, начиная с 2010 года, только около 11% из них были оценены на предмет риска исчезновения.

Оценка риска исчезновения является первым шагом в сохранении вида и должна обеспечить научную и объективную оценку вероятности вымирания вида в одно время, если обстоятельства, в которых он находится, останутся.

Оценка риска исчезновения всех известных видов является глобальной проблемой, согласованной сторонами Конвенции о биологическом разнообразии (КБР) в рамках целевой задачи 2 Глобальной стратегии сохранения растений (ГССР).

Оставшийся большой пробел в знаниях о сохранении статуса нашей флоры вместе с задачей полной ее оценки к 2020 году показывает, что использование технологий, позволяющих оперативно оценивать риск исчезновения, помогает квалифицированным специалистам принимать решения об окончательной категоризации видов.

Небольшая технологическая помощь

которые решают специалисты нашей компании

Оценка риска — методологический процесс, определенный Международным союзом охраны природы (МСОП) и принятый многими странами, такими как Бразилия. В этой методологии совокупность методов и информации о видах составления и анализа информации о возникновении потенциальных угроз для остального населения.

Часть этой методологии использует «записи о происшествиях», которые поступают главным образом из коллекций гербариев, сделанные образцами высушенных растений, установленных на листе картона, сопровождаемого ярлыком с названием вида и дополнительными данными, относящимися к этому образцу. Эти данные представляют собой наличие биологического образца во времени и пространстве, являясь основным источником данных для исследований по биоразнообразию и сохранению.

Таким образом, методология использует широту и долготу всех записей видов для расчета Области Занятости, расширения потока и субпопуляций.

Чтобы помочь процессу оценки риска исчезновения всей бразильской флоры, был разработан инструмент под названием «Экспресс-оценка рисков» — RRAPP, в котором эти пространственные и основанные на конкретных критериях исчисления, классифицируют риск исчезновения каждого вида бразильской флоры.

Индексирование с помощью Elasticsearch и Kibana

простой и эффективный инструмент

Из-за нехватки ресурсов для инфраструктуры и персонала очень важен простой и эффективный инструмент. Поэтому Elasticsearch стал лучшим выбором.

Таксономическая информация — название вида данных о происхождении пространственных данных и результатов анализа индексируемых в Elasticsearch. Сочетание запросов таксономии и различного вида вхождения генерирует данные оценки.

Агрегация этих данных позволяет получить качественную визуализацию статистических данных и сформировать полный или частичный отчет, при этом используя минимум ресурсов.

В данном проекте Kibana используется для ускоренного перебора цикла индексирования. Также, Kibana позволяет выявить недочеты и проблемы, с которыми необходимо работать. Здесь мы можем просмотреть общий результат анализа во время его работы.

Общий результат анализа Кибаны во время работы

Мы можем также просмотреть распределение точек возникновения и увидеть, что в центре (0 широта и долгота) существует огромная концентрация из-за проблем с качеством данных.

Другим важным моментом является то, что все это может выполняться ежедневно в ограниченной инфраструктуре: имеется единственный узел с 4 ядрами и 8 ГБ ОЗУ, в котором оба бота и Elastic stack индексируют и анализируют около 100 000 названий видов и 15 000 000 данных о событиях, предоставляя несколько агрегатов и отчетов.

Масштабирование будущего

объединение всех существующих данных

В данной статье была рассмотрена система по оценке рисков всей Бразильской флоры, но очень важно понять, что такое решение можно масштабировать для всех стран, которые готовы получать данные об их флоре.

Учитывая эту глобальную цель, мы уверены, что масштабируемость продуктов Elastic позволит проекту расти до необходимого размера, поскольку глобальный набор данных в настоящее время в сотни раз превышает наши текущие данные.

Представьте…

На минуту задумайтесь, если возможно спрогнозировать вымирание целого вида растений, получая данные из гербария, что можно сделать с реальными данными…

Можно построить модель по прогнозу потребления, продаж, количеству и качеству оплаты за услуги, планируемым объемам прибыли и многое другое. Получая подобного рода данные, принимаемые решения станут, как минимум, обоснованными точными данными.

Бесчисленное количество вариантов — нужно только понять, что все возможно.