Проекты
Конкурсные проекты

Виртуальная лаборатория для обработки и анализа данных по биоразнообразию видов растений и биоклиматическому моделированию


Тип участника:  Авторский/творческий коллектив
Полное наименование организации/физического лица/авторского или творческого коллектива:  Алтайский государственный университет. Творческий коллектив: Покалякин Захар Валерьевич, магистрант Института математики и информационных технологий; Хворова Любовь Анатольевна, доцент кафедры теоретической кибернетики и прикладной математики ИМИТ
В лице (для организации или авторского/творческого коллектива указывается ФИО и должность руководителя):  Хворова Любовь Анатольевна, доцент кафедры теоретической кибернетики и прикладной математики ИМИТ
Интернет-сайт заявителя:  www.asu.ru
Контактное лицо: ФИО:  Хворова Любовь Анатольевна
ФИО всех участников авторского/творческого коллектива:  1. Покалякин Захар Валерьевич
2. Хворова Любовь Анатольевна
Идея и краткое описание ИТ-проекта:  Проект направлен на разработку уникального ИТ-продукта – виртуальной лаборатории для решения задач цифровой инвентаризации биоты Алтая, биоклиматического моделирования, исследования глобального биоразнообразия регионов Большого Алтая.

Виртуальная лаборатория опирается на передовые цифровые и интеллектуальные инструменты и включает в себя разработку алгоритмов и программ, баз данных, компьютерных методов и моделей для обработки, анализа и визуализации биологических данных для более эффективной работы с ними.

Для реализации Проекта необходимо было решить следующие задачи:

•        1) Создание единой информационной системы для хранения и анализа данных по биоразнообразию территории Большого Алтая, доступной для заповедников и университетов Большого Алтая.

•        2) Разработка программного модуля для моделирования и визуализации распространения видов на конкретной территории.

•        3) Разработка модели коррекции пространственной неравномерности для данных о местоположении особей определенного вида.

•        4) Разработка моделей популяционных процессов и биоразнообразия на основе машинного обучения и технологий искусственного интеллекта.

         5) Разработка web-интерфейса виртуальной лаборатории.



Перечень решаемых задач: 

Задача 1. Cоздана крупнейшая научная цифровая коллекция и виртуальная база данных фиторазнообразия Алтайского края и Большого Алтая.

Задача 2. Разработан прототип сервиса для Яндекс по биоклиматическому прогнозному моделированию экологических ниш перспективных таксонов флоры Большого Алтая из числа хозяйственно-ценных (лекарственных, пищевых, кормовых и т.д.), редких и эндемичных.

Задача 3. Набор сервисов из области прикладной информатики для решения природоохранных задач заповедников и национальных парков трансграничного биосферного резервата «Большой Алтай» и Тигирекского заповедника.

Описание функциональных возможностей и элементов проекта: 

В связи с ростом объема данных и необходимостью осуществления прогнозного и реального биоклиматического моделирования (при ограниченности мощностей персональных компьютеров) все большее развитие и востребованность получают виртуальные лаборатории. Биологическое разнообразие является важнейшим компонентом окружающей среды, непосредственно и опосредованно влияющее на состояние глобальных экосистем и климат планеты. Мероприятия по изучению живых организмов должны осуществляться по мировым стандартам и на высочайшем методологическом уровне, так как данный процесс напрямую влияет на стратегические национальные приоритеты, связанные со здравоохранением и продовольственной безопасностью. Применение достижений прикладной информатики и общая тенденция цифровизации в биологии позволяют объединять разрозненные данные и осуществлять анализ данных удаленно в виртуальных лабораториях.

Виртуальная лаборатория послужит решению задач цифровой геопространственной инвентаризации флоры Большого Алтая, разработке сервисов биоклиматического моделирования биоразнообразия, исследованию и анализу глобального биоразнообразия регионов Большого Алтая.

Дата внедрения (в случае, если предполагается запуск проекта в эксплуатацию):  20.12.2022
Используемые платформы, средства разработки: 

Интерфейс виртуальной лаборатории разработан при помощи языка программирования Python с использованием фреймворка для веб-приложений Django.

Для моделирования биоразнообразия видов используется программа MaxEnt. Используются современные методы машинного обучения, например, RandomForest, GradientBoosting для моделирования популяционных процессов.

Для коррекции пространственной неравномерности  использован метод кластеризации данных DBSCAN из Python библиотеки scikit-learn.

Для хранения данных Яндекс предоставляет базу данных на облачной платформе Yandex.Cloud.

Стоимость разработки системы:  500 000 рублей
Средний размер ежегодных затрат на эксплуатацию:  10 000 рублей
Перспективы развития:  1. Перспективы развития связаны с решением задач партнеров - заповедников на территории Большого Алтая.
2. Подключение блока автоматической сортировки изображений с фотоловушек на базе компьютерного зрения.
Достижение поставленных целей:  Достижение поставленных целей и задач связано с заинтересованностью заповедников в результатах проекта.
Кроме того, 90% задач реализовано в рамках выполнения выпускной работы. В рамках магистерской диссертации все поставленные задачи будут реализованы.
Социальная значимость и/или экономическая эффективность (в зависимости от типа проекта): 

– На уровне университета – создана крупнейшая научная цифровая коллекция и виртуальная база данных фиторазнообразия Алтайского края и Большого Алтая; разработан прототип сервиса для Яндекс по биоклиматическому прогнозному моделированию экологических ниш перспективных таксонов флоры Большого Алтая из числа хозяйственно-ценных (лекарственных, пищевых, кормовых и т.д.), редких и эндемичных;

– на уровне региона – разработана единая информационная система для хранения и анализа данных по биоразнообразию территории Большого Алтая, доступная для заповедников и университетов Большого Алтая; создан набор сервисов для решения природоохранных задач заповедников и национальных парков трансграничного биосферного резервата «Большой Алтай» и Тигирекского заповедника.

–- на национальном уровне – создана виртуальная лаборатория для обработки и анализа данных по биоразнообразию видов растений и животных.

Актуальность, экономическая или социальная полезность: 

Актуальность и новизна проекта обусловлены переходом к передовым цифровым, интеллектуальным технологиям, потребностью в создании систем обработки больших объемов данных, машинного обучения и искусственного интеллекта, ростом требований к квалификации исследователей, привлечением в науку молодых специалистов.

В вопросах стратегического решения социально-экономических задач развития Алтайского края и сопредельных регионов важны оперативные мониторинговые данные, глубокие фундаментальные знания и системный подход к сохранению и восстановлению биоразнообразия, в основе которых заложены методологические подходы и мировые стандарты из области  цифровизации (информатика биоразнообразия, цифровые мировые банки и стандарты в спецификации биологических данных). Эти подходы являются определяющими в современном мире при точной идентификации биологических объектов, оценке природных и антропогенных факторов, влияющих на устойчивость природных экосистем, выявления редких и исчезающих видов.

Алтайский край заинтересован в данных о растительных объектах, так они являются  основой таких стратегических приоритетов, как здравоохранение и продовольственная безопасность. Задачи настоящей работы в полной мере согласуются с приоритетами национальных проектов «Экология», «Наука» и «Образование», и способствуют развитию перспективных рынков Национальной технологической инициативы региона: FoodNet, HealthNet и SafeNet. 

Адаптивность, стилистическое единство всех функциональных блоков:  При реализации проекта учитывалась адаптивность и стилистическое единство всех функциональных блоков.
Масштабируемость, способность к взаимодействию с другими системами, мобильность: 

Для решения поставленных задач проекта используется Американская сеть данных по биоразнообразию (Inter-American Biodiversity Information Network), способствующая решению внутренних задач для каждого из регионов,  а также Глобальная Информационная Система о Биоразнообразии (GBIF – Global Biodiversity Information Facility) – интернет-система, содержащая базу точечных данных о распространении видов на Земле, которые покрывают большой временной период. . В Европе успешно работает сеть Таксономических организаций (The Consortium of European Taxonomic Facilities), способствующая объединению баз данных таксономических систем растений, наземных и морских животных. 

Указанные выше проекты являются целевым прообразом к которому стремится наш ИТ-проект. Данные о ресурсном потенциале лекарственных, пищевых и редких видов растений Большого Алтая методами современных ГИС послужат серьезной прикладной опорой для оценки экономического потенциала трансграничного региона и Алтайского края.

С помощью развития данного проекта мы постараемся преодолеть низкий уровень исследовательской грамотности по работе в международных стандартах информатики биоразнообразия, что, в коечном счете, позволит подготовить специалистов, которые будут способны производить качественный и эффективный мониторинг растительных ресурсов региона.

Обоснованность применяемых проектных решений: 

Проект относится к междисциплинарной области, объединяющей биологию, кибернетику, компьютерные науки, математику и статистику. Крупномасштабные биологические проблемы, требующие анализа больших объемов данных, в данном проекте решаются с вычислительной точки зрения и, главным образом, включают в себя разработку алгоритмов и программ, баз данных, компьютерных методов и моделей для обработки, анализа и визуализации биологических данных в рамках виртуальной лаборатории для более эффективной работы с ними.

Оригинальность, новизна, отличие от аналогов либо отсутствие аналогов: 

Виртуальные лаборатории подразумевают под собой программное обеспечение или программно-аппаратный комплекс, с помощью которого проводятся разного рода исследования и эксперименты без прямого контакта с объектом исследования или лабораторным оборудованием. Чаще виртуальная лаборатория  представляет собой моделирование опыта при помощи современных компьютерных алгоритмов. Подобные лаборатории могут служить как для обучения студентов, так и для настоящей исследовательской деятельности ученых.

Виртуальная лаборатория по оценке и анализу биоразнообразия вида – это универсальный центр моделирования, который предоставляет все необходимые инструменты для процесса моделирования изменения биоразнообразия видов. Данная лаборатория позволяет объединить усилия ученых из разным областей по изучению биоразнообразия видов на разных территориях.

Виртуальная лаборатория позволит ускорить процесс исследования благодаря стандартизации набору инструментов для моделирования и источников данных. Это в свою очередь позволит расширить область исследования и открыть новые его траектории.

Виртуальная лаборатория будет объединять современные инструменты для исследования и данные множества ученых и специалистов в одной онлайн среде для поддержки данной сферы исследования.

В настоящее время существует подобная виртуальная англоязычная лаборатория биоразнообразия и изменения климата (BCCVL), осуществляющая (Modelling Biodiversity in a Changing World, https://bccvl.org.au/) моделирование биоразнообразия в меняющемся мире, разработка которой финансировалась под Национальную стратегию инфраструктуры совместных исследований (NCRIS) через Австралийское сообщество исследовательских данных (ARDC) и совместными инвестициями партнеров проекта.

Сайт BCCV предоставляет доступ к большому набору биологических, экологических и климатических наборов данных (включая сценарии будущего), позволяет осуществлять их визуализацию, а также выполняет статистический анализ данных. BCCV предоставляет непосредственный доступ к платформам регистрации встречаемости видов, таким как ALA и GBIF. На сайте можно запустить модели распределения видов, а затем использовать полученные результаты для прогнозирования изменения климата. Кроме того можно смоделировать влияние климата на конкретные виды растений.

Несомненно, BCCV имеет много преимуществ и достоинств, но 1) разработана на английском языке, что может оказаться препятствием для использования ее возможностей начинающими исследователями (студентами); 2) отсутствуют данные по территории Большого Алтая и России в целом; 3) не позволяет вносить изменения в структуру, в частности, добавление программных модулей, необходимых для исследователей Большого Алтая (например, программный модуль коррекции пространственной неравномерности точек регистрации объектов растительного мира, разработанный автором ВКР).


Соответствие дизайн-решения целевой аудитории:  В целом, дизайн-решение соответствует целевой аудитории.
Юзабилити и полезность:  Полезность отражена в социально-экономической целесообразности проекта и глобальном контекстном решении. Удобство и простота использования изначально закладывались в проект.
Гарантирую достоверность предоставленной в заявке информации. Подтверждаю, что организация не находится в состоянии ликвидации, банкротства, реорганизации (Только для организаций):  Да
Презентация проекта pdf:  Загрузить
Возврат к списку
нет доступа к комментариям Авторизоваться