AN ONTOLOGY OF CROP COLOUR IMAGE CATEGORIES FOR TRAINING AND TESTING ARTIFICIAL NEURAL NETWORK MODELS WITH CONVOLUTIONAL LAYERS
AN ONTOLOGY OF CROP COLOUR IMAGE CATEGORIES FOR TRAINING AND TESTING ARTIFICIAL NEURAL NETWORK MODELS WITH CONVOLUTIONAL LAYERS
Abstract
The relevance of the work is conditioned by the fact that intensification of agricultural production requires processing of significant amounts of information to solve the problems of increasing bioproductivity and implementation of import substitution policy. The development of artificial intelligence (AI) methods, deep machine learning and neural network technologies makes it possible to process operational and retrospective information from agricultural lands using digital technologies on the basis of high-performance capacities of modern computing complexes. The article describes the algorithm of collection, formation and classification of colour (RGB) images of crops, as well as aspects of computer implementation of relational database (DB) for their storage. The implemented database based on MySQL database management system in MySQL Workbench development environment is designed for training and testing deep machine learning models, including artificial neural networks with convolutional layers. The ontology of high-resolution image classes includes 4 categories: healthy vegetation ("healthy"), affected vegetation ("affected"), soil, unplanted field ("soil") and miscellaneous objects ("other").
1. Введение
Развитие технологий искусственного интеллекта, методов глубокого машинного обучения и нейросетевых технологий обуславливает возможность их широкого применения в различных отраслях народного хозяйства, в том числе сельском хозяйстве. В Российской Федерации реализуется целый ряд государственных программ для развития современного высокоэффективного сельского хозяйства, в частности, ключевой задачей является переход к цифровому сельскому хозяйству, точному земледелию, активному использованию интеллектуальных технологий в АПК . Актуальность работы обусловлена тем, что интенсификация сельскохозяйственного производства требует обработки значительных объемов информации для решения задач повышения биопродуктивности и реализации политики импортозамещения.
Промышленный характер сельскохозяйственного производства в регионах Российской Федерации требует создания новых методов его интенсификации, среди которых важное место занимают интеллектуальные методы мониторинга и анализа состояния посевов на значительных площадях с использованием средств дистанционного мониторинга. Различные вопросы применения искусственного интеллекта, компьютеризированных систем и нейросеветевых технологий рассмотрены в работах Бородычева В.В. , , Михайленко И. М. , Трухачева В.И. , Юрченко И.Ф. и других отечественных и зарубежных авторов , , , .
2. Материалы и методы
Рисунок 1 - Типовые изображения, полученные в ходе аэрофотосъемки тестовых участков
Рисунок 2 - Фрагмент наполнения таблицы классифицированных сегментов изображений
3. Основные результаты и обсуждение
Реализованная база данных для хранения исходных и размеченных цветных изображений высокого разрешения базируется на реляционной модели данных, EER- диаграмма которой представлена на рисунке 3 и состоит из 5 таблиц:
- таблица хранения исходного цветного изображения поля с посевами, содержащая следующие патрибуты: id - индивидуальный номер изображения в БД; directory - путь до хранимого изображения; culture_group_id - ключ-значение индивидуального номера соответствующей изображению сельскохозяйственной культуры; season_id – ключ-значение индивидуального номера соответствующего изображению сезона фотографирования культуры; day_period_id – ключ-значение индивидуального номера соответствующего изображению временного периода роста культуры;
- таблица хранения сегментов исходного цветного изображения поля с экспертной разметкой (классификацией), содержащая следующие атрибуты: id – индивидуальный номер сегмента изображения в БД; directory - путь до хранимого сегмента изображения; field_image_id – ключ-значение индивидуального номера соответствующего сегменту оригинального изображения, is_good - значение типа «Да/Нет» (1/0 соответственно), отражающие наличие в сегменте класса «здоровая растительность», is_bad – значение типа «Да/Нет» (1/0 соответственно), отражающие наличие в сегменте класса «пораженная растительность», is_soil – значение типа «Да/Нет» (1/0 соответственно), отражающие наличие в сегменте класса «почва, незасеянное поле», is_other – значение типа «Да/Нет» (1/0 соответственно), отражающие наличие в сегменте класса «прочие объекты»;
- таблица сезонов аэрофотосъемки полей с посевами, содержащая следующие поля: id – индивидуальный номер сезона аэрофотосъемки в БД, season_name - наименование сезона аэрофотосъемки;
- таблица выращиваемой на поле культуры, содержащая следующие поля: id – идентифицирующий номер возделываемой сельскохозяйственной культуры в БД, culture_name – наименование сельскохозяйственной культуры;
Рисунок 3 - EER диаграмма базы данных хранения цветных изображений
Рисунок 4 - Базовый алгоритм работы программы
Рисунок 5 - Скрипт создания схемы данных реляционной БД
4. Заключение
В ходе проводимого исследования, поддержанного грантом Российского научного фонда и администрации Волгоградской области (№ 22-21-20041) осуществлен сбор аэрофотоснимков посевов сельскохозяйственных культур на экспериментальных участках полей УНПЦ Горная поляна с использованием средств дистанционного мониторинга, что позволило сформировать базу данных цветных изображений высокого разрешения. Онтология классов цветных изображений, хранимых в БД, включает в себя 4 категории: здоровая растительность («healthy»), пораженная растительность («affected»), почва, незасеянное поле («soil») и прочие объекты («other»). Реализованная БД на базе системы управления базами данных MySQL в среде разработки MySQL Workbench, использовалась для обучения и тестирования моделей глубокого машинного обучения, в том числе, созданной и обученной, в ходе реализации проекта, рекуррентной нейронной сети со сверточными слоями.