Российская сельскохозяйственная наука, 2022, № 1
УДК 631.17
DOI: 10.31857/S2500262722010112
ПРОГНОЗИРОВАНИЕ ЗАСОРЕННОСТИ ПОСЕВОВ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ
МАШИННОГО ОБУЧЕНИЯ
В.К. Каличкин1, доктор сельскохозяйственных наук,
О.К. Альсова2, кандидат технических наук,
К.Ю. Максимович1, аспирант,
Н.В. Васильева1, кандидат биологических наук
1Сибирский федеральный научный центр агробиотехнологий РАН, 630501, Новосибирская область, пос. Краснообск
E-mail: vk.kalichkin@mail.com
2Новосибирский государственный технический университет,
630073, Новосибирск, просп. Карла Маркса, 20
Представлены результаты исследования по оценке влияния качественных факторов и метеорологических параметров на
засоренность посевов. Выполнено построение прогнозной модели засоренности посевов на основе дерева решений в усло-
виях ограниченной выборки. В ходе исследования использованы материалы длительных полевых опытов, проведенных в
лесостепи Новосибирской области, и сведения о метеорологических параметрах Новосибирского поста метеонаблюдений
за 1996-2018 гг. Для решения задач исследования применяли разные классы методов интеллектуального анализа данных,
а именно непараметрические вероятностно-статистические методы, методы визуализации и метод деревьев решений.
Выбор методов исследования обусловлен особенностями структуры и характера распределения исходных данных: несо-
ответствие модели закону нормального распределения; сравнительно небольшой объем выборки; наличие как качествен-
ных, так и количественных предикторов; сложные нелинейные корреляционные связи между степенью засоренности
посевов и метеорологическими параметрами. Выявлены качественные факторы, определяющие степень засоренности
посевов: фон химизации, размещение культуры после пара, система обработки почвы и метеорологические параметры
(среднедекадные температуры воздуха и осадки за период с 3-й декады апреля по конец мая). Выполнена оценка их вклада
и статистической значимости. С использованием алгоритма CART построения дерева решений разработана модель
прогноза засоренности посевов и сформулированы логические правила развития сорняков в зависимости от управляющих
воздействий и агрометеоусловий. Точность модели характеризуется следующими показателями: MAE (средняя абсолют-
ная ошибка) = 3,75; RMSE (среднеквадратичная ошибка) = 5,70 и R2 (коэффициент детерминации) = 0,80. Построенный
набор логических правил описывает структуру причинно-следственных связей и может быть использован в дальнейшем
при создании экспертной системы поддержки принятия решений в растениеводстве.
APPLICATION OF MACHINE LEARNING TO FORECAST THE CONTAMINATION OF CROPS
Kalichkin V.K. 1, Alsova O.K. 2, Maksimovich K.Yu. 1, Vasilyeva N. V.1
1Siberian Federal Research Center of Agricultural Biotechnology, Russian Academy of Sciences,
630501, Novosibirskaya obl., pos. Krasnoobsk
E-mail: vk.kalichkin@gmail.com
2Novosibirsk State Technical University,
630073, Novosibirsk, prosp. Karla Marksa, 20
The paper provides the results on evaluating the influence of qualitative factors and meteorological parameters on the crop infestation
index. The prediction model of crops infestation has been built on the application of the decision tree method given limited samples of
data. In research work using the materials of long-term field experiments of Siberian Research Institute of Farming and Chemization of
Agriculture - structural subdivision of Siberian Branch of the Russian Academy of Sciences, carried out in the forest-steppe of Novosibirsk
region and data on meteorological parameters of Novosibirsk weather observation station for 1996-2018. In order to meet the objectives
of the study, different classes of data mining methods were used, such as nonparametric probabilistic-statistical methods, visualization
methods, and decision tree methods. Selection of research methods was determined by the peculiarities of the structure and nature of the
initial data distribution: nonconformity of the law of normal distribution model; sufficiently small sample size; multiple qualitative and
quantitative predictors; complex nonlinear correlations between the crop infestation index and meteorological parameters. Qualitative factors
determining the crop infestation index (use of chemicalization, crop placement after fallow, tillage system) and meteorological parameters
(average ten-day air temperatures and precipitation during the period from the 3rd ten-day period of April to the end of May) have been
identified. Their contribution and statistical significance were evaluated. Using the CART algorithm for building a decision tree, developed
the model for crop infestation forecasting and formulated the logical rules of weed development depending on the controlling influences
and agrometeorological conditions. The accuracy of the model is characterized by the following indicators: MAE (Mean Absolute Error) =
3.75; RMSE (Root Mean Square Error) = 5.7 and R2(Coefficient of Determination/R Squared)= 0.8. The set of logical rules describes the
structure of causal relationships in the data and can be used in the future to create a decision support system in crop production.
Ключевые слова: прогнозирование, непараметрические
Key words: forecasting, nonparametric probability-statistical
вероятностно-статистические методы, деревья решений,
methods, decision trees, crop infestation, R.
засоренность посевов, язык R.
С распространением инновационных технологиче-
агрономии, защиты растений, агрохимии, экологии,
ских решений в сельском хозяйстве возникает потреб-
которые могут быть использованы для оценки возмож-
ность в разработке прогностических инструментов, соз-
ных рисков, обоснования экономической эффективности
данных совместно разработчиками программного обе-
используемых агроприемов и принятия решений в об-
спечения и исследователями из прикладных областей:
ласти сельского хозяйства [1, 2, 3].
67
Российская сельскохозяйственная наука, 2022, № 1
Способность предвидеть развитие вредных организ-
после пара - первая культура (1), вторая (2), третья (3). На
мов, оценить возможные риски потери урожайности и
интенсивном фоне азотные удобрения вносили ежегодно
оперативно принять взвешенное решение обосновывает
в дозе N90 перед посевом, фосфорные - в дозе P120 один раз
актуальность поиска и применения эффективных методов
за ротацию севооборота в паровом поле. По вегетации при-
прогнозирования в сельском хозяйстве [4, 5, 6]. Создание
меняли баковую смесь гербицидов против однодольных и
предиктивных моделей агросистем осложняется наличием
двудольных сорных растений (в фазе кущения), фунгициды
нелинейных взаимосвязей между входными факторами и
против болезней (в фазе флаг-листа) и инсектициды по
результирующими показателями, большим количеством
ситуации. На экстенсивном фоне удобрения и пестициды
предикторов при сравнительно малом количестве на-
не использовали.
блюдений, практической сложностью проведения много-
Исследования проводили в севообороте пар - озимая
факторных экспериментов [7, 8, 9]. Оптимизационные и
рожь - яровая пшеница - яровая пшеница. После 2007 г.
биофизические модели имеют ограниченное применение,
озимую рожь заменили яровой пшеницей. Сорная расти-
поскольку требуют большого объема входных данных [10,
тельность на опытном поле была представлена 30 видами,
11, 12]. Необходим поиск качественно новых подходов к
относящимися преимущественно к типичным для лесостеп-
оценке рисков и управлению посевами, которые основаны
ной зоны. Большую часть сорного фитоценоза составляли
на современных разработках в области информационных
мятликовые (злаковые) виды - просо куриное и посевное
технологий [13].
(Echinochloa crusgalli (L.), Panicum miliaceum L.), щетин-
Одним из таких подходов может стать метод дерева
ники сизый и зеленый (Setaria viridis L., S.pumila (Po: ret)
решений - графическое представление логических правил
Schultes). В разные годы доля мятликовых от общей фито-
развития процесса в зависимости от складывающихся усло-
массы сорных растений достигала 73...84 %. Двудольные
вий (сочетание действующих факторов), демонстрирующий
сорные растения представлены большей частью однолет-
альтернативные варианты развития событий [14, 15, 16].
ними ранними и поздними яровыми. Наиболее распростра-
Визуально представленная логическая модель, позво-
нены были щирица запрокинутая (Amaranthus retroflexus
ляет объяснять варианты развития событий и исследовать
L.), пикульник двунадрезанный (жабрей) (Galeopsis bifida
вероятные последствия выбора их сочетаний [17]. Все
Boenn.), паслен черный (Solanum nigrum L.), липучка ще-
это открывает возможности для анализа рисков в соче-
тинистая (Lappula squarrosa (Retz.) Dum.), подмаренник
тании с каждым вариантом складывающихся условий.
цепкий (Galium aparine L.) и различные виды семейства
Формализация предметной области на логическом уровне
гречишные (Fagopirum tataricum (L.), Persicaria lapathifolia
демонстрирует высокие показатели достоверности при
(L.) S.F.Gray), P. hydropiper (L)., Fallopia convolvulus (L.).
ограниченном количестве влияющих факторов и без «по-
Многолетние виды вьюнок полевой (Convolvulus arvensis
гружения» в биофизические свойства исследуемого объекта
L.), бодяк щетинистый (Cirsium setosum (Willd.) Bess.) и
[13]. Дерево решений - это инновационный инструмент
осот полевой (Sonchus arvensis L.) встречались в основном
в сельском хозяйстве, который уже применяют по таким
на экстенсивном фоне и на их долю приходилось не более
направлениям, как моделирование эрозионных процессов
0,3 % сорного фитоценоза.
[18], оценка засоленности почвы [19], определение болезней
В исследовании использовали данные по метеорологи-
[20], прогнозирование урожайности сельскохозяйственных
ческим показателям Новосибирского поста метеонаблю-
культур [21, 22, 23].
дений, расположенного вблизи г. Новосибирска, а именно,
Сельскохозяйственной наукой и практикой накоплено
среднесуточные температуры воздуха за декаду (ºС), сумма
большое количество информации, которая содержит в себе
осадков (в мм) за 3-ю декаду апреля и 1...3 декады мая, а
сформированные и устоявшиеся знания, но их практиче-
также суммы среднесуточных температур воздуха и осадков
ская реализация на основе инженерии знаний - актуальная
за эти же периоды (http://www.pogodaiklimat.ru ).
проблема методического характера. Разработка моделей,
В ходе работы применяли вероятностно-статистические
приближенных к логическим рассуждениям человека, и их
методы и критерии для исследования законов распреде-
использование в построении систем поддержки принятия
ления данных (критерий согласия Шапиро-Уилка [14]),
решений - одно из современных направлений цифрови-
выявления факторов, влияющих на показатель засорен-
зации сельского хозяйства. Становится возможным ис-
ности посевов и оценки их вклада (непараметрический
пользование метода деревьев решений для частных задач
критерий Краскела-Уоллиса [15], ранговый коэффициент
в области растениеводства [24]. Так, прогнозирование за-
корреляции Спирмена). Для прогнозирования степени засо-
соренности посевов потенциально позволит помочь в при-
ренности посевов была построена модель дерева решений
нятии обоснованных решений по выбору агротехнологий
с использованием алгоритма CART [16]. Оценку точности
и эффективному применению средств защиты растений,
и оптимизацию модели выполняли с использованием 10-
что выступает одним из ключевых вопросов управления
кратной 10-блочной кросс-проверки. Для графического
агрофитоценозом.
представления структуры исходных данных и результатов
Цель исследования - построение прогнозной модели
анализа применяли методы визуализации (построение диа-
засоренности посевов на основе применения метода дерево
грамм размаха, гистограмм, деревьев решений).
решений в условиях ограниченной выборки.
Всего в выборке было представлено 528 значений за-
Методика. В работе использованы данные по засо-
соренности посевов (в % от фитомассы надземной части
ренности посевов яровой пшеницы длительных полевых
посевов) яровой пшеницы и обусловливающих ее факторов.
опытов СибНИИЗиХ - структурного подразделения
Для качественной характеристики засоренности посевов
СФНЦА РАН, расположенных в Новосибирской области,
вводили показатель уровня относительной засоренности
р.п. Краснообск, за 1996-2018 гг. В качестве факторов,
(полученный в эксперименте), принимающий значение
влияющих на формирование уровня засоренности посевов,
одной из 4 категорий соотношения с экономическим по-
рассматривали фон применения средств химизации - экс-
рогом вредоносности (ЭПВ = 10 % от фитомассы надземной
тенсивный (Э), интенсивный (И); систему обработки
части посевов): 1 - существенно ниже ЭПВ (менее 10 %),
почвы - ежегодная вспашка на глубину 20…22 см (В), без-
обработка посевов гербицидами не требуется; 2 - в пределах
отвальная глубокая обработка на глубину 20…22 см (БГ),
ЭПВ (10 % + 1 %), обработка гербицидами по ситуации
минимальная плоскорезная обработка на глубину 10…12
(учитывая погодные условия); 3 - существенно выше ЭПВ
см (М), без основной обработки почвы (БО); размещение
(более 10 %), гербицидная обработка обязательна, 4 - экс-
68
Российская сельскохозяйственная наука, 2022, № 1
Табл. 1. Статистические характеристики показателя засоренности посевов
Статистические характеристики
Значение
Фактор
число наблю-
среднеквадратиче-
минимальное
максимальное
фактора
среднее
дений
ское отклонение
значение
значение
Фон применения
И
264
2,0
2,5
0,0
17,9
средств химизации
Э
264
16,8
14,3
0,1
67,0
Культура после пара
1
176
4,0
5,5
0,0
31,2
2
176
8,6
10,8
0,0
50,9
3
176
15,6
16,4
0,1
67,0
Система обработки
БГ
132
8,6
12,0
0,0
58,1
почвы
БО
132
12,1
14,8
0,1
67,0
В
132
6,8
9,9
0,0
42,7
М
132
10,1
13,0
0,0
54,4
тремальный уровень превышения ЭПВ, при котором воз-
года проведения исследований и используемой системы
можны значительные потери урожая (более 25 %).
обработки почвы сравнительно меньше, чем от фона хи-
Все расчеты выполняли средствами языка R в среде
мизации и удаленности культуры от пара (рис. 2). Для под-
статистического анализа данных R-Studio.
тверждения предварительных выводов о наличии и степени
Результаты и обсуждение. Для изучения структуры
влияния качественных факторов на формирование уровня
данных и обоснованного выбора методов исследования
засоренности посевов был использован непараметрический
был проведен анализ характера распределения показателя
критерий Краскела-Уоллиса. Выбор критерия обусловлен
засоренности посевов по всей выборке и по подвыборкам,
характером распределения показателя засоренности по-
сформированным при конкретном значении качественного
севов (отклонена гипотеза о нормальном распределении)
фактора (система обработки почвы, фон химизации, куль-
и сравнительно небольшим объемом исходных данных. В
тура после пара).
результате применения критерия Краскела-Уоллиса выяв-
Распределение показателя засоренности посевов зна-
лена статистически значимая связь между засоренностью
чительно отличалось для экстенсивного и интенсивного
посевов и фоном химизации (р<0,00001), размещением
фонов (табл. 1). На экстенсивном фоне соответствующие
статистические характеристики примерно в 8 раз выше,
чем на интенсивном.
Выполнена проверка гипотезы о соответствии показате-
ля засоренности модели закона нормального распределения
(ЗНР). Визуально распределения не согласуются с моделью
ЗНР, имеют ярко выраженную асимметрию (рис. 1). Гипо-
теза о ЗНР показателя засоренности посевов отвергается
при использовании критерия согласия Шапиро-Уилка
(р-значение<0,05). Аналогичные результаты были получе-
ны по всем сформированным подвыборкам исследуемого
показателя.
Выявлены значительные отличия в статистических
характеристиках засоренности посевов, вычисленных
при разных значениях качественных факторов (фон хи-
мизации, культура после пара). Разница в статистических
характеристиках засоренности посевов в зависимости от
Рис. 2. Диаграммы размаха показателя засоренности
посевов в зависимости от значений качественного
фактора: a) год; б) система обработки почвы; в)
культура после пара; г) фон химизации (положение
центральной линии определяет медиану, границы
прямоугольника соответствуют нижнему и верхнему
квартилям, высота прямоугольника - значение
интерквартильного размаха (ИКР), положение верхнего
(нижнего) «уса» диаграммы определяется как сумма
Рис. 1. Гистограмма показателя засоренности посевов
верхнего (нижнего) квартиля и величины 1,5×ИКР,
с наложением аппроксимирующей функции плотности
либо соответствует максимальному (минимальному)
распределения вероятностей: 1 - мода, 2 - медиана,
значению. Значения за пределами «усов» могут быть
3 - среднее.
аномальными выбросами).
69
Российская сельскохозяйственная наука, 2022, № 1
культуры после пара (р<0,00001), системой обработки по-
ляций между исследуемыми факторами, так и о более слож-
чвы (р<0,0005), а также особенностями года исследований
ном нелинейном характере их связи, для описания которого
(р<0,0001).
необходимо применение методов других классов.
Наибольший уровень засоренности посевов выявлен на
Исходя из полученных результатов анализа характера
3 культуре после пара и без обработки почвы (см. табл. 1).
распределения и взаимосвязей данных, для построения
Связь засоренности с размещением культуры в севообороте
прогнозной модели был выбран метод дерева решений. При
была прямая - чем дальше культура расположена от пара,
его выборе учитывали небольшой объем выборки, наличие
тем выше засоренность. Это объясняется накоплением
как качественных, так и количественных предикторов,
семян однолетних сорных растений и многолетних кор-
значительные отклонения распределения показателя засо-
неотпрысковых сорняков в пахотном слое почвы по мере
ренности посевов от закона нормального распределения.
удаления от парового поля. Наиболее явно зависимость
Кроме того, дерево решений часто позволяет построить
наблюдается на экстенсивном фоне без применения герби-
сравнительно точную прогнозную модель при отсутствии
цидов. На интенсивном фоне тенденция также сохраняется,
сильных линейных корреляций между целевым показате-
хотя проявляется в меньшей степени. На заключительной
лем (степень засоренности посевов) и предикторами, как в
культуре севооборота отмечена максимальная засоренность
нашем случае.
посевов по всем вариантам обработки почвы.
Дерево решений графически представляет собой
Отмечено значительное влияние системы обработки по-
логическую модель взаимосвязи степени засоренности
чвы на засоренность посевов. Безотвальные обработки (БГ
культуры, качественных факторов и метеорологических
и М) способствовали накоплению на поверхности почвы
показателей (рис. 3). Каждый узел дерева показывает про-
семян сорных растений, которые весной в массе прорастали
гнозируемое значение степени засоренности посевов (в %),
в последующей культуре. В варианте со вспашкой засорен-
число наблюдений в узле и долю наблюдений от общего
ность была минимальной, так как оборот пласта способ-
количества (в %).
ствует попаданию семян сорняков в нижние слои пахотного
Система обработки почвы не была выделена в качестве
горизонта, где большая часть их погибает. Кроме того, при
значащего фактора в прогнозной модели, что объясняется высо-
вспашке уничтожается значительная часть многолетних
ким комплексным вкладом факторов «фон интенсификации»,
сорных растений. Отсутствие обработки почвы (вариант
«культура после пара» и выделенных метеорологических по-
БО) способствует увеличению засоренности.
казателей в формирование засоренности посевов. В результате
Связь показателя засоренности посевов и года исследо-
включение в модель данных по засоренности в зависимости
ваний подтверждает гипотезу о его зависимости от метео-
от системы обработки почвы не приводит к статистически
условий. Для оценки связи между уровнем засоренности
значимому улучшению показателей ее точности.
посевов и метеорологическими показателями использовали
Минимальное количество сорного компонента наблю-
ранговый коэффициент корреляции Спирмена, который не
дается на интенсивном фоне (лист дерева 2). Наименьший
требует выполнения условия нормального распределения
уровень засоренности посевов формируется по 1-й культуре
исходных данных и может быть использован для получения
после пара и равен 6,6 % на экстенсивном фоне (лист дерева
корректных выводов о наличии и силе связи между иссле-
12). По 2-й культуре после пара доля сорняков в общей
дуемыми количественными показателями.
биомассе посевов увеличивается с 10 % до 35 % (листья 21,
Выявлено наличие слабой корреляционной линейной
54, 55). Регулирующим фактором в варианте размещения
связи между уровнем засоренности посевов и метеороло-
пшеницы 2-й культурой после пара на экстенсивном фоне
гическими показателями (табл. 2): статистически значимые
выступают осадки 1-й декады мая, которые способствуют
положительные связи на экстенсивном фоне химизации
значительному увеличению биомассы сорняков (лист 55).
выявлены только с температурой воздуха в 3-й декаде мая
Наибольшая доля сорной растительности (45%) достигается
и суммарной температурой воздуха за период с 3-й декады
при среднесуточной температуре воздуха за вторую декаду
апреля по конец мая, отрицательная статистически значимая
мая выше 9,5 °С и сумме осадков выше 12 мм (лист дерева
связь - с осадками за 3-ю декаду апреля; на интенсивном
61). Фактором, значительно лимитирующим рост и развитие
фоне химизации отмечена статистически значимая связь
сорняков на 3-й культуре после пара на экстенсивном фоне,
только с осадками в 3-й декаде апреля. Такой результат
была среднесуточная температура воздуха за 2-ю декаду
может свидетельствовать как об отсутствии сильных корре-
мая ниже 9,5 °С.
Табл. 2. Результаты расчета коэффициента корреляции Спирмена
Экстенсивный фон
Интенсивный фон
Показатель
значение
значение
р-значение
р-значение
коэффициента
коэффициента
Среднесуточная температура
воздуха за:
3 декаду апреля
-0,02
>0,05
0,06
>0,05
1 декаду мая
0,10
>0,05
0,03
>0,05
2 декаду мая
0,09
>0,05
-0,05
>0,05
3 декаду мая
0,13
<0,05
0,04
>0,05
Сумма осадков за:
3 декаду апреля
-0,18
<0,05
-0,16
<0,05
1 декаду мая
-0,06
>0,05
-0,11
>0,05
2 декаду мая
0,06
>0,05
-0,08
>0,05
3 декаду мая
-0,04
>0,05
0,01
>0,05
Сумма среднесуточных темпе-
ратур воздуха за период (с 3-ей
декады апреля по конец мая)
0,15
<0,05
-0,02
>0,05
Сумма осадков за период (с
3-ей декады апреля по конец
мая)
-0,06
>0,05
0,05
>0,05
70
Российская сельскохозяйственная наука, 2022, № 1
Рис. 3. Дерево решений для прогнозирования показателя засоренности посевов.
По полученным результатам можно заключить, что
если фон химизации экстенсивный и первая культура
количество атмосферных осадков существенно влияет
после пара, то показатель засоренности посевов равен
на засоренность посевов яровой пшеницы. При этом мак-
6,6 %;
симальное воздействие оказывают осадки и температура
если фон химизации экстенсивный, 2 культура после
в период посева и всходов (май), когда культурные и
пара и сумма осадков 3 декады апреля выше 3,5 мм, то
сорные растения только формируются. Высокая темпе-
показатель засоренности посевов равен 10 %;
ратура воздуха способствует более быстрому росту яро-
если фон химизации экстенсивный, 3 культура после
вой пшеницы, что дает возможность ей занять площадь
пара и среднесуточная температура воздуха 2 декады
питания и подавить прорастающие сорные растения. В
мая ниже 9,5 °С, то показатель засоренности посевов
период от фазы кущения до уборки (июнь-август) за-
равен 18 %;
висимость засоренности от атмосферных осадков значи-
если фон химизации экстенсивный, 3 культура после
тельно слабее, так как сформировавшаяся масса растений
пара, среднесуточная температура воздуха 2 декады мая
пшеницы препятствует росту сорняков и появлению их
выше 9,5 °С и сумма осадков 2 декады мая выше 12 мм, то
новых всходов.
показатель засоренности посевов равен 45 %.
Показатели точности модели дерева решений соста-
Таким образом, по результатам изучения разных классов
вили: MAE (средняя абсолютная ошибка) = 3,75; RMSE
методов интеллектуального анализа данных, как непараме-
(среднеквадратичная ошибка) = 5,70 и R2 (коэффициент
трических вероятностно-статистических, так и построения
детерминации) = 0,80.
логической модели (набор правил «если - то»), установлено,
На основе построенного дерева решений можно сформу-
что для прогнозирования изменения показателя засоренно-
лировать наиболее значимые логические правила, которые
сти посевов лучше всего подходит метод дерево решений.
дают возможность прогнозировать степень засоренности
Такой выбор обусловлен особенностями структуры и ха-
посевов яровой пшеницы:
рактера распределения исходных данных: несоответствие
71
Российская сельскохозяйственная наука, 2022, № 1
модели закону нормального распределения; сравнительно
Научно-технические ведомости Санкт-Петербургского
небольшой объем выборки; наличие как качественных, так
государственного политехнического университета.
и количественных предикторов; сложные нелинейные кор-
Информатика, телекоммуникации и управление. 2011.
реляционные связи между степенью засоренности посевов
№ 1 (115). С. 99-105.
и метеорологическими показателями.
12. Использование динамической модели агроэкосисте-
К основным факторам, определяющим засоренность
мы для оценки влияния климатических изменений
посевов яровой пшеницы, относятся: фон интенсификации,
на продуктивность посевов (теория и реализация) /
удаленность культуры от пара, а также среднедекадные
Р. А. Полуэктов, А. Г. Топаж, В. П. Якушев и др. //
температуры воздуха и осадки за период с 3-ей декады
Вестник Российской академии сельскохозяйственных
апреля по конец мая.
наук. 2012. №. 2. С. 7-12.
13. Имитационная модель агроэкосистемы как инстру-
Литература.
мент теоретических исследований / В. Л. Баденко, А.
1.
Agriculture in 2050: recalibrating targets for sustainable
Г. Топаж, В. В. Якушев и др. // Сельскохозяйственная
intensification / M. C. Hunter, R. G. Smith, M. E. Schipanski,
биология. 2017. Т. 52. № 3. С. 437-445.
et al. // Bioscience. 2017. Vol. 67. No. 4. P. 386-391. doi:
14 Статистический анализ данных, моделирование
10.1093/biosci/bix010.
и исследование вероятностных закономерностей.
2.
Climate smart agriculture, farm household typologies
Компьютерный подход: монография / Б. Ю. Лемешко,
and food security: An ex-ante assessment from Eastern
С. Б. Лемешко, С. Н. Постовалов и др. Новосибирск:
India / S. Lopez-Ridaura, R. Frelat, M. T. van Wijk, et
Изд-во НГТУ, 2011. 888 с.
al. // Agricultural systems. 2018. Vol. 159. P. 57-68. doi:
15. Kruskal W. H., Wallis W. A. Use of ranks in one-criterion
10.1016/j.agsy.2017.09.007
variance analysis. // Journal of the American Statistical
3.
Decision support systems for agriculture 4.0: Survey and
Association. 1952. Vol. 47. No. 260. Р. 583-621.
challenges / Z. Zhai, J. F. Martínez, V. Beltran, et al. //
16. Classification and regression trees / L. Breiman,
Computers and Electronics in Agriculture. 2020. Vol. 170.
J. H. Friedman, R. A. Olshen, et al. Monterey, CA:
P. 105256. URL: https://www.sciencedirect.com/science/
Wadsworth & Brooks / Cole Advanced Books & Software.
article/pii/S0168169919316497?via%3Dihub (дата обра-
1984. 368 p. doi: 10.1201/9781315139470.
щения: 12.10.2021). doi: 10.1016/j.compag.2020.105256.
17. Орлов А. И. Новая парадигма прикладной статистики
4.
Köksal Ö., Tekinerdogan B. Architecture design approach
// Заводская лаборатория. Диагностика материалов.
for IoT-based farm management information systems //
2012. Т. 78. № 1-1. С. 87-93.
Precision Agriculture. 2019. Vol. 20. No. 5. P. 926-958.
18. Gayen A., Pourghasemi H. R. Spatial modeling of gully
doi: 10.1007/s11119-018-09624-8.
erosion: a new ensemble of CART and GLM data-mining
5.
IoT and agriculture data analysis for smart farm /
algorithms // Spatial Modeling in GIS and R for Earth and
J. Muangprathub, N. Boonnam, S. Kajornkasirat, et al. //
Environmental Sciences. Elsevier. 2019. P. 653-669. doi:
Computers and electronics in agriculture. 2019. Vol. 156.
10.1016/B978-0-12-815226-3.00030-2.
P. 467-474. doi: 0.1016/j.compag.2018.12.011.
19. Засолённые почвы Венгрии: прогноз распространения
6.
A systems approach to forecast agricultural land
на основе гидрогеологических карт / Т. Тот, Л. Пастор,
transformation and soil environmental risk from economic,
Ш. Кабош и др. // ББК 40.3. Э 40. 2009. С. 116-158.
policy, and cultural scenarios in the north central United
20 Detection and classification of citrus diseases in agriculture
States (2012-2062) / B. L. Turner, M. Wuellner, T.
based on optimized weighted segmentation and feature
Nichols, et al. // International Journal of Agricultural
selection / M. Sharif, M. A. Khan, Z. Iqbal, et al. // Computers
Sustainability. 2017. Vol. 15. No. 2. P. 102-123. doi:
and electronics in agriculture. 2018. Vol. 150. P. 220-234.
0.1080/14735903.2017.1288029.
doi: 10.1016/j.compag.2018.04.023.
7.
Opinion: Smart farming is key to developing sustainable
21. Zeinvand Lorestani E., Kamkar B., Razavi S. E. Study on the
agriculture / A. Walter, R. Finger, R. Huber, et al. //
effect of agricultural management factors on fungal diseases
Proceedings of the National Academy of Sciences.
diversity indices and wheat yield in Gorgan using decision
2017. Vol. 114. No. 24. P. 6148-6150. doi: 10.1073/
tree analysis CART // Cereal Research. 2016. Vol. 6. No. 4.
pnas.1707462114.
P. 489-505.
8.
Big data analytics and precision animal agriculture
22. Monjezi N. The Application of the CART and CHIAD
symposium: Machine learning and data mining advance
Algorithms in Sugar Beet Yield Prediction // Basrah Journal of
predictive big data analysis in precision animal agriculture
Agricultural Sciences. 2021. Vol. 34. No. 1. URL: https://bjas.
/ G. Morota, R. V. Ventura, F. F. Silva, et al. // Journal of
bajas.edu.iq/index.php/bjas/article/view/318 (дата обраще-
animal science. 2018. Vol. 96. No. 4. P. 1540-1550. doi:
ния: 17. 10. 2021). doi: 10.37077/25200860.2021.34.1.01.
10.1093/jas/sky014.
23 Use of classification and regression trees (CART) for
9.
Кравченко Ю. А., Лежебоков А. А., Запорожец Д. Ю.
analyzing determinants of winter wheat yield variation
Способы интеллектуального анализа данных в сложных
among fields in Poland / M. Iwańska, A. Oleksy, M. Dacko,
системах // Известия Кабардино-Балкарского научного
et al. // Biometrical Letters. 2018. Vol. 55. No. 2. P. 197-214.
центра РАН. 2012. № 3. С. 52-57.
doi: 10.2478/bile-2018-0013.
10. Кремер Н. Ш. Теория вероятностей и математическая
24. Kalichkin V. K., Alsova O. K., Maksimovich K. Y. Application
статистика как фундамент новой комплексной при-
of the decision tree method for predicting the yield of spring
кладной дисциплины «анализ данных» // Современная
wheat // IOP Conference Series: Earth and Environmental
математика и концепции инновационного математи-
Science. IOP Publishing. 2021. Vol. 839. No. 3. Р. 032042.
ческого образования. 2019. Т. 6. № 1. С. 333-337.
URL: https://iopscience.iop.org/article/10.1088/1755-
11. Хворова Л. А., Топаж А. Г. Построение моделей агро-
1315/839/3/032042 (дата обращения: 15.10.2021). doi:
экосистем и их адаптация к конкретным условиям //
10.1088/1755-1315/839/3/032042.
Поступила в редакцию 02.12.2021
После доработки 28.12.2021
Принята к публикации 20.01.2021
72