ЖУРНАЛ ОБЩЕЙ ХИМИИ, 2020, том 90, № 6, с. 953-964
УДК 544.354.081.7:004.021
ЭМПИРИЧЕСКИЕ МОДЕЛИ УСТОЙЧИВОСТИ
КОМПЛЕКСОВ КРАУН-ЭФИРОВ С КАТИОНАМИ
ЩЕЛОЧНЫХ И ЩЕЛОЧНОЗЕМЕЛЬНЫХ МЕТАЛЛОВ
В НЕКОТОРЫХ ЧИСТЫХ РАСТВОРИТЕЛЯХ
© 2020 г. Н. В. Бондарев*
Харьковский национальный университет имени В. Н. Каразина, пл. Свободы 4, Харьков, 61022 Украина
*e-mail: bondarev_n@rambler.ru
Поступило в Редакцию 4 февраля 2020 г.
После доработки 4 февраля 2020 г.
Принято к печати 27 февраля 2020 г.
На основе разведочных и нейросетевых методов математического моделирования равновесий в растворах
развит подход по прогнозированию констант устойчивости коронатов по свойствам растворителей, катио-
нов и краун-эфиров. Разработаны разведочные (факторная, кластерные, дискриминантная, каноническая,
деревья решения), регрессионные и нейросетевые (с учителем, сеть Кохонена) модели устойчивости
комплексов краун-эфиров (12С4, 13С4, 14С4, 15С4, 15С5, 18С6, 21С7, 24С8, B12C4, B15C5, CH15C5,
CH18C6, DCH18C6, DCH21C7, DB18C6, DB21C7, DB24C8, DB27C9, DB30C10) c катионами щелочных
(Li+, Na+, K+, Cs+, Rb+) и щелочноземельных (Ca2+, Sr2+, Ba2+) металлов в водных и неводных (ацетон,
ацетонитрил, диметилсульфоксид, метанол, пиридин, диметилформамид, диоксан, пропиленкарбонат,
1,2-дихлорэтан, нитробензол) растворах по свойствам растворителей (диаметр молекулы растворителя,
параметр Камлета-Тафта, параметр Димрота-Райхардта, диэлектрическая проницаемость), краун-эфиров
(топологический индекс Балабана) и катионов (диаметр катиона) при 298.15 K.
Ключевые слова: краун-эфиры, константа комплексообразования, разведочный анализ, множественная
линейная регрессия, нейронные сети, моделирование, прогнозирование
DOI: 10.31857/S0044460X20060170
Количественные подходы к описанию влияния
20 растворителях [9], п-нитрофенилацетонитрила
свойств растворителя на взаимодействие между
в 16 растворителях при температурах от 278.15
растворенным веществом и растворителем деталь-
до 333.15 K. Для 300 растворителей предложены
но рассмотрены в работах [1, 2]. В недавних ра-
новые эмпирические параметры, описывающие
ботах, посвященных этой тематике, предлагается
взаимодействия растворенного вещества и раство-
нейросетевая модель прогнозирования оптималь-
рителя [11].
ных условий (катализатор, растворитель, реагент,
Методом Камлета-Тафта [1, 2] исследовано
температура) для проведения конкретной органи-
влияние водно-ацетонитрильного растворителя
ческой реакции [3], разработан [4] интерактивный
(50% ацетонитрила по объему) на силу (pKa1 и
инструмент для выбора растворителя с использо-
pKa2) четырех противораковых препаратов - дау-
ванием программного обеспечения R. Выполне-
норубицина, доксорубицина, винкристинсульфата
но моделирование растворимости о-нитрофенил-
и 6-тиогуанина [12].
ацетонитрила [5], D-аспарагиновой кислоты [6] в
чистых растворителях, заряженных и незаряжен-
Применение пакетов прикладных программ
ных частиц для различных пар растворителей [7],
STATISTICA и SPSS в химии растворов, клини-
антибиотика биапенема в разных чистых и сме-
ческой медицине, охране окружающей среды со-
шанных растворителях, 2-амино-6-хлорпурина в
действует созданию информационных технологий
953
954
БОНДАРЕВ
Таблица 1. Описательная статистика показателей комплексообразования в разных растворителях, отобранных для
разведочного анализа
Количество
Минимальное
Максимальное
Стандартное
Стандартная
Показатель
Среднее
значений
значение
значение
отклонение
ошибка
lgK
164
3.83
0.00
14.20
2.93
0.23
d
11
0.44
0.34
0.58
0.07
0.01
BKT
11
0.50
0.10
0.76
0.18
0.01
ET
11
0.64
0.16
1.00
0.25
0.02
ε
11
41.00
2.21
78.36
21.14
1.65
Bind
19
12.24
8.49
16.97
1.96
0.15
DM
8
2.42
1.42
3.46
0.69
0.05
прогнозирования силы слабых электролитов [13,
главных компонент отобраны для разработки эм-
14] и устойчивости краун-эфирных комплексов
пирических моделей параметры: растворителей -
[15, 16] в разных растворителях, прогнозирования
диэлектрическая проницаемость ε, параметры
нарушений сердечной проводимости [17], класси-
Димрота-Райхардта ET и Камлета-Тафта BKT, ди-
фикации территории Украины по основным пока-
аметр молекулы растворителя d [40]; катионов -
зателям повседневного функционирования [18] на
эффективный ионный кристаллохимический ди-
основе разведочных методов анализа и нейронных
аметр для координационного числа шесть D [41-
сетей.
43] и краун-эфиров - топологический Sum Ваlаban
Целью данной работы являются анализ, класте-
индекс [44-46]. Топологические индексы краун-
ризация и разработка моделей прогнозирования
эфиров рассчитаны с использованием библиотеки
термодинамических констант комплексообразова-
MathChem 1.1.3, модифицированной для работы с
ния краун-эфиров с катионами металлов в зависи-
Python 3.5.2 [47].
мости от строения лиганда, взаимодействующего
Поставленная цель достигнута путем решения
с ним катиона и используемого растворителя. В ка-
следующих задач: (1) первичный анализ данных,
честве объектов исследования выбаны комплексы
вычисление описательных статистик, проверка
краун-эфиров с катионами щелочных и щелочно-
нормальности распределения; (2) факторный ана-
земельных металлов состава 1:1 в воде и органи-
лиз - построение корреляционных матриц, выделе-
ческих средах при 298.15 K. Предметом исследо-
ние латентных факторов; (3) кластерный анализ -
вания служила термодинамическая устойчивость
алгоритм древовидной кластеризации, итераци-
(lgK) краун-эфирных комплексов в растворах в
онный алгоритм k-средних; (4) дискриминантный
зависимости от свойств краун-эфиров, катионов и
анализ Фишера - построение линейных класси-
среды, а также модели прогнозирования устойчиво-
фикационных функций; (5) канонический дискри-
сти коронатов.Методыисследованияматематичес-
минантный анализ - построение канонических
кое моделирование и методы химической информатики.
линейных дискриминантных функций; (6) деревья
Для анализа использованы усредненные кон-
классификации - построение правил классифика-
станты устойчивости коронатов катионов ще-
ции устойчивости коронатов; (7) регрессионный
лочных и щелочноземельных металлов [19-39],
анализ зависимости устойчивости коронатов от
полученные разными авторами, в воде [19-21],
свойств среды, катионов и краун-эфиров; (8) ней-
метаноле [19-21, 24, 28-36], ацетонитриле [19,
росетевой анализ - нейросетевой классификатор,
24, 29, 37-39], диметилсульфоксиде [19, 24, 25,
нейросетевой аппроксиматор;
(9) прогностиче-
28], ацетоне [19, 24], 1,2-дихлорэтане [19, 28], пи-
ские возможности нейросетевых моделей.
ридине [19, 24, 25], N,N-диметилформамиде [19,
Первичный анализ данных. В табл. 1 приве-
25, 28], нитробензоле [19, 28], пропиленкарбонате
дены количественные параметры описательной
[19, 24], диоксане [29].
статистики отобранных для анализа показателей.
Построены корреляционные матрицы свойств
Среднее квадратическое отклонение (стандартное
растворителей, катионов и краун-эфиров. Методом
отклонение) данных меньше половины среднего
ЖУРНАЛ ОБЩЕЙ ХИМИИ том 90 № 6 2020
ЭМПИРИЧЕСКИЕ МОДЕЛИ УСТОЙЧИВОСТИ КОМПЛЕКСОВ КР
АУН-ЭФИРОВ
955
Таблица 2. Расчетные и табличные (критические) значения критериев проверки гипотезы нормальности распреде-
ления переменныхa
Критерий Шапиро-Уилка,
Критерий Колмогорова-
Критерий Хи-квадрат
Переменная, (n)
W
расч
(Wтабл)
Смирнова, Dрасч (Dтабл)
Пирсона, χ2расч 2табл)
lgK (164)
0.116
(0.069)
42.540 (16.919)
lgK* (164)
0.062
(0.069)
5.121
(9.488)
d (11)
0.893
(0.859)
BKT (11)
0.877
(0.859)
ET (11)
0.863
(0.859)
ε (11)
0.798
(0.859)
Bind (19)
0.937 (901)
D (8)
0.887
(0.818)
a n - объем выборки, p - уровень значимости. Если табличное значение Wтабл меньше расчетного значения Wрасч, а Dтабл > Dрасч и
χ2табл > χ2расч, то распределение считается соответствующим нормальному на уровне значимости р = 0.05. Приведение данных по
lgK к нормальному распределению осуществлено извлечением квадратного корня lgK lgK *.
Таблица 3. Корреляционная матрица показателей равновесия комплексообразования
Коэффициенты корреляции
Показатели
lgK
d
B
KT
ET
ε
Bind
D
lgK (164)
1.00
0.51
-0.69
-0.57
-0.58
0.47
0.15
d (11)
0.51
1.00
-0.31
-0.92
-0.62
0.18
-0.20
BKT (11)
-0.69
-0.31
1.00
0.40
0.13
-0.25
-0.11
ET (11)
-0.57
-0.92
0.40
1.00
0.74
-0.12
0.18
ε (11)
-0.58
-0.62
0.13
0.74
1.00
-0.20
0.12
Bind, (19)
0.47
0.18
-0.25
-0.12
-0.20
1.00
0.26
D (8)
0.15
-0.20
-0.11
0.18
0.12
0.26
1.00
арифметического, поэтому за исключением lgK и
(d, Bind, D), так и отрицательную (BKT, ET, ε) взаи-
ε, распределение можно считать симметричным.
мосвязь с lgK (табл. 3). Нагрузки латентных фак-
Проверка гипотезы нормального распределе-
торов (F1 и F2) определены методом главных ком-
ния анализируемых данных (табл. 2) осуществлена
понент с использованием критерия каменистой
по критериям Шапиро-Уилка (8 < n < 50), Хи-ква-
осыпи и процедуры ортогонального варимакс-вра-
драт Пирсона (n > 30) и Колмогорова-Смирнова
щения факторов. Для анализа отобрано два факто-
(n > 50).
ра, собственные значения которых больше едини-
Факторный анализ. Надежность вычислений
цы. Первый фактор объясняет 43.27% суммарной
элементов корреляционной матрицы и целесо-
дисперсии, второй фактор - 26.80% (табл. 4). Пе-
образность ее описания с помощью факторного
ременные d, ET и ε коррелируют с фактором 1,
анализа подтверждены мерой адекватности вы-
коэффициент корреляции равен 0.9048, -0.9504
борки Кайзера-Мейера-Олкина (критерий КМО =
и -0.8161 соответственно, а переменные Bind и D
0.562) и коэффициентом сферичности Бартлетта
коррелируют с фактором 2 (-0.7194 и -0.6700). Та-
(критерий Хи-квадрат = 735.403, значимость кри-
ким образом, первый фактор связан с вариациями
терия Бартлетта р < 0.001).
свойств растворителей, а второй фактор - с изме-
Методом главных компонент по выборочной
нением свойств катионов и краун-эфиров.
совокупности значений семи отобранных показа-
Математические факторные модели имеют сле-
телей вычислены корреляционная матрица систе-
дующий вид:
мы используемых для анализа данных (табл. 3), ее
собственные значения, факторные нагрузки и веса
F1 = 0.125lgK + 0.317d - 0.042BKT - 0.331ET - 0.282ε
факторов (табл. 4).
- 0.061Bind - 0.226D,
Свойства растворителей, краун-эфиров и кати-
F2 = -0.323lgK + 0.080d + 0.324BKT - 0.072ET - 0.054ε
онов проявляют как умеренную положительную
- 0.406Bind - 0.442D,
ЖУРНАЛ ОБЩЕЙ ХИМИИ том 90 № 6 2020
956
БОНДАРЕВ
Таблица 4. Факторные нагрузки, собственные значе-
Объединение констант устойчивости коронатов в
ния и веса факторов
кластеры проведено методом Варда с использова-
Факторные нагрузки
нием евклидового расстояния в качестве метрики
Показатели
фактор 1
фактор 2
пространства. На расстоянии, равном 40, выявле-
(F1)
(F2)
но 4 кластера; при увеличении расстояния до 60
lgK
0.6041
-0.6926
количество кластеров равно трем, на расстоянии
d
0.9048
-0.0720
80 - 2 кластера.
BKT
–0.3549
0.6374
Кластерный анализ алгоритмом k-средних.
ET
-0.9504
0.0960
Наилучшее согласие результатов двух методов
ε
-0.8161
0.0969
кластерного анализа получено при выборе 4 кла-
Bind
0.1009
-0.7194
стеров. На рис. 2 приведен график средних значе-
D
-0.3744
-0.6700
ний показателей комплексообразования в четырех
Собственные значения
3.0290
1.8762
кластерах, отображающих различие между груп-
Вес фактора, %
0.4327
0.2680
пами констант устойчивости коронатов по каждо-
му из свойств.
Анализ рассчитанных факторов F1 и F2 по-
зволяет выяснить, какие эффекты превалируют в
Результаты дисперсионного анализа свиде-
устойчивости коронатов в растворе - эффекты сре-
тельствуют (табл. 5), что распределение констант
устойчивости по кластерам проведено успешно.
ды или свойства катионов и краун-эфиров.
Уровень значимости р у критерия Фишера зна-
Кластерный анализ. В работе реализованы
чительно меньше 0.05 для всех переменных, а
два метода кластерного анализа: агломеративный -
наблюдаемый критерий Фишера больше критиче-
объединение, или дерево кластеризации и диви-
ского Fнабл > Fкр.
зивный - кластеризация k-средними. Предвари-
Количественный (164 константы) состав кла-
тельно была проведена процедура стандартизации
стеров: первый кластер объединяет 27 констант
исходных данных (z-оценки) путем вычитания
устойчивости коронатов в апротонных раствори-
среднего и деления на стандартное отклонение.
телях диоксане, 1,2-дихлорэтане, нитробензоле;
Агломеративная кластеризация. На рис. 1
второй кластер - 33 константы устойчивости коро-
приведена дендрограмма иерархической класте-
натов в воде - протолитическом растворителе; тре-
ризации устойчивости 164 коронатов по свой-
тий кластер группирует 56 констант устойчивости
ствам растворителей, катионов и краун-эфиров.
коронатов в апротонных (MeCN, ДМСО, пропи-
ɉɟɪɟɦɟɧɧɵɟ
Рис. 2. Средние значения показателей комплексообра-
зования для четырех групп констант устойчивости
Рис. 1. Дендрограмма иерархической кластеризации
коронатов катионов щелочных и щелочноземельных
констант устойчивости коронатов.
металлов.
ЖУРНАЛ ОБЩЕЙ ХИМИИ том 90 № 6 2020
ЭМПИРИЧЕСКИЕ МОДЕЛИ УСТОЙЧИВОСТИ КОМПЛЕКСОВ КР
АУН-ЭФИРОВ
957
Таблица 5. Результаты дисперсионного анализа стандартизированных показателей комплексообразования методом
k-среднихa
Показатель
σ21
ν1
σ22
ν 2
F(3, 160)
p
lgKst
111.45
3
51.55
160
115.29
0.000
dst
122.80
3
40.20
160
162.91
0.000
BKT,st
103.65
3
59.35
160
93.15
0.000
ET,st
119.52
3
43.48
160
146.61
0.000
εst
137.70
3
25.30
160
290.33
0.000
Bind,st
57.84
3
105.16
160
29.33
0.000
Dst
73.49
3
89.51
160
43.78
0.000
a σ21 - межгрупповая дисперсия; σ22 - внутригрупповая дисперсия; ν1, ν2 - степени свободы; F(3, 160) - наблюдаемый критерий
Фишера, [Fкр(3, 160, p 0.05) = 2.66]; р - наблюдаемый уровень значимости.
Таблица 6. Результаты дискриминантного анализа (алгоритм - переменные в модели)
Группирующая переменная: 4 кластера констант устойчивости коронатов; Λ-Уилкса: 0.031;
Fнабл(18, 438) = 163.36, p < 0.000; Fкр(18, 438) = 1.54, Fкр(3, 155) = 2.66
Свойство
частная
толерант-
Λ-Уилкса
Fискл(3, 155)
p-уровень
R2 а
Λ-Уилкса
ность,1-R2
d
0.014
0.216
187.979
0.000
0.116
0.884
BKT
0.019
0.164
262.529
0.000
0.295
0.705
ET
0.009
0.361
91.390
0.000
0.114
0.886
ε
0.017
0.186
225.977
0.000
0.423
0.577
Bind
0.004
0.837
10.041
0.000
0.965
0.035
D
0.005
0.637
29.453
0.000
0.987
0.013
a R2 - коэффициент детерминации.
ленкарбонат) и протолитическом (MeOH) раство-
Дискриминантный анализ. Для разделения
рителях и четвертый кластер - 48 констант устой-
констант устойчивости коронатов на группы по
чивости коронатов в апротонных (MeCN, ДМСО,
свойствам растворителей, краун-эфиров и катио-
пропиленкарбонат, пиридин, ацетон, ДМФА) и
нов проведен линейный дискриминантный анализ
протолитическом (MeOH) растворителях [48].
Фишера, реализованный в статистическом пакете
STATISTICA 12.
Распределение девятнадцати краун-эфиров по
кластерам: 1, 2, 3, 4 кластеры - 18C6, DB18C6; 2, 3,
Значение стандартной статистики Уилкса
4 кластеры - 15С5, СH15C5, CH18C6, DCH18C6;
лямбда (Λ-Уилкса) равно 0.031 (табл. 6), что сви-
детельствует о высокой дискриминирующей мощ-
1, 3 кластеры - DB24C8, DB30C10; 3, 4 кластеры -
ности модели (1.0 - дискриминация отсутствует,
B15C5; 2 кластер - DCH21C7; 3 кластер - 21C7,
0.0 - полная дискриминация). Этот вывод также
24C8, DB21C7, DB27C9; 4 кластер - 12C4, 13C4,
подтверждается наблюдаемым значением Fнабл-
14C4, 15C4, B12C4.
статистики, Fнабл(18, 438) = 163.36, p < 0.000 и
Распределение катионов по кластерам: 1, 2 кла-
Fнабл(18, 438) > Fкр(18, 438). Из табл. 6 (столбец
стеры - все участвующие в комплексообразовании
Λ-Уилкса) также следует, что только три свойства -
восемь катионов; 3 кластер - Na+, K+, Rb+, Cs+,
BKT, ε и d обладают наибольшей мощностью дис-
Ca2+, Sr2+, Ba2+; 4 кластер - Li+, Na+, K+.
криминации, чем больше значение Λ-Уилкса, тем
Для подтверждения результатов кластерного
более желателен параметер в процедуре разделе-
анализа проведен дискриминантный и канониче-
ния констант устойчивости коронатов на группы.
ский анализ влияния свойств растворителей, кати-
Частная Λ-Уилкса, характеризующая единичный
онов и краун-эфиров на устойчивость коронатов,
вклад соответствующего свойства в дискримини-
построены деревья классификации и нейросете-
рующую мощь модели, подтверждает этот вывод.
вые аппроксиматор и классификаторы.
Чем меньше значение частной Λ-Уилкса, тем боль-
ЖУРНАЛ ОБЩЕЙ ХИМИИ том 90 № 6 2020
958
БОНДАРЕВ
Таблица 7. Матрица кластеризации констант устойчивости коронатовa
Кластер
% правильной кластеризации
Кластер 1
Кластер 2
Кластер 3
Кластер 4
Кластер 1
100.0
27
0
0
0
Кластер 2
100.0
0
33
0
0
Кластер 3
98.2
0
0
55
1
Кластер 4
97.9
0
0
1
47
Всего, %
98.8
27
33
56
48
a Строки матрицы - наблюдаемая кластеризация методом k-средних. Столбцы матрицы - предсказанная классификация дискри-
минантным анализом Фишера.
Таблица 8. Характеристика извлеченных канонических корней (канонических линейных дискриминантных функ-
ций)a
Ивлеченные корни
Со
R
R2
Λ
χ2
ν
p
0
24.40
0.9801
0.9606
0.0031
912.19
18
0.000
1
4.79
0.9096
0.8274
0.0790
401.07
10
0.000
2
1.19
0.7365
0.5424
0.4576
123.51
4
0.000
a Со - собственное значение, R - коэффициент канонической корреляции, R2 - коэффициент детерминации, Λ - значение стати-
стики Λ-Уилкса, χ2 - значение статистики Хи-квадрат, ν - число степеней свободы, p - уровень значимости соответствующего
канонического корня.
ший вклад этого свойства в общую дискримина-
Кластер 3 = 856.128d + 82.774BKT + 361.550ET - 1.235ε
цию. Наряду с этим, чем меньше значение крите-
+ 3.957Bind + 11.533D - 363.431;
рия Фишера Fискл (табл. 6), тем менее желательны
Кластер 4 = 837.835d + 79.233BKT + 325.394ET - 1.100ε
свойства в модели дискриминации - ET, D, Bind.
+ 2.455Bind + 8.519D - 309.325.
Значения толерантности, близкие к единице, сви-
Подставив в эти уравнения значения свойств
детельствуют об избыточности переменных Bind и
растворителя, катиона и краун-эфира, которые не
D в дискриминантной модели.
использовались при построении линейных клас-
сификационных функций, можно предсказать кла-
Математические модели дискриминации кон-
стер (первый, второй, третий или четвертый), к ко-
стант устойчивости коронатов - линейные класси-
торому константа устойчивости будет отнесена по
фикационные функций имеют следующий вид:
наибольшему рассчитанному значению линейной
Кластер 1 = 804.222d + 2.702BKT + 363.138ET - 0.306ε
классификационной функции [15].
+ 3.513Bind + 10.872D - 344.450;
Высокую мощность дискриминантной модели
Кластер 2 = 819.224d + 26.656BKT + 312.827ET - 0.840ε
демонстрирует матрица классификации (табл. 7).
+ 2.990Bind + 12.179D - 292.998;
На диагонали матрицы содержится количество
констант устойчивости коронатов правильно клас-
сифицированных в кластеры. В третий кластер
правильно отнесены 55 констант устойчивости
коронатов из 56, что составляет 98.2% правиль-
ной кластеризации. Одна константа устойчивости
ошибочно отнесена к четвертому кластеру. В чет-
вертый кластер правильно отнесены 47 констант
устойчивости - 97.9% правильной кластеризации.
Одна константа устойчивости ошибочно отнесена
к третьему кластеру. Таким образом, дискрими-
нантная модель кластеризации констант устойчи-
вости коронатов на 98.8% подтвердила результаты
DF1
метода k-средних кластерной модели.
Рис. 3. Распределение констант устойчивости коро-
Канонический анализ. Показано как канони-
натов по четырем кластерам в координатах DF1-DF2.
ческие линейные дискриминантные функции не-
ЖУРНАЛ ОБЩЕЙ ХИМИИ том 90 № 6 2020
ЭМПИРИЧЕСКИЕ МОДЕЛИ УСТОЙЧИВОСТИ КОМПЛЕКСОВ КР
АУН-ЭФИРОВ
959
зависимых свойств растворителей, краун-эфиров
Таблица 9. Средние канонических переменных (цен-
и катионов распределяют константы устойчивости
троиды кластеров)
коронатов по 4 кластерам, выделенным методом
Кластер
DF1
DF2
DF3
k-средних.
Кластер 1
-9.166
2.675
0.133
Кластер 2
7.015
2.904
0.339
Вычислены три независимые (ортогональные)
Кластер 3
0.443
-1.174
-1.371
дискриминирующие функции (табл. 8). Первая
Кластер 4
-0.184
-2.132
1.292
строка содержит критерий значимости для всех
дискриминантных функций (корней), во второй
DF3 будет отнесена к кластеру по наименьшему
строке приведены данные о значимости дискри-
расстоянию до центра (центроида) соответствую-
минантных функций, оставшихся после удаления
щего кластера [15]. В табл. 9 приведены координа-
первой, в третьей строке содержатся данные о
ты центроидов четырех кластеров констант устой-
значимости функций, оставшихся после удаления
чивости коронатов.
первых двух. Каждая последующая дискрими-
нантная функция вносит все меньший и меньший
Первая дискриминантная функция DF1 отделя-
вклад в общую дискриминацию. Из анализа дан-
ет первый кластер от второго (рис. 3, 4), в то вре-
ных табл. 8 вытекает, что извлеченные три канони-
мя как третий и четвертый кластеры разделяются
ческие корня (дискриминантные функции) стати-
третьей дискриминантной функцией DF3 (рис. 4).
стически значимы, так как собственные значения
Вторая дискриминантная функция DF2 отделяет
больше единицы, а значения канонической корре-
первый и второй кластеры от третьего и четвер-
ляции равны 0.9801, 0.9096 и 0.7365 соответственно.
того, а третий и четвертый кластеры разделяются
Математические канонические модели для рас-
третьей дискриминантной функцией DF3 (рис. 5).
чета канонических линейных дискриминантных
Деревья классификации. Методологические
функций (DF) имеют следующий вид:
аспекты построения деревьев классификации
DF1 = - 68.241d + 10.588BKT - 14.602ET + 0.166ε
(правил решения) алгоритмом СART (classification
- 0.023Bind - 0.062D + 27.429
and regression trees) изложены в работах [13, 15].
DF2 = 28.860d - 12.412BKT + 12.085ET + 0.023ε
На рис. 6 приведен граф дерева классификации
+ 0.086Bind + 0.176D - 16.493
устойчивости коронатов катионов щелочных и
DF3 = 10.852d - 1.962BKT + 1.979ET + 0.018ε
щелочноземельных металлов - четыре вершины
- 0.333Bind - 1.571D + 2.111
ветвления (1, 2, 5, 6) и пять терминальных вершин
Константа устойчивости исследуемого коро-
(3, 4, 7, 8, 9) - обозначения в верхнем левом углу
ната, для которого по свойствам растворителя,
вершин. Текст под вершинами ветвления описы-
краун-эфира и катиона рассчитаны канонические
вает условие ветвления. Числа в правом верхнем
линейные дискриминантные функции DF1, DF2 и
углу вершин обозначают номер кластера. Числа
DF1
DF2
Рис. 4. Распределение констант устойчивости коро-
Рис. 5. Распределение констант устойчивости коро-
натов по четырем кластерам в координатах DF1-DF3.
натов по четырем кластерам в координатах DF2-DF3.
ЖУРНАЛ ОБЩЕЙ ХИМИИ том 90 № 6 2020
960
БОНДАРЕВ
Таблица 10. Структура дерева классификации устойчивости коронатов
Левая
Правая
Сluster
Сluster
Сluster
Сluster
Предсказанный
Константа
Переменная
Вершина
вершина
вершина
1
2
3
4
кластер
ветвления
ветвления
1
2
3
27
33
56
48
3
0.881
ET
2
4
5
27
0
56
48
3
0.385
BKT
3
0
33
0
0
2
4
27
0
0
0
1
5
6
7
0
0
56
48
3
2.0
DM
6
8
9
0
0
5
46
4
12.865
Bind
7
0
0
51
2
3
8
0
0
1
46
4
9
0
0
4
0
3
над вершинами показывают количество констант
Проведенный кластер-анализ с использовани-
устойчивости коронатов, отнесенных к данной
ем деревьев решений на 98.5% подтвердил (рис. 6,
вершине. Все константы устойчивости корона-
табл. 10) результаты кластерного анализа устойчи-
вости коронатов методом k-средних. Состав пер-
тов в вершинах ветвления относятся к кластеру, в
вого и второго кластеров подтверждены на 100%.
котором количество констант устойчивости наи-
Oдна константа третьего кластера алгоритмом
большее. Поэтому корневая вершина ветвления 1
CART ошибочно отнесена в четвертый кластер
обозначена как Cluster 3.
(98.2%), а две константы четвертого кластера оши-
В табл. 10 приведена структура дерева клас-
бочно отнесены к третьему кластеру (95.8%).
сификации устойчивости коронатов катионов по
Регрессионный анализ. Математические ре-
свойствам растворителей (ET, BKT), катионов (DM)
грессионные модели [49, 50] имеют следующий вид:
и краун-эфиров (Bind). Ранги значимости предик-
- включены все переменные
торов дерева кластеризации d, BKT, ET, ε, DM, Bind
lgK = (1.29±4.57) + (9.89±7.90)d - (10.16±1.43)BKT
равны 81, 81, 89, 71, 100, 54 соответственно (0 -
+ (3.77±2.84)ET - (0.08±0.02)ε + (0.26±0.12)Bind
низкая значимость, 100 - высокая значимость).
+ (0.42±0.31)DM,
Рис. 6. Граф дерева классификации устойчивости коронатов катионов щелочных и щелочноземельных металлов.
ЖУРНАЛ ОБЩЕЙ ХИМИИ том 90 № 6 2020
ЭМПИРИЧЕСКИЕ МОДЕЛИ УСТОЙЧИВОСТИ КОМПЛЕКСОВ КР
АУН-ЭФИРОВ
961
Таблица 11. Итоги нейросетевого аппроксиматора МLP 6-8-1a
MLP 6-8-1
0.962
0.965
0.965
0.334
0.200
0.284
BFGS 51
SOS
Exponent
Logistic
а Производительность обучения, контрольная производительность, тестовая производительность - отношение стандартного от-
клонения ошибки прогноза к стандартному отклонению исходных данных на соответствующих выборках; Ошибка обучения,
контрольная ошибка, тестовая ошибка - ошибки сети на соответствующих выборках; BFGS - Алгоритм Бройдена-Флетчера-
Гольдфарба-Шанно; SOS - среднеквадратичная ошибка
P - количество обработанных примеров
в выборке; Exponent - экспоненциальная функция φ(x) = ex; Logistic - логистическая функция φ(x) = 1/[1 + exp(-tx)].
Таблица 12. Основные характеристики нейросетевых классификаторов RBF 6-27-4 и МLP 6-7-4a
RBF 6-27-4
97.4
100
100
RBFT
SOS
Gaussian
Identical
MLP 6-7-4
98.3
100
100
BFGS 15
SOS
Logistic
Tanh
а RBFT - обучающий алгоритм радиальной базисной функции; Gaussian - φ(x) = exp(-x2); Tanh - гиперболический тангенс
th(Ax) = (eAx - e-Ax)/ (eAx + e-Ax); Identical - тождественная функция φ(x) = x.
R = 0.8932, наблюдаемое значение критерия Фи-
R = 0.8838, Fнабл(3,160) = 190.29, p < 0.000,
шера Fнабл(6,157) = 103.25, p < 0.000, критическое
Fкр(3,160) = 2.66, p = 0.05,
значение критерия Фишера Fкр(6,157) = 2.16, p =
стандартная ошибка = 1.39, dDW = 1.85.
0.05, стандартная ошибка = 1.34, критерий Дарби-
Результаты разведочных и регрессионных ме-
на-Уотсона dDW = 1.91;
тодов анализа данных с высокой согласованно-
- отбор переменных методом прямого выбора
стью подтвердили статистическую значимость
(forward selection)
выбранных входных переменных для построения
lgK = (6.46±1.77) - (9.35±1.22)BKT -
прогностических нейросетевых моделей зависи-
- (0.07±0.02)ε + (0.31±0.12)Bind + (0.39±0.32)DM,
мости констант устойчивости коронатов lgK от
R = 0.8882, Fнабл(4,159) = 148.51, p < 0.000,
свойств растворителей, катионов и краун-эфиров.
Fкр(4,159) = 2.43, p = 0.05,
Нейросетевой анализ. В табл. 11 приведены
стандартная ошибка = 1.36, dDW = 1.86;
основные характеристики обученного нейросете-
- отбор переменных методом обратного исклю-
вого аппроксиматора - многослойного персептро-
чения (backward elimination)
на МLP 6-8-1. Коэффициенты корреляции на об-
lgK = (6.89±1.77) - (9.45±1.24)BKT - (0.06±0.01)ε
учающей (70%), контрольной (15%) и тестовой
+ (0.35±0.12)Bind,
(15%) выборках равны 0.9620, 0.9647 и 0.9659
ЖУРНАЛ ОБЩЕЙ ХИМИИ том 90 № 6 2020
962
БОНДАРЕВ
Таблица 13. Основные характеристики сети Кохонена как классификатора
lgK устойчивости коронатов катионов
Ошибка
Количественный состав кластеров
Тестовая
Алгоритм
Обучающая
Контрольная
выборка
обучения
выборка 70%
выборка 15 %
15%
SOFM
Kohonen
27
33
56
48
0.2028
0.2201
0.1561
10-4
1000
Таблица 14. Итоги кластеризации констант устойчивости коронатов нейронными сетями: радиальной базисной
функцией RBF 6-27-4 и многослойным персептроном МLP 6-7-4
Архитектура
Показатели
Кластер 1
Кластер 2
Кластер 3
Кластер 4
Все
сети
кластеризации
RBF 6-27-4
Все
27
33
56
48
164
Правильно
27
33
55
46
161
Неправильно
0
0
1
2
3
Правильно, %
100
100
98
96
98.17
Неправильно, %
0
0
2
4
1.83
МLP 6-7-4
Все
27
33
56
48
164
Правильно
27
33
55
47
162
Неправильно
0
0
1
1
2
Правильно, %
100
100
98
98
98.78
Неправильно, %
0
0
2
2
1.22
Таблица 15. Предсказанные персептроном MLP 6-8-1 значения lgK устойчивости коронатов
Краун-
Краун-
Катион
Растворитель
lgKэксп
lgKMLP
Катион
Растворитель
lgKэксп
lgK
MLP
эфир
эфир
12C4
Mg2+
Пропиленкарбонат
2.61
1.27
DB18C6
Ag+
Вода
1.41
1.86
15С5
Ag+
Вода
0.94
1.53
DB18C6
Tl+
Вода
1.50
1.75
15С5
Tl+
Вода
1.23
1.08
DB18C6
Pb2+
Вода
1.89
1.93
15С5
Pb2+
Вода
1.85
1.56
DB18C6
Ag+
MeOH
4.04
3.93
18C6
Ag+
Вода
1.55
1.90
DB18C6
Tl+
MeCN
4.90
4.95
18C6
Tl+
Вода
2.27
2.10
DB21C7
Tl+
MeCN
>5.00
5.36
18C6
Pb2+
Вода
4.30
2.00
DB21C7
Tl+
Ацетон
4.71
4.83
18C6
Ag+
MeOH
4.57
3.96
DB21C7
Tl+
MeOH
3.97
4.38
соответственно. Статистические характеристики
В табл. 12 и 13 приведены основные характери-
обученной нейросетевой модели персептронного
стики обученных неросетевых классификаторов -
типа МLP 6-8-1 (табл. 11) отражают успешность
RBF 6-27-4, МLP 6-7-4 и SOFM 10-4. Алгоритмы
проведенного обучения. Так, качество обучения на
радиальной базисной функции, многослойного
различных выборках больше 96%, ошибка обуче-
персептрона и сети Кохонена, соответственно, на
ния на контрольной выборке (0.200) не превышает
98.17, 98.78 и 100% подтвердили правомочность
ошибку на независимой тестовой выборке (0.284).
кластеризации методом k-средних (табл. 13, 14).
Эти данные также свидетельствуют о том, что ней-
Прогностические возможности персептро-
росетевая модель обладает большей прогнозирую-
на. Табл. 15 демонстрирует возможности обу-
щей силой, чем модели множественной линейной
ченного многослойного персептрона MLP 6-8-1,
регрессии, коэффициенты корреляции которых не
как аппроксиматора, по предсказанию констант
превышают 0.9.
устойчивости коронатов lgKMLP по свойствам
ЖУРНАЛ ОБЩЕЙ ХИМИИ том 90 № 6 2020
ЭМПИРИЧЕСКИЕ МОДЕЛИ УСТОЙЧИВОСТИ КОМПЛЕКСОВ КР
АУН-ЭФИРОВ
963
растворителей, катионов и краун-эфиров. Экспе-
10. Chen G., Liang J., Han J., Zhao H. // J. Chem. Eng.
риментальные константы комплексообразования
Data. 2019. Vol. 64. N 1. P. 315. doi 10.1021/acs.
jced.8b00811
lgKэксп, взятые из работы [19], не участвовали в об-
11. Laurence C., Legros J., Chantzis A., Planchat A.,
учении нейронной сети.
Jacquemin D. // J. Phys. Chem. B. 2015 Vol. 119. N 7.
На основе известных методов математического
P. 3174. doi 10.1021/jp512372c
моделирования разработаны методология и мо-
12. Sanli S., Altun Y., Guven G. // J. Chem. Eng. Data. 2014.
дели количественного описания влияния свойств
Vol. 59. N 12. P. 4015. doi:10.1021/je500595w
растворителя, катионов и краун-эфиров на устой-
13. Бондарев Н.В. // ЖОХ. 2016. Т. 86. № 6. С. 887;
чивость комплексов макроциклических лигандов
Bondarev N.V. // Russ. J. Gen. Chem. 2016. Vol. 86.
с катионами щелочных и щелочноземельных ме-
N 6. P. 1221. doi 10.1134/S1070363216060025
таллов. Построены прогностические модели кон-
14. Бондарев Н.В. // ЖОХ. 2017. Т. 87. № 2. С. 207;
станта комплексообразования-свойство для кла-
Bondarev N.V. // Russ. J. Gen. Chem. 2017. Vol. 87.
N 2. P. 188. doi 10.1134/S1070363217020062
стеризации, расчета и прогнозирования констант
15. Бондарев Н.В. // ЖОХ. 2019. Т. 89. № 2. С. 288;
устойчивости коронатов.
Bondarev N.V. // Russ. J. Gen. Chem. 2019. Vol. 89.
Автор выражает благодарность IТ-специали-
N 2. P. 281. doi 10.1134/S1070363219020191
сту Д.А. Козлову за помощь в обработке исходных
16. Бондарев Н.В. // ЖОХ. 2019. Т. 89. № 7. С. 1085;
данных по константам устойчивости коронатов и
Bondarev N.V. // Russ. J. Gen. Chem. 2019. Vol. 89.
расчеты топологических индексов краун-эфиров.
N 7. P. 1438. doi 10.1134/S1070363219070144
17. Никулина С.Ю., Чернова А.А., Третьякова С.С., Ни-
КОНФЛИКТ ИНТЕРЕСОВ
кулин Д.А. // Рос. кардиол. ж. 2018. Т. 23. № 10. С. 53.
Авторы заявляют об отсутствии конфликта
doi 10.15829/1560-4071-2018-10-53-58
интересов
18. Тютюник В.В., Бондарєв М.В., Шевченко Р.І., Чор-
ногор Л.Ф., Калугін В.Д. // Техногенно-екологічна
СПИСОК ЛИТЕРАТУРЫ
безпека та цивільний захист. 2014. № 7. С. 107.
1. Kamlet M.J., Abboud J.L.M., Abraham M.H.,
19. Izatt R.M., Bradshaw J.S., Nielsen S.A., Lamb J.D.,
Taft R.W. // J. Org. Chem. 1983. Vol. 48. N 17. P. 2877.
Christensen J. J., Sen D. // Chem. Rev. 1985. Vol. 85.
doi 10.1021/jo00165a018
N 4. P. 271. doi 10.1021/cr00068a003
2. Politzer P., Murray J.S. Quantitative Approaches
20. Frensdorff H. K. // J. Am. Chem. Soc. 1971. Vol. 93.
to Solute-Solvent Interactions. Modern Aspects of
N 3. P. 600. doi 10.1021/ja00732a007
Electrochemistry / Ed. C. Vayenas. New York: Springer,
21. Pedersen C.J., Frensdorff H.K. // Angew Chem. Int. Ed.
2005. N 39. P. 1. doi 10.1007/978-0-387-31701-4_1
1972. Vol. 11. N 1. P. 16. doi 10.1002/anie.197200161
3. Gao H., Struble T.J., Coley C.W., Wang Y., Green
22. Izatt R.M., Terry R.E., Haymore B.L., Hansen L.D.,
W.H., Jensen K.F. // ACS Cent. Sci. 2018. Vol. 4. N 11.
Dalley N.K., Avondet A.G., Christensen J.J. // J. Am.
P. 1465. doi 10.1021/acscentsci.8b00357
Chem. Soc. 1976. Vol. 98. N 24. P. 7620. doi 10.1021/
4. Piccione P.M., Baumeister J., Salvesen T., Flores Y.,
ja00440a028
Grosjean Ch., Murudi V., Shyadligeri A., Lobanova O.,
23. Høiland H., Ringseth J.A., Brun T.S. // J. Solut. Chem.
Lothschütz Ch. // Org. Proc. Res. Dev. 2019. Vol. 23.
1979. Vol. 8. N 11. P. 779. doi 10.1007/bf00648577
N 5. P. 998. doi 10.1021/acs.oprd.9b00065
24. Smetana A.J., Popov A.I. // J. Solut. Chem. 1980.
5. Wang H., Wang X., Chen G., Farajtabar A., Zhao H.,
Vol. 9. N 3. P. 183. doi 10.1007/bf00648325
Li X. // J. Chem. Eng. Data. 2019. Vol. 64. N 6. P. 2867.
25. Lin J.D., Popov A.I. // J. Am. Chem. Soc. 1981.
doi 10.1021/acs.jced.9b00243
Vol. 103. N. 13. P. 3773. doi 10.1021/ja00403a026
6. Wu J., Wang J., Zhao H. // J. Chem. Eng. Data. 2019.
26. Host Guest Complex Chemistry III / Eds F. Vögtle, E.
Vol. 64. N 6. P. 2904. doi 10.1021/acs.jced.9b00320
Weber. Berlin; Heidelberg: Springer, 1984. Vol. 121.
7. Qiu J., Albrecht J. // Org. Process Res. Dev. 2018.
P. 1. doi 10.1007/3-540-12821-2_1
Vol. 22. N 7. P. 829. doi 10.1021/acs.oprd.8b00117
27. Stover F.S. // J. Chromatogr. (A). 1984. Vol. 298. P. 203.
8. Xu R., Huang C., Xu J. // J. Chem. Eng. Data. 2019.
doi 10.1016/s0021-9673(01)92714-1
Vol. 64. N 4. P. 1454. doi 10.1021/acs.jced.8b01051
28. Samec Z., Papoff P. // Anal. Chem. 1990. Vol. 62 N 10.
9. Li W., Zhu Ya., Wang X., Zheng M., Li X., Zhao H. //
P. 1010. doi 10.1021/ac00209a009
J. Chem. Eng. Data. 2019. Vol. 64. N 2. P. 771. doi
29. Gokel G.W., Leevy W.M., Weber M.E. // Chem. Rev.
10.1021/acs.jced.8b01014
2004. Vol. 104. N 5. P. 2723. doi 10.1021/cr020080k
ЖУРНАЛ ОБЩЕЙ ХИМИИ том 90 № 6 2020
964
БОНДАРЕВ
30. Бондарев Н.В. // ЖОХ. 2006. Т. 76. № 1. С. 13;
41. Shannon R.D., Prewitt C.T. // Acta Crystallogr.
Bondarev N.V. // Russ. J. Gen. Chem. 2006. Vol. 76.
(B). 1969. Vol. 25. N 5. P. 925. doi 10.1107/
N 1. P. 11. doi 10.1134/S1070363219020191
s0567740869003220
31. Gokel G.W., Goli D.M., Minganti C., Echegoyen L. //
42. Shannon R.D., Prewitt C.T. // J. Inorg. Nucl. Chem.
J. Am. Chem. Soc. 1983. Vol. 105. N 23. P. 6786. doi
1970. Vol. 32. N 5. P. 1427. doi 10.1016/0022-
10.1021/ja00361a003
1902(70)80629-7
32. Inoue Y., Hakushi T., Liu Y., Tong L.H. // J. Org. Chem.
43. Бугаенко Л.Т., Рябых С.М., Бугаенко А.Л. // Вестн.
1993. Vol. 58. N 20. P. 5411. doi 10.1021/jo00072a024
МГУ. Сер. Химия. 2008. Т. 49. № 6. С. 363; Bugaen-
33. Lamb J.D., Izatt R.M., Swain C.S., Christensen J.J. //
ko L.T., Ryabykh S.M., Bugaenko A.L. // Moscow.
J. Am. Chem. Soc. 1980. Vol. 102. N 2. P. 475. doi
Univ. Chem. Bull. 2008. N 6. P. 303. doi 10.3103/
10.1021/ja00522a005
s0027131408060011
34. Haymore B.L., Lamb J.D., Izatt R.M., Christensen J.J. //
44. Balaban A.T. // J. Pure Appl. Chem. 1983. Vol. 55. N 2.
Inorg. Chem. 1982. Vol. 21. N 4. P. 1598. doi 10.1021/
P. 199. doi 10.1351/pac198855020199
ic00134a065
35. Bradshaw J.S., Izatt R.M. // Acc. Chem. Res. 1997.
45. Станкевич М. И., Станкевич И. В., Зефиров Н. С. //
Vol. 30. N 8. P. 338. doi 10.1021/ar950211m
Усп. хим. 1988. Т. 58. № 3. С. 337.
36. Shamsipur M., Popov A.I. // J. Am. Chem. Soc. 1979.
46. Xing R., Zhou B., Graovac A. // Ars Combin. 2012.
Vol. 101. N 15. P. 4051. doi 10.1021/ja00509a005
Vol. 104. P. 211.
37. Hopkins H.P., Norman A.B. // J. Phys. Chem. 1980.
47. Vasilyev A., Stevanovi´c D. // MATCH Commun. Math.
Vol. 84. N 3. P. 309. doi 10.1021/j100440a019
Comput. Chem. 2014. Vol. 71. P. 657.
38. Buschmann H.-J. // J. Sol. Chem. 1988. Vol. 17. N 3.
48. Райхардт К. Растворители и эффекты среды в орга-
P. 277. doi 10.1007/bf00646180
нической химии. M.: Мир, 1991. 763 с.
39. Ельцов С.В., Дорошенко А.О., Бондарев Н.В. // ЖНХ.
49. Боровиков В. STATISTICA. Искусство анализа
1999. Т. 44. № 2. С. 329; El’tsov S.V., Doroshenko A.O.,
данных на компьютере: Для профессионалов. СПб:
Bondarev N.V. // Russ. J. Inorg. Chem. 1999. Vol. 44.
Питер, 2003. 686 с.
N 2. P. 284.
40. Marcus Y. The Properties of Solvents. Chichester: John
50. Паклин Н.Б., Орешков В.И. Бизнес-аналитика: от
Wiley & Sons, 1999. Vol. 4. 399 p.
данных к знаниям. СПб: Питер, 2009. 624 c.
Empirical Stability Models of Crown Ether Complexes
with Alkaline and Alkaline Earth Metals in Some Pure Solvents
N. V. Bondarev*
V.N. Karazin Kharkov National University, Kharkov, 61022 Ukraine
*e-mail: bondarev_n@rambler.ru
Received February 4, 2020; revised February 4, 2020; accepted February 27, 2020
Based on exploratory and neural network methods for mathematical modeling of equilibria in solutions, an
approach was developed to predict the stability constants of coronates by the properties of solvents, cations, and
crown ethers. Exploration (factor, cluster, discriminant, canonical, decision trees), regression and neural network
(with a teacher, Kohonen network) stability models of crown ether complexes (12С4, 13С4, 14С4, 15С4, 15С5,
18С6, 21С7, 24С8, B12C4, B15C5, CH15C5, CH18C6, DCH18C6, DCH21C7, DB18C6, DB21C7, DB24C8,
DB27C9, DB30C10) with cations of alkali (Li+, Na+, K+, Cs+, Rb+) and alkaline earth (Ca2+, Sr2+, Ba2+) metals
in aqueous and non-aqueous (acetone, acetonitrile, dimethyl sulfoxide, methanol, pyridine, dimethylformamide,
dioxane, propylene carbonate, 1,2-dichloroethane, nitrobenzene) solutions were developed according to the
properties of solvents (diameter of solvent molecule, Kamlet-Taft parameter, Dimroth-Reichardt parameter,
dielectric constant), crown ethers (Balaban topological index) and cations (cation diameter) at 298.15 K.
Keywords: crown ethers, complexation constant, prospecting analysis, multiple linear regression, neural net-
works, modeling, forecasting
ЖУРНАЛ ОБЩЕЙ ХИМИИ том 90 № 6 2020