Кристаллография, 2022, T. 67, № 6, стр. 935-942
Сравнительный анализ границы между мономерами в димере бактериальных гистоноподобных белков hu методом MM-GBSA
Ю. К. Агапова 1, *, Д. Е. Петренко 1, В. И. Тимофеев 1, 2, Т. В. Ракитина 1, 3, **
1 Национальный исследовательский центр “Курчатовский институт”
Москва, Россия
2 Институт кристаллографии им. А.В. Шубникова ФНИЦ “Кристаллография и фотоника” РАН
Москва, Россия
3 Институт биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН
Москва, Россия
* E-mail: agapova.jk@gmail.com
** E-mail: taniarakitina@yahoo.com
Поступила в редакцию 18.03.2022
После доработки 01.04.2022
Принята к публикации 06.04.2022
- EDN: DYQXZA
- DOI: 10.31857/S0023476122060029
Аннотация
Работа посвящена сравнительному анализу границы раздела между мономерами в димерах ДНК-связывающих гистоноподобных белков бактерий (HU-белков) и изучению корреляции между термостабильностью и величинами свободной энергии связывания мономеров в димерах. Анализ границ разделов проводили с помощью программы PDBePISA, а расчет свободной энергии связывания мономеров в димере (ΔGдим) – с помощью метода MM-GBSA, основанного на комбинации молекулярной механики и решения обобщенного уравнения Борна. Установлено, что увеличение ΔGдим HU-белка из микоплазмы Spiroplasma melliferum (HUSpM) хорошо коррелирует с увеличением термостабильности. Продемонстрирована корреляция между снижением термостабильности мутантных вариантов HUSpM, несущих аланиновые замены на границе раздела между мономерами в димере, и расчетными величинами ΔGдим у соответствующих мутантов. Полученные результаты подтверждают, что метод MM-GBSA может быть использован для предсказания термоустойчивости гистоноподобных белков, а также учета влияния точечных замен аминокислотных остатков границы раздела между мономерами на термостабильность мутантных белков.
ВВЕДЕНИЕ
Термостабильность белков представляет собой способность полипептидной цепи поддерживать определенную пространственную структуру, несмотря на воздействие высокой температуры [1]. Термодинамическая стабильность белка зависит от разности свободной энергии (ΔG) между свернутым и развернутым состояниями белковой глобулы и характеризуется температурой плавления (Tпл) [2]. Термостабильные белки востребованы в различных биотехнологических процессах и поэтому являются объектами многочисленных фундаментальных и прикладных исследований, значительная часть которых посвящена поиску путей оптимизации аминокислотного состава с целью увеличения устойчивости белков и пептидов к высоким температурам [3]. Классическим методом выявления ключевых факторов температурной стабилизации является сравнительное исследование последовательностей белков термофильных и мезофильных организмов [4, 5]. В то же время развитие компьютерного моделирования и молекулярной динамики (МД) привело к появлению многочисленных теоретических методов и компьютерных алгоритмов, позволяющих прогнозировать термостабильность белков исходя из их структурных особенностей [6].
ДНК-связывающие гистоноподобные HU-белки бактерий являются наиболее распространенными и высоко представленными нуклеоид-ассоциированными белками бактерий и потенциальными терапевтическими мишенями [7–9]. Данные белки представляют собой хорошую модель для разработки и валидации теоретических методов предсказания термостабильности, так как, во-первых, они имеют небольшой размер и достаточно простую, но исключительно консервативную пространственную укладку, во-вторых, методом рентгеноструктурного анализа получены пространственные структуры HU-белков, обладающих разной степенью термоустойчивости [10–14]. HU-белки представляют собой гомодимеры размером ∼20 кДа, состоящие из относительно стабильного α-спирального домена и β-ленточного ДНК-связывающего домена, подвижного в отсутствие ДНК. Методами дифференциальной сканирующей калориметрии (ДСК) и спектроскопии кругового дихроизма было установлено, что основной вклад в термическую денатурацию HU-белков вносит плавление границы раздела между мономерами в димере [12, 13]. В этой связи следует отметить, что хотя внутренняя область границы между мономерами в димере не участвует напрямую в связывании ДНК, ее изменения с помощью мутагенеза или низкомолекулярных ингибиторов приводят к нарушению конформационной динамики белка, а в некоторых случаях к нарушению ДНК-связывающих свойств [9, 15–18].
В данной работе с целью изучения предсказательной способности метода MM-GBSA, сочетающего молекулярно-механические расчеты с решением обобщенного уравнения Борна, и его применимости для прогнозирования термостабильности проведен анализ свободной энергии связывания мономеров в димерах HU-белков (ΔGдим), обладающих разной термостабильностью. Было выявлено, что увеличение ΔGдим HU-белка из микоплазмы Spiroplasma melliferum (HUSpM) хорошо коррелирует с его аномально высокой термостабильностью. Кроме того, найдена корреляция между снижением термостабильности мутантных вариантов HUSpM, несущих аланиновые замены на границе раздела между мономерами в димере, и расчетными величинами ΔGдим у соответствующих мутантов. Полученные результаты указывают на применимость метода MM-GBSA для предсказания термоустойчивости HU-белков.
МАТЕРИАЛЫ И МЕТОДЫ
Моделирование и молекулярная динамика. В качестве моделей для анализа границы раздела между мономерами в димере и проведения МД-экспериментов использовали пространственные структуры ДНК-связывающих гистоноподобных HU-белков, депонированные в базу данных PDB [19]. Были выбраны структуры гомодимерных HU-белков из Escherichia coli HUEcoliα (PDB ID 1MUL) и HUEcoliβ (PDB ID 4P3V), HUSpM (PDB ID 5L8Z), а также микоплазменного HU-белка из Micoplasma gallisepticum (HUMGal, PDB ID 2NDP) [12, 13, 20]. Недостающие фрагменты белка в кристаллических структурах 1MUL и 4P3V были достроены с использованием программ Modeller и Chimera.
Модели мутантных вариантов HUSpM получены c помощью интерактивной графической программы COOT [21].
Для всех систем моделирование проводили с помощью программы GROMACS 2020.3 [22]. Использовали силовое поле ff14SB, обеспечивающее высокую точность моделирования боковых цепей аминокислотных остатков [23], и модель воды TIP3P, подходящую для использования с силовым полем ff14SB. Молекула белка была помещена в кубическую ячейку, заполненную молекулами воды, при этом расстояние от атомов молекулы белка до граней ячейки составляло не менее 1.5 нм. В каждую из систем добавлены ионы К+ и Сl– до концентрации 0.15 мМ и уравновешивающие заряд системы. Сначала для каждой системы была проведена минимизация энергии с шагом 1 фс до величины 1000.0 кДж/моль–1нм–1. Затем системы были уравновешены при температуре 298 K и давлении 1 атм путем моделирования в NVT и NPT термодинамических ансамблях продолжительностью по 100 пс. Температуру и давление в системах поддерживали с помощью модифицированного термостата Берендсена [24] и баростата Паринелло–Рахмана [25]. Продуктивные МД-симуляции продолжительностью по 50 нс проводили в изотермоизобарическом ансамбле (NPT) с шагом в 2 фс. Для ограничения связей атомов водорода с не водородными атомами использовали алгоритм LINCS [26]. Для расчета дальних электростатических взаимодействий использовали метод частица–сетка Эвальда [27]. Ван-дер-ваальсовы и прямые кулоновские взаимодействия были ограничены (vdwtype = Cut-off) расстоянием 1.4 нм, оптимальным для силового поля ff14SB [23]. Перецентрирование белковых молекул и их возврат в ячейку моделирования проводили с помощью команды gmx trjconv программного пакета GROMACS с флагом – pbc nojump.
Расчет энергии взаимодействия мономеров в димерах HU-белков. Расчет выигрыша свободной энергии при образовании димера ΔGдим проводили методом MM-GBSA [28], как описано в [29]. Были использованы версия v1.4.0 программы gmx_MMPBSA (http://doi.org/10.5281/zenodo.4569307), программный пакет AmberTools2020 и программа MMPBSA.py [30], что позволило применить метод MM-GBSA для траекторий, полученных с использованием программного пакета GROMACS. Расчеты ΔGдим проводили для 5000 фреймов. При вычислениях применяли модифицированную версию обобщенной модели Борна [31].
РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ
В настоящее время для проведения теоретических расчетов выигрыша свободной энергии при образовании различного вида комплексов в растворе широко используются теоретические подходы, основанные на использовании МД-анализа, которые имеют более высокую точность, чем большинство алгоритмов молекулярного докинга, но при этом не требуют значительных вычислительных мощностей [32]. Данные методы используют молекулярную механику для оценки изменения термодинамического состояния системы в вакууме и решение уравнения Пуассона–Больцмана (метод ММ-PBSA) или обобщенного уравнения Борна (метод ММ-GBSA) для учета сольватации молекул.
Метод MM-GBSA позволяет оценить выигрыш свободной энергии при образовании димера (ΔGдим) в растворе (табл. 1). Расчет выигрыша свободной энергии при образовании димера в вакууме (ΔGвак) проводят с помощью молекулярной механики (ММ) путем усреднения энергий взаимодействия мономеров (ΔGмм) на основе записанных кадров и с учетом энтропийного фактора (TΔS), которым пренебрегают, когда сравнивают состояния с одинаковой энтропией. Вклад, который вносит в изменение энергии сольватация молекул (ΔGcолв), вычисляют путем решения обобщенного уравнения Борна [33, 34], учитывая электростатический (ΔGэл) и гидрофобный (ΔGгидр) вклады.
Таблица 1.
Основные формулы | Основные параметры |
---|---|
ΔGдим = ΔGвак + + ΔGcолв | ΔGвак–ΔG при образовании димера в вакууме ΔGcолв–ΔG, связанное с переходом из вакуума в раствор |
ΔGвак = ΔGмм – – TΔS | ΔGмм – усредненная ΔG, рассчитанная с помощью ММ TΔS – энтропийный фактор |
ΔGcолв = ΔGэл + + ΔGгидр | ΔGэл – электростатический вклад ΔGгидр – гидрофобный вклад |
В данной работе применен усовершенствованный метод MM-GBSA, разработанный для макромолекул, в котором борновские радиусы масштабируются для учета межузельных пространств между атомными сферами [31]. Объектами исследования были мезофильные HU-белки HUEcoliα, HUEcoliβ и HUMGal, а также термостабильный HUSpM и его мутантные варианты со сниженной термостабильностью [12, 13, 20].
HU-белки представляют собой небольшие положительно заряженные димерные белки [7–14]. Известно, что термическая денатурация HU-белков происходит путем диссоциации димера на денатурированные (развернутые) мономеры и может протекать в одну или две стадии [12, 13]. В случае двухступенчатой денатурации предполагается образование промежуточного продукта, представляющего собой димер, состоящий из частично денатурированных мономеров [12]. В обоих случаях основной вклад в термическую денатурацию вносит плавление границы раздела между мономерами в димере.
В работе проведен анализ границ раздела между мономерами в димере модельных HU-белков с помощью программы PDBePISA и метода MM-GBSA и установлена корреляция между изменением свободной энергии при образовании димеров HU-белков и их термостабильностью.
Трехмерные модели четырех исследуемых HU-белков, на которых область границы раздела между мономерами отмечена окраской, соответствующей электростатическому потенциалу, представлены на рис. 1. Сравнительный анализ первичных и пространственных структур исследуемых HU-белков, а также границ раздела между мономерами в димерах представлены в табл. 2 и 3 соответственно.
Таблица 2.
Идентичность первичных структур в % (СКО атомов Са в Å при наложении 3D-структур) | HUSpM (5L8Z) |
HUMGal (2NDP-А) |
HUEcα (1MUL) |
---|---|---|---|
HUMGal (PDB ID 2NDP-А) | 26 (2.1) | ||
HUEcoliα (PDB ID 1MUL) | 38 (1.5) | 15 (1.7) | |
HUEcoliβ (PDB ID 4P3V) | 38 (1.2) | 14 (1.5) | 64 (0.6) |
Таблица 3.
Название белка (PDB ID) |
HUMGal (2NDP-А) |
HUSpM (5L8Z) |
HUEcα (1MUL*) |
HUEcβ (4P3V*) |
---|---|---|---|---|
Аминокислотные остатки ГР, % | 56.6 | 54.7 | 51.1 | 55.6 |
Площадь внутренней части ГР, % | 23.6 | 29.3 | 20.9 | 24.8 |
ΔG гидрофобных контактов ГР, ккал/моль | –34.3 | –42.3 | –36.3 | –32.2 |
Водородные связи ГР | 19 | 16 | 12 | 14 |
Солевые мосты ГР | 0 | 2 | 0 | 2 |
Как следует из табл. 2, аминокислотные последовательности HUEcoliα и HUEcoliβ имеют высокую степень гомологии между собой (64% идентичности), более низкую с HUSpM (38% идентичности) и очень низкую с HUMGal (14–15% идентичности); при этом последовательности HUSpM и HUMGal тоже имеют низкую гомологию друг с другом (26% идентичности). В то же время при сравнении пространственных структур среднеквадратичные отклонения (СКО) Сα-атомов находятся в диапазоне от 0.6 Å (HUEcoliα vs. HUEcoliβ) до 2.1 Å (HUMGal vs. HUSpM), что свидетельствует о том, что несмотря на низкую гомологию аминокислотных последовательностей, пространственная укладка HU-белков очень консервативна (рис. 1). Как следует из табл. 3, во всех исследуемых белках более 50% аминокислотных остатков вовлечены в формирование границы раздела между мономерами, при этом недоступная молекулам растворителя (внутренняя) часть границы раздела составляет от 20 до 30% от всей поверхности. Как следует из рис. 1, периферические области границы раздела между мономерами обогащены заряженными и полярными аминокислотными остатками, участвующими в формировании полярных контактов, тогда как внутренние области гораздо более гидрофобны. Отметим, что количество полярных межграничных контактов в HUMGal, HUSpM и HUEcoliβ практически одинаково, а заметное их уменьшение, наблюдаемое у HUEcoliα, компенсируется увеличением энергии гидрофобных взаимодействий во внутренней части границы раздела (табл. 3).
Исходя из анализа границы раздела HUSpM, следует предположить, что ее высокая термостабильность определяется именно высокой энергией гидрофобных взаимодействий в ее внутренней части, причем выигрыш в энергии связан не с количеством вовлеченных аминокислот, а с их природой и взаимным расположением. В [15] описан не консервативный кластер ароматических аминокислот, формирующих центр стекинг-взаимодействий в гидрофобном ядре димера HUSpM. Замены аминокслотных остатков фенилалана (F14, F29 и F31), составляющих этот кластер на аланин, приводили к снижению термостабильности HUSpm [13]. Поэтому для изучения точности предсказания термоустойчивости гистоноподобных белков методом MM-GBSA к модельным HU-белкам дикого типа были добавлены мутантные варианты HUSpM: HUSpMF14A, HUSpMF29A и HUSpMF31A.
Для проведения расчетов методом MM-GBSA для всех исследуемых белков получены и проанализированы МД-траектории протяженностью 50 нс. При проведении анализа оценивали следующие параметры: изменения радиусов инерции димеров, СКО Cα-атомов от начального положения и среднеквадратичные флуктуации (СКФ) аминокислотных остатков в процессе МД-эксперимента. Анализ МД-траекторий, полученных для четырех HU-белков и для трех мутантных вариантов HUSpM, представлены на рис. 2 и 3 соответственно.
Из графиков на рис. 2 и 3 видно, что радиусы инерции во всех системах находятся в диапазоне от 1.9 до 2.2 нм. Данные значения указывают, что при МД-симуляции компактность систем существенно не меняется, что указывает на стабильное положение мономеров в димере. СКО Cα-атомов колеблются в диапазоне от 0.5–0.7 нм у HUMGal, HUEcoliβ и мутантов HUSpM и в диапазоне 0.5–0.9 нм у HUEcoliα и HUSpM дикого типа. Относительно высокие для систем такого размера (молекулярная масса димеров HU-белков составляет ~20 кДа) СКО связаны со значительной подвижностью петлевых участков ДНК-связывающих доменов в отсутствие ДНК, что наглядно демонстрируют графики СКФ аминокислотных остатков. СКФ остатков N-концевой области белка, включающей α-спиральные и β-листовые области, участвующие в формировании границы раздела между мономерами в димере, как правило, не превышают 0.2 нм, тогда как СКФ остатков вытянутых менее структурированных “рук” ДНК-связывающего домена (рис. 1) достигают 1.0 и более нм. Таким образом, все исследуемые димеры являются достаточно стабильными в МД-эксперименте, а полученные траектории могут быть использованы для расчета энергии связывания мономеров в димерах методом MM-GBSA.
В табл. 4 представлены расчетные ΔGдим для четырех HU-белков дикого типа и трех мутантов HUSpM, а также взятые из литературных источников Tпл, измеренные с помощью ДСК. Как следует из таблицы, результаты расчетов коррелируют с экспериментально определенной термоустойчивостью. В случае мезофильных HU-белков HUEcoliα, HUEcoliβ и HUMGal, имеющих температуры плавления границы раздела между мономерами в димере в диапазоне 50–56°С, выигрыш свободной энергии при формировании димера составляет от –149.8 до –133.5 ккал/моль. В то же время у термоустойчивого HUSpM, у которого два тепловых перехода, связанные с плавлением границы раздела, происходят при температурах 74.5 и 84.3°С, выигрыш свободной энергии при формировании димера составляет около –180 ккал/моль. Кроме того, наблюдается явная корреляция снижения термоустойчивости у мутантных вариантов HUSpm, несущих аланиновые замены остатков фенилаланина из ароматического кластера стекинг-взаимодействий на границе раздела между мономерами (рис. 1), с уменьшением выигрыша свободной энергии при образовании димера у соответствующих мутантов: HUSpMF14A и HUSpMF31A имеют Tпл в диапазоне 63–64°С, а ΔGдим от –163 до –160 ккал/моль, тогда как наименее термоустойчивый мутант HUSpMF29A имеет ΔGдим около –150 ккал/моль.
Таким образом, полученные результаты указывают на то, что метод MM-GBSA может быть использован для предсказания термоустойчивости гистоноподобных белков, а также учета влияния точечных замен аминокислотных остатков границы раздела между мономерами на термостабильность мутантных белков. Кроме того, используя аналогичный подход, можно было бы прогнозировать стабильность димерных белков других классов или изучать стабильность белковых комплексов.
Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект № 20-04-01001) в части моделирования, МД-экспериментов и термодинамических расчетов. Сравнительный анализ границы раздела между мономерами в димере проводили при поддержке Министерства науки и высшего образования РФ в рамках выполнения работ по Государственному заданию ФНИЦ “Кристаллография и фотоника” РАН.
Список литературы
Bischof J.C., He X. // Ann. New York Acad. Sci. 2006. V. 1066. P. 12. https://doi.org/10.1196/annals.1363.003
Miotto M., Olimpieri P.P., Rienzoet L.D. et al. // Bioinformatics. 2019. V. 35. № 15. P. 2569. https://doi.org/10.1093/bioinformatics/bty1011
Grishin D.V., Pokrovskaya M.V., Podobed O.V. et al. // Biomed. Chem. 2017. V. 63. № 2. P. 124. https://doi.org/10.18097/PBMC20176302124
Christodoulou E., Vorgias C. // Extremophiles. 2002. V. 6. P. 21. https://doi.org/10.1007/s007920100235
Razvi A., Scholtz J.M. // Protein Sci. 2006. V. 15. № 7. P. 1569. https://doi.org/10.1110/ps.062130306
Sanaviaa T., Biroloa G., Montanucc L. et al. // Comput. Struct. Biotechnol. J. 2020. V. 18. P. 1968. https://doi.org/10.1016/j.csbj.2020.07.011
Kamashev D., Agapova Y., Rastorguev S. et al. // PLoS One. 2017. V. 12. P. e0188037. https://doi.org/10.1371/journal.pone.0188037
Bhowmick T., Soumitra Ghosh S., Dixit K. et al. // Nat. Commun. 2014. V. 11. P. 4124. https://doi.org/10.1038/ncomms5124
Agapova Y.K., Altukhov D.A., Timofeev V.I. et al. // Sci. Rep. 2020 V. 10. P. 15128. https://doi.org/10.1038/s41598-020-72113-4
White S.W., Wilson K.S., Appelt K. et al. // Acta Cryst. D. 1999. V. 55. P. 801. https://doi.org/10.1107/s0907444999000578
Christodoulou E., Rypniewski W.R., Vorgias C.E. // Extremophiles. 2003. V. 7. P. 111. https://doi.org/10.1007/s00792-002-0302-7
Ramstein J., Hervouet N., Coste F. et al. // J. Mol. Biol. 2003. V. 331. P. 101. https://doi.org/10.1016/s0022-2836(03)00725-3
Boyko M.K., Rakitina T.V., Korzhenevskiy D.A. et al. // Sci. Rep. 2016. V. 6. P. 36366. https://doi.org/10.1038/srep36366
Papageorgiou A.C., Adam P.C., Stavros P. et al. // Extremophiles. 2016. V. 20. P. 695. https://doi.org/10.1007/s00792-016-0859-1
Timofeev V.I., Altukhov D.A., Talyzina A.A. et al. // J. Biomol. Struct. Dyn. 2018. V. 36. P. 4392. https://doi.org/10.1080/07391102.2017.1417162
Agapova Y.K., Talyzina A.A., Altukhova D.A. et al. // Crystallography Reports. 2019. V. 64. P. 602. https://doi.org/10.1134/S1063774519030027
Agapova Y.K., Altukhov D.A., Kamashev D. et al. // Crystallography Reports. 2020. V. 65. P. 900. https://doi.org/10.31857/S0023476120060041
Komolov A.S., Agapova Y.K., Timofeev V.I. et al. // J. Surf. Investigation. 2021. V. 10. P. 23. https://doi.org/10.1134/S1027451021050293
WwPDB Consortium // Nucleic acids research. 2019. V. 47. P. D520.
Altukhov D.A., Agapova Y.K., Talyzina A.A. et al. // J. Biomol. Struct. Dyn. 2016. V. 36. P. 45. https://doi.org/10.1080/07391102.2016.1264893
Emsley P., Lohkamp B., Scott W.G. et al. // Acta Cryst. D. 2010. V. 66. P. 486. https://doi.org/10.1107/S0907444910007493
Abraham M.J., Murtola T., Schulz R. et al. // SoftwareX. 2015. V. 1–2. P. 19. https://doi.org/10.1016/j.softx.2015.06.001
Maier J.A., Martinez C., Kasavajhala K., Wickstrom L. et al. // J. Chem. Theory Comput. 2015. V. 11. № 8. P. 3696. https://doi.org/10.1021/acs.jctc.5b00255
Berendsen H.J.C., Postma J.P.M., van Gunsteren W.F. et al. // J. Chem. Phys. 1984. V. 81. № 8. P. 3684. https://doi.org/10.1063/1.448118
Parrinello M., Rahman A. // J. Chem. Phys. 1982. V. 76. № 5. P. 2662. https://doi.org/10.1063/1.443248
Hess B., Bekker H., Berendsen H.J.C. et al. // J. Comput. Chem. 1997. V. 18. P. 1463. https://doi.org/10.1002/(SICI)1096-987X(199709)18:12<1463::AID-JCC4>3.0.CO;2-H
Darden T., York D., Pedersen L. // J. Chem. Phys. 1993. V. 98. P. 10089. https://doi.org/10.1063/1.464397
Kollman P.A., Massova I., Reyes C. et al. // Acc. Chem. Res. 2000. V. 33. № 12. P. 889. https://doi.org/10.1021/ar000033j
Petrenko D.E., Timofeev V.I., Karlinsky D.M. et al. // Crystallography Reports. 2022. V. 67. № 3. P. 430. https://doi.org/10.31857/S002347612203016X
Miller B.R., McGee T.D., Swails J.M. et al. // J. Chem. Theory Comp. 2012. V. 8. № 9. P. 3314. https://doi.org/10.1021/ct300418h
Onufriev A., Bashford D., Case D.A. // Proteins. 2004. V. 55. P. 383. https://doi.org/10.1002/prot.20033
Wang E., Sun H., Wang J. et al. // Chem. Rev. 2019. V. 119. № 16. P. 9478. https://doi.org/10.1021/acs.chemrev.9b00055
Srinivasan J., Trevathan M.W., Beroza P. et al. // Theor. Chem. Acc. 1999. V. 101. P. 426. https://doi.org/10.1007/s00214990m185
Still W.C., Tempczyk A., Hawley R.C. et al. // J. Am. Chem. Soc. 1990. V. 112. P. 6127. https://doi.org/10.1021/ja00172a038
Дополнительные материалы отсутствуют.
Инструменты
Кристаллография