Геонейрон
191 subscribers
357 photos
96 links
Здесь мы рассказываем о применении искусственного интеллекта в геологии
Download Telegram
🚀 ИИ и литофации 🚀

🌍 Угленосные сланцы Каменноугольно-Пермского периода — ключевые объекты для изучения и развития шельфового газа по всему миру. Однако высокая изменчивость литофаций, их минеральный состав и органическое вещество создают сложности при прогнозировании перспективных месторождений («sweet spots»). Цель исследования "Lithofacies types and formation mechanisms of Carboniferous - Permian shales: Insights from big data and machine learning" (Earth-Science Reviews, Volume 264, May 2025) — детальное классифицирование литофаций этих сланцев, выявление главных факторов, влияющих на их формирование, а также раскрытие условий накопления органического вещества с помощью big data и машинного обучения. Это поможет улучшить стратегию разведки и добычи сланцевого газа.

📊 Исходные данные для обучения и анализа

Обширный датасет, включающий:
- 8166 образцов с данными о содержании общего органического углерода (TOC).
- 4524 образца с информацией о минеральном составе.
- 814 образцов с данными о содержании основных и редких элементов.

Пробы собраны из 24 бассейнов мира с широко охватываемым географическим распространением.

Данные частично взяты из опубликованной литературы с добавлением новых измерений, проведённых авторами, что обеспечивает масштаб и надёжность анализа.

🤖 Методы машинного обучения и основные результаты

В исследовании применены два основных ML-алгоритма:

🔺 Random Forest (RF) — ансамблевый метод, использующий множество решающих деревьев. Отличается устойчивостью к выбросам и способностью выявлять важность переменных.
🔺 Artificial Neural Networks (ANN) — многослойные нейронные сети, которые эффективно выявляют сложные нелинейные зависимости и связи в данных.

Оба алгоритма классифицировали литофации с точностью около 90%:
- RF-достиг общей точности 92.8%,
- ANN — 90.9%.

Наиболее сильное влияние на формирование литофаций оказывают следующие факторы:
- Содержание алюминия (Al),
- Отношение фосфор/титан (P/Ti),
- Химический индекс выветривания (CIA),
- Солёность (Sr/Ba),
- Степень ограничения водной массы (Co×Mn).

Наименее значимым фактором было содержание никеля (Ni).

Классификация литофаций основана на пороге TOC в 5.3%, а также на распределении минералов в третичной диаграмме «кремнистые — карбонатные — глинистые».

Выделено 7 основных литофаций, среди которых органо- и кремнезёмосодержащий сланец (Ss-H) представлен как наиболее перспективный тип для добычи сланцевого газа.

📌 Заключение

Применение машинного обучения с использованием больших геохимических данных позволило разработать чёткую и надёжную классификацию литофаций Каменноугольно-Пермских сланцев и выявить главные геохимические и палеоклиматические факторы их формирования. Органо- и кремнезёмосодержащие сланцы (Ss-H) являются наиболее привлекательными для разработки сланцевого газа, значительной хрупкости и хорошим поровым свойствам. Тем не менее, их представленность в общей толщине малочисленна, а тип органического вещества менее оптимален по сравнению с более древними породами, что ограничивает масштаб добычи. Статья даёт важное направление для дальнейших исследований и использования ИИ в геологии, позволяя повысить эффективность поиска углеводородов в сложнохарактеризуемых формациях.

🎯 Голосование

👍 — Понравилась статья
👎 — Не очень интересно
— Хотелось бы больше подробностей о методах
🔥 — Очень полезно для геологов

--
Спасибо за внимание! Если вам интересен обзор других исследований о применении ИИ в геологии — пишите, обсудим!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍21
👍 ИИ и хемостратиграфия 👍

Principal Component Analysis (#PCA) — мощный метод снижения размерности, применяемый к химическому составу горных пород в хемостратиграфии для интерпретации минералогических связей и геологических условий. Исследование "Best practices of utilizing principal component analysis in chemostratigraphic studies" (Applied Geochemistry, July, 2025) показывает, что для устойчивого построения моделей PCA необходимо учитывать объем и состав данных.

Хемостратиграфия — многомерная задача, включающая анализ десятков элементов (Na–U) для выявления ключевых стратиграфических границ и интерпретации геологических процессов. Традиционные методы требуют большого времени и опыта, а выбранные параметры часто непереносимы между разными исследованиями. PCA уменьшает число переменных, сохраняя информацию до 80–95%, облегчая интерпретацию.

📖 Данные

Анализируются данные до 10,000 образцов из около 100 скважин по карбонатным и кремнистые отложениям, собранные с помощью ICP-MS и ICP-OES. Образцы представлены кернами и выбурками с шагом ~10 футов.

🔮 Методология

PCA строится через стандартизацию, вычисление ковариационной матрицы, собственных векторов и значений для определения главных компонентов (PC). Особое внимание уделяется анализу собственных векторов для выявления элементно-минеральных и геологических связей. Проведено 1000+ экспериментов с увеличением числа образцов с шага 10 до нескольких тысяч для оценки устойчивости PCA.

⚡️ Основные результаты

PC1 и PC2 стабилизируются уже при ~100 образцах, обеспечивая надежный геологический смысл.
Для PC3–PC6 требуется значительно больше данных (от 1000 до 6000+), из-за их чувствительности к вариабельности данных.
Карбонатные и кремнистые осадки требуют раздельного анализа, поскольку интерпретации существенно различаются.
Корреляция PCA, проведенная на разрозненных наборах данных, не рекомендуется из-за изменяющейся структуры собственных векторов.
При наличии интерпретаций возможно применение существующих весов и моделей к новым данным, если новые данные по статистике соответствуют исходным (проверка с помощью метрик, например, дивергенции Кульбака-Лейблера).

💡 Рекомендации

Использовать для каждого PCA минимум 100 образцов, желательно более 300 для анализа более высоких компонентов. Создавать обобщенные шаблоны PCA отдельно для карбонатов и силикатов с объемом порядка 10,000 образцов для устойчивости модели.
Объединять данные и проводить PCA совместно, а не на раздельных подвыборках.

🧭 Выводы

1️⃣ PCA — эффективный инструмент для упрощения и повышения точности хемостратиграфии. Для надежных интерпретаций требуется достаточный объем данных, особенно для компонент высокого порядка.
2️⃣ Раздельные модели для разных литологий позволяют избежать ошибочных интерпретаций.
3️⃣ Корреляции результатов PCA между разными исследованиями возможны лишь при соблюдении условий представительности и обширности данных.

👍👎 Голосование по статье

👍 Впечатлил!
🔥 Может быть полезно.
👎 Не впечатлил.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥2
💎 ИИ и кристаллические породы 💎

🏞 В современной геологии одной из ключевых задач является точное воспроизведение мезоструктуры кристаллических горных пород. Эти породы характеризуются выраженной гетерогенностью, сложной формой зерен и межзерновыми границами, что существенно влияет на их механическое поведение при нагрузках. Для моделирования мезомеханики пород в численных симуляциях необходимо иметь детализированную и точную реконструкцию внутренней структуры породы. Существует две основные группы методов решения этой задачи: статистические и методы цифровой обработки изображений. В статье "Expert K-means reconstruction method: a novel image processing approach for mesostructure reconstruction of crystalline rocks" (Computers & Geosciences, August, 2025) предложен инновационный подход — Expert K-Means Reconstruction Method (#EKRM), объединяющий экспертную систему с машинным обучением, что позволяет повысить точность и воспроизводимость реконструкции мезоструктур.

📊 Исходные данные для обучения и работы

Для обучения и валидации алгоритмов использовались высококачественные оптические микроскопические изображения образцов гранита и других кристаллических пород. Некоторые из них были дополнительно аннотированы вручную с помощью программного обеспечения Labelme, что послужило эталоном для оценки точности методов. Работа с изображениями включала преобразование цветового пространства (наиболее эффективным признан CIELAB) и использование нескольких цветовых каналов для лучшего различения минералов. Валидация также проводилась на наборах данных с различными видами пород: диабаз, гнейс, диорит, что подтвердило универсальность алгоритма.

🤖 Методы и алгоритмы машинного обучения

Основой разработки является комбинирование классического алгоритма кластеризации K-means (unsupervised learning) с экспертным модулем, который вручную сопоставляет кластеры с минералами. Это позволило избежать основных ограничений чисто автоматических методов — плохой интерпретируемости и невысокой точности при близких цветах минералов. EKRM проводит двойное сегментирование по цветному пространству с использованием K-means, затем корректирует результаты через экспертные правила. Для повышения точности границ минералов применяется вероятностное выделение границ с помощью гауссового сглаживания.

📈 Основные результаты

1️⃣ EKRM превосходит существующие методы (PGBM, U-Net, классическая сегментация, обычный K-means) по метрике точности (ACC), особенно в сложных участках с переходами между минералами.
2️⃣ Помимо лучшей точности, EKRM демонстрирует высокую устойчивость к изменениям изображений (повороты, шумы) и хорошую переносимость на разные типы горных пород.
3️⃣ Механические численные эксперименты с использованием моделей, построенных с помощью EKRM, эффективно воспроизводят реальные закономерности трещинообразования и поведения пород при гидроразрыве, что подтверждено экспериментами в лаборатории.
4️⃣ Анализ фрактальной размерности и распределения размеров зерен показал, что EKRM лучше отражает реальную сложность структуры породы.

📝 Заключение

В работе предложен новый гибридный метод Expert K-Means Reconstruction Method (EKRM), успешно сочетающий достоинства машинного обучения и экспертных знаний для точного восстановления мезоструктуры кристаллических пород. EKRM демонстрирует высокую точность, устойчивость, возможность повторного использования на различных типах пород и отлично подходит для поддержки численных моделей механики пород, значительно повышая достоверность имитаций процессов деформации и разрушения. Метод носит прикладной характер и может быть внедрен в исследования горных пород, минералогию и разработку фильтрационных моделей.

🎯 Голосование по статье

👍 — понравилась статья
👎 — не понравилась статья
🤔 — остались вопросы
🔥 — очень полезно и интересно
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8🤔2👍1
❄️ ИИ и вечная мерзлота ❄️

🏔 Исследование "Assessing machine learning models to generate permafrost distribution map in Solukhumbu, Nepal" (Geodesy and Geodynamics, May 2025) посвящено картированию распространения вечномерзлых пород (пермафроста) в горах района Солухумбу, Непал — важного компонента криосферы, который тает в связи с глобальным потеплением. Пермафрост обеспечивает стабильность горных склонов и влияет на гидрологические процессы, его сокращение может приводить к лавинам и оползням. В горах Непала недоизучены границы пермафроста, что осложняет прогнозирование экологических и гидрологических рисков. Для решения задачи определяют статус каменных ледников (intact – ледистые, relict – безледные), служащих прокси индикаторами вечной мерзлоты, и используют машинное обучение для генерации карты вероятности распределения пермафроста.

📊 Исходные данные для обучения и анализа

🗺 Картографирование каменных ледников осуществлено на основе анализа спутниковых изображений Google Earth (2017–2019 годы) в регионе Солухумбу. Всего идентифицировано 168 объектов, из которых 90 ледистых и 78 безледных.
🌡 Топоклиматические параметры (предикторы):
- Среднегодовая температура воздуха (MAAT), полученная из базы WorldClim с разрешением 21 км и затем детализированная до 30 м.
- Потенциальное поступающее солнечное излучение (PISR), рассчитано на основе цифровой модели рельефа (DEM).
- Рельефные характеристики: высота, экспозиция и уклон, извлечённые из 30 м DEM SRTM. Эти переменные считаются влияющими на распределение вечномерзлых грунтов и каменных ледников.

🤖 Методы и алгоритмы машинного обучения

Для моделирования вероятности наличия пермафроста использовались три классификационные модели:

🔹 Логистическая регрессия (Logistic Regression, LR) – классический статистический метод с регуляризацией (L1=0.6, L2=0.01), оптимизация модели через 10-кратную перекрестную проверку.
🔹 Случайный лес (Random Forest, RF) – ансамбль из 500 деревьев решений с настройками по умолчанию, построенный для борьбы с переобучением, с 10-кратной перекрестной проверкой.
🔹 Метод опорных векторов (Support Vector Machines, SVM) с линейным ядром и 5-кратной перекрестной проверкой, оптимизация параметра регуляризации с помощью сеточного поиска.

Целевой переменной являлась классификация каменных ледников на intact (пермафрост есть) и relict (пермафрост отсутствует). Модели обучались на проэкстрагированных значениях топоклиматических параметров в точках начала движения пермафроста (перемещение каменного ледника).

📈 Основные результаты

1️⃣ Качество моделей: Логистическая регрессия показала наилучшую общую точность (~91% на тестовой выборке), SVM близко (~89%), RF уступил (~81%) и выдавал более «шумные» пространственные карты.
2️⃣ Прогноз распределения: Вероятное распространение пермафроста находится выше 5000 м над уровнем моря. LR и SVM дали очень схожие карты вероятностей, RF более фрагментированную и менее точную.
3️⃣ Важность признаков: MAAT — самый значимый фактор во всех моделях. Экспозиция (аспект) снижала качество прогнозов LR и SVM (возможно из-за отсутствия данных о градиентах осадков), RF менее реагировал на аспект. Уклон и PISR играли менее значимую роль.
4️⃣ Ограничения: Модели плохо предсказывают пермафрост на плоских и ледниковых участках, трудно учесть северо-южную градацию из-за перекоса данных. Есть неопределённость в выборе порога вероятности (cut-off), но 0.6 выбран как наиболее приемлемый. Необходимы дополнительные данные о температуре грунта и осадках.

📜 Заключение

В статье показано, что машинное обучение эффективно помогает создавать карты вероятности распределения вечномерзлых пород в труднодоступных горных районах с ограниченными данными. Для улучшения прогноза требуется сбор данных более высокого разрешения, в частности наземной температуры и осадков, а также расширение выборки каменных ледников и доработка моделей.

Голосование:

👍 – Понравилась статья
👎 – Не понравилась статья
– Хотелось бы узнать больше
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41
Минутка юмора

#мемы
🤣7👀3🤯1😱1
🗺 ИИ и геологические формации 🗺

⛏️ Геологическая задача исследования "Assimilation of the chronology of mineral system components in prospectivity analysis procedure for mineral exploration targeting: Adaptation of recurrent neural networks" (Journal of Geochemical Exploration, May 2025) заключается в повышении точности моделирования перспективных зон для поиска рудных месторождений, учитывая хронологическую последовательность геологических процессов формирования руд. Минеральные залежи формируются сложными, временно и пространственно зависимыми процессами, а традиционные методы минералогического моделирования часто игнорируют временной аспект формирования. Это создаёт неопределённости и снижает эффективность прогноза. Авторы предлагают инновационный подход — использование рекуррентных нейронных сетей (RNN), способных моделировать последовательности данных и учитывать временную структуру – ключевой фактор для правильного прогноза минерализации. На конкретном примере месторождений Pb–Zn типа Миссисиппийской долины (MVT) в западной части провинции Семнан (Иран) демонстрируется применение этого метода.

📊 Исходные данные

В исследовании использованы разносторонние данные геологических и геохимических наблюдений:

- Геохимические анализы 1111 сборов донных отложений с масштабом выборки 2 км²
- Цифровая геологическая карта с обозначением литологических единиц (особое внимание уделено сланцам, карбонатным породам и зонам доломитизации)
- Карта плотности и расположения разломов
- Данные дистанционного зондирования ASTER для выявления зон гидротермального изменения (доломитизация)
- Многофакторный геохимический анализ (Pb, Zn, Ba) с интерполяцией методом обратного взвешивания расстояния (IDW)
- Позиции 16 известных рудных тел и 16 случайных точек для обучения и проверки

Для обучения модели выделен сбалансированный набор положительных (месторождения) и отрицательных точек с пространственными буферами.

🤖 Методы машинного обучения и алгоритмы

Основной инновацией в работе является применение трёх архитектур рекуррентных нейросетей:

🔹 Simple RNN (SRNN) – базовая архитектура, работающая с последовательностями, но страдающая от проблем затухающего градиента
🔹 Long Short-Term Memory (LSTM) – расширенный тип RNN, который благодаря механизмам «входных», «выходных» и «забывающих» ворот способен учитывать долговременные зависимости
🔹 Gated Recurrent Units (GRU) – упрощённая версия LSTM с объединёнными воротами, более эффективная по скорости обучения

Для сравнения были использованы:
- Convolutional Neural Network (CNN) – классическая сверточная архитектура без учёта временной последовательности процессов
- Классический нечёткий гамма-оператор – запатентованный метод объединения карт вероятности

📈 Основные результаты

1️⃣ Модели на базе LSTM и GRU показали превосходство над SRNN, CNN и фуззи-методом по всем метрикам, с небольшим преимуществом GRU.
2️⃣ GRU достиг сбалансированной точности 84%, полноты 84%, точности 93%, общей точности 95% и AUC 0.84.
3️⃣ Пространственные карты перспективности rуд нашли локализации известных месторождений в зонах с высоким коэффициентом предсказания.
4️⃣ Анализ важности признаков с помощью SHAP показал, что главный вклад в прогноз вносит тип карбонатных пород (карбонат-хост), затем следуют данные о металлоносном сланце, плотности разломов и зоне доломитизации.
5️⃣ Использование временной последовательности геологических событий (TMPM – Time sequence-based Mineral Prospectivity Mapping) значительно улучшило качество прогнозов по сравнению с подходами, игнорирующими хронологию.

📝 Заключение

Применение рекуррентных нейронных сетей для интеграции последовательных хронологических данных геологических систем в процедуру оценки перспективности залегания руд позволило значительно повысить точность прогнозирования минерализации.

👍👎 Что думаете по поводу использования RNN в геологическом моделировании?

👍 Полезно и инновационно
🤔 Требует дальнейших исследований
👎 Сомнительно, оставим классические методы
👍6🤔1
Минутка юмора
🤣17😁2🔥1