Данные – это новая нефть.
Когда говорим о данных и их экспоненциальном росте в 21 веке, часто слышим фразу: «данные – это новая нефть». Но, в нефтяной и газовой отрасли это не банальная фраза, а реальная цель – результат умного управления данными и их применения – есть новая нефть.
Развитие интернета и ИТ систем ускорили развитие искусственного интеллекта (анг. Artificial intelligence), в рамках которого развивается теория и методы анализа данных (анг. data science). Теория и методы анализа данных используют передовые аналитические методы для выделения из данных информации, значимой для принятия бизнес-решений, стратегического планирования и пр.
Анализ данных повышает операционную эффективность.
В результате анализа данных в нефтяной отрасли повышается операционная эффективность и выявляются новые деловые возможности, повышается конкурентоспособность на рынке. Неотъемлемой частью анализа данных является инженерия данных (анг. data engineering), анализ результатов наблюдения и моделирования алгоритмами машинного обучения.
Широкое применение алгоритмов машинного обучения.
Наша цифровая лаборатория широко применяет алгоритмы машинного обучения (анг. machine learning) с целью прогноза будущего сценария; алгоритмы обучаются на данных, полученных на тренингах, без программирования в явном виде. Наиболее известны алгоритмы классификации и регрессии, относящиеся к контролируемому обучению. Используя алгоритмы классификации, мы прогнозируем категориальные целевые переменные, напр. является ли порода коллектором нефти или нет (бинарная классификация), или каков литологический состав породы в скважине (многопараметрическая классификация). Алгоритмы регрессии решают проблемы прогнозирования непрерывного целевого значения переменных, например, дебета жидкости в нефтяной скважине или прогноза индекса сложности месторождения.
Неконтролируемое обучение применяется в области поиска структур в данных, исходя из искомой конкретной структуры, кластеризации (возможно, это наиболее узнаваемый алгоритмы данного типа обучения). Примером является группирование владельцев карты лояльности НИС «Нам по пути». Более сложные проблемы решаются с помощью автоэнкордера (напр. устранение шума на записи).
Машинное обучение и нейронные сетиые сети
Нейронные сети построены по принципу функционирования нейронных сетей человеческого мозга, с целью копирования процесса учения. Они часто неправильно считаются синонимом механического обучения. На самом деле, нейронные сети используют для обучения исключительно при обработке больших массивов данных и когда процесс обучения основывается на неполных и частично искаженных данных. Их используют в решении проблем контролируемого и неконтролируемого обучения. Нейронные сети включают вычислительные единицы («нейроны») соединенные в «пласты»; машинное обучение в сетях с двумя или несколькими пластами называется глубинным обучением (анг. deep learning).