Hackathon - IA para Óleo & Gás

Datas: 10 a 14 de novembro de 2025 - Presencial no CBPF (Rio de Janeiro, RJ)

Pitch e banca final: 20 de novembro de 2025 - durante a SBGF

Trilhas de Dados

O Hackathon contará com três trilhas de dados independentes. Cada grupo inscrito deverá escolher e trabalhar em duas trilhas, desenvolvendo soluções com base nos conjuntos de dados simulados e preparados exclusivamente para esta competição.

Cada trilha possui subconjuntos de treino e teste:

  1. Treino – disponível para desenvolvimento e ajustes das soluções.
  2. Teste – utilizado exclusivamente para a avaliação final pela banca.

Ressonância Magnética Nuclear (RMN)

Descrição:

O desafio consiste em desenvolver modelos de inteligência artificial capazes de prever as proporções de fluidos (óleo e água) a partir de curvas de relaxação magnética da componente perpendicular da magnetização, M_⊥ (t), obtidas por Ressonância Magnética Nuclear (RMN), especificamente sequências CPMG. Trata-se da aplicação de modelos/algoritmos de machine learning , na qual as entradas são séries temporais representando a evolução da magnetização ao longo do tempo, e a saída-alvo são as correspondentes concentrações de óleo na rocha digital para cada entrada M_⊥ (t). As curvas de entrada M_⊥ (t) forma simuladas computacionalmente em rochas digitais e vem acompanhadas de ruído branco com diferentes níveis da relação sinal-ruído. O resultado esperado contribui para a caracterização petrofísica de reservatórios, auxiliando na estimativa referente à proporção de fluidos de interesse com diferentes parâmetros petrofisicos.

Estrutura dos dados:

  1. Simulação a partir de rochas digitais geradas pelo empacotamento de esferas rígidas (raios de 3 μm a 21 μm) em cubo de 100 μm.
  2. Porosidade média de ~0,26.
  3. Sequências CPMG com tempo entre ecos de 500 μs e relaxatividade superficial de 50 μm.
  4. Proporção de óleo variando entre 15% e 80%.
  5. Formato tabular (train.csv e test.csv), contendo:
dados
  1. Série temporal da curva M⊥(t) (entrada).
  2. Proporção entre óleo e água (saída).

Lâminas petrográficas

Descrição:

Desenvolver modelos de aprendizado de máquina capazes de classificar, de forma automática, a litologia de lâminas petrográficas de rochas carbonáticas do pré-sal brasileiro. O objetivo é aumentar a eficiência e a padronização da análise petrográfica em contextos geológicos complexos.

Estrutura dos dados:

  1. Tipo de dado: cortes de imagens sintéticas de lâminas delgadas de rochas carbonáticas.
  2. Quantidade: 800 imagens.
  3. Resolução: 256 × 256 pixels.
  4. Formato de cor: três canais (RGB).
  5. Classes litológicas: esferulitito, estromatólito, laminito e retrabalhado.
  6. Características: preservam texturas e estruturas das lâminas originais.
  7. Formato dos dados: (2 arquivos .zip - treino e teste - com imagens .jpg ou .tif).
laminas

Sísmica

Descrição:

Desenvolver modelos de aprendizado de máquina capazes de segmentar fácies sísmicas de forma automática. O objetivo é apoiar a automatização da interpretação sísmica, contribuindo para a construção de modelos geológicos mais precisos e acelerando processos de exploração.

Estrutura dos dados

sismica
  1. Tipo de dado: fragmentos (patches) de imagens sísmicas extraídos de volume 3D.
  2. Quantidade: aproximadamente 25.000 patches, gerados em malha regular com sobreposição mínima.
  3. Resolução: 224 × 224 pixels.
  4. Formato: níveis de cinza (canal único).
  5. Rótulos: máscaras segmentadas pixel a pixel indicando as diferentes fácies sísmicas presentes em cada fragmento.
  6. Características: o conjunto de dados contempla seis classes de fácies, representando diferentes sistemas deposicionais.
  7. Formato dos arquivos: dividido em conjuntos de treino e teste. Cada conjunto é disponibilizado em dois arquivos .npy: um contendo as imagens sísmicas e outro contendo as máscaras correspondentes com as fácies segmentadas.

NotaTodos os patches foram gerados a partir de um volume sísmico de domínio público (Nova Zelândia). A interpretação das fácies é de autoria da Chevron (sob licença Creative Commons CC-BY-SA).

  1. Os dados sísmicos estão disponíveis publicamente e são fornecidos pela New Zealand Petroleum and Minerals (NZPM). Veja https://www.nzpam.govt.nz/maps-geoscience/exploration-database/
  2. Os rótulos associados, Modelo geológico rotulado dos dados sísmicos de Parihaka para aprendizado de máquina, da Chevron U.S.A. Inc., estão licenciados sob CC BY-SA 4.0. Veja https://creativecommons.org/licenses/by-sa/4.0/

Observação:

Os conjuntos de dados utilizados neste hackathon são de uso exclusivo do Centro Brasileiro de Pesquisas Físicas (CBPF) e foram preparados especificamente para esta competição. Seu uso é permitido apenas durante o evento.

As soluções desenvolvidas serão de propriedade intelectual dos respectivos autores, que poderão manter e utilizar os modelos treinados após o hackathon. No entanto, é proibido compartilhar, reproduzir ou redistribuir os conjuntos de dados fora do contexto desta competição.

Ao efetuar a inscrição, o participante declara estar ciente e de acordo com esta regra, comprometendo-se a cumpri-la integralmente.