Método MapBiomas Fogo

Aqui apresentamos um resumo do método desenvolvido e aplicado na Coleção 1 do mapeamento das cicatrizes de fogo do Brasil (1985-2020).
Para maiores detalhes metodológicos acesse o ATBD (Documento Base da Teoria do Algoritmo) neste LINK.

1. CARACTERÍSTICAS GERAIS

Todo o mapeamento de cicatrizes de fogo no Brasil foi baseado em mosaicos de imagens dos satélites Landsat com resolução espacial de 30 metros. O período de mapeamento foi de 1985 a 2020, com dados mensais e anuais de cicatrizes de queimada cobrindo todo o território brasileiro.
Todo processo foi feito de forma colaborativa entre instituições do MapBiomas e com inteligência artificial a partir do uso de algoritmos de aprendizagem de máquina (deep learning) na plataforma Google Earth Engine e Google Cloud Storage que oferecem imensa capacidade de processamento em nuvem.
O trabalho foi organizado por biomas e regiões, com coleta de amostras em áreas queimadas e não queimadas para treino do algoritmo por regiões, além do uso de mapas de referência, como de áreas queimadas do produto do MODIS (MCD64A1 - https://lpdaac.usgs.gov/products/mcd64a1v006/) de 500 m de resolução espacial e dados de focos de calor do INPE (https://queimadas.dgi.inpe.br/).

2. VISÃO GERAL DO MÉTODO

A primeira etapa consiste na definição das regiões por bioma para classificação. Já a segunda etapa consiste na construção dos mosaicos anuais para classificação, e a terceira etapa na coleta de amostras de treinamento de áreas queimadas e não queimadas nos mosaicos de imagens Landsat na plataforma Google Earth Engine. Para a etapa de classificação foi usada a plataforma Google Cloud Storage Bucket, onde foram armazenados os mosaicos para classificação e as amostras de treinamento, além da utilização de máquinas virtuais para o processamento dos algoritmos de classificação.
O diagrama abaixo ilustra as principais etapas e plataformas usadas no processo de classificação das cicatrizes de fogo no Brasil.

2.1. DEFINIÇÃO DE REGIÕES POR BIOMA

Para cada bioma foram definidas regiões para as coletas de amostras de treinamento e a classificação de áreas queimadas por região, com objetivo de obter uma classificação mais precisa com base em fatores edafoclimáticas e da vegetação regional. As seguintes regiões foram definidas para cada bioma:

2.2. MOSAICOS ANUAIS 

A classificação foi realizada usando mosaicos de imagens dos satélites Landsat (Surface Reflectance) (30 x 30 metros) construídos para cada um dos anos de 1985 a 2020. Foram usadas todas as cenas disponíveis do Landsat 5 (de 1985 a 1998 e de 2003 a 2011), Landsat 7 (1999 - 2002 e 2012) e Landsat 8 (2013 - 2020), todos com um intervalo de 16 dias.

2.3. COLETA DE AMOSTRAS

Esta etapa consiste na coleta de polígonos de amostras de treinamento de áreas queimadas e não queimadas nos mosaicos anuais Landsat para cada região dos biomas e para sensor (Landsat 05/Landsat 07 e Landsat 08).
Dessa forma, obteve-se um conjunto amostral por sensor e para as 21 regiões do Brasil, para serem usadas no treinamento do modelo de classificação.

2.4. CLASSIFICAÇÃO

O modelo de classificação utilizado foi o Deep Neural Network (redes neurais profundas) que consiste em modelos computacionais baseados em cálculos matemáticos capazes de realizar o aprendizado de máquina e reconhecimento de padrões visuais.
O algoritmo de mapeamento das áreas queimadas consistiu em duas fases: treinamento e predição. Com base nas amostras de treinamento de áreas queimadas e não queimadas, as seguintes bandas espectrais foram usadas como entrada para o modelo de classificação de áreas queimadas: vermelho (VERMELHO - 0,65 µm), infravermelho próximo (NIR - 0,86 µm) e infravermelho de ondas curtas (SWIR 1 - 1,6 µm e SWIR 2 - 2,2 µm). Além dessas bandas espectrais selecionadas, as bandas Landsat 2 a 7 e os índices NDVI (Índice de Vegetação por Diferença Normalizada), NBR (Índice de Queimada Normalizada) e Delta NBR foram testados. Essas bandas espectrais do Landsat foram escolhidas com base em sua sensibilidade a eventos de fogo. A entrada dos dados de treinamento foi dividida em dois conjuntos: 70% das amostras utilizadas para treinamento e 30% para teste.

2.5. PÓS-CLASSIFICAÇÃO

Após treinar e testar o modelo, a classificação foi aplicada com imagens Landsat quinzenais para todo o período de análise (1985 a 2019). Um filtro espacial foi aplicado para remoção de ruído e preencher pequenas lacunas vazias: áreas menores ou iguais a 1,4 hectares (16 pixels) foram removidas, e lacunas vazias menores ou iguais a 5,8 ha (64 pixels) foram preenchidos como áreas queimadas.
Após avaliação dos resultados da classificação, foram também aplicados filtros de pós classificação removendo pixels que que estavam nas seguintes classes de cobertura e uso da terra da Coleção 6 do MapBiomas nos biomas:

    • Amazônia: Água, Área Urbanizada e Afloramento Rochoso;
    • Caatinga: Água e Afloramento Rochoso;
    • Cerrado: Água e Área urbanizada;
    • Mata Atlântica: Água, Área Urbanizada e Arroz;
    • Pampa: Arroz, Soja, Outras Culturas Temporárias, Área Urbanizada e Água;
    • Pantanal: Água, soja e Outras Culturas Temporárias;


Como os métodos de Deep Learning precisam grande processamento computacional, as implementações foram baseadas em unidades de processamento gráfico (GPUs) e componentes de hardware especializados para executar operações aritméticas paralelas. O acesso às GPUs em um ambiente de máquina virtual foi implementado no Google Cloud Platform (https://console.cloud.google.com), um conjunto de serviços de computação em nuvem fornecidos pelo Google.
Para obter a informação do mês em que a cicatriz de fogo foi mapeada, foi realizado um processamento de pós-classificação para recuperar a informação da data do pixel que foi queimado, a partir da data do pixel em que o mosaico anual foi construído a partir do NBR mínimo.

2.6. AVALIAÇÃO DA CLASSIFICAÇÃO

Foram realizadas avaliações da classificação de cicatrizes de queimadas com imagens Landsat mensais, com inspeção visual, estatísticas e relação com uso e cobertura da terra, além da comparação com mapas de referência (MODIS e INPE).

3. VALIDAÇÃO

A validação dos mapeamentos de áreas queimadas foi realizada por bioma, considerando os anos de 2007, 2011 e 2019. Cada um dos biomas foi dividido em áreas de 2 km por 2 km, espacialmente integradas aos dados de áreas queimadas do FIRMS (Fire Information for Resource Management System - https://firms.modaps.eosdis.nasa.gov/), para os mesmos anos, onde as unidades amostrais foram agrupadas em 4 categorias: sem ocorrência de fogo, com até 32% de ocorrência de fogo, com ocorrência de fogo entre 32% e 70% e com ocorrência de fogo acima de 70%.
Em seguida, foram aleatoriamente selecionadas as unidades amostrais de validação para cada categoria, ano e bioma.

Para cada unidade amostral selecionada, foi extraída uma imagem Landsat de mínimo NBR anual. Em seguida foi realizada a segmentação automática de todas as imagens das unidades amostrais selecionadas. Os segmentos foram interpretados a fim de se explicitar quais possuíam ocorrência de incêndios. Após a interpretação de todos os segmentos, foram obtidos os centróides dos mesmos (pontos de validação)
Os pontos de validação (fogo e não fogo), foram espacialmente integrados com os mapeamentos do MapBiomas Fogo, sendo possível avaliar as qualidades dos mapeamentos e obter a acurácia da classificação.