Descrição do Dataset Jura




Os dados do dataset Jura estão estruturados em um dataframe e são ilustrados a partir de seu conjunto multivariado de dados do solo, relacionados com a contaminação por metais pesados numa região de 14,5 km² feito na Suíça. Eles são sondagens feitas em 359 furos, considerando-se os atributos de coordenadas, tipo de rocha, uso do solo e teores de metais pesados (cádmio, cobalto, cromo, chumbo, cobre, níquel e zinco). O conjunto foi então separado em uma amostra de treinamento e outra de validação, ambas com 259 e 100 posições cada. Para o nosso trabalho, utilizamos os teores de chumbo. O conjunto de validação é usado para verificar os resultados fornecidos pelas várias interpolações e algoritmos de simulação proposto.


Uma análise geoestatística típica é realizada no Jura com os seguintes objetivos:


-  Descrever os padrões de dependência espacial de metais pesados, e relacioná-los com a distribuição de fontes potenciais, tais como tipos de rocha e atividades humanas (uso da terra);
-  Construir um modelo probabilístico da distribuição espacial de metais pesados ​​na região;
-  Estimar a concentração de metais em locais de teste;
-  Modelo de distribuição de probabilidade de concentrações de metais em locais de teste, e avaliar o risco de ultrapassar limiares críticos;
-  Identificar os locais de teste, onde medidas corretivas devem ser tomadas;
-  Modelo de incerteza espacial conjunta das concentrações de metais através de um conjunto de alternativas de modelos numéricos (imagem estocástica), e avaliar o risco envolvido em declarar a área de estudo segura.