Analisis de Suelo Con Fines Forenses
Analisis de Suelo Con Fines Forenses
Analisis de Suelo Con Fines Forenses
2011
Aceptación/publicación: enero 2012
Resumen
El suelo es uno de los indicios periciales de mayor dificultad investigativa por el elevado número de
características generales y particulares que presenta, y la baja información y diferenciación con que
cuenta su capa superficial, que es la parte presente en muestras que se colectan en el lugar del hecho,
o en residuos adheridos en prendas de vestir, zapatos u objetos de un sospechoso. El presente trabajo tiene
como objetivo mostrar la factibilidad y utilidad del empleo de la Microscopía Electrónica de Barrido con
Analizador de Rayos X (SEM-EDS), para el análisis y caracterización química de muestras de suelos
procedentes del municipio de Guanabacoa, provincia La Habana, y la obtención de un modelo de
clasificación automática por tipicidades, en correspondencia con la clasificación genética de suelos ya
existente, que permita la identificación del tipo de suelos en muestras desconocidas, y su ubicación
geográfica, con el uso de herramientas quimiométricas para el procesamiento multivariante de los datos.
Los datos obtenidos del análisis SEM-EDS fueron sometidos a un análisis exploratorio, utilizando el
análisis jerárquico de agrupamientos, demostrándose la factibilidad de una diferenciación de las muestras
analizadas en seis tipos de suelos de los nueve presentes. Los elementos Mg, Si, K, Ca, Ti, Fe y Al
resultaron los más significativos en la discriminación. A partir de estos resultados, se construyó un modelo
de clasificación automática para seis clases, quedando como mejor clasificador las máquinas de soporte
vectorial. El modelo fue validado con muestras externas, con un 97 % de eficacia.
Palabras clave: suelos, microscopia electrónica de barrido, quimiometría.
Abstract
Soil forensic evidence samples are very difficult to process, due to the greater number of general
and individuals characteristics presents at the same time and the low discriminative information that the
surface layer has , and this part is the one that is collected in crime scene or in shoes and other objects
belonging to a suspect. The main purpose of this paper is demonstrating the feasibility and benefits of
the Scanning Electron Microscopy with X-ray Analyzer coupled (SEM-EDS) for the analysis and
chemical characterization of samples of soils of the municipality of Guanabacoa in Havana City, and the
construction of an automatic classification model for soil samples discrimination, in correlation with the
present-day genetic classification existing of this place, in order to predict the origin and soil type in
unknown samples related with a case using Chemometrics tools for the multivariate processing of the
data. The data from the SEM-EDS analysis was submitted to an exploratory analysis using the
Hierarchical Clusters Analysis, demonstrating the feasibility and differentiation of 6 types of soils of the
9 presents. Elements Mg, Si, K, Ca, Ti, Fe and Al were the most significant elements in the discrimination.
From these results a model for the automatic classification for 6 types of soil samples was constructed
using a Support Vector Machines classifier. The model was validated with external samples not present
in the training set) with 97 % of efficacy.
Keywords: soils, scanning electron microscopy, chemometrics, HCA.
Se observa una tendencia muy marcada en las patrones para clasificar y predecir automáticamente
investigaciones actuales del suelo, y en nuestro caso muestras desconocidas.
específico con fines forenses, al uso de las técnicas Los avances de la química en el uso de las
de Espectroscopía de Fluorescencia de Rayos X herramientas quimiométricas para el análisis
(XRF), Fluorescencia de Rayos X Dispersiva de multivariado de datos han facilitado la solución a esta
Energía (EDXRF) y la Microscopía Electrónica de problemática /12-15/.
Barrido con analizador de fluorescencia de Rayos X
de energía dispersiva acoplado (SEM-EDS). Por todo lo antes expuesto, se considera dirigir el
objetivo principal de este estudio a mostrar la factibilidad
La XRF y sus variantes son ahora una herramienta
y utilidad del empleo de la Microscopía Electrónica de
analítica bien establecida para el análisis de especies
Barrido con Analizador de Rayos X (SEM-EDS) para
de interés geológico y el estudio de suelos/ 9-11/.
el análisis y caracterización química de muestras de
Los espectrómetros modernos tienen la capacidad suelos con fines forenses, procedentes del municipio
de proporcionar análisis precisos para un espectro de Guanabacoa en la provincia La Habana, y lograr
amplio de elementos, sobre un rango de concentración construir un modelo de automático de clasificación
dinámica amplia de niveles de ppm, además no destruye por tipicidades de suelos, en correspondencia con
la muestra y requiere poca o ninguna preparación, es la clasificación genética existente en esa zona y su
muy rápida y por tanto conduce a una reducción ubicación geográfica, con el empleo de herramientas
significativa en el costo analítico, cuando se compara quimiométricas para el procesamiento multivariante
con otras técnicas de análisis elemental. de los datos, dirigido a la predicción del tipo y
Su acople con la Microscopía Electrónica de origen de muestras desconocidas vinculadas a
Barrido abre potencialidades significativas en el análisis hechos delictivos.
elemental dentro de las investigaciones criminalísticas,
al combinarse la capacidad de detectar, estudiar, y Materiales y métodos
analizar todo sus componentes con el apoyo de sus
imágenes. Procedimiento de muestreo
En lo que respecta a los suelos, como ya Para esta investigación se colectaron 96 muestras
enunciamos con anterioridad, la propia diversidad de de suelos procedentes del municipio Guanabacoa de
sus constituyentes lo convierten en una huella material la actual provincia La Habana, las zonas de muestreo
difícil de analizar, si el perito cuenta con la posibilidad fueron seleccionadas en correspondencia con las
de visualizar sus componente y a la vez, dirigir el zonas de clasificación genética de tipos de suelos (9)
análisis l a aquellos de mayor significación, se elevan realizadas por el Instituto de suelos y GEOCUBA en
incuestionablemente las posibilidades y alcance de este municipio /16/, estos son: 1) arena, 2) esquelético,
buenos resultados. 3) fersialítico pardo rojizo típico, 4) pardos sin carbonato,
No obstante, no deben obviarse algunas limitaciones 5) fersialítico pardo rojizo ferromagnesial, 6) redzina
actuales de estas técnicas como son. No permite el roja, 7) pardos con carbonato típico, 8) pardos con
análisis de elementos más ligeros que el sodio (Z= 11), carbonato plastogénico, 9) muestras de suelos de
no supera la sensibilidad que ofrece el ICP, lo que zona no clasificada.
limita el análisis de trazas, y es sensible a los efectos Se realizó un muestreo exploratorio a juicio
de micro heterogeneidad por su baja penetración del experto que establece la toma de muestra de
(tamaño de partículas y textura de la superficie, suelo superficial y la distribución de los puntos
variación de una muestra a otra). de muestreo a tomar, utilizando la norma cubana
Otro aspecto importante a considerar, está referido, NC 37:1999 sobre requisitos generales para la
una vez hecho el análisis, a la selección de los toma de muestras, y la mexicana NMX-AA-
métodos de procesamiento de los datos y la extracción 132-SCFI-2006 muestreo de suelos para la
de información útil, así como la incorporación de identificación y cuantificación de metales y
herramientas inteligentes de reconocimiento de metaloides y manejo de la muestra /17-18/.
Se tomaron las muestras superficialmente a una eliminar cualquier peso indeseado debido a la diferencia
profundidad de 0-5 cm, en forma radial a partir de un en magnitud de las variables o de las muestras y la
punto central, tomando de 4 a 7 puntos parciales, Variación Normal Estándar (SNV) un tipo de
según el tamaño del área a muestrear por hectárea de normalización que permite compensar los efectos
suelo presente en cada unidad cartográfica del mapa. nocivos presentes en los espectros provocados por la
dispersión de la luz incidente en sólidos /21-22/.
Preparación de muestras y materiales
utilizados Para la exploración de los datos fue seleccionado
el Análisis Jerárquico de Agrupamiento, conocido por
Las muestras fueron secadas a temperatura sus siglas en inglés como HCA (Hierarchical Cluster
ambiente y tamizadas, utilizando un tamiz de malla Analysis) atendiendo a que la otra técnica exploratoria
2 mm; se montaron en porta muestras de aluminio de el Análisis de Componentes Principales es,
12,5 mm y 25 mm de diámetro con material gomoso preferentemente utilizada cuando existe un número
LEIT-C PLAST y cinta adhesiva de carbón de doble muy elevado de variables, y se requiere de una
capa de la firma AGAR SCIENTIFIC mediante una reducción de dimensionalidad para lograr su
pinza de alto grado de precisión tipo Style#5 de puntos interpretación.
superfinos de 110 mm, por observación visual a través
de un estéreo microscopio marca LEICA. En el caso específico de esta investigación, se
cuenta con un número relativamente reducido de
Equipos elementos, y se considera más adecuado el uso del
HCA. Esta técnica tuvo su origen en la taxonomía
Las muestras montadas fueron analizadas en un numérica. El objetivo fue formar grupos conteniendo
equipo de microscopía electrónica de barrido de la objetos semejantes.
firma TESCAN, modelo 5130 SB, con un
espectrómetro de rayos X dispersivo de energías Los resultados fueron presentados en forma de un
acoplado de la firma OXFORD INSTRUMENTS, árbol jerárquico conocido con el nombre de
modelo INCA 350. Los espectros fueron adquiridos DENDROGRAMA, donde la compresión de dos
con un voltaje de aceleración de 20,0 kV, una ramas del árbol representa una gran similaridad entre
magnificación de 100 X con dos detectores, uno de los objetos. Se incluyen como opciones diferentes
electrones secundarios para visualizar la muestra y el métodos de agrupamiento: Método simple, Método
de Si dopado con Li acoplado a un sistema completo, Método de la media, Método del Centróide,
computarizado de análisis de rayos X dispersivo de y el Método Ward /22, 23/.
energías, que detecta los elementos químicos de la
Para la obtención del modelo óptimo de clasificación
micro región sobre la que se focaliza el haz electrónico,
fueron probados sobre el conjunto de entrenamiento
con resoluciones de 3,0 nm a 30 kV de alto vacío y
cuatro clasificadores:
un tiempo de procesamiento de cinco segundos para
cada muestra. · K- vecinos más cercanos (K-NN). Modelo de
clasificación fuerte. Siempre clasifica a un objeto
Tratamiento de los datos
acorde con su mayor similitud con alguna de las clases
Todo el prepreprocesamiento de los datos, la presentes en el modelo, independientemente de que
exploración y la construcción de los modelos de pertenezca o no a la citada clase, se calcula la
clasificación y la evaluación de los errores de distancia que existe entre la muestra desconocida y el
clasificación, fue realizado utilizando plataforma resto de las muestras del modelo, y se le asignará la
automatizada QUIMIOMETRIX v 1.0 /19-20/. clase de sus k vecinos más cercanos, es un clasificador
simple, muy rápido y no lineal /22, 24/.
Los datos experimentales fueron mejorados y
preparados convenientemente para el análisis · Clasificador simple de analogías de clase
mediante técnicas de preprocesamiento. Fueron (SIMCA) Es un modelo de clasificación blando,
seleccionadas para estos fines el autoescalado para capaz de discernir si las muestras u objetos pertenecen
a una clase, a más de una o a ninguna; se basa sobre lineales y no lineales, tiene una capacidad de
el principio de la analogía entre muestras, y emplea las generalización muy buena (conjunto de datos de
puntuaciones determinadas mediante el Análisis de entrenamiento pequeños). Resuelve el problema de
Componentes Principales (PCA) para el cálculo de la no linealidad de los datos, incluyendo el uso de las
las distancias entre los objetos, calcula un modelo funciones kernel, que es un transformador matemático
PCA para cada clase o categoría presente en el que logra en una dimensión superior separar las
sistema objeto de estudio, posteriormente, integra clases /22, 26/.
cada una de las clases y calcula sus límites o fronteras
con una probabilidad dada, comúnmente del 95 %, Resultados y discusión
además reduce la dimensionalidad de las variables del
sistema /22, 25/. A los datos provenientes del análisis SEM-EDS
de las 96 muestras en estudio, previamente escalados
· Máquinas de Soporte Vectorial ( SVM). Es y normalizados por SVN, se le aplicó la exploración
un modelo de clasificación fuerte; resulta una reciente HCA. La distancia euclidiana y el método de
y exitosa técnica de aprendizaje automático agrupamiento Ward con un índice de similaridad de
supervisado, creada sobre la base de un problema de 0,80, reportaron los mejores resultados.
clasificación lineal; se ha usado en muchos campos
de la ciencia con buenos resultados. Muestra ventajas Se logró visualizar en el dendograma (figura 1), la
sobresalientes, por ejemplo, sirve tanto para clasificar separación de los suelos en seis tipos de los nueve
como para calibrar, es adecuado para procesar datos establecidos en la clasificación genética.
Fig. 1 Resultados del método HCA obtenido a partir de los espectros de rayos X de las muestras
de suelo. Se muestra en la columna de la izquierda los seis grupos.
Clase I – arenas, clase II- esqueléticos, clase III— presentes en el conjunto de entrenamiento, o sea
fersialítico pardo rojizo típico y pardos sin carbonato, desconocidas para él.
clase IV- fersialítico pardo rojizo ferromagnesial,
En el set de entrenamiento se encuentran
clase v -rendzina roja, clase VI- pardos carbonatados
representadas todas las tipicidades de suelos
típicos y pardos carbonatados plastogénico, y las
etiquetadas, de acuerdo con su clase, según los
muestras de suelo sin clasificar. Los suelos no
requisitos de una clasificación supervisada, donde se
diferenciados fueron los pardos con carbonato
entrena los modelos con conocimiento de las clases
plastogénico y carbonato típico, por su gran similitud
presentes. Se procedió de igual manera para el set de
química en general, para lograr la diferenciación del
validación, pero realizando el etiquetado sólo para
tipo de carbonato, es necesario acudir a la aplicación
conocimiento del investigador, pues para el modelo
de la difracción de rayos X, al igual que los pardos sin
deben ser muestras desconocidas.
carbonato y fersialítico pardo rojizo típico por su gran
similitud en el contenido Fe-Ca. Fueron usados los valores correspondientes a
siete elementos químicos que contienen la mayor
Las muestras de suelos sin clasificación genética,
información en estos suelos (Mg, Al, Si, K, Ca, Ti y
resultaron ser de acuerdo con el agrupamiento
Fe), por lo cual las dimensiones de las matrices X de
correspondiente a la clase VI.
trabajo para el set de entrenamiento y validación
Un estudio del comportamiento de las variables fueron 66 · 7 y 30 · 7, respectivamente.
(elementos) a través de la aplicación del poder de
modelación y discriminación permitió seleccionar que Fueron construidos cuatro modelos de acuerdo
los elementos o variables más discriminantes fueron con los tres clasificadores sujetos a prueba (KNN,
el Mg, Si, K, Ca, Ti, Fe, Al. SIMCA y SVM). Para el KNN, el número de vecinos
más cercanos fue 7, y la distancia utilizada fue la
A partir de lo resultados de la exploración de datos euclidiana. En el modelo SIMCA, el método de
y la factibilidad de la discriminación de tipos de suelo validación utilizado fue el cross validación o validación
acorde con los datos obtenidos, se procedió a construir cruzada, para un 95 % de confianza; el número de
el modelo óptimo de clasificación automático de factores fue 4. En el modelo SVM, se seleccionó un
suelos, atendiendo a su tipicidad. kernel lineal y el parámetro C= 100.
Para este propósito, se dividieron las muestras en La matriz de confusión de los errores para cada
un conjunto para entrenamiento con 66 muestras, y clasificador para la fase de entrenamiento y para la
otro para la validación del modelo con 30 muestras no validación, se muestra en las tablas /1-3/.