lunes, 22 de noviembre de 2010

La quimiometría: el arte de leer lo que nos intentan decir los espectros entre líneas

La quimiometría es una disciplina que, principalmente mediante la estadística avanzada, permite extraer información analíticamente útil de los datos experimentales.  Aunque la quimiometría, hoy en día, engloba una gran variedad de técnicas y es aplicable a muchos tipos de datos, mi explicación estará enfocada hacia uno de sus usos más populares: el procesamiento de datos espectroscópicos, sobre todo los obtenidos mediante espectroscopía infrarroja. 

Como hay infinidad de sitios en Internet en los que se explican exhaustivamente los detalles de esta técnica, aquí tocaré sólo algunos aspectos muy conceptuales, de base, para que el neófito tenga un punto de partida “amigable”.   En entregas posteriores daré explicaciones más concretas y enlaces a páginas donde ampliar la información.

Lo que hace un algoritmo quimiométrico, en esencia, es poner de manifiesto, evidenciar, algunas tendencias ocultas que no se pueden apreciar mediante el estudio directo de los datos “en bruto”.  La intención es, casi siempre, que el sistema instrumento + software quimiométrico nos de un resultado numérico, por ejemplo, la concentración de un analito o una propiedad física de la muestra.  En otras ocasiones, lo que interesa no es un modelo que entregue resultados cuantitativos, sino que sea capaz de clasificar las muestras desconocidas en grupos predefinidos acorde a una propiedad cualitativa; en tales casos se habla de modelos discriminantes o de análisis clasificatorio.

Para usar las herramientas quimiométricas de manera óptima, normalmente hay que organizar el trabajo en dos fases: la primera, la de entrenamiento (training) y luego la de predicción.  

El objetivo de la primera es obtener el “modelo”, que explicado de manera muy simple, es como una fórmula matemática.  Dicha “fórmula” siempre se elabora mediante un software específico que, en muchas ocasiones, es lo suficientemente friendly como para que lo pueda usar un no especialista en estadística.  Lo importante, de cara al usuario de un sistema quimiométrico, es que para completar esta fase de entrenamiento, es necesario disponer de una colección de datos experimentales de partida, tomados sobre muestras reales –no síntéticas, en muchos casos-, como por ejemplo, un conjunto de decenas o centenares de espectros de infrarrojo y de los correspondientes valores reales –determinados por técnicas tradicionales- de la magnitud que se desea modelar.   La calidad y utilidad del modelo que consigamos hacer siempre dependerá de la calidad y de la naturaleza de los datos experimentales que hayamos empleado para elaborarlo.

La fase de predicción es en la que, usando el modelo que hemos elaborado, conseguimos conocer el valor de la magnitud modelada en muestras “problema”, es decir, es la fase útil, en la que hacemos el trabajo de rutina.  También en ésta es imprescindible la asistencia de un programa informático que gestione el procesamiento del espectro de la muestra problema, en base al modelo que hicimos en la fase previa.  Generalmente se trata de un módulo que complementa al software de modelado.  En muchos casos el paquete informático viene asociado al instrumento de medición y es capaz, además, de gestionar el funcionamiento del instrumento.

La idea central en la que se sustenta la quimiometría es que, aunque la forma de los espectros es una consecuencia directa de la composición química y de algunas propiedades físicas de las muestras, esa influencia no se manifiesta de manera simple, ya que las contribuciones de cada uno de los factores que aportan variabilidad espectral se superponen de manera compleja y, por ello, esa razón hay que tratar y “reorganizar” la información ostensible.  Eso se consigue mediante procedimientos estadísticos, que se apoyan en técnicas de álgebra lineal, implementados sobre en una plataforma informática.

Un ejemplo, para aclarar el galimatías: Supongamos que usted tiene un espectrofotómetro NIR y quiere usarlo para determinar el grado alcohólico de muestras de vinos.  Si pretendiera buscar un punto de los espectros en el que el valor de la absorbancia esté en relación con el grado, sin que el resto de las sustancias presentes en el vino influyan, no conseguiría encontrarlo.  Ha de hacer un modelo quimiométrico que sea capaz de encontrar esa relación oculta, tomando en cuenta todas las absorbancias. 

Para ello seleccionará un centenar de muestras de distintos vinos –tintos, blancos, rosados, jóvenes, de crianza, de varias denominaciones de origen y con el mayor rango de grados posible-, conseguirá los valores reales del grado de cada una –mediante técnicas tradicionales, como la destilación + densimetría- y las pasará, una a una, por el instrumento, a fin de disponer de cada uno de los espectros.  Hasta aquí todo es puramente instrumental.

Ahora entra en juego la quimiometría.  Usando un software adecuado –algunas veces viene con el propio instrumento-, relacionará cada espectro con el valor real del grado y pedirá al programa que elabore un modelo que sea capaz de expresar la relación entre las absorbancias y los valores del grado, si tal relación existe.  En la mayoría de los programas comerciales ese proceso es semiautomático, o sea, hay que guiar al programa en cada uno de los puntos de decisión, pero el trabajo sucio –los cálculos- lo realiza el software por su cuenta.  Claro está, la habilidad del que use el programa es muy importante para conseguir un modelo realmente bueno, fiable ante cualquier muestra problema en el futuro.  De un modelo así, se dice que es “robusto”.  En este punto ya usted tiene el modelo, o sea, “la fórmula”, que en realidad casi nunca verá con sus propios ojos, ya que no es propiamente una fórmula, sino una sucesión de operaciones con matrices multidimensionales.

Ha llegado ahora el momento de sacar provecho práctico del trabajo realizado: Estamos en la fase de predicción.  Si queremos saber el grado de una muestra de vino cualquiera, de la que no tengamos información previa alguna, bastará con pasarla por el espectrofotómetro, a fin  de obtener su espectro, y luego someter dicho espectro a la rutina del modelo.  Esto suele ser casi instantáneo y automático si se usa el programa que acompaña al instrumento.  El resultado de las operaciones estará muy próximo al grado real, si nuestro modelo está bien hecho, el instrumento funciona correctamente y la muestra no es demasiado “rara”… 

Y este es el único punto verdaderamente problemático de la quimiometría.  Las muestras problema han de ser de la misma naturaleza que las que se emplearon en la elaboración del modelo.  En caso de que no ocurra así, habrá siempre un resultado, pero seguramente será inaceptablemente erróneo; es lo que se conoce como “efecto matriz”.  Dicho de otro modo, si en vez de vino pasamos una muestra de cerveza de, digamos, 4.5 %VOL, tal vez obtengamos un valor de 3 o de 6 %VOL, o incluso peor. 

Aún con esta limitación, la espectroscopía asistida con recursos quimiométricos hoy en día es el paradigma de la economía y la rapidez en los análisis de control de calidad in-line, on-line y at-line, y se ha convertido en un recurso imprescindible para muchas empresas e instituciones de algunos sectores críticos, como el farmacéutico, el agroalimentario y el petroquímico.

Me gusta ilustrar las posibilidades de la quimiometría con el siguiente escenario virtual: Imaginemos que deseamos ver lo que hay dentro de una habitación a través de una ventana, estando nosotros fuera.  En este escenario, considerado desde el punto de vista de la quimiometría aplicada a la espectroscopía, la habitación es el conjunto de espectros –o datos multivariantes experimentales-, la ventana es el instrumento de medición, los objetos de la habitación constituyen la información a la deseamos acceder –o sea, propiedades químicas o físicas- y nosotros somos el modelo quimiométrico. 

Para ver lo que hay dentro hemos de colocarnos en algún lugar óptimo, generalmente frente a la ventana y cerca de ella, para tener un ángulo mayor.  Cada sitio en que nos pongamos nos permitirá ver una colección distinta de objetos; en dependencia de cómo estén distribuidos los objetos, tal vez nunca consigamos ver algunos.  Está claro que nunca podremos ver, desde ciertas posiciones, aquellos objetos que estén detrás de los que ocupan las primeras filas. Y también es evidente que cuanto más ancha sea la ventana y más transparente el vidrio, más y mejor veremos lo que hay dentro.  Esto último equivale a tener un instrumento con mayor rango y menos ruido, respectivamente.  Asimismo, si tenemos algún modo de encender la luz del interior o de limpiar la ventana por ambos lados -lo cual equivaldría a realizar pretratamientos de los datos-, mejoraremos la calidad de lo que vemos. 

Eso sí, nos pongamos donde nos pongamos, por intensa que sea la luz, por amplia que sea la ventana y por limpio que esté el vidrio, nunca conseguiremos ver los objetos que no estén, ni aquellos tan pequeños que se escapen a la resolución de nuestros ojos, ni los que estén guardados, contenidos, dentro de otros objetos. 

En otras palabras, aunque la quimiometría es una herramienta poderosísima y gratamente sorprendente, hay cosas que no puede hacer: Puede revelar información oculta, pero nunca aquella que no esté.  Si la señal que queremos identificar es muy pequeña, no mucho mayor que el ruido experimental, tampoco sacaremos nada en claro.  Y los resultados dependerán mucho de la calidad del modelo –o sea, de la habilidad que tengamos para colocarnos en el sitio idóneo en la fase de entrenamiento-.  De hecho, es probable que necesitemos varios modelos distintos a fin de cubrir eficientemente toda la variabilidad posible que encontraremos en la fase de predicción. 

Como dije antes, conseguir un buen modelo depende de muchos factores, lo que convierte esta labor en un quehacer casi artístico, que ha de realizarse con rigor, buenas dosis de intuición y mucha paciencia.  Es un acto, en cierto modo, creativo.  Cada modelo es, en sí mismo, un pequeño proyecto de I+D.



No hay comentarios:

Publicar un comentario