Até precisarem desta ferramenta, acredito que muitos colegas nunca mensuraram sua importância. Hoje, é impossível imaginar um processo de validação sem Estatística da Qualidade.
Convidei um Consultor em Estatística, o Biomédico Jesiel Assis – que é uma das minhas referências se tratando do assunto – para falar um pouco deste universo – ainda não muito explorado por todos da área, porém, os grandes laboratórios já estão investindo alto e esta tendência, veio para ficar. – Fábia Yves
“A Estatística é uma ciência que faz inferência sobre um conjunto de dados, sejam eles quantitativos ou qualitativos. Com o advento do Big Data, a estatística vem ganhando corpo por representar a ciência dos dados, pois além de estruturá-los ela também analisa e faz inferência sobre eles. Acredita-se que os dados serão o novo petróleo e vendo isso com uma tendência, as empresas que se capacitarem na arte de minerar, estruturar e analisar esses dados, conseguirá migrar em direção a novas perspectivas de ganhos em seus negócios.
O Laboratório Clínico é uma verdadeira fábrica de dados. Conseguir enxergar o potencial desses elementos possibilitará novas pontes de relações, além de colaborar com a saúde coletiva de sua comunidade. Nós, quanto profissionais atuantes em laboratório, tratamos diariamente com muitas informações, e dentro de uma pequena parte geramos indicadores que ajudará a gerenciar os processos, entretanto, nem sempre estamos preparados para operar grandes volumes de materiais que são produzidos constantemente, e esta será uma habilidade necessária que este segmento de negócio terá que lidar.
As metodologias estatísticas sempre foram nossas aliadas nas validações técnicas, nas análises de tendências e nas pesquisas diversas que realizamos no laboratório. Somos capacitados em várias ferramentas de análises de controle de qualidade utilizando a estatística descritiva, embora possamos usufruir destes aparatos, saber interpretar e inferir baseado no output não é uma tarefa simples. Muitos softwares de fácil uso estão disponíveis para facilitar a nossa caminhada, compreender o seu funcionamento e os algoritmos utilizados não é o nosso foco, já que para nós o mais importante são as saídas que ele nos dar de acordo com nossas necessidades momentâneas. Várias empresas investem robustamente em softwares sofisticados que atendem e muitas vezes superam as necessidades, entretanto nem sempre há profissionais qualificados no mercado para o trabalho da engenharia de mineração e da ciência dos dados.
Os avanços nas áreas tecnológicas, na utilização da inteligência artificial que tem como subproduto, por exemplo, o machine learning, vem trazendo ganhos substanciais ao cotidiano de muitas empresas. Muitas bibliotecas com algoritmos poderosos utilizando as linhas de programação do python, linguagem R entre outros, vem progredindo consideravelmente e com isso facilitando a manipulação, as análises e a tomada de decisão na volumetria da grande quantidade de dados que são gerados.
Toda transição vem sempre acompanhado de um fenômeno, como na atualidade, o SARS-CoV-2 que vem impulsionando a ciência a se desafiar na confecção de soluções prol saúde coletiva. Neste sentido, muitas empresas dedicadas ao diagnóstico laboratorial se movimentaram na busca dos melhores ensaios para promover um diagnóstico seguro com melhores probabilidades de acertos, entretanto, algumas variáveis e a própria constituição biotecnológica de cada kit agem de forma particular e dependendo do estágio viral poderemos ter sensibilidades diferentes na captura viral e também no processo sorológico em especial a soro conversão. Nas incertezas que nos assolam a estabelecer critérios, por exemplo na imunologia, inúmeras plataformas surgiram com excelentes capacidades de detecção do IgG, entretanto muitas delas não possuem uma resposta pareada no perfil da imunoglobulina, isto porque utilizam regiões de epítopos distintos ocasionando diferentes sensibilidades e especificidades. Uma saída para aumentar o poder probabilístico preditivo seria conjugar plataformas, mas esta não é uma tarefa trivial no olhar do cotidiano, necessitamos de ferramentas que nos ajude estabelecer esses critérios probabilísticos para tomada de decisão, pois nem sempre teremos recursos disponíveis para uma implantação maciça de tecnologias.
Em um estímulo prático, muitos trabalhos de consultores e de profissionais envolvidos na tomada de decisão são provocados nesta condução, e saber usar as ferramentas certas para sermos objetivos e não perdermos tempo é crucial. O R Studio é uma linguagem de programação muito utilizada por estatísticos, o interessante aqui é que podemos ter acesso a diversos códigos abertos, onde o programador conseguirá permear por muitos algoritmos que o ajudará a melhorar seus processos e implantar melhorias no mesmo. As bibliotecas “rpart” e o “rpart.plot” que são códigos de programação que poderemos criar árvores de decisão baseado em um dataset a ser utilizado para diversos fins, tanto para áreas administrativas, financeira e de estudos aplicados. Uma árvore de decisão seria interessante, por exemplo, no estudo probabilístico de concordância entre plataformas para detectar IgG em resposta ao SARS-CoV-2. Caso o laboratório tenha algumas plataformas implantadas dos fornecedores A, B, C, D e E e gostaria de aumentar a sua capacidade de detecção, mas não saberia como fazer este alinhamento, um programador utilizando o “rpart” no R Studio conseguirá delinear. A plataforma do fornecedor A foi escolhida como referência de dosagem inicial, por ser de menor custo frente as demais. Fizemos uma demonstração simples no R Studio como segue abaixo:
Observe na árvore que o 1º nó foi construído pela plataforma D, isto significa que esta plataforma representa a menor entropia nos dados e caso a dosagem nesta plataforma seja reagente poderemos dizer com segurança que este resultado é um verdadeiro positivo. Na divisão da esquerda obtivemos a 1ª folha que é a plataforma E, ela conjugada com a plataforma D representa a menor entropia, sendo assim, todos os resultados obtidos na plataforma D que são não reagentes se faz necessário confirmar na plataforma E, se a plataforma E nos retornar um resultado não reagente poderemos dizer com segurança que este resultado é um verdadeiro negativo, por outro lado, se o resultado na plataforma E for reagente tendo um não reagente na plataforma D, do 1º nó, faz-se necessário uma terceira plataforma, outra divisão, que neste caso é a C e se esta plataforma nesta sequência indicar um resultado não reagente poderemos dizer com segurança que este paciente é negativo para IgG contra o SARS-CoV-2. Este é um modelo de árvore de classificação e podemos defini-la como indutiva. Usamos neste laboratório hipotético uma validação metodológica de 5 plataformas que temos disponíveis no setor técnico ou as mesmas estão em um processo de validação para futuras negociações, portanto, este algoritmo de aprendizado de máquina supervisionado nos ajudou a inferir sobre uma problemática simples, porém de forma significativa na decisão do direcionamento dos recursos.
A medicina laboratorial sempre se associou com os avanços tecnológicos e nós quanto profissionais ativos neste bloco é indispensável continuarmos com o ânimo versátil para novos aprendizados na construção de novas conexões.”
Jesiel Assis
Graduado em Estatística e Biomedicina.
Consultor da qualidade e Estatística da empresa Data Science Analytics.