PROGRAMA COMPUTACIONAL PARA CONSTRUÇÃO E ANÁLISE DE MODELOS DE QSAR
Daniel Barbosa de Oliveira (PG) e Anderson Coser Gaudio (PQ)
Departamento de Física - Centro de Ciências Exatas Universidade Federal do Espírito Santo
palavras-chave: programa de computador, regressão linear múltipla, qsar
Introdução.
A metodologia empregada no estudo de QSAR1,2 (sigla em
inglês para Relações Quantitativas entre
Estrutura e Atividade) requer o uso de programas de computador
específicos capazes executar diversas tarefas, como o
armazenamento de grande variedade de constantes de substituintes
(banco de dados), a possibilidade de fazer pesquisa no banco de dados
e extrair deste um ou mais subgrupos de constantes de substituintes,
organizando-os em conjuntos de dados e, a partir daí, promover
seleção de variáveis e gerar análise
estatística completa capaz de evidenciar as relações
estrutura-atividade procuradas. Considerando-se esses aspectos,
construiu-se o programa denominado QSAR que, espera-se, venha a
atender às expectativas do pesquisador desta área.
As
vantagens em dispor-se de um programa como QSAR são inúmeras:
(a) tendo os autores experiência pessoal na prática de
QSAR, há boas chances do programa realmente atender às
necessidades do praticante de QSAR; (b) a propriedade do código-fonte
permite grande flexibilidade para incluir possíveis
modificações sugeridas pelos usuários; (c) o
fato de o programa ser colocado gratuitamente à disposição
da comunidade científica poderá evitar futuros gastos
com a compra de programas similares e disponibilizar recursos para
outros fins; (d) a utilização deste programa no
ambiente Windows permite a troca de informações com
outros aplicativos, como editores de texto e planilhas eletrônicas,
agilizando o trabalho de publicação da pesquisa gerada.
Objetivo. O objetivo do presente trabalho é construir um programa de computador capaz de promover seleção de variáveis, construção de modelos lineares, parabólicos e bilineares, executar testes de validação interna e cruzada nos modelos, executar análise gráfica e gerenciar banco de dados de constantes de substituintes.
Metodologia.
QSAR foi baseado em projeto orientado a objeto, altamente
estruturado, e codificado em linguagem DELPHI, que permite integração
ao ambiente Windows, estabilidade, fácil manutenção
e ampliação. Baseado em interface MDI (sigla em inglês
para Interface de Múltiplos Documentos), permite que
diversos conjuntos de dados e bancos de dados sejam manipulados
simultaneamente. Dados podem ser facilmente transferidos de um
conjunto de dados para outro e também a partir do banco de
dados. Várias operações são possíveis
a partir de um conjunto de dados, tais como: cálculo da matriz
de correlação, análise de variância,
análise de regressão linear múltipla, construção
de modelos parabólicos e bilineares, seleção de
variáveis através de busca sistemática e análise
gráfica dos resultados. Sendo esta a estrutura básica
do programa, sua arquitetura permitirá que futuramente sejam
incorporados métodos multivariados, como PLS (Mínimos
Quadrados Parciais) e PCA (Análise de Componentes
Principais), seleção de variáveis através
de algoritmo genético, além de outras.
Resultados. O Diagrama 1 mostra a estrutura geral do programa QSAR, enquanto que os Diagramas 2-4 mostram as partes que compõem o Diagrama 1.
Os
testes preliminares demonstraram que o programa QSAR poderá
realmente ser de grande utilidade para o pesquisador da área
de QSAR. Algumas facilidades incluídas no programa são:
(a) facilidade para criar subconjuntos de dados, a partir do conjunto
de dados principal; (b) facilidade para criar novas variáveis
a partir das variáveis existentes; (c) facilidade de criação
de variáveis indicadoras; (d) facilidade para eliminar os
chamados outliers de modelos mal ajustados. Outras facilidades
como copiar e colar, exportar gráficos em formato de figura
auxiliarão a rápida publicação da
pesquisa produzida.
Todos os cálculos produzidos pelo programa QSAR foram checados com programas tradicionais de estatística e a concordância, até o momento, foi perfeita.
Conclusões..A codificação do programa encontra-se em fase final e uma versão teste estará disponível para a comunidade acadêmica brasileira, à epoca deste congresso, no endereço http://www.cce.ufes.br/~anderson.
Bibliografia.. 1. Kubinyi, H.; QSAR: Hansch Analysis and Related Approaches, In: Methods and Principles in Medicinal Chemistry; R. Mannhold, P. Krogsgaard-Larsen and H. Timmerman Ed.; VCH; Weinheim, 1993. 2. Gaudio, A. C.; Química Nova 1996, 19, 278.
(PRPPG-UFES e CNPq)